安装
本指南将帮助您安装和运行 vLLM 语义路由。路由完全在 CPU 上运行,推理不需要 GPU。
系统要求
备注
无 需 GPU - 路由使用优化的 BERT 模型在 CPU 上高效运行。
要求:
- Python: 3.10 或更高版本
- Docker: 运行路由容器所需
- 可选: HuggingFace 令牌(仅针对门控模型)
快速开始
1. 安装 vLLM 语义路由
# 创建虚拟环境 (推荐)
python -m venv vsr
source vsr/bin/activate # Windows 上: vsr\Scripts\activate
# 从 PyPI 安装
pip install vllm-sr
验证安装:
vllm-sr --version
2. 初始化配置
# 在当前目录创建 config.yaml
vllm-sr init
这将创建一个带有默认设置的 config.yaml 文件。