版本：v0.1(draft)

Open WebUI 集成

本指南介绍如何使用提供的管道 (Pipe) 将 vLLM 语义路由与 Open WebUI 集成。

架构

已部署且可访问的 vLLM 语义路由（推荐：通过 kubectl apply -k deploy/kubernetes/ 进行 Kubernetes 部署）
已安装并运行的 Open WebUI

打开您的 Open WebUI 实例，前往 管理面板 (Admin Panel) → 设置 (Settings) → 管道 (Pipelines)
点击 "+" 添加新管道

从 URL 导入管道：

https://raw.githubusercontent.com/vllm-project/semantic-router/main/tools/openwebui-pipe/vllm_semantic_router_pipe.py

点击管道旁边的齿轮图标以配置设置：

设置	描述	示例
`vsr_base_url`	语义路由端点 URL	`http://semantic-router.vllm-semantic-router-system.svc.cluster.local:8000`
`show_vsr_info`	在聊天中显示路由决策	`true`
`timeout`	请求超时（秒）	`300`

对于 Kubernetes 部署，请使用服务 DNS 名称：

http://semantic-router.vllm-semantic-router-system.svc.cluster.local:8000

点击 "保存 (Save)" 应用配置。

管道将在聊天界面中显示路由信息：

🔀 vLLM Semantic Router Decision 🔀

📂 用户意图类别: general-qa
⚡ 思维链 (CoT): off
🥷 隐藏模型: qwen2.5-7b-instruct
🎯 系统提示词优化: true
🔥 语义缓存: Hit (快速响应)

要隐藏此信息，请在管道配置中将 show_vsr_info 设置为 false。

如果您看到连接错误：

如果模型没有出现在选择器中：