跳到主要内容
版本:v0.1(draft)

API 参考

软件包

vllm.ai/v1alpha1

软件包 v1alpha1 包含了 v1alpha1 API 组的 API Schema 定义。

资源类型

Decision (决策)

Decision 定义了基于规则组合的路由决策。

出现位置:

字段描述默认值验证
name stringName 是此决策的唯一标识符MaxLength: 100
MinLength: 1
Required: {}
priority integerPriority 定义了此决策的优先级(值越高 = 优先级越高)
当策略为 "priority" 时使用
0Maximum: 1000
Minimum: 0
description stringDescription 提供了对此决策的人类可读描述MaxLength: 500
signals SignalCombinationSignals 定义了信号组合逻辑Required: {}
modelRefs ModelRef arrayModelRefs 定义了此决策的模型引用(目前仅支持一个模型)MaxItems: 1
MinItems: 1
Required: {}
plugins DecisionPlugin arrayPlugins 定义了应用于此决策的插件MaxItems: 10

DecisionPlugin (决策插件)

DecisionPlugin 定义了决策的插件配置。

出现位置:

字段描述默认值验证
type stringType 是插件类型 (semantic-cache, jailbreak, pii, system_prompt, header_mutation)Enum: [semantic-cache jailbreak pii system_prompt header_mutation]
Required: {}
configuration RawExtensionConfiguration 是作为原始 JSON 对象的插件特定配置Schemaless: {}

DomainSignal (领域信号)

DomainSignal 定义了用于分类的领域类别。

出现位置:

字段描述默认值验证
name stringName 是此领域的唯一标识符MaxLength: 100
MinLength: 1
Required: {}
description stringDescription 提供了对此领域的人类可读描述MaxLength: 500

EmbeddingSignal (嵌入信号)

EmbeddingSignal 定义了基于嵌入的信号提取规则。

出现位置:

字段描述默认值验证
name stringName 是此信号的唯一标识符MaxLength: 100
MinLength: 1
Required: {}
threshold floatThreshold 是匹配的相似度阈值 (0.0-1.0)Maximum: 1
Minimum: 0
Required: {}
candidates string arrayCandidates 是用于语义匹配的候选短语列表MaxItems: 100
MinItems: 1
Required: {}
aggregationMethod stringAggregationMethod 定义了如何聚合多个候选相似度maxEnum: [mean max any]

IntelligentPool (智能池)

IntelligentPool 定义了带有配置的模型池。

出现位置:

字段描述默认值验证
apiVersion stringvllm.ai/v1alpha1
kind stringIntelligentPool
metadata ObjectMeta有关 metadata 的字段,请参阅 Kubernetes API 文档。
spec IntelligentPoolSpec
status IntelligentPoolStatus

IntelligentPoolList (智能池列表)

IntelligentPoolList 包含 IntelligentPool 列表。

字段描述默认值验证
apiVersion stringvllm.ai/v1alpha1
kind stringIntelligentPoolList
metadata ListMeta有关 metadata 的字段,请参阅 Kubernetes API 文档。
items IntelligentPool array

IntelligentPoolSpec (智能池规范)

IntelligentPoolSpec 定义了 IntelligentPool 的期望状态。

出现位置:

字段描述默认值验证
defaultModel stringDefaultModel 指定未选择特定模型时使用的默认模型MaxLength: 100
MinLength: 1
Required: {}
models ModelConfig arrayModels 定义了此池中可用模型的列表MaxItems: 100
MinItems: 1
Required: {}

IntelligentPoolStatus (智能池状态)

IntelligentPoolStatus 定义了观察到的 IntelligentPool 状态。

出现位置:

字段描述默认值验证
conditions Condition arrayConditions 代表 IntelligentPool 状态的最新可用观察结果
observedGeneration integerObservedGeneration 反映了最近观察到的 IntelligentPool 的代 (generation)
modelCount integerModelCount 表示池中模型的数量

IntelligentRoute (智能路由)

IntelligentRoute 定义了智能路由规则和决策。

出现位置:

字段描述默认值验证
apiVersion stringvllm.ai/v1alpha1
kind stringIntelligentRoute
metadata ObjectMeta有关 metadata 的字段,请参阅 Kubernetes API 文档。
spec IntelligentRouteSpec
status IntelligentRouteStatus

IntelligentRouteList (智能路由列表)

IntelligentRouteList 包含 IntelligentRoute 列表。

字段描述默认值验证
apiVersion stringvllm.ai/v1alpha1
kind stringIntelligentRouteList
metadata ListMeta有关 metadata 的字段,请参阅 Kubernetes API 文档。
items IntelligentRoute array

IntelligentRouteSpec (智能路由规范)

IntelligentRouteSpec 定义了 IntelligentRoute 的期望状态。

出现位置:

字段描述默认值验证
signals SignalsSignals 定义了用于路由决策的信号提取规则
decisions Decision arrayDecisions 定义了基于信号组合的路由决策MaxItems: 100
MinItems: 1
Required: {}

IntelligentRouteStatus (智能路由状态)

IntelligentRouteStatus 定义了观察到的 IntelligentRoute 状态。

出现位置:

字段描述默认值验证
conditions Condition arrayConditions 代表 IntelligentRoute 状态的最新可用观察结果
observedGeneration integerObservedGeneration 反映了最近观察到的 IntelligentRoute 的代 (generation)
statistics RouteStatisticsStatistics 提供了有关已配置决策和信号的统计信息

KeywordSignal (关键词信号)

KeywordSignal 定义了基于关键词的信号提取规则。

出现位置:

字段描述默认值验证
name stringName 是此规则的唯一标识符(也用作类别名称)MaxLength: 100
MinLength: 1
Required: {}
operator stringOperator 定义了关键词的逻辑运算符 (AND/OR)Enum: [AND OR]
Required: {}
keywords string arrayKeywords 是要匹配的关键词列表MaxItems: 100
MinItems: 1
Required: {}
caseSensitive booleanCaseSensitive 指定关键词匹配是否区分大小写false

LoRAConfig (LoRA 配置)

LoRAConfig 定义了 LoRA 适配器配置。

出现位置:

字段描述默认值验证
name stringName 是此 LoRA 适配器的唯一标识符MaxLength: 100
MinLength: 1
Required: {}
description stringDescription 提供了对此 LoRA 适配器的人类可读描述MaxLength: 500

ModelConfig (模型配置)

ModelConfig 定义了单个模型的配置。

出现位置:

字段描述默认值验证
name stringName 是此模型的唯一标识符MaxLength: 100
MinLength: 1
Required: {}
reasoningFamily stringReasoningFamily 指定了推理语法家族(例如 "qwen3", "deepseek")
必须在全局静态配置的 ReasoningFamilies 中定义
MaxLength: 50
pricing ModelPricingPricing 定义了此模型的成本结构
loras LoRAConfig arrayLoRAs 定义了此模型可用的 LoRA 适配器列表MaxItems: 50

ModelPricing (模型定价)

ModelPricing 定义了模型的定价结构。

出现位置:

字段描述默认值验证
inputTokenPrice floatInputTokenPrice 是每个输入 token 的成本Minimum: 0
outputTokenPrice floatOutputTokenPrice 是每个输出 token 的成本Minimum: 0

ModelRef (模型引用)

ModelRef 定义了不带评分的模型引用。

出现位置:

字段描述默认值验证
model stringModel 是模型名称(必须存在于 IntelligentPool 中)MaxLength: 100
MinLength: 1
Required: {}
loraName stringLoRAName 是要使用的 LoRA 适配器名称(必须存在于模型的 LoRAs 中)MaxLength: 100
useReasoning booleanUseReasoning 指定是否为此模型启用推理模式false
reasoningDescription stringReasoningDescription 提供了何时使用推理的上下文MaxLength: 500
reasoningEffort stringReasoningEffort 定义了推理努力等级 (low/medium/high)Enum: [low medium high]

RouteStatistics (路由统计)

RouteStatistics 提供了有关 IntelligentRoute 配置的统计信息。

出现位置:

字段描述默认值验证
decisions integerDecisions 表示决策数量
keywords integerKeywords 表示关键词信号的数量
embeddings integerEmbeddings 表示嵌入信号的数量
domains integerDomains 表示领域信号的数量

SignalCombination (信号组合)

SignalCombination 定义了如何组合多个信号。

出现位置:

字段描述默认值验证
operator stringOperator 定义了组合条件的逻辑运算符 (AND/OR)Enum: [AND OR]
Required: {}
conditions SignalCondition arrayConditions 定义了信号条件列表MaxItems: 50
MinItems: 1
Required: {}

SignalCondition (信号条件)

SignalCondition 定义了单个信号条件。

出现位置:

字段描述默认值验证
type stringType 定义了信号类型 (keyword/embedding/domain)Enum: [keyword embedding domain]
Required: {}
name stringName 是要引用的信号名称MaxLength: 100
MinLength: 1
Required: {}

Signals (信号)

Signals 定义了信号提取规则。

出现位置:

字段描述默认值验证
keywords KeywordSignal arrayKeywords 定义了基于关键词的信号提取规则MaxItems: 100
embeddings EmbeddingSignal arrayEmbeddings 定义了基于嵌入的信号提取规则MaxItems: 100
domains DomainSignal arrayDomains 定义了用于分类的 MMLU 领域类别MaxItems: 14