Files
lijiaoqiao/docs/llm_gateway_competitor_function_business_2026-03-16.md

421 lines
20 KiB
Markdown
Raw Normal View History

# 商用 LLM 通用转发网关竞品全景调研(功能清单 + 商业模型 + 技术优劣)
- 版本v1.0(可评审版)
- 日期2026-03-16
- 阶段定位:产品与市场阶段(非技术实现设计)
- 适用对象:产品负责人、商业负责人、技术管理层、投融资材料准备
## 0. 阶段声明
本文档用于回答“是否值得做、怎么切入、先做什么”三类问题。
本阶段**不展开**数据库、服务拆分、接口实现细节;仅输出:
1. 竞品功能清单与覆盖差异
2. 竞品商业模型与定价逻辑
3. 技术能力优劣(平台成熟度层面)
4. 我方可执行的产品切入与机会空白
## 1. 研究边界与方法
## 1.1 目标产品定义
目标产品是“商用 LLM 通用转发网关”,核心能力是:
1. 多模型统一接入OpenAI 兼容/原生协议)
2. 路由与回退(成本、延迟、可用性、多策略)
3. 治理与风控(预算、配额、权限、审计)
4. 可观测与经营(成本看板、告警、账单、归因)
## 1.2 样本分层
本次样本分三层:
1. 商业化 AI 网关直接竞争OpenRouter、Portkey、Cloudflare AI Gateway、Helicone、Kong AI Gateway
2. 开源网关价格天花板竞争LiteLLM OSS、One-API、New-API、Sub2API
3. 云厂商平台替代竞争AWS Bedrock、Google Vertex AI、Azure AI
## 1.3 信息来源原则
1. 优先官方文档、官方定价页、官方仓库/官方 API
2. 对无法完全核验的字段,标注“公开信息未完全披露”
3. 开源热度采用 GitHub 官方 API2026-03-16 当天采集)
## 2. 竞品分层与定位地图
| 层级 | 代表产品 | 主要购买方 | 主要卖点 | 主要短板/风险 |
|---|---|---|---|---|
| 商业 AI 网关 | OpenRouter / Portkey / Cloudflare / Helicone / Kong | AI 团队、平台团队、企业采购 | 快速上线、平台化治理、SLA/支持 | 价格与锁定、功能边界受平台约束 |
| 开源网关 | LiteLLM OSS / One-API / New-API / Sub2API | 成本敏感团队、DevOps 能力团队 | 零 license、可控可改、上线快 | 运维/合规/SLA 自担 |
| 云厂商替代 | Bedrock / Vertex / Azure AI | 已重度上云企业 | 合规与采购便利、生态整合 | 跨云治理弱、迁移成本高 |
## 3. 核心竞品标准化卡片(商业 + 开源)
## 3.1 OpenRouter
- 定位:多模型聚合与交易型路由平台,强调“统一 API + 提升可用性”。
- 目标客户:独立开发者、中小团队、需要快速接入多模型的产品团队。
- 关键能力:
1. 提供 provider routing排序、fallback、参数兼容约束
2. 支持按价格/延迟/吞吐路由偏好
3. 支持 BYOK 与数据策略控制字段
- 商业模型:
1. 推理价格按上游透传
2. 充值时收取平台费FAQ 公布 5.5%,最低 0.8 美元)
3. BYOK 超阈值后按比例收取服务费
- 优势:模型覆盖广、接入速度快、路由能力产品化强。
- 短板:企业私有化与深度合规能力相对有限,采购链路偏“开发者自助”。
## 3.2 Portkey
- 定位AI Gateway + Guardrails + Observability 一体化生产平台。
- 目标客户:中大型 AI 团队、强调治理与生产稳定性的组织。
- 关键能力:
1. 配置化路由(负载、回退、可组合策略)
2. 观测、告警、策略控制、治理能力并列提供
3. 强调组织级运营能力(跨项目管理)
- 商业模型:
1. 公开套餐化(官网展示免费/成长/企业路径)
2. 企业合同与支持服务并行
3. 常见模式为平台订阅 + 用量增长
- 优势:功能面完整,偏“生产控制台”而非单纯转发器。
- 短板:对小团队可能偏重,学习和治理配置复杂度高于轻量网关。
## 3.3 Cloudflare AI Gateway
- 定位:依托 Cloudflare 网络边缘能力的 AI 网关与观测层。
- 目标客户:已使用 Cloudflare 的开发团队与企业平台团队。
- 关键能力:
1. OpenAI 兼容统一端点
2. 日志、缓存、限流、重试与回退
3. 动态路由(条件、比例、预算限制、版本管理)
- 商业模型:
1. 核心功能免费(文档明确)
2. 持久日志与 Logpush 基于配额/计划计费
3. 企业版价格走客户经理/合同
- 优势:边缘网络与全球可用性、与现有 Cloudflare 体系集成紧密。
- 短板:跨云中立能力虽有,但企业常会被其生态绑定。
## 3.4 Helicone
- 定位LLM 观测与成本优化平台,内含网关能力。
- 目标客户:先监控再治理的成长型 AI 团队。
- 关键能力:
1. 请求级追踪、分析、评估
2. 网关能力缓存、限流、fallback 等)
3. 注重成本可视化与运营闭环
- 商业模型:
1. 公开分层Hobby 免费、Pro/Team/Enterprise
2. 座席 + 用量计费并行
3. 企业版提供 SSO、私有化、合同能力
- 优势:观测产品成熟、上手快、性价比高。
- 短板:在“企业级治理深度”上通常弱于重平台化网关。
## 3.5 Kong AI Gateway
- 定位:从 API Gateway 领军平台延展至 AI 流量治理与安全。
- 目标客户:大型企业、已有 API 平台治理基础的组织。
- 关键能力:
1. Universal API多模型统一接入
2. AI 插件体系安全、治理、路由、观测、RAG 注入)
3. 企业级身份、审计、控制面整合
- 商业模型:
1. 平台订阅Konnect Plus/Enterprise
2. AI 能力作为 add-on 或模型代理配额收费
3. 企业合同主导
- 优势:企业采购成熟、治理与安全体系完整、组织落地能力强。
- 短板:成本和引入门槛较高,中小团队早期采用摩擦大。
## 3.6 LiteLLM OSS / Enterprise
- 定位:开发者友好的多模型统一 SDK + ProxyOpenAI 兼容)。
- 目标客户:平台工程团队、希望自建网关的组织。
- 关键能力:
1. 多 provider 统一调用与代理
2. 虚拟 Key、预算、团队治理、回退与负载
3. 企业版补充 SSO/SCIM/JWT/支持服务
- 商业模型:
1. OSS 免费MIT
2. Enterprise 合同收费SaaS 或自管)
- 优势:生态活跃、扩展快、可作为自建底座。
- 短板OSS 到企业级落地仍需工程投入,复杂场景需要二次治理。
## 3.7 One-API开源
- 定位:经典 API 聚合与二次分发系统。
- 目标客户:预算敏感、追求快速上线的团队。
- 关键能力:
1. 多模型统一入口
2. 基础分发与额度管理
3. 部署简单、社区基础大
- 商业模型开源为主MIT
- 优势:部署快、学习成本低。
- 短板:高级调度、企业治理、可观测深度相对有限。
## 3.8 New-API开源
- 定位:高活跃多协议聚合平台,强调 OpenAI/Claude/Gemini 兼容。
- 目标客户:需要多协议快速接入的中小团队。
- 关键能力:
1. 协议覆盖广
2. 预扣/结算计费链路、重试与通道治理
3. 高迭代发布节奏
- 商业模型开源为主AGPLv3。
- 优势:功能覆盖广、更新频繁。
- 短板AGPL 合规约束对闭源商用影响显著。
## 3.9 Sub2API开源高增长
- 定位:面向订阅配额分发的 AI API Gateway。
- 目标客户:对成本非常敏感、希望快速中转的团队。
- 关键能力:
1. 多账户/多 key/精细计费
2. 调度策略较深(会话粘性 + 负载)
3. 运营控制面完整度在开源项目中较强
- 商业模型开源MIT以社区传播驱动。
- 优势:增长快、调度与运营字段较完整。
- 短板:企业合规、条款风险、商业支持体系需自担。
## 4. 竞品功能清单54 项)
说明:以下为“商用 LLM 网关”功能全景清单,按产品能力域分组。建议你们把它作为 PRD 功能池与版本裁剪基线。
## 4.1 接入与协议A01-A10
| ID | 功能项 | 业务价值 |
|---|---|---|
| A01 | OpenAI 兼容接口 | 降低迁移成本 |
| A02 | 原生协议透传Anthropic/Gemini 等) | 覆盖更多场景 |
| A03 | 多模型统一模型目录 | 减少模型选择成本 |
| A04 | 多 provider 凭证管理 | 支持多供应商并行 |
| A05 | BYOK自带上游 Key | 满足企业合规与成本控制 |
| A06 | 统一 SDK/客户端 | 降低接入复杂度 |
| A07 | 流式输出兼容 | 保障交互体验 |
| A08 | 多模态接口支持(图像/音频) | 拓展业务边界 |
| A09 | 批处理接口 | 降本增效 |
| A10 | 模型能力标签(上下文、工具调用、响应格式) | 提高路由准确率 |
## 4.2 路由与弹性R01-R10
| ID | 功能项 | 业务价值 |
|---|---|---|
| R01 | 基础负载均衡 | 提升吞吐稳定性 |
| R02 | 主备回退链 | 提升可用性 |
| R03 | 重试策略(指数退避) | 降低瞬时失败 |
| R04 | 会话粘性路由 | 保障上下文连续性 |
| R05 | 按成本排序路由 | 降低单位调用成本 |
| R06 | 按延迟排序路由 | 优化用户体验 |
| R07 | 按吞吐排序路由 | 优化批量任务效率 |
| R08 | 条件路由(用户分层/场景) | 精细化运营 |
| R09 | 灰度/比例路由A/B | 降低模型切换风险 |
| R10 | 熔断与自动恢复 | 避免故障扩散 |
## 4.3 治理与安全G01-G10
| ID | 功能项 | 业务价值 |
|---|---|---|
| G01 | 多租户隔离 | 支持企业组织结构 |
| G02 | RBAC 权限模型 | 降低误操作风险 |
| G03 | API Key 生命周期管理 | 保障密钥安全 |
| G04 | SSO/OIDC/SAML | 企业集成必备 |
| G05 | 审计日志 | 满足审计与追责 |
| G06 | 敏感信息脱敏/PII 处理 | 合规要求 |
| G07 | 模型白名单/黑名单 | 规范调用范围 |
| G08 | 提示词防护/内容安全 | 降低安全与品牌风险 |
| G09 | 区域与数据边界策略 | 满足数据驻留要求 |
| G10 | 策略版本与回滚 | 降低配置变更风险 |
## 4.4 成本与计费C01-C08
| ID | 功能项 | 业务价值 |
|---|---|---|
| C01 | 请求级 token 成本核算 | 精准经营 |
| C02 | 预扣-结算-退款链路 | 账实一致 |
| C03 | 预算(租户/团队/key | 防止失控消费 |
| C04 | 配额周期管理(日/周/月) | 可运营化控制 |
| C05 | 成本归因(项目/用户/功能) | ROI 分析 |
| C06 | 成本告警(阈值/异常) | 及时止损 |
| C07 | 成本优化建议(模型替代) | 持续降本 |
| C08 | 发票/账单导出 | 财务对账 |
## 4.5 可观测与运维O01-O08
| ID | 功能项 | 业务价值 |
|---|---|---|
| O01 | 请求日志检索 | 故障排查 |
| O02 | 成功率/延迟监控 | SLA 管理 |
| O03 | 模型级性能对比 | 路由优化 |
| O04 | Trace 级链路追踪 | 定位瓶颈 |
| O05 | 自定义标签/元数据 | 业务分析 |
| O06 | 告警中心(邮件/IM/Webhook | 快速响应 |
| O07 | 仪表盘与运营看板 | 管理层可视化 |
| O08 | 长期日志归档与检索 | 审计与复盘 |
## 4.6 生态与交付E01-E08
| ID | 功能项 | 业务价值 |
|---|---|---|
| E01 | SaaS 部署 | 快速上线 |
| E02 | 私有化部署 | 满足合规 |
| E03 | 混合部署 | 平衡灵活与安全 |
| E04 | Terraform/声明式配置 | 平台工程标准化 |
| E05 | Webhook/事件订阅 | 与业务系统联动 |
| E06 | 插件机制 | 可扩展能力 |
| E07 | SIEM/Observability 集成 | 融合企业工具链 |
| E08 | 商业支持与 SLA | 降低生产风险 |
## 5. 关键能力覆盖矩阵P0 级 20 项)
说明:`✅`=公开明确支持,`◐`=部分/需组合实现,`-`=未见公开明确说明。
| 功能 | OpenRouter | Portkey | Cloudflare | Helicone | Kong | LiteLLM OSS | One-API | New-API | Sub2API |
|---|---|---|---|---|---|---|---|---|---|
| OpenAI 兼容接口 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 多 provider 路由 | ✅ | ✅ | ✅ | ◐ | ✅ | ✅ | ◐ | ✅ | ✅ |
| 自动 fallback | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ◐ | ✅ | ✅ |
| 负载均衡 | ◐ | ✅ | ✅ | ◐ | ✅ | ✅ | ◐ | ✅ | ✅ |
| BYOK | ✅ | ✅ | ✅ | ◐ | ✅ | ✅ | ◐ | ◐ | ◐ |
| 缓存 | ◐ | ✅ | ✅ | ✅ | ✅ | ✅ | ◐ | ◐ | ◐ |
| 限流 | ◐ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 预算管理 | ◐ | ✅ | ✅(动态路由预算节点) | ◐ | ✅ | ✅ | ◐ | ✅ | ✅ |
| 成本看板 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ◐ | ✅ | ✅ |
| 组织/团队管理 | ◐ | ✅ | ◐ | ✅ | ✅ | ✅ | ◐ | ✅ | ✅ |
| SSO/SAML/OIDC | 企业版 | 企业版 | Cloudflare 体系 | 企业版 | 企业版 | 企业版 | - | - | - |
| 审计日志 | ◐ | ✅ | ✅ | ✅ | ✅ | 企业版 | - | ◐ | ◐ |
| 可观测追踪 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ◐ | ✅ | ✅ |
| 灰度/比例路由 | ◐ | ✅ | ✅ | ◐ | ✅ | ◐ | - | ◐ | ◐ |
| 数据策略/隐私控制 | ✅ | ✅ | ✅ | ✅ | ✅ | ◐ | - | ◐ | ◐ |
| 策略可组合 | ◐ | ✅ | ✅ | ◐ | ✅ | ◐ | - | ◐ | ◐ |
| 私有化部署 | - | 可选 | - | 企业版 | ✅ | ✅ | ✅ | ✅ | ✅ |
| 插件/扩展能力 | ◐ | ◐ | ◐ | ◐ | ✅ | ✅ | ◐ | ✅ | ✅ |
| 企业 SLA 支持 | 企业版 | ✅ | ✅ | ✅ | ✅ | 企业版 | - | - | - |
| 合规能力SOC2/HIPAA 等) | ◐ | 企业版 | Cloudflare 体系 | Team/Enterprise 提供 | 企业版 | 企业版 | - | - | - |
## 6. 商业模型矩阵(重点)
## 6.1 模型类型
| 商业模型 | 代表玩家 | 收费逻辑 | 对客户吸引点 | 对我方的启示 |
|---|---|---|---|---|
| 推理透传 + 平台费 | OpenRouter | 模型价透传,充值/服务费 | 成本透明、上手快 | 可作为“低摩擦入口”模型 |
| 订阅 + 用量 | Helicone、Portkey常见 | 基础套餐 + 请求/存储/事件增量 | 可预测支出 + 可扩展 | 适合 SaaS 中腰部客户 |
| 平台订阅 + AI Add-on | Kong | 基础平台 + AI 模块附加 | 企业治理统一采购 | 高客单价但销售周期长 |
| 云生态捆绑计费 | Cloudflare | 计划配额 + 增量特性计费 | 与现有云资源整合 | 强生态对抗靠跨云中立 |
| 开源免费 + 企业授权 | LiteLLM | OSS 免费,企业版收费 | 先试后买、开发者友好 | 建议采用双轮驱动策略 |
| 开源自建 | One-API/New-API/Sub2API | license 免费,运维自担 | 最低软件成本 | 迫使商用版必须提供“非代码价值” |
## 6.2 定价指标(行业常见)
1. 按请求量requests
2. 按日志事件/存储量logs/events/storage
3. 按模型代理数model proxy
4. 按组织/座席org/seats
5. 按账单量或平台分润billing volume/fee
6. 按企业功能包SSO/审计/私有化/SLA
## 6.3 商业模型优劣
| 模式 | 优点 | 缺点 | 适配阶段 |
|---|---|---|---|
| 纯加价分润 | 规则简单、现金流快 | 同质化强、被价格战击穿 | 不建议作为主模式 |
| 纯订阅 | 收入稳定、可预测 | 初期成交门槛高 | 中后期可强化 |
| 混合BYOK + 订阅 + 企业年约) | 可兼顾增长与利润 | 产品和销售复杂度更高 | 建议主路径 |
## 7. 技术优劣(平台成熟度视角)
评分范围1-5用于商业判断不代表代码质量绝对值。
| 维度 | OpenRouter | Portkey | Cloudflare | Helicone | Kong | LiteLLM | One-API | New-API | Sub2API |
|---|---:|---:|---:|---:|---:|---:|---:|---:|---:|
| 接入广度 | 5 | 5 | 4 | 4 | 5 | 5 | 4 | 5 | 4 |
| 路由策略深度 | 5 | 5 | 4 | 3 | 5 | 4 | 3 | 4 | 4 |
| 成本治理能力 | 4 | 5 | 4 | 4 | 4 | 4 | 3 | 4 | 4 |
| 企业治理能力 | 3 | 5 | 4 | 4 | 5 | 4 | 2 | 3 | 3 |
| 可观测成熟度 | 4 | 5 | 4 | 5 | 5 | 4 | 2 | 4 | 4 |
| 部署灵活性 | 2 | 4 | 2 | 4 | 5 | 5 | 5 | 5 | 5 |
| 合规与采购友好 | 3 | 4 | 5 | 4 | 5 | 4 | 2 | 2 | 2 |
| 生态与渠道能力 | 4 | 4 | 5 | 3 | 5 | 4 | 3 | 3 | 3 |
### 关键观察
1. 商业化赛道中Portkey/Kong 更偏“企业治理平台”OpenRouter 更偏“交易聚合路由”。
2. Cloudflare 的边缘与平台集成强,但跨云中立价值是其薄弱环节。
3. Helicone 在观测与运营视角强,适合作为“先观测后治理”的切入。
4. 开源赛道在“基础能力”上已足够成熟商业产品必须强化治理、合规、SLA、组织协同价值。
## 8. 开源项目运营信号GitHub 官方 API
采样时间2026-03-16。
| 项目 | Star | Fork | License | 最近推送 | 备注 |
|---|---:|---:|---|---|---|
| LiteLLM | 39,228 | 6,434 | MIT仓库 API 显示 NOASSERTION仓库内 LICENSE 为 MIT | 2026-03-16 | 社区与生态最强 |
| One-API | 30,599 | 5,838 | MIT | 2026-01-09 | 中文社区影响力大 |
| New-API | 21,019 | 4,067 | AGPLv3 | 2026-03-16 | 高活跃,高合规约束 |
| Sub2API | 5,915 | 894 | MIT | 2026-03-16 | 增长快,运营导向明显 |
## 9. 机会空白(可用于你们产品定位)
## 9.1 市场尚未被充分满足的需求
1. 多租户 FinOps 自动化:不仅展示成本,还要自动给出路由降本建议并可回放验证。
2. 业务语义路由:按“场景目标(准确率/速度/预算)”驱动路由,而非仅按模型名。
3. 财务对账闭环:预算、账单、团队归因、异常追责一体化。
4. 合规策略模板:按行业(金融/医疗/出海)提供可落地策略包。
5. “开源友好 + 企业可升级”:让技术团队先低成本接入,再平滑升级到企业治理版。
## 9.2 建议定位语(可选)
“不是另一个 API 转发器,而是企业 AI 成本与治理控制面。”
## 10. 对你项目的可执行结论
1. 基础接入和转发能力不是壁垒,必须用“治理 + FinOps + 合规”打差异化。
2. 商业模型建议从第一天就采用混合:
- 自助版BYOK + 免费额度)
- 增长版(订阅 + 用量)
- 企业版(年约 + 私有化 + SLA
3. 首发版本不要追“模型最多”,而要追“企业采购可解释价值”:
- 成本可控
- 风险可控
- 责任可追溯
## 11. 下一轮补充调研(建议 2 周内)
1. 客户访谈:
- 10 家中型 AI 团队(技术负责人)
- 5 家企业安全/合规负责人
2. 商务访谈:
- 5 位有采购权的 IT/平台负责人
3. 定价调研:
- 做一轮 Van Westendorp100+ 样本)
- 验证“按组织 + 按请求 + 企业功能包”接受度
4. 竞品实测:
- 选 3 家商业网关做 2 周试运行
- 对比接入时长、治理能力、成本可解释性
## 12. 参考来源(官方优先)
- OpenRouter Provider Routing: https://openrouter.ai/docs/features/provider-routing
- OpenRouter FAQ费用与 BYOK: https://openrouter.ai/docs/faq
- Portkey 官网: https://portkey.ai/
- Portkey Fallbacks: https://docs.portkey.ai/docs/product/ai-gateway/fallbacks
- Portkey Load Balancing: https://docs.portkey.ai/docs/product/ai-gateway/load-balancing
- Cloudflare AI Gateway 概览: https://developers.cloudflare.com/ai-gateway/
- Cloudflare Unified API: https://developers.cloudflare.com/ai-gateway/usage/chat-completion/
- Cloudflare Dynamic Routing: https://developers.cloudflare.com/ai-gateway/features/dynamic-routing/
- Cloudflare Pricing: https://developers.cloudflare.com/ai-gateway/reference/pricing/
- Helicone Pricing: https://www.helicone.ai/pricing
- Kong AI Gateway 产品页: https://konghq.com/products/kong-ai-gateway
- Kong AI Gateway 文档: https://developer.konghq.com/ai-gateway/
- Kong AI Proxy 插件: https://docs.konghq.com/hub/kong-inc/ai-proxy/
- Kong Pricing: https://konghq.com/pricing
- LiteLLM 官网: https://www.litellm.ai/
- LiteLLM Enterprise: https://www.litellm.ai/enterprise
- LiteLLM Virtual Keys: https://docs.litellm.ai/docs/proxy/virtual_keys
- GitHub API - one-api: https://api.github.com/repos/songquanpeng/one-api
- GitHub API - new-api: https://api.github.com/repos/QuantumNous/new-api
- GitHub API - litellm: https://api.github.com/repos/BerriAI/litellm
- GitHub API - sub2api: https://api.github.com/repos/Wei-Shaw/sub2api