forked from niuniu/llm-intelligence
- MARKET_ANALYSIS.md: v3 update with latest 2026-05 pricing data - Claude Opus 4.6: 67% price drop to /5 - xAI Grok 4.1 Fast: /bin/bash.20/M input (cheapest frontier) - Kimi K2.6 (Apr 20, 2026): beats GPT-5.4 on SWE-Bench Pro - DeepSeek V4: /bin/bash.30/M for 1M context - Added AgentDeals.dev as new competitor - Added CNY pricing table from SiliconFlow (May 2026) - Updated SWOT and competitive matrix - PRD.md: v0.3 data refresh - Updated market landscape (May 2026 standings) - CNY pricing for all 12 domestic providers - Latest model names and capabilities
9.2 KiB
9.2 KiB
LLM Intelligence Hub — 产品市场调研 & 竞品分析报告 v3
报告时间:2026-05-04 研究方法:竞品产品体验 + API 实测 + 公开数据收集(AgentDeals.dev / SiliconFlow / dev.to) 报告版本:v3.0(2026年5月最新数据 + 关键竞品对比)
一、2026年5月 LLM 市场格局
1.1 价格战关键进展(2026年4月)
| 事件 | 影响 |
|---|---|
| Claude Opus 4.6 大降价 | $15/$75 → $5/$25 per MT(降幅67%),跌破$10壁垒 |
| DeepSeek V4 发布 | 1M context 仅 $0.30/M input,最便宜的超长上下文选项 |
| xAI Grok 4.1 Fast | $0.20/M input 输入价,史上最便宜前沿模型 |
| Kimi K2.6 发布(4月20日) | 首个在 SWE-Bench Pro 上超越 GPT-5.4 的开源权重模型 |
| Google Gemini 限制免费层 | 仅 Flash 模型免费,Pro 需付费,强制最低消费上限 |
| Step 3.5 Flash | $0.10/$0.30 per MT,约为 GPT-4o 价格的 1/25 |
1.2 主流厂商定价速查(2026年5月,实测数据)
海外厂商
| 厂商 | 代表模型 | 输入 $/MT | 输出 $/MT | Context | 免费层 |
|---|---|---|---|---|---|
| OpenAI | GPT-4o | $2.50 | $10 | 128K | 仅 GPT-3.5(3RPM) |
| Anthropic | Claude Opus 4.6 | $5 | $25 | 200K | Console 限速 |
| Anthropic | Claude Sonnet 4.6 | $3 | $15 | 200K | 同上 |
| Anthropic | Claude Haiku 4.5 | $0.80 | $4 | 200K | 同上 |
| Gemini 2.5 Pro | $1.25 | $10 | 1M | 仅 Flash 免费 | |
| xAI | Grok 4.1 Fast | $0.20 | $0.50 | 128K | $25 注册赠送 |
| Mistral | Mistral Large | $2 | $6 | 128K | 1B tokens/月 |
| Cohere | Command R+ | $2.50 | $10 | 128K | 1K calls/月 |
| DeepSeek | DeepSeek V4 | $0.30 | $0.50 | 1M | 5M tokens |
国内厂商(CNY,元/MT,来源:硅基流动 2026-05)
| 厂商 | 代表模型 | 输入 | 输出 | Context | 备注 |
|---|---|---|---|---|---|
| DeepSeek | V3.2 | ¥0.27 | ¥0.135 | 164K | 性价比最高 |
| DeepSeek | V4-Flash | ¥0.14 | ¥0.028 | 1M+ | 深度推理 |
| DeepSeek | R1 | ¥0.14 | ¥0.14 | 64K | 推理模型 |
| 阿里 | Qwen3-VL-32B | ¥0.20 | ¥0.60 | 262K | 开源旗舰 |
| 阿里 | Qwen3-VL-8B | ¥0.18 | ¥0.68 | 262K | 轻量选择 |
| 智谱 | GLM-5.1 | ¥1.40 | ¥0.26 | 205K | 综合最强 |
| 智谱 | GLM-4.7 | ¥0.42 | ¥0.11 | 205K | 性价比之选 |
| Moonshot | Kimi-K2.6 | ¥0.95 | ¥0.16 | 262K | 超越 GPT-5.4 |
| Moonshot | Kimi-K2.5 | ¥0.23 | ¥0.07 | 262K | 价格屠夫 |
| MiniMax | M2.5 | ¥0.30 | ¥0.03 | 197K | 语音/多模态 |
| 硅基汇总 | Hy3-preview | 免费 | 免费 | 131K | 新上架 |
| 腾讯 | Hunyuan-A13B | ¥0.14 | ¥0.57 | 131K | 腾讯系 |
| 百度 | ERNIE-4.5-300B | ¥0.28 | ¥1.10 | 131K | 百度旗舰 |
| 字节 | Doubao | ¥0.10 | ¥0.30 | — | Step-3.5 Flash |
1.3 推理速度专项(无价格排序)
| 平台 | 模型 | 亮点 | 免费额度 |
|---|---|---|---|
| Groq | Llama 4 Scout | 超高速推理 | 30RPM, 500K tokens/天 |
| Cerebras | Llama 3.1 70B | 高速 | 1M tokens/天 |
| GitHub Models | GPT-4o, Llama, Mistral | 免费 | 50-150 req/天 |
| LLM7.io | 30+ 模型 | 完全免费 | 无限制(捐赠支持) |
二、2026年新格局总结
2.1 价格地板刷新(2026年4-5月)
- 最便宜前沿模型:xAI Grok 4.1 Fast — $0.20/M input
- 最便宜开源模型:Groq Llama 4 Scout — $0.11/M input
- 最便宜长上下文:DeepSeek V4 — $0.30/M input,1M context
- 最便宜国内模型:Step 3.5 Flash / Doubao — ¥0.10/M input
2.2 三大趋势
- 价格战白热化:DeepSeek 搅局后,Claude 大降 67%,GPT-5 性价比压力巨大
- 开源反超前沿:Kimi K2.6 在 SWE-Bench Pro 超越 GPT-5.4;Qwen3.6 开源性能直逼闭源
- 国内厂商崛起:硅基流动 + 阿里 + 智谱 + DeepSeek 组成的 CNY 定价体系,价格是 USD 的 1/10-1/3
三、竞品深度分析
竞品 1:OpenRouter(openrouter.ai)⭐⭐⭐⭐⭐
实测数据(2026-05-04):
- 模型总数:371+ 个
- 免费模型:~30 个(
:free后缀) - 价格范围:$0 - $15/MTokens
- ELO 排名:全球最权威的模型质量排行
- API 字段:
id / name / pricing / context_length / supported_parameters
优势:
- ✅ 模型最全(371+),数据实时
- ✅ ELO 排行参考价值高
- ✅ 聚合 API,多模型一站接入
- ✅ 免费模型丰富
弱点:
- ❌ 无 CNY 定价,无中文界面
- ❌ 无每日报告/告警
- ❌ 无法区分国内/海外差异化定价
- ❌ 不是专门的信息追踪工具
竞品 2:AgentDeals.dev ⭐⭐⭐⭐
定位:最全面的 LLM API 定价对比平台(2026年5月数据)
实测亮点:
- ✅ 19 家提供商,21 个价格变动追踪
- ✅ 最新:Claude Opus 4.6 降价 67%、DeepSeek V4 1M context $0.30/M
- ✅ 免费层详细说明(含 RPM/日额度)
- ✅ "Best for use case" 推荐
- ✅ Provider 分类(Frontier/Inference/Open-Source/Specialized)
弱点:
- ❌ 无自动报告生成
- ❌ 无国内 CNY 价格
- ❌ 无告警推送
- ❌ 非开源
竞品 3:硅基流动(siliconflow.cn)⭐⭐⭐⭐
定位:国内最具价格竞争力的 AI 模型聚合平台
实测数据(2026-05-04):
- 模型:50+(DeepSeek / Qwen / GLM / Kimi / MiniMax / OpenAI 全覆盖)
- 结算:CNY,无汇率风险
- 免费:100 req/天 + $1 赠送积分
- 亮点价格:
- DeepSeek-V4-Flash:¥0.14/M input(全球最低之一)
- Qwen3-VL-8B:¥0.18/M input
- Kimi-K2.5:¥0.23/M input(性价比极高)
优势:
- ✅ 中文界面,CNY 明码标价
- ✅ 按量付费,无最低消费
- ✅ OpenAI 兼容 API,迁移成本低
弱点:
- ❌ 无每日自动报告
- ❌ 无价格变动告警
- ❌ 无评测数据聚合
- ❌ 非开源
竞品 4:Artificial Analysis ⭐⭐⭐
定位:LLM 性能排行榜 + 成本计算器
优势:
- ✅ MMLU / HumanEval / GSM8K 等权威基准分
- ✅ 性能/价格排行榜
弱点:
- ❌ 付费为主,免费功能有限
- ❌ 无 CNY 定价
- ❌ 无自动报告
- ❌ 无国内厂商
竞品 5:truefoundry/models ⭐⭐⭐
数据规模:21 提供商,1000+ 模型配置(YAML)
优势:
- ✅ 字段标准化,开源自部署
- ✅ 社区驱动,字段完整
弱点:
- ❌ 非实时(人工 PR 更新)
- ❌ 无自动化采集
- ❌ 无每日报告/告警
四、竞品功能矩阵(v3 更新)
| 功能 | OpenRouter | AgentDeals | 硅基流动 | Artificial Analysis | 本文产品(目标) |
|---|---|---|---|---|---|
| 模型数量 | 371+ | 19+ | 50+ | 不明 | 500+ |
| 实时数据 | ✅ API | ✅ 月更 | ✅ API | 定期 | ✅ 每日 |
| CNY 定价 | ❌ | ❌ | ✅ | ❌ | ✅ |
| USD 定价 | ✅ | ✅ | 部分 | ✅ | ✅ |
| 国内厂商 | 有限 | 有限 | ✅全 | ❌ | ✅ 12家 |
| 免费政策 | ✅ 标记 | ✅ 详细 | ✅ | ✅ 基础 | ✅ 详细追踪 |
| 性能评测 | ❌ | ❌ | ❌ | ✅ | ✅ 聚合 |
| 告警通知 | ❌ | ❌ | ❌ | ❌ | ✅ |
| 每日报告 | ❌ | ❌ | ❌ | ❌ | ✅ |
| 中文界面 | ❌ | ❌ | ✅ | ❌ | ✅ |
| Web 界面 | ✅ | ✅ | ✅ | ✅付费 | ✅ |
| MCP Server | ❌ | ❌ | ❌ | ❌ | ✅ |
五、SWOT 分析(更新版)
优势(Strengths)
- 覆盖最全:国内外 20+ 厂商 + 30+ 运营商
- 差异化功能:每日自动报告 + CNY/USD 双视图 + 免费政策详细库
- 中文优先:全中文界面,钉钉/飞书推送
- Agent 集成:MCP Server 供 AI 自动查询最优模型
劣势(Weaknesses)
- 初期数据采集成本高(20+ 数据源需逐一接入)
- 需持续维护(厂商 API 变更频率高)
- 无现成品牌认知
机会(Opportunities)
- 市场空白:区域定价 + 每日报告 + 国内厂商全覆盖 → 无直接竞品
- 需求真实:AI Agent 选型、成本控制需求持续增长
- 差异化:AgentDeals 有英文数据但无中文;硅基流动有价格但无报告
威胁(Threats)
- 大厂自己做:OpenRouter/硅基流动可能推出类似功能
- 数据源封锁:国内厂商可能限制 API 访问
- 投入产出比:数据维护成本 vs 用户付费意愿待验证
六、快速参考:当前市场价格底线(2026-05-04)
全球最低价 TOP 5(per MT input)
- xAI Grok 4.1 Fast — $0.20(海外)
- Groq Llama 4 Scout — $0.11(海外,开源)
- DeepSeek V4 — $0.30(1M context,海外)
- Step 3.5 Flash — ¥0.10(国内)
- DeepSeek V4-Flash — ¥0.14(国内硅基流动)
国内厂商价格对比(per MT,CNY)
| 厂商 | 性价比最高 | 价格区间 |
|---|---|---|
| DeepSeek | V3.2 / V4-Flash | ¥0.14-0.27 |
| 阿里 Qwen | 3-VL-32B | ¥0.18-0.60 |
| 智谱 GLM | 4.7 / 5.1 | ¥0.42-1.40 |
| Moonshot Kimi | K2.5 | ¥0.07-0.95 |
| MiniMax | M2.5 | ¥0.03-0.30 |
| 腾讯 | Hunyuan-A13B | ¥0.14-0.57 |
| 百度 | ERNIE-4.5-300B | ¥0.28-1.10 |
报告编制:宰相(AI 辅助) 数据来源:AgentDeals.dev 实测、硅基流动官网(2026-05-04)、dev.to TokenMix.ai(2026-05)