Files

Your Name dbdf13ea42 docs: v3 market analysis + PRD v0.3 data update

- MARKET_ANALYSIS.md: v3 update with latest 2026-05 pricing data
  - Claude Opus 4.6: 67% price drop to /5
  - xAI Grok 4.1 Fast: /bin/bash.20/M input (cheapest frontier)
  - Kimi K2.6 (Apr 20, 2026): beats GPT-5.4 on SWE-Bench Pro
  - DeepSeek V4: /bin/bash.30/M for 1M context
  - Added AgentDeals.dev as new competitor
  - Added CNY pricing table from SiliconFlow (May 2026)
  - Updated SWOT and competitive matrix

- PRD.md: v0.3 data refresh
  - Updated market landscape (May 2026 standings)
  - CNY pricing for all 12 domestic providers
  - Latest model names and capabilities

2026-05-04 09:09:40 +08:00

9.2 KiB

Raw Blame History

LLM Intelligence Hub — 产品市场调研 & 竞品分析报告 v3

报告时间：2026-05-04 研究方法：竞品产品体验 + API 实测 + 公开数据收集（AgentDeals.dev / SiliconFlow / dev.to）报告版本：v3.0（2026年5月最新数据 + 关键竞品对比）

一、2026年5月 LLM 市场格局

1.1 价格战关键进展（2026年4月）

事件	影响
Claude Opus 4.6 大降价	$15/$75 → $5/$25 per MT（降幅67%），跌破$10壁垒
DeepSeek V4 发布	1M context 仅 $0.30/M input，最便宜的超长上下文选项
xAI Grok 4.1 Fast	$0.20/M input 输入价，史上最便宜前沿模型
Kimi K2.6 发布（4月20日）	首个在 SWE-Bench Pro 上超越 GPT-5.4 的开源权重模型
Google Gemini 限制免费层	仅 Flash 模型免费，Pro 需付费，强制最低消费上限
Step 3.5 Flash	$0.10/$0.30 per MT，约为 GPT-4o 价格的 1/25

1.2 主流厂商定价速查（2026年5月，实测数据）

海外厂商

厂商	代表模型	输入 $/MT	输出 $/MT	Context	免费层
OpenAI	GPT-4o	$2.50	$10	128K	仅 GPT-3.5（3RPM）
Anthropic	Claude Opus 4.6	$5	$25	200K	Console 限速
Anthropic	Claude Sonnet 4.6	$3	$15	200K	同上
Anthropic	Claude Haiku 4.5	$0.80	$4	200K	同上
Google	Gemini 2.5 Pro	$1.25	$10	1M	仅 Flash 免费
xAI	Grok 4.1 Fast	$0.20	$0.50	128K	$25 注册赠送
Mistral	Mistral Large	$2	$6	128K	1B tokens/月
Cohere	Command R+	$2.50	$10	128K	1K calls/月
DeepSeek	DeepSeek V4	$0.30	$0.50	1M	5M tokens

国内厂商（CNY，元/MT，来源：硅基流动 2026-05）

厂商	代表模型	输入	输出	Context	备注
DeepSeek	V3.2	¥0.27	¥0.135	164K	性价比最高
DeepSeek	V4-Flash	¥0.14	¥0.028	1M+	深度推理
DeepSeek	R1	¥0.14	¥0.14	64K	推理模型
阿里	Qwen3-VL-32B	¥0.20	¥0.60	262K	开源旗舰
阿里	Qwen3-VL-8B	¥0.18	¥0.68	262K	轻量选择
智谱	GLM-5.1	¥1.40	¥0.26	205K	综合最强
智谱	GLM-4.7	¥0.42	¥0.11	205K	性价比之选
Moonshot	Kimi-K2.6	¥0.95	¥0.16	262K	超越 GPT-5.4
Moonshot	Kimi-K2.5	¥0.23	¥0.07	262K	价格屠夫
MiniMax	M2.5	¥0.30	¥0.03	197K	语音/多模态
硅基汇总	Hy3-preview	免费	免费	131K	新上架
腾讯	Hunyuan-A13B	¥0.14	¥0.57	131K	腾讯系
百度	ERNIE-4.5-300B	¥0.28	¥1.10	131K	百度旗舰
字节	Doubao	¥0.10	¥0.30	—	Step-3.5 Flash

1.3 推理速度专项（无价格排序）

平台	模型	亮点	免费额度
Groq	Llama 4 Scout	超高速推理	30RPM, 500K tokens/天
Cerebras	Llama 3.1 70B	高速	1M tokens/天
GitHub Models	GPT-4o, Llama, Mistral	免费	50-150 req/天
LLM7.io	30+ 模型	完全免费	无限制（捐赠支持）

二、2026年新格局总结

2.1 价格地板刷新（2026年4-5月）

最便宜前沿模型：xAI Grok 4.1 Fast — $0.20/M input
最便宜开源模型：Groq Llama 4 Scout — $0.11/M input
最便宜长上下文：DeepSeek V4 — $0.30/M input，1M context
最便宜国内模型：Step 3.5 Flash / Doubao — ¥0.10/M input

2.2 三大趋势

价格战白热化：DeepSeek 搅局后，Claude 大降 67%，GPT-5 性价比压力巨大
开源反超前沿：Kimi K2.6 在 SWE-Bench Pro 超越 GPT-5.4；Qwen3.6 开源性能直逼闭源
国内厂商崛起：硅基流动 + 阿里 + 智谱 + DeepSeek 组成的 CNY 定价体系，价格是 USD 的 1/10-1/3

三、竞品深度分析

竞品 1：OpenRouter（openrouter.ai）⭐⭐⭐⭐⭐

实测数据（2026-05-04）：

模型总数：371+ 个
免费模型：~30 个（:free 后缀）
价格范围：$0 - $15/MTokens
ELO 排名：全球最权威的模型质量排行
API 字段：id / name / pricing / context_length / supported_parameters

优势：

✅ 模型最全（371+），数据实时
✅ ELO 排行参考价值高
✅ 聚合 API，多模型一站接入
✅ 免费模型丰富

弱点：

❌ 无 CNY 定价，无中文界面
❌ 无每日报告/告警
❌ 无法区分国内/海外差异化定价
❌ 不是专门的信息追踪工具

竞品 2：AgentDeals.dev ⭐⭐⭐⭐

定位：最全面的 LLM API 定价对比平台（2026年5月数据）

实测亮点：

✅ 19 家提供商，21 个价格变动追踪
✅ 最新：Claude Opus 4.6 降价 67%、DeepSeek V4 1M context $0.30/M
✅ 免费层详细说明（含 RPM/日额度）
✅ "Best for use case" 推荐
✅ Provider 分类（Frontier/Inference/Open-Source/Specialized）

弱点：

❌ 无自动报告生成
❌ 无国内 CNY 价格
❌ 无告警推送
❌ 非开源

竞品 3：硅基流动（siliconflow.cn）⭐⭐⭐⭐

定位：国内最具价格竞争力的 AI 模型聚合平台

实测数据（2026-05-04）：

模型：50+（DeepSeek / Qwen / GLM / Kimi / MiniMax / OpenAI 全覆盖）
结算：CNY，无汇率风险
免费：100 req/天 + $1 赠送积分
亮点价格：
- DeepSeek-V4-Flash：¥0.14/M input（全球最低之一）
- Qwen3-VL-8B：¥0.18/M input
- Kimi-K2.5：¥0.23/M input（性价比极高）

优势：

✅ 中文界面，CNY 明码标价
✅ 按量付费，无最低消费
✅ OpenAI 兼容 API，迁移成本低

弱点：

❌ 无每日自动报告
❌ 无价格变动告警
❌ 无评测数据聚合
❌ 非开源

竞品 4：Artificial Analysis ⭐⭐⭐

定位：LLM 性能排行榜 + 成本计算器

优势：

✅ MMLU / HumanEval / GSM8K 等权威基准分
✅ 性能/价格排行榜

弱点：

❌ 付费为主，免费功能有限
❌ 无 CNY 定价
❌ 无自动报告
❌ 无国内厂商

竞品 5：truefoundry/models ⭐⭐⭐

数据规模：21 提供商，1000+ 模型配置（YAML）

优势：

✅ 字段标准化，开源自部署
✅ 社区驱动，字段完整

弱点：

❌ 非实时（人工 PR 更新）
❌ 无自动化采集
❌ 无每日报告/告警

四、竞品功能矩阵（v3 更新）

功能	OpenRouter	AgentDeals	硅基流动	Artificial Analysis	本文产品（目标）
模型数量	371+	19+	50+	不明	500+
实时数据	✅ API	✅ 月更	✅ API	定期	✅ 每日
CNY 定价	❌	❌	✅	❌	✅
USD 定价	✅	✅	部分	✅	✅
国内厂商	有限	有限	✅全	❌	✅ 12家
免费政策	✅ 标记	✅ 详细	✅	✅ 基础	✅ 详细追踪
性能评测	❌	❌	❌	✅	✅ 聚合
告警通知	❌	❌	❌	❌	✅
每日报告	❌	❌	❌	❌	✅
中文界面	❌	❌	✅	❌	✅
Web 界面	✅	✅	✅	✅付费	✅
MCP Server	❌	❌	❌	❌	✅

五、SWOT 分析（更新版）

优势（Strengths）

覆盖最全：国内外 20+ 厂商 + 30+ 运营商
差异化功能：每日自动报告 + CNY/USD 双视图 + 免费政策详细库
中文优先：全中文界面，钉钉/飞书推送
Agent 集成：MCP Server 供 AI 自动查询最优模型

劣势（Weaknesses）

初期数据采集成本高（20+ 数据源需逐一接入）
需持续维护（厂商 API 变更频率高）
无现成品牌认知

机会（Opportunities）

市场空白：区域定价 + 每日报告 + 国内厂商全覆盖 → 无直接竞品
需求真实：AI Agent 选型、成本控制需求持续增长
差异化：AgentDeals 有英文数据但无中文；硅基流动有价格但无报告

威胁（Threats）

大厂自己做：OpenRouter/硅基流动可能推出类似功能
数据源封锁：国内厂商可能限制 API 访问
投入产出比：数据维护成本 vs 用户付费意愿待验证

六、快速参考：当前市场价格底线（2026-05-04）

全球最低价 TOP 5（per MT input）

xAI Grok 4.1 Fast — $0.20（海外）
Groq Llama 4 Scout — $0.11（海外，开源）
DeepSeek V4 — $0.30（1M context，海外）
Step 3.5 Flash — ¥0.10（国内）
DeepSeek V4-Flash — ¥0.14（国内硅基流动）

国内厂商价格对比（per MT，CNY）

厂商	性价比最高	价格区间
DeepSeek	V3.2 / V4-Flash	¥0.14-0.27
阿里 Qwen	3-VL-32B	¥0.18-0.60
智谱 GLM	4.7 / 5.1	¥0.42-1.40
Moonshot Kimi	K2.5	¥0.07-0.95
MiniMax	M2.5	¥0.03-0.30
腾讯	Hunyuan-A13B	¥0.14-0.57
百度	ERNIE-4.5-300B	¥0.28-1.10

报告编制：宰相（AI 辅助） 数据来源：AgentDeals.dev 实测、硅基流动官网（2026-05-04）、dev.to TokenMix.ai（2026-05）

9.2 KiB Raw Blame History Unescape Escape