博客
长文与数据分析。写得不勤,但每一篇都从实际数据出发。
-
2026 LLM API 性价比实测:用真实定价算出每种任务的最低成本
「最便宜」不等于「最划算」。本文用本站每日更新的真实定价与 Artificial Analysis 智能指数,先设一条 AA Index ≥ 40 的质量门槛,再依「每一美元买到多少智能」排序,找出各价位带的性价比王——并用三种典型用量算出实际月成本。
阅读全文 →
-
中国 vs 美国 LLM 大对决(2026):定价、能力、context window 全面对比
本站收录 228 个美国模型与 128 个中国模型。放在同一张表上会看到清楚的趋势:中国顶规(GLM 5.2、Qwen3.7 Max)在智能指数上已逼近 GPT-5.4,输入价却只要一半、输出价只要约四分之一,coding 指数甚至更高。本文用真实数据拆解两强的定价、能力与 context window,以及怎么依合规与延迟取舍。
阅读全文 →
-
LLM token 计价完全指南:input、output、cached、reasoning token 怎么算,账单为什么比你想的贵
同样是「$/1M tokens」,input、output、cached input 与 reasoning token 的算法完全不同,而账单最后的数字往往由你看不到的部分决定。本文用真实模型的定价(例如 Claude 把 cached input 压到标准价 10%、OpenAI o1 只打到 50%)说清楚每种 token 怎么计费、为什么 output 通常贵 3–5 倍,以及怎么估算与压低成本。
阅读全文 →
-
开放权重性价比之王怎么选:DeepSeek V4、MiniMax M3、Kimi K2.6、GLM 5.2 实战比较
2026 年最划算的模型几乎全是开放权重,而且多半来自中国团队。DeepSeek V4 Flash($0.09、AA 40)、MiniMax M3($0.30、AA 44、1M context)、Kimi K2.6(agentic 强)、GLM 5.2($1.2、AA 51、coding 68.8)各有定位。本文用真实定价与 coding/agentic 指数把四强放进同一张价格–能力定位图,告诉你哪个场景该选哪一个。
阅读全文 →
-
同一个模型,为什么在不同平台价格不同?OpenRouter、官方 API、云端代管的定价逻辑
同一个模型,在官方 API、OpenRouter、Bedrock/Vertex/Azure 上的价格可能不一样。本文解释这些价差从何而来——路由 margin、批量与承诺用量折扣、地区与承载成本、batch API——以及为什么本站显示的是 OpenRouter 的路由价(不等于官方价,是特性不是 bug)。看完你会知道怎么替自己的用量找到最便宜的来源。
阅读全文 →
-
MiniMax M3 专题:1M context、首周 $0.30/M,coding agent 价格战升级
MiniMax M3 把 1M context、原生多模态、coding agent benchmark、OpenRouter 路由与首周 50% API 折扣放在同一个产品里。它不是直接取代 Claude,而是在压低长任务 agent 的价格下限。
阅读全文 →
-
Claude Code 最新攻略:Opus 4.8、Dynamic Workflows、Auto Mode 怎么用?
Claude Code 最近更新很密集:Opus 4.8、dynamic workflows、auto mode、agent view、/goal、/usage、/code-review 与 security-guidance plugin 都改变了实战打法。这篇用一套可复制的流程说清楚怎么用。
阅读全文 →
-
Claude Opus 4.8 没有降价:高价模型如何守住价值?
Claude Opus 4.8 标准 API 价格仍是 $5/M input、$25/M output,fast mode 则是 $10/$50。它不是加入价格战,而是在用可靠性、长任务能力与更少返工守住高价模型的位置。
阅读全文 →
-
DeepSeek V4-Pro 与 Mimo V2.5 永久降价:LLM API 价格战真的开始了吗?
DeepSeek V4-Pro 把 75% 折扣变成正式价格,小米 Mimo V2.5 系列也宣布最高 99% 永久降价。这不是单一模型促销,而是 LLM API 成本下限被重新定义。
阅读全文 →
-
Gemini 2.0 Flash 即将关闭:2026 年替代模型与 API 价格比较
Google 已标示 Gemini 2.0 Flash 与 2.0 Flash-Lite 将在 2026-06-01 停止服务。本文比较 2.5 Flash-Lite、2.5 Flash、Gemini 3 Flash 与 3.1 Flash-Lite 的价格与迁移选择。
阅读全文 →
-
2026 年选 LLM API 的 5 个重点
价格已经不是主要痛点。Context window、推理 token、cache 命中率、输出速度、开源 vs 闭源——这 5 件事在 2026 年才是选型的关键。
阅读全文 →