博客

长文与数据分析。写得不勤，但每一篇都从实际数据出发。

2026 LLM API 性价比实测：用真实定价算出每种任务的最低成本

发表于 2026-06-19 · 阅读约 11 分钟

「最便宜」不等于「最划算」。本文用本站每日更新的真实定价与 Artificial Analysis 智能指数，先设一条 AA Index ≥ 40 的质量门槛，再依「每一美元买到多少智能」排序，找出各价位带的性价比王——并用三种典型用量算出实际月成本。

阅读全文 →
中国 vs 美国 LLM 大对决（2026）：定价、能力、context window 全面对比

发表于 2026-06-18 · 阅读约 12 分钟

本站收录 228 个美国模型与 128 个中国模型。放在同一张表上会看到清楚的趋势：中国顶规（GLM 5.2、Qwen3.7 Max）在智能指数上已逼近 GPT-5.4，输入价却只要一半、输出价只要约四分之一，coding 指数甚至更高。本文用真实数据拆解两强的定价、能力与 context window，以及怎么依合规与延迟取舍。

阅读全文 →
LLM token 计价完全指南：input、output、cached、reasoning token 怎么算，账单为什么比你想的贵

发表于 2026-06-17 · 阅读约 10 分钟

同样是「$/1M tokens」，input、output、cached input 与 reasoning token 的算法完全不同，而账单最后的数字往往由你看不到的部分决定。本文用真实模型的定价（例如 Claude 把 cached input 压到标准价 10%、OpenAI o1 只打到 50%）说清楚每种 token 怎么计费、为什么 output 通常贵 3–5 倍，以及怎么估算与压低成本。

阅读全文 →
开放权重性价比之王怎么选：DeepSeek V4、MiniMax M3、Kimi K2.6、GLM 5.2 实战比较

发表于 2026-06-16 · 阅读约 11 分钟

2026 年最划算的模型几乎全是开放权重，而且多半来自中国团队。DeepSeek V4 Flash（$0.09、AA 40）、MiniMax M3（$0.30、AA 44、1M context）、Kimi K2.6（agentic 强）、GLM 5.2（$1.2、AA 51、coding 68.8）各有定位。本文用真实定价与 coding／agentic 指数把四强放进同一张价格–能力定位图，告诉你哪个场景该选哪一个。

阅读全文 →
同一个模型，为什么在不同平台价格不同？OpenRouter、官方 API、云端代管的定价逻辑

发表于 2026-06-15 · 阅读约 9 分钟

同一个模型，在官方 API、OpenRouter、Bedrock／Vertex／Azure 上的价格可能不一样。本文解释这些价差从何而来——路由 margin、批量与承诺用量折扣、地区与承载成本、batch API——以及为什么本站显示的是 OpenRouter 的路由价（不等于官方价，是特性不是 bug）。看完你会知道怎么替自己的用量找到最便宜的来源。

阅读全文 →
MiniMax M3 专题：1M context、首周 $0.30/M，coding agent 价格战升级

发表于 2026-06-05 · 阅读约 10 分钟

MiniMax M3 把 1M context、原生多模态、coding agent benchmark、OpenRouter 路由与首周 50% API 折扣放在同一个产品里。它不是直接取代 Claude，而是在压低长任务 agent 的价格下限。

阅读全文 →
Claude Code 最新攻略：Opus 4.8、Dynamic Workflows、Auto Mode 怎么用？

发表于 2026-06-01 · 阅读约 12 分钟

Claude Code 最近更新很密集：Opus 4.8、dynamic workflows、auto mode、agent view、/goal、/usage、/code-review 与 security-guidance plugin 都改变了实战打法。这篇用一套可复制的流程说清楚怎么用。

阅读全文 →
Claude Opus 4.8 没有降价：高价模型如何守住价值？

发表于 2026-05-31 · 阅读约 9 分钟

Claude Opus 4.8 标准 API 价格仍是 $5/M input、$25/M output，fast mode 则是 $10/$50。它不是加入价格战，而是在用可靠性、长任务能力与更少返工守住高价模型的位置。

阅读全文 →
DeepSeek V4-Pro 与 Mimo V2.5 永久降价：LLM API 价格战真的开始了吗？

发表于 2026-05-28 · 阅读约 11 分钟

DeepSeek V4-Pro 把 75% 折扣变成正式价格，小米 Mimo V2.5 系列也宣布最高 99% 永久降价。这不是单一模型促销，而是 LLM API 成本下限被重新定义。

阅读全文 →
Gemini 2.0 Flash 即将关闭：2026 年替代模型与 API 价格比较

发表于 2026-05-24 · 阅读约 10 分钟

Google 已标示 Gemini 2.0 Flash 与 2.0 Flash-Lite 将在 2026-06-01 停止服务。本文比较 2.5 Flash-Lite、2.5 Flash、Gemini 3 Flash 与 3.1 Flash-Lite 的价格与迁移选择。

阅读全文 →
2026 年选 LLM API 的 5 个重点

发表于 2026-05-17 · 阅读约 8 分钟

价格已经不是主要痛点。Context window、推理 token、cache 命中率、输出速度、开源 vs 闭源——这 5 件事在 2026 年才是选型的关键。

阅读全文 →