部落格
長文與資料分析。寫得不勤,但每一篇都從實際資料出發。
-
2026 LLM API 性價比實測:用真實定價算出每種任務的最低成本
「最便宜」不等於「最划算」。本文用本站每日更新的真實定價與 Artificial Analysis 智能指數,先設一條 AA Index ≥ 40 的品質門檻,再依「每一美元買到多少智能」排序,找出各價位帶的性價比王——並用三種典型用量算出實際月成本。
閱讀全文 →
-
中國 vs 美國 LLM 大對決(2026):定價、能力、context window 全面對比
本站收錄 228 個美國模型與 128 個中國模型。放在同一張表上會看到清楚的趨勢:中國頂規(GLM 5.2、Qwen3.7 Max)在智能指數上已逼近 GPT-5.4,輸入價卻只要一半、輸出價只要約四分之一,coding 指數甚至更高。本文用真實數據拆解兩強的定價、能力與 context window,以及怎麼依合規與延遲取捨。
閱讀全文 →
-
LLM token 計價完全指南:input、output、cached、reasoning token 怎麼算,帳單為什麼比你想的貴
同樣是「$/1M tokens」,input、output、cached input 與 reasoning token 的算法完全不同,而帳單最後的數字往往由你看不到的部分決定。本文用真實模型的定價(例如 Claude 把 cached input 壓到標準價 10%、OpenAI o1 只打到 50%)說清楚每種 token 怎麼計費、為什麼 output 通常貴 3–5 倍,以及怎麼估算與壓低成本。
閱讀全文 →
-
開放權重性價比之王怎麼選:DeepSeek V4、MiniMax M3、Kimi K2.6、GLM 5.2 實戰比較
2026 年最划算的模型幾乎全是開放權重,而且多半來自中國團隊。DeepSeek V4 Flash($0.09、AA 40)、MiniMax M3($0.30、AA 44、1M context)、Kimi K2.6(agentic 強)、GLM 5.2($1.2、AA 51、coding 68.8)各有定位。本文用真實定價與 coding/agentic 指數把四強放進同一張價格–能力定位圖,告訴你哪個場景該選哪一個。
閱讀全文 →
-
同一個模型,為什麼在不同平台價格不同?OpenRouter、官方 API、雲端代管的定價邏輯
同一個模型,在官方 API、OpenRouter、Bedrock/Vertex/Azure 上的價格可能不一樣。本文解釋這些價差從何而來——路由 margin、批量與承諾用量折扣、地區與承載成本、batch API——以及為什麼本站顯示的是 OpenRouter 的路由價(不等於官方價,是特性不是 bug)。看完你會知道怎麼替自己的用量找到最便宜的來源。
閱讀全文 →
-
MiniMax M3 專題:1M context、首週 $0.30/M,coding agent 價格戰升級
MiniMax M3 把 1M context、原生多模態、coding agent benchmark、OpenRouter 路由與首週 50% API 折扣放在同一個產品裡。它不是直接取代 Claude,而是在壓低長任務 agent 的價格下限。
閱讀全文 →
-
Claude Code 最新攻略:Opus 4.8、Dynamic Workflows、Auto Mode 怎麼用?
Claude Code 最近更新很密集:Opus 4.8、dynamic workflows、auto mode、agent view、/goal、/usage、/code-review 與 security-guidance plugin 都改變了實戰打法。這篇用一套可複製的流程說清楚怎麼用。
閱讀全文 →
-
Claude Opus 4.8 沒有降價:高價模型如何守住價值?
Claude Opus 4.8 標準 API 價格仍是 $5/M input、$25/M output,fast mode 則是 $10/$50。它不是加入價格戰,而是在用可靠性、長任務能力與更少返工守住高價模型的位置。
閱讀全文 →
-
DeepSeek V4-Pro 與 Mimo V2.5 永久降價:LLM API 價格戰真的開始了嗎?
DeepSeek V4-Pro 把 75% 折扣變成正式價格,小米 Mimo V2.5 系列也宣布最高 99% 永久降價。這不是單一模型促銷,而是 LLM API 成本下限被重新定義。
閱讀全文 →
-
Gemini 2.0 Flash 即將關閉:2026 年替代模型與 API 價格比較
Google 已標示 Gemini 2.0 Flash 與 2.0 Flash-Lite 將在 2026-06-01 停止服務。本文比較 2.5 Flash-Lite、2.5 Flash、Gemini 3 Flash 與 3.1 Flash-Lite 的價格與遷移選擇。
閱讀全文 →
-
2026 年選 LLM API 的 5 個重點
價格已經不是主要痛點。Context window、推理 token、cache 命中率、輸出速度、開源 vs 閉源——這 5 件事在 2026 年才是選型的關鍵。
閱讀全文 →