← 所有模型

Meta: Llama 3.1 8B Instruct

🇺🇸 Meta · Llama 3.1

输入价格 $0.020 每百万 tokens NT$0.64
输出价格 $0.030 每百万 tokens NT$0.96
Context Window 131K tokens 输出上限 16K
OpenRouter 路由价 请以官方定价页为准
通过 OpenRouter 使用此模型 →

概览

Meta: Llama 3.1 8B Instruct 是 Meta 推出的大型语言模型 API,属于其 Llama 3.1 系列。输入每百万 token $0.020、输出每百万 token $0.030,定位在预算型区间,是高吞吐或成本敏感工作负载中较便宜的选择之一。输出 token 的成本约为输入的 2 倍,因此以提示为主的工作负载会比以生成为主的明显便宜。131K token 的上下文窗口(约 197 页文字)足以处理长文档、跨文件代码或较长的对话。在 Artificial Analysis 的 Intelligence Index 上得分为 8(F 级),可作为其整体推理能力相对于本站其他模型的参考指标。本页所有价格反映的是 OpenRouter 的路由费率,每日自动同步;正式投入生产前,请以提供商官方定价为准。

维度 单位 价格 (USD) 价格 (TWD) 有效自
输入 每 1M tokens $0.020 NT$0.64
输出 每 1M tokens $0.030 NT$0.96

提供商
Meta
模型家族
Llama 3.1
版本字符串
meta-llama/llama-3.1-8b-instruct
状态
使用中
模态
文字
Context Window
131,072 tokens
输出上限
16,384 tokens

综合指标

由 Artificial Analysis 评估的跨领域能力指数 — Artificial Analysis

Agentic Index 1 F 测量于 2026-07-01
Coding Index 5 F 测量于 2026-07-01
Intelligence Index 8 F 测量于 2026-07-01

Benchmark 分数

数据来源:Artificial Analysis

AA-LCR 15.7% F 测量于 2026-07-01
GPQA Diamond 25.9% F 测量于 2026-07-01
HLE 5.1% D 测量于 2026-07-01
IFBench 28.6% F 测量于 2026-07-01
Non-Hallucination 58.2% 测量于 2026-07-01
Omniscience Accuracy 8.1% 测量于 2026-07-01
SciCode 13.2% D 测量于 2026-07-01
Tau2 16.4% 测量于 2026-07-01
TerminalBench 0.8% 测量于 2026-07-01

效能指标

实测数据,由 Artificial Analysis 每 72 小时更新 — Artificial Analysis

首 Token 延迟 0.9s 测量于 2026-07-01
输出速度 142 t/s 测量于 2026-07-01
回应时间 4.4s 测量于 2026-07-01

用途分析

基于基准测试和官方资料整理的模型强项、缺点与适用场景

强项

  • 卓越效率 MMLU (CoT) 73.0%,GSM8K 84.5%。8B參數模型中同類最佳。 基准测试
  • 消費者硬件運行 適合單個RTX 4090(24GB VRAM)或更小的GPU量化。 官方

最适合

  • 個人/小企業AI 可在個人計算機上本地運行;無雲依賴或API成本。 官方
  • 微調基礎模型 在計算有限的情況下進行特定領域微調的絕佳起點。 官方

不推荐

  • 複雜推理任務 對於多步驟邏輯、高級數學或科學推理,使用70B或405B。 官方

过去 90 天价格走势

输入 / 输出价格(USD per 1M tokens)

过去 90 天记录;每次价格变动会在此呈现

日期 维度 价格 (USD) 来源
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter
输出 $0.030 OpenRouter
输入 $0.020 OpenRouter

描述

Meta's latest class of model (Llama 3.1) launched with a variety of sizes & flavors. This 8B instruct-tuned version is fast and efficient. It has demonstrated strong performance compared to...

重点摘要

以下为本页面的关键数据,供快速参考与引用。

  • Meta: Llama 3.1 8B Instruct input 价格为 $0.02/M tokens
  • Meta: Llama 3.1 8B Instruct output 价格为 $0.03/M tokens
  • Context window:131,072 tokens
  • 提供商:Meta
  • 模型家族:Llama 3.1
  • 支持模态:文字
  • 数据来源:OpenRouter,每日自动更新