← 所有模型

Meta: Llama 3.3 70B Instruct

🇺🇸 Meta · Llama 3.3

输入价格 $0.100 每百万 tokens NT$3.2
输出价格 $0.320 每百万 tokens NT$10.2
Context Window 131K tokens 输出上限 16K
OpenRouter 路由价 请以官方定价页为准
通过 OpenRouter 使用此模型 →

概览

Meta: Llama 3.3 70B Instruct 是 Meta 推出的大型语言模型 API,属于其 Llama 3.3 系列。输入每百万 token $0.100、输出每百万 token $0.320,定位在预算型区间,是高吞吐或成本敏感工作负载中较便宜的选择之一。输出 token 的成本约为输入的 3 倍,因此以提示为主的工作负载会比以生成为主的明显便宜。131K token 的上下文窗口(约 197 页文字)足以处理长文档、跨文件代码或较长的对话。在 Artificial Analysis 的 Intelligence Index 上得分为 9(F 级),可作为其整体推理能力相对于本站其他模型的参考指标。本页所有价格反映的是 OpenRouter 的路由费率,每日自动同步;正式投入生产前,请以提供商官方定价为准。

维度 单位 价格 (USD) 价格 (TWD) 有效自
输入 每 1M tokens $0.100 NT$3.2
输出 每 1M tokens $0.320 NT$10.2

提供商
Meta
模型家族
Llama 3.3
版本字符串
meta-llama/llama-3.3-70b-instruct
状态
使用中
模态
文字
Context Window
131,072 tokens
输出上限
16,384 tokens

综合指标

由 Artificial Analysis 评估的跨领域能力指数 — Artificial Analysis

Coding Index 12 F 测量于 2026-07-01
Intelligence Index 9 F 测量于 2026-07-01

Benchmark 分数

数据来源:Artificial Analysis

AA-LCR 15.0% F 测量于 2026-07-01
GPQA Diamond 49.8% C 测量于 2026-07-01
HLE 4.0% D 测量于 2026-07-01
IFBench 47.1% C 测量于 2026-07-01
IFBench 47.1% C 测量于 2026-07-01
Non-Hallucination 14.9% 测量于 2026-07-01
Omniscience Accuracy 17.9% 测量于 2026-07-01
SciCode 26.0% C 测量于 2026-07-01
Tau2 26.6% 测量于 2026-07-01
TerminalBench 3.0% 测量于 2026-07-01

效能指标

实测数据,由 Artificial Analysis 每 72 小时更新 — Artificial Analysis

首 Token 延迟 1.7s 测量于 2026-07-01
输出速度 91 t/s 测量于 2026-07-01
回应时间 7.2s 测量于 2026-07-01

用途分析

基于基准测试和官方资料整理的模型强项、缺点与适用场景

强项

  • 405B級性能70B成本 MMLU (CoT) 86.0%匹配405B,HumanEval 88.4%超過405B,MATH 77.0%超過405B。 基准测试
  • 卓越指令遵循 IFEval 92.1%,同類最佳,甚至優於405B(88.6%)。 基准测试

最适合

  • 生產企業應用 大規模部署的最佳價值——以70B成本和延遲實現405B質量。 官方
  • 指令遵循應用 92.1% IFEval分數——最適合代理系統、工具使用和結構化工作流。 基准测试

过去 90 天价格走势

输入 / 输出价格(USD per 1M tokens)

过去 90 天记录;每次价格变动会在此呈现

日期 维度 价格 (USD) 来源
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter
输出 $0.320 OpenRouter
输入 $0.100 OpenRouter

描述

The Meta Llama 3.3 multilingual large language model (LLM) is a pretrained and instruction tuned generative model in 70B (text in/text out). The Llama 3.3 instruction tuned text only model...

重点摘要

以下为本页面的关键数据,供快速参考与引用。

  • Meta: Llama 3.3 70B Instruct input 价格为 $0.1/M tokens
  • Meta: Llama 3.3 70B Instruct output 价格为 $0.32/M tokens
  • Context window:131,072 tokens
  • 提供商:Meta
  • 模型家族:Llama 3.3
  • 支持模态:文字
  • 数据来源:OpenRouter,每日自动更新