AI 算力即服务

Token超市

聚合全球 20+ 主流大模型,统一 API 接入、智能路由、用量监控,让 AI 算力像水电一样随取随用

🧠

DeepSeek-V3.2

🔵 深度求索 55折
文本生成
输入 ¥0.002/千tok | 输出 ¥0.003/千tok | 缓存 ¥0.0002
🧠

DeepSeek-V4-pro

🏢 nan 99折
文本生成
输入 ¥0.012/千tok | 输出 ¥0.024/千tok | 缓存 ¥0.001
🧠

Deepseek-v4-flash

🏢 nan 99折
文本生成
输入 ¥0.001/千tok | 输出 ¥0.002/千tok | 缓存 ¥0.0002
🧠

Kimi-K2.5

🟣 月之暗面 80折
文本生成
输入 ¥0.004/千tok | 输出 ¥0.021/千tok | 缓存 ¥0.0007
🧠

kimi-k2.6

🏢 nan 85折
文本生成
输入 ¥0.0065/千tok | 输出 ¥0.027/千tok | 缓存 ¥0.0011
🧠

GLM-5

🟢 智谱 80折
文本生成
输入 ¥0.004/千tok | 输出 ¥32/千tok | 缓存 ¥32
🧠

GLM-5.1

🏢 nan 90折
文本生成
输入 ¥0.006/千tok | 输出 ¥32/千tok | 缓存 ¥32
🧠

Qwen3.5-Plus

🟠 阿里 50折
文本生成
缓存 ¥128
🧠

Qwen3.5-Flash

🏢 nan 50折
文本生成
缓存 ¥128
🧠

Qwen3.5-35B-A3B

🏢 nan 50折
文本生成
输入 输入不大于128K,0.0004 输入128K到256K,0.0016
🧠

Qwen3.5-27B

🏢 nan 50折
文本生成
输入 输入不大于128K,0.0006 输入128K到256K,0.0018
🧠

Qwen3.5-122B-A10B

🏢 nan 50折
文本生成
输入 输入不大于128K,0.0008 输入128K到256K,0.002
🧠

Qwen3.5-397B-A17B

🏢 nan 50折
文本生成
输入 输入不大于128K,0.0012 输入128K到256K,0.003
🧠

Qwen-3.6-Plus

🏢 nan 70折
文本生成
输入 输入不大于256K,0.002 输入256K到1M,0.008 | 缓存 ¥256
🧠

Qwen-3.6-Flash

🏢 nan 70折
文本生成
输入 输入不大于256K,0.0012 输入256K到1M,0.0048 | 缓存 ¥256
🧠

Qwen3.6-max-preview

🏢 nan 70折
文本生成
输入 输入不大于128K,0.009 输入128K到256K,0.015 | 缓存 ¥128
🧠

Qwen3.6-35B-A3B

🏢 nan 70折
文本生成
输入 ¥0.0018/千tok | 输出 ¥0.0108/千tok
🧠

Qwen3.6-27b

🏢 nan 70折
文本生成
输入 ¥0.003/千tok | 输出 ¥0.018/千tok
🧠

MiniMax-M2.5

🏢 nan 75折
文本生成
输入 ¥0.0021/千tok | 输出 ¥0.0084/千tok | 缓存 ¥0.0002
🧠

MiniMax-M2.7

🏢 nan 99折
文本生成
输入 ¥0.0021/千tok | 输出 ¥0.0084/千tok | 缓存 ¥0.0004
🧠

图片类

🏢 nan 95折
参考官网
🧠

claude-sonnet-4-5(C类)

💜 Anthropic 70折
文本生成
输入 ¥0.021/千tok | 输出 ¥0.105/千tok | 缓存 ¥0.0021
🧠

claude-sonnet-4-5(B类)

🏢 nan 85折
文本生成
输入 ¥0.021/千tok | 输出 ¥0.105/千tok | 缓存 ¥0.0021
🧠

claude-haiku-4-5(C类)

🏢 nan 70折
文本生成
输入 ¥0.007/千tok | 输出 ¥0.035/千tok | 缓存 ¥0.0007
🧠

claude-haiku-4-5(B类)

🏢 nan 85折
文本生成
输入 ¥0.007/千tok | 输出 ¥0.035/千tok | 缓存 ¥0.0007
🧠

claude-opus-4-6(C类)

🏢 nan 70折
文本生成
输入 ¥0.035/千tok | 输出 ¥0.175/千tok | 缓存 ¥0.0035
🧠

claude-opus-4-6(B类)

🏢 nan 85折
文本生成
输入 ¥0.035/千tok | 输出 ¥0.175/千tok | 缓存 ¥0.0035
🧠

claude-sonnet-4-6(C类)

🏢 nan 70折
文本生成
输入 ¥0.021/千tok | 输出 ¥0.105/千tok | 缓存 ¥0.0021
🧠

claude-sonnet-4-6(B类)

🏢 nan 85折
文本生成
输入 ¥0.021/千tok | 输出 ¥0.105/千tok | 缓存 ¥0.0021
🧠

claude-opus-4-5(C类)

🏢 nan 70折
文本生成
输入 ¥0.035/千tok | 输出 ¥0.175/千tok | 缓存 ¥0.0035
🧠

claude-opus-4-5(B类)

🏢 nan 85折
文本生成
输入 ¥0.035/千tok | 输出 ¥0.175/千tok | 缓存 ¥0.0035
🧠

claude-opus-4-7(C类)

🏢 nan 70折
文本生成
输入 ¥0.035/千tok | 输出 ¥0.175/千tok | 缓存 ¥0.0035
🧠

claude-opus-4-7(B类)

🏢 nan 85折
文本生成
输入 ¥0.035/千tok | 输出 ¥0.175/千tok | 缓存 ¥0.0035
🧠

gemini-3.1-pro-preview

🔷 Google 70折
文本生成
输入 不超过200K,0.014 超过200K,0.028 | 缓存 ¥200
🧠

gemini-2.5-flash

🏢 nan 70折
文本生成
输入 ¥0.0021/千tok | 输出 ¥0.0175/千tok | 缓存 ¥0.0002
🧠

gemini-2.5-flash-lite

🏢 nan 70折
文本生成
输入 ¥0.0007/千tok | 输出 ¥0.0028/千tok | 缓存 ¥7
🧠

gemini-2.5-pro

🏢 nan 70折
文本生成
输入 单次不超过200K,0.00875 单次大于200K,0.0175 | 缓存 ¥200
🧠

gemini-3-flash-preview

🏢 nan 70折
文本生成
输入 ¥0.0035/千tok | 输出 ¥0.021/千tok | 缓存 ¥0.0003
🧠

gpt-5.4

🏢 nan 70折
文本生成
输入 上下文小于272K,0.0175 大于272K,0.035 | 缓存 ¥272
🧠

gpt-5.4-mini

🏢 nan 70折
文本生成
输入 ¥0.0053/千tok | 输出 ¥0.0315/千tok | 缓存 ¥0.0005
🧠

Grok-4-1-fast

⚪ xAI 75折
文本生成
输入 ¥0.0014/千tok | 输出 ¥0.0035/千tok
🧠

grok-4-1-fast-non-reasoning

🏢 nan 75折
文本生成
输入 ¥0.0014/千tok | 输出 ¥0.0035/千tok
🧠

DeepSeek-V3.2(旗舰版)

🏢 nan 输入 95折
输入
输入 ¥2/千tok
🧠

DeepSeek-V3.1

🏢 nan 输入 30折
输入
输入 ¥4/千tok
🧠

DeepSeek-R1-0528

🏢 nan 输入 30折
输入
输入 ¥4/千tok
🧠

DeepSeek-R1

🏢 nan 输入 30折
输入
输入 ¥4/千tok
🧠

DeepSeek-V3-0324

🏢 nan 输入 30折
输入
输入 ¥2/千tok
🧠

DeepSeek-V3

🏢 nan 输入 30折
输入
输入 ¥2/千tok
🧠

DeepSeek-R1-Distill-Llama-70B

🏢 nan 输入 30折
输入
输入 ¥4.1/千tok
🧠

DeepSeek-R1-Distill-Qwen-32B

🏢 nan 输入 30折
输入
输入 ¥1.3/千tok
🧠

Qwen3.5-35B-A3B (输入≤128K)

🏢 Qwen系列 输入 45折
输入
输入 ¥0.4/千tok
🧠

Qwen3.5-35B-A3B (128K<输入≤256K)

🏢 nan 输入 45折
输入
输入 ¥1.6/千tok
🧠

Qwen3.5-122B-A10B (输入≤128K)

🏢 nan 输入 45折
输入
输入 ¥0.8/千tok
🧠

Qwen3.5-122B-A10B (128K<输入≤2..

🏢 nan 输入 45折
输入
输入 ¥2/千tok
🧠

Qwen3.5-397B-A17B(正式版) (输入≤1..

🏢 nan 输入 30折
输入
输入 ¥1.2/千tok
🧠

Qwen3.5-397B-A17B(正式版) (128K..

🏢 nan 输入 30折
输入
输入 ¥3/千tok
🧠

Qwen3-235B-A22B-Instruct-2507

🏢 nan 输入 30折
输入
输入 ¥2/千tok
🧠

Qwen3-Coder-480B-A35B-Instruct

🏢 nan 输入 30折
输入
输入 ¥8/千tok
🧠

Qwen3-235B-A22B

🏢 nan 输入 30折
输入
输入 ¥2.5/千tok
🧠

Qwen3-Next-80B-A3B-Instruct

🏢 nan 输入 45折
输入
输入 ¥1/千tok
🧠

Qwen3-30B-A3B

🏢 nan 输入 30折
输入
输入 ¥1/千tok
🧠

Qwen3-32B

🏢 nan 输入 30折
输入
输入 ¥1/千tok
🧠

Qwen3-14B

🏢 nan 输入 30折
输入
输入 ¥0.8/千tok
🧠

Qwen3-8B

🏢 nan 输入 30折
输入
输入 ¥0.3/千tok
🧠

Qwen3-4B

🏢 nan 输入 30折
输入
输入 ¥0.3/千tok
🧠

Qwen3-VL-235B-A22B-Instruct

🏢 nan 输入 30折
输入
输入 ¥2/千tok
🧠

Qwen3-VL-30B-A3B-Instruct

🏢 nan 输入 45折
输入
输入 ¥0.75/千tok
🧠

Qwen2.5-72B-Instruct

🏢 nan 输入 30折
输入
输入 ¥4.13/千tok
🧠

Qwen2.5-VL-72B-Instruct

🏢 nan 输入 30折
输入
输入 ¥4.13/千tok
🧠

Qwen-VL-Chat

🏢 nan 输入 30折
输入
输入 ¥0.8/千tok
🧠

GLM-5.1 (输入≤32K)

🟢 智谱 输入 75折
输入
输入 ¥6/千tok
🧠

GLM-5.1 (32K<输入≤200K)

🏢 nan 输入 75折
输入
输入 ¥8/千tok
🧠

GLM-5(正式版) (输入≤32K)

🏢 nan 输入 80折
输入
输入 ¥4/千tok
🧠

GLM-5(正式版) (32K<输入≤200K)

🏢 nan 输入 80折
输入
输入 ¥6/千tok
🧠

GLM4.6V (输入≤32K)

🏢 nan 输入 85折
输入
输入 ¥1/千tok
🧠

GLM4.6V (32K<输入≤200K)

🏢 nan 输入 85折
输入
输入 ¥2/千tok
🧠

Kimi-K2-Instruct

🏢 nan 输入 30折
输入
输入 ¥4/千tok
🧠

Kimi-K2-Thinking

🏢 nan 输入 30折
输入
输入 ¥4/千tok
🧠

DeepSeek-V3.1(批量)

☁️ 电信云 批量推理
批量推理
输入 ¥0.4/千tok
🧠

DeepSeek-R1-0528(批量)

☁️ 电信云 批量推理
批量推理
输入 ¥0.4/千tok
🧠

DeepSeek-R1(批量)

☁️ 电信云 批量推理
批量推理
输入 ¥0.4/千tok
🧠

DeepSeek-V3-0324(批量)

☁️ 电信云 批量推理
批量推理
输入 ¥0.2/千tok
🧠

DeepSeek-V3(批量)

☁️ 电信云 批量推理
批量推理
输入 ¥0.2/千tok
👁️

Doubao-Seed-2.0-pro

🔴 字节 深度思考、图片理 80折
深度思考、图片理解
输入 ¥0.0032/千tok | 输出 ¥32/千tok | 缓存 ¥32
👁️

Doubao-Seed-2.0-lite

🏢 nan 深度思考、图片理 80折
深度思考、图片理解
输入 ¥0.0006/千tok | 输出 ¥32/千tok | 缓存 ¥32
👁️

Doubao-Seed-2.0-mini

🏢 nan 深度思考、图片理 80折
深度思考、图片理解
输入 ¥0.0002/千tok | 输出 ¥32/千tok | 缓存 ¥32
👁️

Doubao-Seed-1.8

🏢 nan 深度思考、视频理 80折
深度思考、视频理解
输入 ¥0.0008/千tok | 输出 ¥32/千tok | 缓存 ¥32
💻

Doubao-Seed-2.0-Code

🏢 nan 智能编码 80折
智能编码
输入 ¥0.0032/千tok | 输出 ¥32/千tok | 缓存 ¥32
💻

gpt-5.3-codex

🟢 OpenAI 70折
文本生成
输入 ¥0.0123/千tok | 输出 ¥0.098/千tok
🎨

Doubao-Seedream-4.5

🏢 nan 图片生成 99折
图片生成
输入 ¥0.25/千tok
🎨

image-01

🩷 Minimax 图像生成 99折
图像生成
输入 ¥0.025/千tok
🎨

image-01-live

🏢 nan 图像生成 99折
图像生成
输入 ¥0.025/千tok
🎨

kling-v2-1

🏢 nan 图片生成 95折
图片生成
输入 参考官网
🎨

kling-v1-5

🏢 nan 图片生成 95折
图片生成
输入 参考官网
🎨

kling-v1

🏢 nan 图片生成 95折
图片生成
输入 参考官网
🎨

kling-image-01

🏢 nan 图片生成 95折
图片生成
输入 参考官网
🎨

kling-v2-new

🏢 nan 图片生成 95折
图片生成
输入 参考官网
🎨

kling-v2

🏢 nan 图片生成 95折
图片生成
输入 参考官网
🎨

gemini-3.1-flash-image-preview

🏢 nan 图片生成 70折
图片生成
输入 512px:0.315 1k:0.469 2k:0.749 4k:1.057
🎨

gemini-2.5-flash-image (nano..

🏢 nan 图片生成 95折
图片生成
输入 ¥0.273/千tok
🎨

gemini-3-pro-image-preview

🏢 nan 图片生成 95折
图片生成
输入 ¥1/千tok
🎬

Doubao-Seedance-1.5-pro

🏢 nan 视觉模型、视频生 80折
视觉模型、视频生成
输入 ¥0.016/千tok
🎬

MiniMax Hailuo 2.3 Fast,768P..

🏢 nan 图生视频 65折
图生视频
输入 ¥1.35/千tok
🎬

MiniMax Hailuo 2.3 Fast,768P..

🏢 nan 图生视频 65折
图生视频
输入 ¥2.25/千tok
🎬

MiniMax Hailuo 2.3 Fast,1080..

🏢 nan 图生视频 65折
图生视频
输入 ¥2.31/千tok
🎬

MiniMax Hailuo 2.3 ,768P*6S

🏢 nan 文生视频,图生视 65折
文生视频,图生视频
输入 ¥2/千tok
🎬

MiniMax Hailuo 2.3 ,768P*10S

🏢 nan 文生视频,图生视 65折
文生视频,图生视频
输入 ¥4/千tok
🎬

MiniMax Hailuo 2.3 ,1080P*6S

🏢 nan 文生视频,图生视 65折
文生视频,图生视频
输入 ¥3.5/千tok
🎬

ViduQ2

🟡 北京生数科技 视频生成 85折
视频生成
输入 ¥0.0312/千tok
🎬

ViduQ2-Pro

🏢 nan 视频生成 85折
视频生成
输入 ¥0.0312/千tok
🎬

ViduQ2-Turbo

🏢 nan 视频生成 85折
视频生成
输入 ¥0.0312/千tok
🎬

Kling-V3-Omni

⚫ 快手 视频生成 99折
视频生成
输入 参考官网
🎬

Kling-Video-O1

🏢 nan 视频生成 99折
视频生成
输入 参考官网
🎬

Kling-V3

🏢 nan 视频生成 99折
视频生成
输入 参考官网
🎬

Kling-V2-6

🏢 nan 视频生成 99折
视频生成
输入 参考官网
🎬

Kling-V2-5-Turbo

🏢 nan 视频生成 99折
视频生成
输入 参考官网
🎬

Kling-V2-1-Master

🏢 nan 视频生成 99折
视频生成
输入 参考官网
🎬

Kling-V2-Master

🏢 nan 视频生成 99折
视频生成
输入 参考官网
🎬

Kling-V1-6

🏢 nan 视频生成 99折
视频生成
输入 参考官网
📊

BGE-m3

📐 向量模型 输入 30折
输入
输入 ¥0.5/千tok
📊

BGE-Reranker-Large

🔄 重排序模型 输入 30折
输入
输入 ¥0.5/千tok
📊

BGE-Reranker-V2-m3

🏢 nan 输入 30折
输入
输入 ¥0.07/千tok
📊

BGE-m3(批量)

☁️ 电信云 批量推理
批量推理
输入 ¥0.05/千tok
为什么选择我们

Token超市核心优势

统一 API 接入 一次开发 · 多模型切换零成本 88%接口兼容率 <50ms平均延迟 99.9%可用性 SLA

统一 API 接入

一套 SDK 覆盖 20+ 主流模型,OpenAI 兼容协议无缝切换,业务代码无需修改即可替换底层模型。

智能路由调度 自动选择最优模型与节点 ROUTER

智能路由调度

根据任务类型自动匹配最佳模型,结合成本、延迟、质量三维决策引擎,实现性能与成本的完美平衡。

用量监控中心 分钟级账单 · 成本透明可控 MonTueWedThuFriSat

实时用量监控

分钟级 Token 用量追踪,可视化仪表盘展示各模型消耗趋势,预算预警与成本优化建议一键触达。

成本智能优化 基于使用模式的降本策略 优化前 ¥12,400 优化后 ¥7,280 节省 41%

成本智能优化

基于历史使用模式自动推荐最优定价方案,智能缓存与批处理策略帮助企业平均降低 30%-50% 的 Token 成本。

立即开启 AI 算力之旅

注册即送 100 万免费 Token 额度,体验全球主流大模型的一站式接入