🏆 单赛道开源冠军模型
每个垂直能力域选取性能排名第一的开源模型 —— 不做通用覆盖,只做赛道冠军。 官方有 API 的我们降价 60-70%,官方只开源权重的我们做唯一商业 API 提供商。
16
冠军赛道
6
大类覆盖
6
唯一API提供商
60-70%
平均比官方便宜
大语言模型
| 赛道 | 冠军模型 | 核心能力 | 与第二名差距 | 官方价格 | TokenWorks | 优势 |
|---|---|---|---|---|---|---|
| 综合对话 | DeepSeek V4 Pro DeepSeek · 671B MoE (37B激活) | 多语言比肩GPT-4o,中文超越。128K上下文,训练成本仅$5.6M。HF 430万下载 | 超Qwen3-235B约12%综合分 | 0.025元/百万token | 0.010元/百万token | ↓60% + 无排队 |
| 推理 | DeepSeek R1 DeepSeek · 671B MoE | 强化学习驱动思维链,13,379 HF likes 全球最高。MATH超GPT-4,AIME竞赛级 | 超QwQ-32B约35%推理分 | 0.10元/百万token | 0.040元/百万token | ↓60% + 不限制推理步数 |
| 代码 | Qwen3-Coder-480B 阿里通义 · 480B MoE (35B激活) | Codeforces Elite级。40+编程语言,代码补全+Debug+代码审查一体化。151万HF下载 | 超DeepSeek Coder V2约18% HumanEval | 2.00元/百万token | 0.80元/百万token | ↓60% + 无并发上限 |
视觉生成
| 赛道 | 冠军模型 | 核心能力 | 与第二名差距 | 官方价格 | TokenWorks | 优势 |
|---|---|---|---|---|---|---|
| 图像生成 | FLUX.1-dev Black Forest Labs · 120亿 DiT | 13,115 HF likes 历史最高。写实/艺术/文字渲染全面超越SD3。原生ControlNet+LoRA | 超SD3.5约28%人类偏好胜率 | $0.04/张 (≈0.28元) | 0.08元/张 | ↓71% + 秒出图,不排队 |
| 视频生成 | Wan2.2 阿里通义万相 · — | ComfyUI原生,312万HF下载。文生视频+图生视频+视频续写。5秒1080P | 超SVD约40% FVD指标 | 3.0元/5秒视频 | 1.0元/5秒 | ↓67% + 不限生成次数 |
| 3D生成 | TripoSR Stability AI · — | 14.9万HF下载。单张RGB→3D模型 <1秒。OBJ+纹理输出,直导Blender | 超TripoSG约35% Chamfer距离 | ⛔ 无官方API | 1.0元/模型 | 🏆 TokenWorks唯一封装商 |
| 图像超分 | Real-ESRGAN 腾讯ARC · — | 盲超分事实标准。4x放大+去噪+去JPEG伪影。动漫/写实双模式+人脸增强 | 无竞品(标准制定者) | ⛔ 无官方API | 0.02元/张 | 🏆 TokenWorks唯一封装商 |
语音
| 赛道 | 冠军模型 | 核心能力 | 与第二名差距 | 官方价格 | TokenWorks | 优势 |
|---|---|---|---|---|---|---|
| 语音合成 TTS | Kokoro-82M + Fish Speech hexgrad / Fish Audio · 82M / — | 双引擎互补:Kokoro 1319万下载82种声音;Fish Speech 30,720⭐零样本声音克隆 | Kokoro下载量超Bark 26倍 | Fish: 1.5元/千字 | 0.50元/千字 | ↓67% + 双引擎自动选优 + 声音克隆免费 |
| 语音识别 STT | Whisper Large V3 OpenAI · 1.55B | 794万HF下载。99种语言,Turbo版<300ms实时识别。Robust WER业界最低 | 超SpeechT5约45% WER | $0.006/分钟 (≈0.042元) | 0.015元/分钟 | ↓64% + 免费送说话人日志 |
| 音乐生成 | MusicGen-Large Meta · 33亿 | 文生音乐+旋律条件生成。古典/电子/爵士/流行10+风格。最长30秒专业级音频 | 唯一成熟的开源音乐生成模型 | ⛔ 无官方API | 0.50元/首 | 🏆 TokenWorks唯一封装商:文字→音乐+封面 |
视觉理解
| 赛道 | 冠军模型 | 核心能力 | 与第二名差距 | 官方价格 | TokenWorks | 优势 |
|---|---|---|---|---|---|---|
| 多模态视觉 | Qwen3-VL-8B 阿里通义 · 8B | 769万HF下载。图文+视频+OCR三合一。1M上下文,可"读"数百页PDF | 超LLaVA 1.5约32%综合Bench | 3.0元/百万token | 1.0元/百万token | ↓67% + 免费送视频帧分析 |
| 文档OCR | GOT-OCR2.0 阶跃星辰 · — | 23.8万下载。中英文OCR最强。手写/印章/数学公式/乐谱。端到端无需分步 | 超PaddleOCR约25%识别率 | 2.0元/千页 | 0.60元/千页 | ↓70% + 带格式还原(表格+排版) |
| 深度估计 | Depth-Anything V2 港中文/腾讯 · — | 7.4万下载。单目→深度图。全场景通用。指标AbsRel=0.051 SOTA | 超MiDaS约18% AbsRel | ⛔ 无官方API | 0.03元/张 | 🏆 TokenWorks唯一封装商 |
文本处理
| 赛道 | 冠军模型 | 核心能力 | 与第二名差距 | 官方价格 | TokenWorks | 优势 |
|---|---|---|---|---|---|---|
| 翻译 | NLLB-200 Meta · 33亿 | 93万下载。200种语言全覆盖。斯瓦西里/豪萨/老挝等低资源语言质量超谷歌翻译 | 超MADLAD-400约15%低资源BLEU | ⛔ 无官方API | 0.01元/千字 | 🏆 TokenWorks唯一封装商:低资源语言场景不可替代 |
| 嵌入向量 | Qwen3-Embedding-0.6B 阿里通义 · 0.6B | 859万HF下载,仅0.6B体量。32K上下文嵌入。MTEB中文第一,多语言前三。单卡<10ms | 超Jina V3约8%中文MTEB | 0.50元/百万token | 0.15元/百万token | ↓70% + 延迟<10ms |
地理空间
| 赛道 | 冠军模型 | 核心能力 | 与第二名差距 | 官方价格 | TokenWorks | 优势 |
|---|---|---|---|---|---|---|
| 遥感/地理 | Prithvi IBM + NASA · 1亿 | 卫星图像分类+洪水映射+作物分类+野火检测。HLS Sentinel-2/Landsat训练 | 唯一成体系的开源地理AI | ⛔ 无官方API | 0.50元/平方公里 | 🏆 TokenWorks唯一封装商:IBM+NASA纯学术,我们首创商业API |
6 大赛道,TokenWorks 是唯一商业 API 提供商
Real-ESRGAN · MusicGen · Depth-Anything · NLLB-200 · Prithvi · TripoSR
官方只开源权重不开 API,我们把这些学术成果变成了可调用的商业服务