4月2日,阿里Qwen3.6-Plus正式上线OpenRouter,4月3日即登顶全球日榜,单日Token调用量1.4万亿,成为该平台有记录以来单模型单日处理量全球纪录持有者[1][2]。

OpenRouter是目前全球接入模型最多的AI API聚合平台,托管逾300个模型,每周处理超20万亿Token。Qwen3.6-Plus上线当天调用量激增711%,OpenRouter随即将其定性为"新模型发布的最强劲表现"[3]。

1.4万亿Token的规模:企业级重度任务在驱动

1.4万亿Token不是随机体验积出来的。OpenRouter上的高消耗场景以Agent工作流、代码生成、长文档处理为主,这类任务单次调用动辄数万Token。从调用曲线看,Qwen3.6-Plus的爆发来自企业用户和开发者在生产环境中的批量接入,而不是个人零散测试[4]。

说白了——这个数字背后是机器在调机器,不是人在聊天。

周榜前六全是中国模型,阿里包揽两席

4月6日公布的周榜数据(覆盖3月30日至4月5日):Qwen3.6 Plus免费版4.6万亿Token居榜首;小米MiMo-V2-Pro以3.08万亿Token居第二;Qwen3.6 Plus预览版以1.64万亿Token居第三[5][6]。阿里一家拿下前三中的两席。

紧随其后的第四至第六名依次是:Step 3.5 Flash(1.26万亿)、MiniMax M2.7(1.19万亿)、DeepSeek V3.2(1.19万亿)。前六名无一来自美国。

中国AI调用量连续5周碾压美国

同期全球LLM总调用量27万亿Token,周环比增18.9%。中国模型合计12.96万亿Token,周环比增31.48%;美国模型3.03万亿Token,周环比仅增0.76%[6]。两者之差超过四倍,且差距在扩大。

这是中国模型连续第5周在OpenRouter全球调用量上超过美国。中国模型占全平台总流量约48%,较2024年底的1.2%增长近40倍。

模型参数和定价

Qwen3.6-Plus支持100万Token上下文窗口,可一次性处理约75万字文本或完整代码库。Arena编程能力子榜单中,该模型全球排名第六、中国第一;阿里在编程类AI机构中全球排名第二,超过OpenAI、谷歌和xAI[7]。阿里云百炼平台定价:输入最低2元/百万Token。

为什么是Agent工作流在推高调用量

Qwen3.6-Plus针对Claude Code、Cline、OpenClaw、Qwen Code等6个主流Agent框架专项优化。企业和开发者部署自动化代码审查、多步骤工具调用、代码库级分析时,一个任务就是数十万Token的消耗。发布即爆发的调用量,本质上是这批用户在等一个能进生产的编码Agent模型[8]。

中国企业级大模型日调用量在2025年下半年增长263%(背景数据)。这次Qwen3.6-Plus的爆发,是那个趋势在2026年的一次具体落地。

OpenRouter下一期全球调用量周榜(覆盖4月6日至4月12日数据)预计4月13日至14日发布,届时可追踪Qwen3.6-Plus能否保持周冠、中国模型整体份额是否突破全平台50%。另一个可跟踪信号:阿里云百炼平台对企业用户的定价策略是否在周榜发布后出现调整。

信息来源