Meta 4月9日发布首个不开放模型权重的大模型 Muse Spark,打破了 Llama 系列自2023年以来的开源惯例。这是 Meta Superintelligence Labs 成立以来的第一个公开产品。

Muse Spark 已在 meta.ai 全平台上线,并向企业和开发者开放付费 API。Artificial Analysis Intelligence Index v4.0 综合评分52,全球第4,落后 GPT-5.4 和 Gemini 3.1 Pro Preview(均57分)以及 Claude Opus 4.6(53分)。

"思维压缩"将推理算力压至 Llama 4 Maverick 十分之一以下

Muse Spark 效率核心来自"思维压缩"(thought compression)强化学习训练:对推理 token 数量施加惩罚,迫使模型主动收缩思考链路,同等复杂任务的算力消耗降至 Llama 4 Maverick 的十分之一以下(官方公告)。

Artificial Analysis 完整测评中,Muse Spark 消耗5800万输出 token,Claude Opus 4.6 为1.57亿,GPT-5.4 为1.2亿。说白了,它用更少的"思考步骤"达到接近的结果。

综合排名第四,编程与抽象推理落后前三

Artificial Analysis Intelligence Index v4.0 中,Muse Spark 综合得分52,位列第四。前三名:Gemini 3.1 Pro Preview 57分、GPT-5.4 57分、Claude Opus 4.6 53分。编程任务和抽象推理两个维度,与前三名差距最明显。

你拆开看看——这不是全面落后,是结构性差距:效率已追上,但上限还差一截。

医疗推理一枝独秀:HealthBench Hard 42.8分超越全场

Muse Spark 是当前在 HealthBench Hard 医疗推理基准上超越全部竞品的唯一模型,得分42.8(Artificial Analysis 官方评测)。GPT-5.4 为40.1分,Gemini 3.1 Pro 为20.6分,Claude Opus 4.6 Max 为14.8分。

本质上,MSL 在医疗垂直方向押了重注——这也是 Muse Spark 目前绝对分值上唯一领先第一梯队的维度。

首次闭源,开源无时间表

Muse Spark 是 Meta 第一个封闭模型权重的产品。Meta 对外表示"未来考虑开源",截至4月9日未给出任何具体版本计划或日期。

当前接入路径:meta.ai 平台直接使用,以及面向企业和开发者的付费 API。

MSL九个月从头重构,Alexandr Wang 首次交卷

Muse Spark 由 MSL 历时九个月从头研发。MSL 于2025年通过143亿美元收购 Scale AI 49%股权后组建,Alexandr Wang 出任首席 AI 官。Muse Spark 是该团队首个公开交付成果。

Muse Spark 后续版本发布无公开日程。两个可跟踪信号:Artificial Analysis Intelligence Index 季度更新排行(当前 v4.0 版本),以及 meta.ai 付费 API 定价变动——定价调整通常早于版本升级出现。