Qwen3.5 小模型全系列亮相！ 9B 成绩近 GPT-OSS-120B

现在 AI 不只是大模型越来越强，小模型也逐渐拉近距离，稍早阿里巴巴正式推出全新 Qwen3.5 小模型全系列，让不少人都惊艳，连马斯克本人都在下方留言称赞「智慧密度惊人」。这次新模型的重点在「更多智能、更少运算」，其中90亿参数的Qwen3.5-9B模型在多项第三方基准测试中，接近甚至超越参数为13倍以上的OpenAI GPT-OSS-120B模型，即便在一般的笔记本也能顺畅运行。

这次推出的 Qwen 3.5 小模型系列共有四款开放权重模型，分别为：

Qwen3.5-0.8B（8 亿参数）
Qwen3.5-2B（20 亿参数）
Qwen3.5-4B（40 亿参数）
Qwen3.5-9B（90 亿参数）

技术层面部分，Qwen3.5系列采用混合注意力架构，结合Gated DeltaNet线性注意力机制与Gated Attention，每8个区块中以3：1比例交替使用，能有效提升推理吞吐量并降低内存消耗。更重要是，这四款模型皆为原生支持多模态，能同处理文字、图片和视频。原生上下文长度为 262,144 个 tokens，4B 和 9B 可扩充到 1,010,000 tokens。

也具备 Agent 能力，原生支持工具呼叫、多轮思考模式与视觉代理任务，如：桌面作、文件解析或自主程式码生成，经强化学习优化后适合建构轻量级智能代理。

在实际性能测试部分，Qwen3.5-9B 可说表现突出。

研究生级科学推理基准的GPQA Diamond，9B得分为81.7，高于GPT-OSS-120B的80.1，多语言知识基准MMMLU达81.2也同样领先。视觉推理部分，MMMU-Pro 得分 70.1，超越 Gemini 2.5 Flash-Lite（59.7）与前代 Qwen3-VL-30B-A3B（63.0）;视频理解 Video-MME（含字幕）得分 84.5;数学基准 HMMT 得分 83.2;文件处理 OmniDocBench 得分 87.7：