评分

阿里开源最新多模态模型：Qwen2.5-VL-32B！比前代72B模型更聪明

8天前发布

2390

就在 DeepSeek V3「小版本更新」后的几个小时，阿里通义千问团队也开源了新模型。

对比近期开源的Mistral-Small-3.1-24B 、Gemma-3-27B-IT等， Qwen2.5-VL-32B在纯文本能力上也达到了同规模的SOTA表现。在多个基准上，Qwen2.5-VL-32B甚至超过了72B，同时支持本地部署并优化了数学推理能力。

于是就得到了网友的一致好评：

特别是在注重主观用户体验评估的 MM-MT-Bench 基准测试中，32B 模型相较于前代 Qwen2-VL-72B-Instruct 实现了显著进步。

视觉能力的进步，已经让用户们感受到了震撼：

除了在视觉能力上优秀，Qwen2.5-VL-32B-Instruct 在纯文本能力上也达到了同规模的最优表现。

关于「细粒度图像理解与推理」：我开着一辆卡车在这条路上行驶，现在是 12 点，我能在 13 点之前到达 110 公里外的地方吗？

Qwen2.5-VL-32B首先对时间、距离、卡车限速进行分析，然后叙述推算条理：

在复杂的数学推理方面也能完成任务：

依次类推，归纳出构造规律：

值得关注的是，Qwen2.5-VL-32B-Instruct 的本地部署能力通过MLX框架，用户可在 Apple Silicon 芯片设备上运行该模型，这对注重数据隐私的企业具有吸引力。

春节期间，DeepSeek就曾与阿里通义千问Qwen多次几乎同时发布新模型，而这一次又实现神仙联动了！

官网地址：https://qwenlm.github.io/zh/blog/qwen2.5-vl-32b

开源地址：https://huggingface.co/Qwen/Qwen2.5-VL-32B-Instruct

评分

欢迎为Ta评分