阿里开源最新多模态模型:Qwen2.5-VL-32B!比前代72B模型更聪明_AI资讯AI圈子_AI项目侠

阿里开源最新多模态模型:Qwen2.5-VL-32B!比前代72B模型更聪明

就在 DeepSeek V3「小版本更新」后的几个小时,阿里通义千问团队也开源了新模型。
对比近期开源的Mistral-Small-3.1-24B 、Gemma-3-27B-IT等, Qwen2.5-VL-32B在纯文本能力上也达到了同规模的SOTA表现。在多个基准上,Qwen2.5-VL-32B甚至超过了72B,同时支持本地部署并优化了数学推理能力。
于是就得到了网友的一致好评:
特别是在注重主观用户体验评估的 MM-MT-Bench 基准测试中,32B 模型相较于前代 Qwen2-VL-72B-Instruct 实现了显著进步。
视觉能力的进步,已经让用户们感受到了震撼:
除了在视觉能力上优秀,Qwen2.5-VL-32B-Instruct 在纯文本能力上也达到了同规模的最优表现。
关于「细粒度图像理解与推理」:我开着一辆卡车在这条路上行驶,现在是 12 点,我能在 13 点之前到达 110 公里外的地方吗?
Qwen2.5-VL-32B首先对时间、距离、卡车限速进行分析,然后叙述推算条理:
在复杂的数学推理方面也能完成任务:
依次类推,归纳出构造规律:
值得关注的是,Qwen2.5-VL-32B-Instruct 的本地部署能力通过MLX框架,用户可在 Apple Silicon 芯片设备上运行该模型,这对注重数据隐私的企业具有吸引力。
春节期间,DeepSeek就曾与阿里通义千问Qwen多次几乎同时发布新模型,而这一次又实现神仙联动了!
官网地址:https://qwenlm.github.io/zh/blog/qwen2.5-vl-32b
开源地址:https://huggingface.co/Qwen/Qwen2.5-VL-32B-Instruct
请登录后发表评论

    没有回复内容