Qwen3-VL以13.5分打破空间推理纪录，3D感知能力跃升

AI快讯 5个月前 AI助手

122 0 0

阿里千问新一代视觉模型Qwen3-VL在权威空间推理评测SpatialBench中以13.5分位居榜首，领先谷歌 Gemini 3.0 Pro与GPT-5.1，逼近人类水平。该榜单涵盖2D/3D结构理解、路径规划等复杂任务，被视为具身智能的关键指标。Qwen3-VL新增旋转框与深度估计能力，遮挡场景识别准确率提升18%，支持草图或短视频生成可执行代码，并推出多规格模型，其中32项测试平均领先Gemini 2.5 Pro达6.4分。Qwen2.5-VL已开源，Qwen3-VL将于2025年第二季度开源，目前已在物流、AR装配等场景试点，定位精度低于2厘米。