在12月SuperCLUE-VLM多模态视觉语言测评中,谷歌Gemini-3-pro以83.64分位列第一,三项核心指标全面领先;国产模型表现亮眼,商汤SenseNova V6.5Pro(75.35分)和字节豆包视觉版(73.15分)分列第二、第三,百度ERNIE-5.0-Preview与阿里Qwen3-vl进入前五,后者成为首个总分超70分的开源模型。相较之下,OpenAI的GPT-5.2(high)仅获69.16分,跌出第一梯队。
本次测评反映出全球多模态AI竞争加剧,中国厂商在视觉理解领域实现快速追赶,开源模型也取得关键突破。
本文内容由开放的智能模型自动生成,仅供参考。