阿里巴巴通义实验室正式开源新一代端到端语音交互大模型Fun-Audio-Chat-8B,支持超低延迟语音对话,具备情感识别与多任务语音指令执行能力,性能在同规模模型中领先,部分指标可媲美GPT-4o Audio等闭源系统。该模型采用双分辨率架构,GPU资源消耗降低近50%,适用于智能客服、情感陪伴、设备控制等场景,并提供完整代码与权重,开发者可通过GitHub等平台免费获取。
此次开源大幅降低语音AI开发门槛,推动行业迈向高情商人机交互新阶段。
本文内容由开放的智能模型自动生成,仅供参考。