近日,基准测试平台Chatbot Arena发布了最新的大模型盲测排名。10天前发布的阿里通义千问开源模型Qwen2.5再次闯入全球十强,其Qwen2.5-72B-Instruct大语言模型在榜单中位列第十,是前十名中唯一的中国模型。此外,通义千问的视觉语言模型Qwen2-VL-72B-Instruct排名第九,是得分最高的开源大模型。
Qwen2.5-72B-Instruct排名Chatbot Arena大语言模型榜单第十
与此同时,基于Qwen系列的衍生模型在全球开源社区中的数量已突破7.43万,超过了Llama系列的7.28万,成为全球最大的生成式语言模型家族。在Hugging Face社区的开源模型排行榜Open LLM Leaderboard上,Qwen系列及其衍生模型包揽了前十全部座次。
Chatbot Arena由开放研究机构LMSYS Org推出,是目前全球顶尖的大模型测试平台。平台目前集成了全球70多个大模型,采用匿名方式将大模型两两组队,交给用户进行盲测,用户根据真实对话体验对模型能力进行投票。(袁宁)
来源: 网易科技报道