通义千问Qwen 2.5-Max超大规模MoE模型号称优于Deepseek V3等竞品

人阅读 2025-01-29 09:39:23快讯

1月29日消息，新年之际，阿里云公布了其全新的通义千问Qwen 2.5-Max超大规模MoE模型，大家可以通过API的方式进行访问，也可以登录Qwen Chat进行体验，例如直接与模型对话，或者使用artifacts、搜索等功能。

据介绍，通义千问Qwen 2.5-Max使用超过20万亿token的预训练数据及精心设计的后训练方案进行训练。

性能

阿里云直接对比了指令模型的性能表现（IT之家注：指令模型即我们平常使用的可以直接对话的模型）。对比对象包括 DeepSeek V3、GPT-4o 和 Claude-3.5-Sonnet，结果如下：

在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中，Qwen2.5-Max 的表现超越了 DeepSeek V3，同时在 MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩。

在基座模型的对比中，由于无法访问 GPT-4o 和 Claude-3.5-Sonnet 等闭源模型的基座模型，阿里云将 Qwen2.5-Max 与目前领先的开源 MoE 模型 DeepSeek V3、最大的开源稠密模型 Llama-3.1-405B，以及同样位列开源稠密模型前列的 Qwen2.5-72B 进行了对比。对比结果如下图所示：

我们的基座模型在大多数基准测试中都展现出了显著的优势。我们相信，随着后训练技术的不断进步，下一个版本的 Qwen2.5-Max 将会达到更高的水平。

大数据

5G

LoRa

NB-IoT

ML/机器学习

区块链

云计算

雾计算

机器人

边缘计算

智能家居

智能安防

智能工业

智能医疗

智能农业

智慧城市

智能交通

智能环保

车联网

移动互联

业界新闻

企业要闻

产业政策

AI智能

通义千问Qwen 2.5-Max超大规模MoE模型号称优于Deepseek V3等竞品

性能

栏目文章

最近发表

标签列表

Powered By LOT物联网 闽ICP备2024036174号-1

通义千问Qwen 2.5-Max超大规模MoE模型号称优于Deepseek V3等竞品

性能

热门推荐

栏目文章

最近发表

标签列表

Powered By LOT物联网 闽ICP备2024036174号-1

Powered By LOT物联网闽ICP备2024036174号-1