阿里云发布通义千问2.5，全面赶超GPT-4 Turbo-天辰平台注册-天辰登录【地址链接】

您现在的位置：天辰平台注册-天辰登录【地址链接】 > 新闻中心 > 阿里云发布通义千问2.5，全面赶超GPT-4 Turbo

资讯导航

阿里云发布通义千问2.5，全面赶超GPT-4 Turbo

作者：天辰平台发布于：2024-05-09 12:45:43 文字：【大】【中】【小】

摘要：通义大模型发布一周年之际，迎来重要的历史性时刻。5月9日，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4 Turbo，成为地表最强中文大模型。同时，通义千问1100亿参数开源模型在多个基准测评收获最佳成绩，超越Llama-3-70B，成为开源领域最强大模型。历经一年

通义大模型发布一周年之际，迎来重要的历史性时刻。5月9日，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4 Turbo，成为地表最强中文大模型。同时，通义千问1100亿参数开源模型在多个基准测评收获最佳成绩，超越Llama-3-70B，成为开源领域最强大模型。历经一年多追赶，国产大模型终于进入核心竞技场，可与国外一流大模型一较高下。奋力追赶一年，成就最强中文大模型大模型技术爆发一年多，行业竞争态势激烈而又多变。通义千问走了一条最“卷”的路，2023年4月问世以来，始终专注于基础模型的技术研发，从初代模型升级至2.5版本。相比此前的通义千问2.1版，通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%，中文能力更是持续领先业界。根据权威基准天辰平台OpenCompass的测评结果，通义千问2.5得分追平GPT-4 Turbo，是该基准首次录得国产大模型取得如此佳绩。同时，通义还发布了1100亿参数开源模型Qwen1.5-110B，该模型在MMLU、TheoremQA、GPQA等基准测评中超越Meta的Llama-3-70B，在HuggingFace开源大模型排行榜Open LLM Leaderboard上进入榜首，再度证明通义开源系列业界最强的天辰注册地址竞争力。通义多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中，通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V，这款模型已在多家企业落地；代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的榜首模型，也是国内用户规模第一的智能编码助手通义灵码的底座。从曾经的追赶者到如今的并行者，通义大模型频频霸榜，可以说是国产大模型一年来砥砺前行、奋力追赶的缩影。一年间，通义还发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力，企业客户和开发者可以通过API调用、模型下载等方式接入通义，个人用户可从APP、官网和小程序免费使用通义。大会当日，原通义千问APP宣布更名为“通义APP”，将通义大模型全套能力集于一身，致力于成为“通情达义”的全能AI助手。坚定开源路线，成为中国最强开源大模型去年8月，通义宣布加入开源行列，随之启动马不停蹄的开源狂飙，沿着“全模态、全尺寸”开源路线陆续推出十多款模型。目前，通义开源模型下载量已经超过700万。大模型的训练和迭代成本极高，绝大部分的AI开发者和中小企业都无法负担。Meta、阿里云等推动的大模型开源风潮，让开发者不必从头训练模型，还把模型选型的主动权交给了开发者，大大加速了大模型的应用落地进程。为顺应不同场景用户需求，通义推出参数规模横跨5亿到1100亿的八款大语言模型，小尺寸模型如0.5B、1.天辰平台注册登录地址8B、4B、7B、14B，可便捷地在手机、PC等端侧设备部署；大尺寸模型如72B、110B能支持企业级和科研级的应用；中等尺寸如32B试图在性能、效率和内存占用之间找到最具性价比的平衡点。此外，通义还开源了视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE。通义72B、110B开源模型都曾登顶Open LLM Leaderboard榜首。在开放研究机构LMSYS Org推出的基准测试平台Chatbot Arena上，通义72B模型多次进入“盲测”结果全球Top 10，创造了国产大模型的先例。

这是水淼·PHPWEB站群文章更新器的试用版本更新的文章，故有此标记(2024-05-09 12:45:46)

标签：天辰平台注册天辰平台注册天辰平台注册天辰平台注册天辰平台注册