在今日举办的2024云栖科技盛会上,阿里云的首席技术官周靖人向全球发布了通义千问的最新力作——开源模型Qwen2.5。这款旗舰产品Qwen2.5-72B,以其卓越的性能,被宣称超越了Llama 405B,成为业界瞩目的焦点。
Qwen2.5系列模型以其全面性著称,不仅包括了不同规模的大型语言模型,还涵盖了多模态模型、数学模型以及代码模型。每种规模的模型均提供了基础版、指令响应版和量化版,总计推出了超过100种不同的模型版本,以满足不同用户的需求。
-
Qwen2.5语言模型:提供了从0.5B到72B不等的多种规模选择;
-
Qwen2.5-Coder编程模型:包括1.5B、7B,以及即将面市的32B版本;
-
Qwen2.5-Math数学模型:同样提供了1.5B、7B和72B三种规模。
值得注意的是,除了3B和72B这两个版本外,通义千问的所有开源模型均采用了Apache 2.0许可证,确保了用户可以在Hugging Face的官方仓库中轻松获取许可证文件。
此外,通义千问还通过Model Studio平台,为用户带来了旗舰语言模型Qwen-Plus和Qwen-Turbo的API接口,同时开源了性能较上个月版本有所提升的Qwen2-VL-72B。
据阿里云官方数据透露,截至2024年9月中旬,通义千问的开源模型累计下载量已经突破了4000万大关,紧随Llama之后,成为了全球范围内备受瞩目的模型群之一。
在2024云栖大会上,阿里云还宣布了一个令人振奋的消息:通义千问推荐模型将进行全面降价,最高降幅可能达到惊人的85%,这一举措无疑将进一步推动开源模型的普及和应用。