678CHAT AI资讯 阶跃星辰开放日:聊聊多模态AI和Agent落地那些事儿

阶跃星辰开放日:聊聊多模态AI和Agent落地那些事儿

2025年2月21日,备受瞩目的“AI六小虎”之一阶跃星辰在生态开放日上,向外界展示了其在模型领域的最新成果。此次开放日不仅聚焦了阶跃星辰对AGI(通用人工智能)的深入探索,更透露出其在面对行业竞争对手DeepSeek时的独特应对策略。

阶跃星辰开放日:聊聊多模态AI和Agent落地那些事儿插图

回顾2024年,阶跃星辰无疑是模型领域的一颗耀眼新星。这家成立时间相对较短的公司,在短短一年内便推出了11款模型,涵盖语言、语音、视觉和推理等多种模态,展现出强大的技术实力和发展潜力。

阶跃星辰的快速崛起与其明确的AGI发展路线密不可分。公司CEO姜大昕曾多次强调,自公司成立之初,便已确定了从单模态到多模态,再到多模理解和生成的统一,最终实现世界模型和AGI的发展路径。

2024年,阶跃星辰在多模态领域取得了令人瞩目的进展。然而,在迈向“多模态理解和生成的统一”这一关键阶段之前,阶跃星辰不得不面对来自DeepSeek的挑战。

2024年,DeepSeek的出现无疑给大模型赛道带来了巨大的冲击。一方面,DeepSeek率先发起价格战,将大模型的价格降至1元/百万tokens,极大地压缩了行业的利润空间;另一方面,其开源推理模型DeepSeek R1引发了行业对Scaling Law的深刻反思。

许多业内人士认为,DeepSeek的崛起对“AI六小虎”产生了深远的影响。R1等高性能模型的开源,给闭源模型的商业化带来了前所未有的挑战。同时,R1采用的低投入强化学习训练模式,也让人们对“AI六小虎”长期以来的高估值和烧钱模式产生了更多质疑。

阶跃星辰开放日:聊聊多模态AI和Agent落地那些事儿插图1

如何应对DeepSeek的挑战,成为“AI六小虎”亟待解决的重要课题。降低模型API业务的重要性,转向C端市场,成为这些企业共同的选择。例如,MiniMax缩减了To B团队规模,并将DeepSeek R1接入了自己的AI助手平台,试图通过整合资源来提升竞争力。

而阶跃星辰则选择了以开源的方式积极应对。虽然没有直接与DeepSeek展开正面竞争,但在DeepSeek R1发布后,阶跃星辰迅速开源了两款模型,这一举措被视为其捍卫技术地位的有力回应。值得关注的是,阶跃星辰开源的是多模态模型,这与专注于文本模型的DeepSeek形成了鲜明的差异化竞争。

其中一款开源模型是拥有300亿参数的图生视频模型Step-Video-T2V,目前是全球参数量最大的同类模型。另一款则是拥有1300亿参数的语音交互模型Step-Audio。姜大昕透露,阶跃星辰计划在2025年3月再次开源一款图生视频模型,进一步巩固其在多模态领域的领先地位。

在开放日上,阶跃星辰还宣布了一个重要的技术突破:与清华大学合作研发了Open-Reasoner-Zero,这是首个直接从预训练模型进行大规模强化学习的开源推理模型,其效率是DeepSeek-R1-Zero的25倍。这一成果不仅展示了阶跃星辰在技术上的领先地位,也为其未来的AGI发展奠定了坚实的基础。

姜大昕还透露,公司正在推进一个视觉推理模型项目。该模型能够实现视觉空间下的“慢思考”,即能够理解路线图并回答“沿着箭头走,最终目的地是什么”这类复杂问题。这表明阶跃星辰在多模态推理领域已经取得了显著的进展。

阶跃星辰对AI Agent的落地应用也充满信心。姜大昕认为,2025年将是Agent的爆发年,其关键因素在于多模态和长思维链推理在2024年都取得了显著进展。阶跃星辰对Agent采取了直接落地的策略,并将其分为垂类Agent和智能终端Agent两大类。在垂类领域,阶跃星辰与财联社合作研发了财经金融信息助手“AI小财神”;在智能终端领域,阶跃星辰的Agent已经接入了吉利汽车、OPPO、乐森机器人等终端厂商的产品中,展现出强大的市场应用潜力。

阶跃星辰开放日:聊聊多模态AI和Agent落地那些事儿插图2

值得一提的是,“AI四小龙”之一旷视科技的创始人印奇,以自动驾驶公司“千里科技”董事长的身份出席了本次生态日的圆桌论坛。他认为,目前最成功的AI产品仍然是特斯拉和抖音,但大模型的崛起将为应用带来更大的市场空间。印奇的这一观点也为阶跃星辰的未来发展提供了新的思路和方向。

本文来自网络,不代表678CHAT立场,转载请注明出处:https://www.678chat.com/ai/10029.html

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部