欢迎来到我的专栏,这已经是我撰写的第352篇文章了。在之前的讨论中,我曾提及小模型SLM的发展前景,如今这一领域正迎来新的突破。
小模型SLM,可以说是大模型LLM的“袖珍版”。它们虽然体积小,但功能强大。与那些需要数百万甚至数十亿参数的大型模型如GPT-4相比,SLM的运行更为简便。这些经过优化的小模型能够高效地处理简单任务,而不会消耗过多的计算资源。
目前,小模型正迅速向产业应用迈进,它们不再是实验室里的试验品,而是成为了各行各业的新动力。
科技巨头们也看到了小模型的巨大潜力,纷纷投身于这场未来之战。
微软、谷歌和苹果等公司都在小模型SLM领域布局,比如微软的Phi-3、谷歌的Gemma和苹果的Foundation Models。
最近,微软推出了专门针对工业领域的新型AI小模型。
通过与拜耳、罗克韦尔自动化、西门子等企业的合作,这些小模型利用行业特定数据进行预训练,以解决关键问题。这就像是为每个行业量身打造了一套“智能装备”,让AI的力量渗透到每一个生产环节,提升效率、优化流程、创造价值。
在这篇文章中,我们将深入探讨小模型在工业应用中的最新进展,以及它们面临的机遇和挑战。
小模型与AI代理:新趋势?
首先,我们需要明确大模型与小模型之间的区别。小模型之所以“小”,不仅因为参数数量少,更因为它们常在小型数据集上进行微调,以优化特定任务的性能,更好地适应业务流程的需求。
小模型擅长处理特定任务和工作流程。尽管参数有限,但通过针对特定领域任务的定制数据集微调,小模型完全能够超越大型通用模型。针对特定任务的训练可以减少幻觉现象,增强解决问题的能力。
资源效率是小型语言模型的一大优势,对于希望在各种平台和设备上实施AI解决方案的企业来说,它们特别吸引人。小模型使企业能够以更简单的基础架构和更低的成本,充分利用AI的优势。据估计,小模型可以节省高达75%的模型训练成本和超过50%的总部署成本。
在小模型的基础上,我们可以探索许多新的可能性。
一些公司将小模型应用于AI代理工作流中,多个小模型通过通信和协作来执行更复杂的任务。
例如,在AI代理工作流中,第一个AI代理可能负责规划任务的解决方案,第二个AI代理进行必要的研究,第三个AI代理执行计划,第四个AI代理验证和评估结果。这种协作方式展示了这些模型如何协同工作,提高生产力并实现更复杂的结果。
在这里,我将解释什么是AI智能代理。
AI代理的官方定义是一种能够感知环境、做出决策和执行动作的智能体。
简而言之,ChatGPT不属于AI代理,但战胜李世石的AlphaGo可以被视为AI代理。
目前,我们与AI的互动主要是输入指令,AI模型根据指令内容做出响应,这意味着我们需要提供有效的提示词才能达到预期效果。
而AI代理则不同,它被设计为具有独立思考和行动能力的AI程序。我们只需要提供一个目标,比如编写一个游戏或开发一个网页,AI代理就会自主生成任务序列并开始工作。
让我们通过几个例子来更深入地理解AI代理。
一个初级的AI代理可能是家中的空调自动控制系统。它遵循简单的“如果-那么”原则运行:如果温度低于设定点,则打开空调暖风;如果温度高于设定点,则关闭空调暖风。这种基础的AI代理虽然简单,但在日常生活中已经发挥了重要作用。
而高级的AI代理,如DeepMind的AlphaGo,是专为复杂的围棋而设计的人工智能系统。AlphaGo展示了非凡的学习能力,最终击败了世界冠军围棋选手。这一里程碑式的事件,彰显了AI代理在处理复杂任务方面的巨大潜力。
就像俄罗斯套娃一样,多个初级和高级的AI代理可以建立起分层代理系统。
分层代理是一种将复杂任务分解为更简单的子任务,并以分层结构组织起来的AI系统。这种方法允许代理管理不同级别的抽象,更有效地处理复杂问题。
分层代理的一个典型例子是亚马逊Amazon Go商店的“Just Walk Out”技术。该系统在运作中表现出了清晰的层级结构:
顶层:整体商店管理和库存跟踪
中级:客户跟踪和行为分析
低级:产品识别和交互检测
最低级别:传感器数据处理和融合
依靠这些AI代理的协同工作,Amazon Go以“不用排队,拿了就走”的全新购物体验,在零售行业和科技圈吸引了无数目光。
上述案例只是冰山一角,AI代理在实际应用中的想象力正在被激发。
小模型与Copilot覆盖超100家公司12万用户
在了解了小模型与AI代理的概况后,让我们一起探索微软与工业企业的最新合作。
本次尝试微软小模型的企业包括拜耳、罗克韦尔自动化、西门子、Sight Machine等。
以罗克韦尔自动化为例,该公司从操作层面开始尝试应用小模型。在人机界面可视化平台FactoryTalk Optix的食品和饮料版本中,他们运用小模型,将行业特定功能的优势带给制造业一线工人,支持食品和饮料领域的资产故障排除。AI模型为工厂车间工人和工程师提供关于特定制造流程、机器和输入的实时建议、解释和知识。
另一款产品FactoryTalk Design Studio是罗克韦尔自动化专注于系统设计的云原生软件,它使用Copilot增强了PLC代码创建和用户管理。工程师能够使用自然语言提示执行产品指导、代码生成、故障排除和代码解释等任务,使系统设计更快、更直观。
同样,西门子正在为CAD解决方案NX X软件引入全新的Copilot。该软件利用经过调整的AI模型,使用户能够通过自然语言提问、获取详细的技术见解并简化复杂的设计任务,实现更快、更智能的产品开发。
目前,包括舍弗勒和蒂森克虏伯自动化工程在内的100多家公司正在使用西门子工业Copilot来简化流程、解决劳动力短缺问题并推动创新。12万名西门子工程软件用户,现在有机会通过生成式AI驱动的助手来提升工作效率。
作为敢于吃螃蟹的用户,蒂森克虏伯自动化工程公司是首家使用Copilot的公司,并且计划从2025年初开始,在该公司的全球体系内普及应用。
根据实践,工程师现在可以在30秒内创建可视化面板,并生成代码,根据经验这些代码仅需20%左右的调整就可以直接应用。这简化了工作流程,减少了人工工作量,解决了熟练劳动力短缺的问题。
就具体场景而言,蒂森克虏伯使用AI辅助开发用于生产汽车电池的自动化系统。例如在一台电池质量的检测装置中,传感器、摄像头和测量系统集成在一起,监控多个阶段的电池单元质量,进行复杂的评估以检测超出设定阈值的放电。Copilot通过自动执行多个任务,如数据管理、传感器配置、电池质量检测等各个重复性步骤,辅助操作员增强了该设备的运行效果。
Copilot:工业生成式AI的现实角色
在工业领域,“想到”和“做到”完全是两码事,生成式AI的工业价值尚需被验证。
古人云“欲得其利、先知其弊”,要充分发挥小模型的优势,就必须了解它的局限性。
生成式AI的弊端在于可靠性较低,具有不可解释性,只能应用于对可靠性要求不高的场合。
小模型的缺点则是精度有限,无法捕捉大规模和复杂数据集中的细致特征和关系,预测能力相对较弱;此外,它们难以应对复杂问题。这些弊端决定了小模型只能承担辅助思考的角色,为我们提供更多可行性方案作为选择,而最终决策仍需由人来做。
在实际应用过程中,也是挑战重重。
工业领域广泛使用AI的最大障碍是数据的缺失。由于工业涉及设备、工艺、操作、环境等多重因素影响,获取大量且多维的全面数据难度很大。大多数制造商虽然坐拥数据,但其中大部分是时间序列数据,没有得到适当的标准化,甚至无法用于AI的模型训练。
数据问题的本质,很多时候不单纯是技术问题,而是人员和流程问题。不成熟的数据管理流程、始终存在的OT与IT鸿沟,以及缺乏对小模型的理解,都是导致