AI大模型打头阵，小模型紧随其后，工业领域试水生成式AI，数据不够、可靠性差，怎么破？

欢迎来到我的专栏，这已经是我撰写的第352篇文章了。在之前的讨论中，我曾提及小模型SLM的发展前景，如今这一领域正迎来新的突破。

小模型SLM，可以说是大模型LLM的“袖珍版”。它们虽然体积小，但功能强大。与那些需要数百万甚至数十亿参数的大型模型如GPT-4相比，SLM的运行更为简便。这些经过优化的小模型能够高效地处理简单任务，而不会消耗过多的计算资源。

目前，小模型正迅速向产业应用迈进，它们不再是实验室里的试验品，而是成为了各行各业的新动力。

科技巨头们也看到了小模型的巨大潜力，纷纷投身于这场未来之战。

微软、谷歌和苹果等公司都在小模型SLM领域布局，比如微软的Phi-3、谷歌的Gemma和苹果的Foundation Models。

最近，微软推出了专门针对工业领域的新型AI小模型。

通过与拜耳、罗克韦尔自动化、西门子等企业的合作，这些小模型利用行业特定数据进行预训练，以解决关键问题。这就像是为每个行业量身打造了一套“智能装备”，让AI的力量渗透到每一个生产环节，提升效率、优化流程、创造价值。

在这篇文章中，我们将深入探讨小模型在工业应用中的最新进展，以及它们面临的机遇和挑战。

小模型与AI代理：新趋势？

首先，我们需要明确大模型与小模型之间的区别。小模型之所以“小”，不仅因为参数数量少，更因为它们常在小型数据集上进行微调，以优化特定任务的性能，更好地适应业务流程的需求。

小模型擅长处理特定任务和工作流程。尽管参数有限，但通过针对特定领域任务的定制数据集微调，小模型完全能够超越大型通用模型。针对特定任务的训练可以减少幻觉现象，增强解决问题的能力。

资源效率是小型语言模型的一大优势，对于希望在各种平台和设备上实施AI解决方案的企业来说，它们特别吸引人。小模型使企业能够以更简单的基础架构和更低的成本，充分利用AI的优势。据估计，小模型可以节省高达75%的模型训练成本和超过50%的总部署成本。

在小模型的基础上，我们可以探索许多新的可能性。

一些公司将小模型应用于AI代理工作流中，多个小模型通过通信和协作来执行更复杂的任务。

例如，在AI代理工作流中，第一个AI代理可能负责规划任务的解决方案，第二个AI代理进行必要的研究，第三个AI代理执行计划，第四个AI代理验证和评估结果。这种协作方式展示了这些模型如何协同工作，提高生产力并实现更复杂的结果。

在这里，我将解释什么是AI智能代理。

AI代理的官方定义是一种能够感知环境、做出决策和执行动作的智能体。

简而言之，ChatGPT不属于AI代理，但战胜李世石的AlphaGo可以被视为AI代理。

目前，我们与AI的互动主要是输入指令，AI模型根据指令内容做出响应，这意味着我们需要提供有效的提示词才能达到预期效果。

而AI代理则不同，它被设计为具有独立思考和行动能力的AI程序。我们只需要提供一个目标，比如编写一个游戏或开发一个网页，AI代理就会自主生成任务序列并开始工作。

让我们通过几个例子来更深入地理解AI代理。

一个初级的AI代理可能是家中的空调自动控制系统。它遵循简单的“如果-那么”原则运行：如果温度低于设定点，则打开空调暖风；如果温度高于设定点，则关闭空调暖风。这种基础的AI代理虽然简单，但在日常生活中已经发挥了重要作用。

而高级的AI代理，如DeepMind的AlphaGo，是专为复杂的围棋而设计的人工智能系统。AlphaGo展示了非凡的学习能力，最终击败了世界冠军围棋选手。这一里程碑式的事件，彰显了AI代理在处理复杂任务方面的巨大潜力。

就像俄罗斯套娃一样，多个初级和高级的AI代理可以建立起分层代理系统。

分层代理是一种将复杂任务分解为更简单的子任务，并以分层结构组织起来的AI系统。这种方法允许代理管理不同级别的抽象，更有效地处理复杂问题。

分层代理的一个典型例子是亚马逊Amazon Go商店的“Just Walk Out”技术。该系统在运作中表现出了清晰的层级结构：

顶层：整体商店管理和库存跟踪

中级：客户跟踪和行为分析

低级：产品识别和交互检测

最低级别：传感器数据处理和融合

依靠这些AI代理的协同工作，Amazon Go以“不用排队，拿了就走”的全新购物体验，在零售行业和科技圈吸引了无数目光。

上述案例只是冰山一角，AI代理在实际应用中的想象力正在被激发。

小模型与Copilot覆盖超100家公司12万用户

在了解了小模型与AI代理的概况后，让我们一起探索微软与工业企业的最新合作。

本次尝试微软小模型的企业包括拜耳、罗克韦尔自动化、西门子、Sight Machine等。

以罗克韦尔自动化为例，该公司从操作层面开始尝试应用小模型。在人机界面可视化平台FactoryTalk Optix的食品和饮料版本中，他们运用小模型，将行业特定功能的优势带给制造业一线工人，支持食品和饮料领域的资产故障排除。AI模型为工厂车间工人和工程师提供关于特定制造流程、机器和输入的实时建议、解释和知识。

另一款产品FactoryTalk Design Studio是罗克韦尔自动化专注于系统设计的云原生软件，它使用Copilot增强了PLC代码创建和用户管理。工程师能够使用自然语言提示执行产品指导、代码生成、故障排除和代码解释等任务，使系统设计更快、更直观。

同样，西门子正在为CAD解决方案NX X软件引入全新的Copilot。该软件利用经过调整的AI模型，使用户能够通过自然语言提问、获取详细的技术见解并简化复杂的设计任务，实现更快、更智能的产品开发。

目前，包括舍弗勒和蒂森克虏伯自动化工程在内的100多家公司正在使用西门子工业Copilot来简化流程、解决劳动力短缺问题并推动创新。12万名西门子工程软件用户，现在有机会通过生成式AI驱动的助手来提升工作效率。

作为敢于吃螃蟹的用户，蒂森克虏伯自动化工程公司是首家使用Copilot的公司，并且计划从2025年初开始，在该公司的全球体系内普及应用。

根据实践，工程师现在可以在30秒内创建可视化面板，并生成代码，根据经验这些代码仅需20%左右的调整就可以直接应用。这简化了工作流程，减少了人工工作量，解决了熟练劳动力短缺的问题。

就具体场景而言，蒂森克虏伯使用AI辅助开发用于生产汽车电池的自动化系统。例如在一台电池质量的检测装置中，传感器、摄像头和测量系统集成在一起，监控多个阶段的电池单元质量，进行复杂的评估以检测超出设定阈值的放电。Copilot通过自动执行多个任务，如数据管理、传感器配置、电池质量检测等各个重复性步骤，辅助操作员增强了该设备的运行效果。

Copilot：工业生成式AI的现实角色

在工业领域，“想到”和“做到”完全是两码事，生成式AI的工业价值尚需被验证。

古人云“欲得其利、先知其弊”，要充分发挥小模型的优势，就必须了解它的局限性。

生成式AI的弊端在于可靠性较低，具有不可解释性，只能应用于对可靠性要求不高的场合。

小模型的缺点则是精度有限，无法捕捉大规模和复杂数据集中的细致特征和关系，预测能力相对较弱；此外，它们难以应对复杂问题。这些弊端决定了小模型只能承担辅助思考的角色，为我们提供更多可行性方案作为选择，而最终决策仍需由人来做。

在实际应用过程中，也是挑战重重。

工业领域广泛使用AI的最大障碍是数据的缺失。由于工业涉及设备、工艺、操作、环境等多重因素影响，获取大量且多维的全面数据难度很大。大多数制造商虽然坐拥数据，但其中大部分是时间序列数据，没有得到适当的标准化，甚至无法用于AI的模型训练。

数据问题的本质，很多时候不单纯是技术问题，而是人员和流程问题。不成熟的数据管理流程、始终存在的OT与IT鸿沟，以及缺乏对小模型的理解，都是导致

微信扫一扫：分享

相关文章

刘慈欣预言：AI终将突破科幻创作结界？深度解码人机文学博弈战

破局糖界！全球首个1型糖尿病AI大模型中国首发

市场监管总局要快马加鞭搞人工智能的国家标准制定

腾讯HaploVL：AI也能眼观六路啦！细粒度视觉理解技术大突破！

美团、快手、拼多多，AI大战谁最狠？

AI眼镜：未来神器还是摆件？说说真心话

发表回复 取消回复

发表回复取消回复