一、发展趋势
1.国外工业大模型进展
大语言模型的基础研究起源于NLP领域,经历了从规则引擎和统计学到机器学习,再到深度学习的演变,最终在Transformer架构的推动下,实现了大模型技术的重大突破。特别是2017年Transformer架构的引入,这成为了多种任务的基础模型,包括NLP、计算机视觉(CV)和多模态应用。随后,2018年BERT模型的推出,以其3亿参数量显著提升了对NLP任务的处理能力。随着大模型参数规模和能力的跃升,大模型技术开始受到工业界的广泛关注,并激发了越来越多的AI研究者探索大模型在工业领域的应用。
国外工业大模型“玩家”大多为传统自动化企业和传统工业软件公司,如Revamp in Action,它是艾默生公司运用人工智能技术研发出控制路径优化的大模型,基于云的先进软件解决方案和改进工具,利用人工智能的力量提供完全集成的数字工作流程,提高资本效率并简化工业企业达到最优控制的路径。再如,西门子工业助手是西门子公司与微软合作推出了名为“西门子工业助手”的生成式AI助手。该模型结合了西门子数字业务平台SiemensXcelerator的自动化和过程模拟信息,以及微软Azure OpenAI服务中的大型语言模型,以增强工厂自动化软件中代码的创建和优化。
2.国内工业大模型进展
近年来,随着AI技术的飞速发展,自2023年国内第一个工业大模型发布以来,国内工业大模型的研究和应用也取得了显著进展。工业大模型作为新一代AI技术的重要组成部分,正在逐步改变传统工业的生产方式和业务流程,为工业转型升级注入了新的动力。
在技术层面,国内工业大模型的研究主要集中在模型的优化、预训练与微调、以及模型压缩等方面。针对工业场景的特殊性,研究者们对通用基础大模型进行了行业化和场景化的改造,通过引入行业知识和特征,提高了模型在工业场景下的准确性和可靠性。此外,随着Transformer架构的广泛应用,国内工业大模型也普遍采用了这一架构,以提升模型的性能和效率。
在应用层面,国内工业大模型的应用场景不断拓展,涵盖了从智能制造、质量控制、设备维护到供应链管理等多个领域。在智能制造方面,工业大模型被用于生产线的智能化改造,提高了生产效率和产品质量。
在质量控制方面,工业大模型能够实现对产品质量的实时监测和预测,降低了不良品率。
在设备维护方面,工业大模型能够预测设备的故障情况,提前进行维护,避免了因设备故障导致的生产中断。
国内知名的工业大模型来自传统工业软件公司、人工智能公司和工业互联网公司。智工·工业大模型是中工互联推出的一款工业领域专业大模型产品,也是国内第一个发布的工业大模型。智工·工业大模型通过深度学习和大数据分析,能够理解和处理复杂的工业数据和任务,为企业提供智能决策支持、提高生产效率和产品质量。其核心产品是AI·SCADA、智工知语和智工工控具身智能体。
奇智孔明工业大模型是创新奇智面向工业领域推出的一款多模态工业大模型。该模型基于Transformer架构,参数量超过750亿,并具备多模态能力。通过深度学习和大数据分析,奇智孔明工业大模型能够理解和处理复杂的工业数据和任务,为企业提供智能决策支持。此外,该模型还支持私有化部署,确保了数据的安全性和隐私性。
Cosmo-GPT是卡奥斯专为工业领域定制的一款大型预训练模型。该模型拥有700亿参数,经过百万级工业数据的微调,具备了工业知识问答、工业代码生成和工业理解计算等专业能力。Cosmo-GPT能够实现对工业数据的全面采集、分析和应用,为企业的数字化转型提供了有力支持。此外,该模型还支持多种应用场景,如设备预测性维护、产品质量控制等,为企业的智能化改造提供了有力支持。
羚羊工业大模型以讯飞星火认知大模型的通用能力为核心技术底座,结合工业场景的实际需求进行打造,具有强大的自然语言处理和知识推理能力,为羚羊工业大模型提供了坚实的技术支撑。羚羊工业大模型具备五大核心能力,包括工业内容生成、工业知识问答、工业理解计算、工业任务规划以及工业多模态。这些能力可以从海量数据和大规模知识中持续进化,实现从问题提出、规划到解决问题的全流程闭环。
3.工业大模型特征的演变趋势
在小型化趋势层面,工业大模型大量运用模型压缩技术(如剪枝、量化和蒸馏等),能够有效减少模型的参数量,形成在特定行业内具备深度任务能力的垂直大模型,能够更快推进工业大模型在工业领域的落地。加之算力资源成本的原因,工业大模型呈现小型化的趋势愈发明显。
在场景化趋势层面,与通用大模型不同,工业大模型更加关注成本、效率、质量、安全、绿色等核心价值,因此在功能方面需要实现场景化适配,如生产监测、能源节约、工艺优化、设备运维等场景,更好地适应和满足工业领域多样化和专业化的需求,实现技术与具体应用场景的深度融合,推动工业智能化和效率提升。
在产品化趋势层面,中国信通院发布的《2025中国信通院深度观察报告》显示,目前落地的大模型项目中,工程化类型的项目占比达到77%,说明当前工业大模型的落地形态仍以技术服务形式呈现。未来,工业大模型将逐步形成标准化的产品,降低大模型技术落地门槛,促进工业大模型技术在工业领域中的广泛应用,推动工业大模型生态商业化发展。
在私有化趋势层面,工业大模型的发展无法脱离行业Knowhow的加持,丰富工业数据是高质量模型训练的前提。同时,工业企业的数据大多具有保密性、私有化特征,因此工业大模型大多以私有化部署的方式落地。
二、主要瓶颈
1.高质量工业数据集
高质量工业数据集是工业大模型训练的必要元素,主要作用体现在两方面:
一是为模型训练提供基础,工业大模型的建立和进化,需要足够量且多元化的数据驱动。数据是工业大模型的“养料”,有了高质量的工业数据,才能让模型学习到更精确、更深层次的逻辑关系和模式。
二是提供衡量模型性能的标准,只有拥有了与应用场景匹配、覆盖多种情况的高质量数据,才能更好地评估工业大模型的性能,及时调整和优化模型,保证其在实际应用中的良好性能。
然而,由于大多数企业数据处理工具和数据治理能力的缺失导致了工业大模型在构建时难以获得全面、高质量的数据进行深度学习训练。数据处理工具方面,企业缺乏对工业数据资源管理工具的整体规划,导致工业数据在收集、清洗、分类、存储等方面存在短板,造成累积的工业数据质量参差不齐。在当前的企业大数据生态环境中,显著的问题是众多企业在构建和应用大数据平台时,对数据质量的重视程度不足。具体表现在数据治理能力的不足,其中,大部分工业企业的数据管理体系缺乏专门的组织架构支持,面临着专业人才短缺的困境。
此外,数据管理工作往往仅限于基础操作层面,未能拓展至更高层次的规划和组织管理。这种结构性滞后不仅阻碍了数据治理工作的有效实施,更是对数据质量和其可用性造成了深层次的影响。
2.模型可用性
工业大模型在实际应用中面临着可用性方面的挑战,主要体现在两个方面:
一是数据不确定性问题导致训练偏差,由于工业数据的不完整性或不准确性,这可能会对因果关系的准确推断造成影响。在实际应用过程中,如何有效地识别和处理混杂因素、选择偏差等问题成为一大难题。这些问题的存在使得模型训练的结果可能偏离真实情况,从而影响模型的准确性和可靠性。
二是因果关系判断问题可能导致结论偏差,在深入探讨大型模型的关联捕捉能力时,我们必须认识到,此类模型所揭示的关联性并不总能确保其转化为确切的因果关系。实际上,即便模型在某些场景下能够辨识出因果链条,此类辨识的泛化能力仍然存在疑问。
由此可知,对于同质化样本集,模型的解释能力可能会展现出显著的差异性,进而限制了用户从少量样本的解释中提炼出普适性因果规律的可能性。这种结论偏差会限制大模型在工业领域的应用效果,因为用户需要模型能够提供稳定且可靠的解释,以支持决策过程。
3.工业专业知识
在探讨如何提升大型通用模型在处理行业特定复杂任务时的效能,以下核心挑战尤为突出:
一是行业专业知识的深入理解问题,当前工业界所使用的大模型往往未能针对特定行业进行精细化的优化,这无疑削弱了它们在处理如工业制造等领域的复杂问题时的性能。在工业制造场景中,模型的效能直接受限于其对行业特有数据与流程的理解深度。
二是训练语料的丰富性不足,特别是行业场景语料均衡性问题显著,训练语料库的不充分性严重限制了工业大模型的专业任务能力。因此,为了提高大模型在行业应用中的实用性,一些机构正在努力构建高质量的语料库,如上海人工智能实验室发布的“万卷CC”语料库,覆盖了过去十年互联网上的公开内容,包含1千亿字。
此外,行业垂直模型的构建对数据资源的规模与品质提出了极为苛刻的要求。此类模型不仅要求数据集内含有丰富的行业专业知识,而且依赖于海量的数据样本以进行深度学习。一般来说,需要对参与模型训练的数据进行包括数据的完整性、一致性、完备性等在内的六个维度50个检查项。因此,确保数据处理的精确性与安全性,同时兼顾数据量的扩充与质的提升,成为推动行业大模型发展的关键环节。
4.模型训练与算力部署成本
在当前人工智能领域,大规模模型的训练初期,算力成本呈现出显著的增长趋势。这一现象在模型参数增多、规模扩大的背景下尤为突出。尽管模型泛化能力的提升令人欣喜,但其带来的成本负担亦不容忽视,尤其是对众多企业而言,这无疑构成了一项严峻的经济挑战:
一是算力资源的高需求问题,具体来说,大型模型的训练阶段往往需要庞大的算力作为支撑,单就训练阶段而言,动辄数亿级别的算力投入已成为常态。而在模型推理应用阶段,对算力的需求更是远超训练阶段,成本有可能飙升至百亿规模。然而,随着新技术的不断发展和应用,算力成本的下降趋势已逐步显现,为大规模模型训练的普及带来一线曙光。在此基础上,深入研究算力成本优化策略,以降低企业经济负担,成为推动人工智能技术发展的关键所在。
二是高硬件成本投入带来的财务负担,以Megatron Turing-NLG(MT-NLG)模型为例,该模型凭借其5300亿参数的规模,在训练阶段耗费了4480块A100 GPU,单次训练成本高达数百万美元。此外,还需考虑除硬件购置外的其他运营成本,例如,OpenAI的ChatGPT模型在初始阶段的算力投入成本约为7.59亿美元,日常电费消耗高达591,864千瓦时。
三是我国在数据和算力资源的集中度方面存在明显不足,当前的数据开放共享机制尚未完善,缺乏用于训练大规模模型的高质量工业数据语料库。同时,各地区及高等教育机构纷纷构建自己的智能计算中心,导致算力资源分散。
三、落地应用三个阶段
1.工业大模型实现工业交互智
在漫长的工业数字化进程中,大部分企业按照信息化蓝图陆续部署实施了各类应用,如企业ERP系统、MES系统、QMS系统、EMS系统、WMS系统等,在工业互联网出现之前,各类信息化应用大多数为独立分散部署,即各应用部署在不同的网络环境和计算环境中,部署的方式包括云部署、本地部署和混合部署,使得这些APP能够相互独立地运行和工作,这种部署方式从一定程度上具备较好的灵活性,但是在集成、管理、维护等方面存在一定弊端。
工业互联网框架的出现,实现了工业信息化应用的整合,基于工业互联网平台底座,借助微服务组件和工业应用开发工具,提供了设计、生产、管理、服务等一系列创新性业务应用,同时构建了良好的工业APP创新环境,使开发者基于平台数据及微服务功能实现应用创新。
在工业互联网框架下,实现了基于PaaS技术底座+SaaS应用微服务的架构模式,企业用户通过统一门户认证身份后,可以在多个工业应用之间切换操作,实现了权限、身份、数据流、业务流的贯穿打通。但是,随着工业数字化进程的加深,垂直领域的专业系统逐渐增多,特别是对于跨专业的交叉岗位,经常需要在多个应用之间频繁切换,工业互联网的应用整合效果受到削弱;另一方面,工厂内部的存在复杂繁多的数据簇,如配置数据簇、审批流程数据簇、生产监控流程簇等,不同的数据簇存在于不同的工业应用中,使得操作人员与信息系统的交互复杂度和时间成本加剧。
工业大模型的出现,标志着工业应用交互方式的重大转变。它不仅整合了工业系统、应用和插件的交互能力,而且彻底重构了工业应用的交互架构。这种整合的直接效果是,用户可以通过一个简洁的交互框,以PromptAnswer式的方式与工业应用进行交流。无论是文字、语音还是图像识别,用户的需求都能被工业大模型准确捕捉并迅速响应。这种交互式AI的实现,使得用户无需深入了解每个应用的具体操作,只需清晰描述所需功能或内容,工业大模型便能自动生成相应的输出。例如,用户需要监控某个设备的实时数据,只需简单描述需求,工业大模型就能自动创建图表;如果需要设备的3D可视化展示,工业大模型也能自动识别并调用相应的3D模型。这种以用户需求为中心的交互方式,极大地简化了用户的操作流程,减少了在多个应用间切换的繁琐步骤。用户不再需要记住复杂的菜单路径或按钮功能,而是通过自然语言与系统进行交流,使得操作更加直观和便捷。这种演变预示着工业应用的未来发展方向,即从传统的点击式、菜单式交互,向更加智能和自然的交互方式转变。
此外,工业大模型还实现了工业人工智能的整合,这包括底层数据的融合、治理以及支撑AI引擎的整合。在企业建立了坚实的数据治理和分析能力后,工业大模型能够调用各类AI引擎,进行复杂的数据处理和分析,最终形成交互式的答案。这意味着,工业大模型不仅能够处理简单的查询和控制任务,还能够进行深入的数据分析和决策支持,为企业提供更深层次的洞察和价值。
2.工业大模型实现工业决策智能
产品的设计、制造、销售和售后服务等环节之间存在着大量的知识交互。这些环节之间的知识交互需要统一的语义表示方式,以便于不同环节之间的知识共享和融合。而工业知识图谱非常适合解决这一问题,随着融入工业生产全环节,它可以将不同环节之间的知识进行抽象和建模,并形成一个具有语义表达能力的图结构,从而实现对不同环节之间的知识的存储、管理、交叉推理、协同应用,为企业级的智能决策实现打下基础。
工业大模型形成的工业知识引擎提供了面向跨行业、跨领域和跨岗位工业专用知识表示方法,它将实体、属性和关系等元素进行抽象和建模,形成一个具有语义表达能力的图结构。在工业领域,将工业领域的知识进行建模,形成一个具有语义表达能力的图结构,从而实现对工业领域知识的存储、管理、推理和应用。
基于工业大模型的工业知识引擎正在加速工业的知识图谱构建,包括获取各种文献、专利信息、技术标准等方面的专业知识,同时自动化处理各种设备信息、工艺参数、质量数据等方面专业知识。
基于工业大模型的工业知识引擎向工业生产链条的多环节快速渗透帮助企业整合和利用各种生产数据、设备数据、质量数据等方面的专业知识,为企业提供生产优化和质量控制的决策支持。
基于工业大模型的工业知识引擎在具体的工业场景中提供决策支持能力的主要机理如下:
一是工业大模型具备数据驱动与深度学习能力,工业大模型依赖于大量的工业数据,包括生产数据、设备状态数据、供应链数据等。这些数据通过深度学习等先进技术进行训练和优化,使模型能够识别出潜在的模式和趋势,为生产决策提供依据。例如,通过分析设备运行数据,工业大模型能够预测设备的故障和维护需求,从而减少意外停机时间,提高设备的使用寿命。同时,它还能在生产过程中实时监控产品质量,通过图像识别等技术检测产品缺陷,确保产品质量的一致性和可靠性。
二是工业大模型具备自我学习与优化能力,与传统的编程算法不同,工业大模型具备自我学习和自我优化的能力。它们能够根据新的数据不断调整和优化自身的算法,以适应不断变化的生产环境。这种能力使得工业大模型能够持续适应新的工业场景和需求,提供更加精准和有效的决策支持。
三是工业大模型具备跨领域融合与知识推理能力,工业大模型能够整合不同领域的知识和技术,如机械工程、电子工程、材料科学等,实现跨学科的创新和优化。通过知识推理和数据分析技术,从知识图谱中提取有用信息,支持复杂问题的解决。这种跨领域融合的能力使得工业大模型能够综合考虑多个因素,提供更加全面和深入的决策支持。
3.工业大模型实现工业具身智能
从工业具身智能的概念层面分析,具身智能的概念最早可以追溯到1950年,当时图灵在其著名论文ComputingMachinery and Intelligence(《计算机器与智能》)中首次提出了具身智能的设想,具身智能是一个强调智能体身体与环境互动的理论概念。结合工业领域特征,基于工业大模型的工业具身智能包括如下几个特征:
在语言理解层面:语言理解能力使得智能体能够理解和解析人类的语言指令,从而实现与人类的自然交互。这种能力使得智能体能够接收并执行复杂的任务指令,而无需人类进行繁琐的编程或操作。
在状态感知层面:智能体通过内置的传感器和感知设备,能够实时监测和感知周围环境的各种信息,如温度、湿度、压力、振动等,这些信息为智能体提供了丰富的数据源,使其能够准确判断当前的生产状态和设备的运行情况。
在实时分析层面:实时分析是工业大模型具身智能的重要功能之一。基于工业大模型所集成任务算法和时序模型,能够实时处理和分析感知到的数据,从而快速做出决策或调整生产参数。例如,在生产线优化方面,智能体可以通过实时分析生产数据,发现生产过程中的瓶颈和问题,并自动调整生产参数或调度方案,以提高生产效率和产品质量。
在科学决策层面:通过深度学习和数据挖掘等技术,能够从海量的数据中挖掘出有价值的信息和规律,从而为企业的决策提供依据。智能体可以通过分析历史数据和反馈结果,不断调整和优化自身的控制策略和决策规则。这种能力不仅提高了智能体的适应性和灵活性,还为企业带来了持续的创新和发展动力。
在学习提升层面:智能体通过不断学习和积累经验,能够不断优化自身的算法和模型,从而提高自身的性能和智能化水平。
综上,基于工业大模型技术所形成的工业具身智能,通过整合感知、认知和决策能力,将设备从单一功能的执行单元提升为具有自主学习和优化能力的智能系统,这种转变使得设备能够更好地适应复杂多变的工业环境,显著提高生产效率和柔性化水平。
从工业具身智能的特征层面分析,普适化知识引擎是工业具身智能的重要组成部分,它具备问答对话、知识库建设和智能搜索等多种功能。该引擎通过整合和存储大量的工业知识,为企业提供了便捷的信息获取途径。同时,其零幻觉可溯源、动态学习等特性,使得企业能够基于准确的信息做出更为明智的决策。在工业大模型的背景下,普适化工业知识引擎能够为企业提供更为全面和深入的工业知识支持,助力企业实现智能化转型和升级。
从全模态数据建模层面分析,全模态工业数据建模是工业具身智能实现感知和认知能力的关键。它利用数学、统计和机器学习等方法,对工业过程中产生的大量数据进行建模和分析。通过对数据的处理和检测,可以提取出数据背后的隐藏规律和趋势,为企业的决策提供科学依据。全模态工业数据建模不仅能够处理结构化数据,还能够处理半结构化和非结构化数据,如传感器数据、图像数据等,从而为企业提供更为全面和准确的数据支持。
从多场景具身智能层面分析,多场景工业具身智能是工业大模型技术的重要应用之一。它使得设备能够具备自主学习和优化能力,从而在不同的工业场景中发挥出最大的效用,包括全局监控、设备启停、故障诊断、节能管理和运维服务等方向。
从轻量级产品部署层面分析,轻量级大模型产品部署是工业具身智能实现广泛应用的关键。在工业环境中,由于设备种类繁多、性能各异,因此需要一种能够灵活部署、易于集成的轻量级大模型产品。轻量级大模型产品不仅具备强大的计算能力和智能化水平,还具备较低的硬件要求和资源消耗,利于工业大模型在行业的快速推广。
四、场景化应用方向
1.全局监控,实时联动
基于工业大模型的工业技术底座组件构建一个高度集成的监控系统,能够实时收集、分析和响应工厂内各个环节的数据。首先,需要部署大量的传感器和监控设备,这些设备能够实时收集生产线上的温度、压力、流量、能耗等关键参数。其次,工业大模型平台具备对异构设备的协议解析能力,从而实现对生产过程的全面监控。在此基础上,使用云平台和边缘计算技术,可以实现数据的快速处理和决策制定,通过与自动化控制系统的集成,使得监控系统能够直接控制生产线上的设备,打造管理与控制的实时联动。
2.设备启停,智能优化
设备启停的智能优化依赖于工业大模型的时序预测组件实现。首先,通过安装在设备上的传感器收集设备的运行数据,如振动、温度、声音等,这些数据能够反映设备的健康状况。然后,利用工业大模型的分析能力,对这些数据进行深入分析,以识别潜在的运行规律、故障特征和性能下降的征兆。通过机器学习算法,系统可以学习设备的最优运行参数,并根据实时数据自动调整设备的运行状态,实现节能和效率的最大化。例如,系统可以根据生产需求、能源成本的变化,智能地安排设备的启停时间,以减少能源消耗和运营成本。
3.故障诊断,能效分析
故障诊断和能效分析通过工业大模型的工业知识引擎组件实现。智工工业智能专家系统中预置了工业领域专业知识和设备专有知识,与智工工业智能监控系统相协同,通过模式识别和异常检测技术,并在高度的数据处理能力和复杂的算法支持下,能够及时发现设备异常并预测潜在的故障。同时,设备监控数据还用于评估和优化生产过程中的能源使用效率。通过集成能源管理系统,可以对生产过程中的能源消耗进行实时监测和分析。利用大模型的专业任务能力,可以识别能源浪费的环节,并提出改进措施。此外,通过模拟和优化算法,可以预测不同生产策略下的能源消耗,从而为企业提供节能降耗的生成控制策略。
4.控制节能,管理节能
在工业大模型加持下,用先进的控制算法对生产过程中的关键参数进行精确控制,使得传统的控制系统具备高度的智能化和自适应能力,能够根据实时数据自动调整控制策略。管理节能则侧重于从宏观层面优化能源使用,通过工业大模型制定能源管理策略,并与控制节能相结合,通过数据分析和决策支持系统,为管理层提供能源使用和节能措施的管理建议与模拟测算。
5.远程运维,服务推送
在工业大模型加持下,传统的工业知识组织效率和传递能力得到明显加强,允许运维工程师通过交互式运维指导完成设备的现场维护的工作,提高了运维效率。同时,通过集成视频监控、远程诊断和控制技术,实现设备运维专家团队在任何地点对设备进行设备运维和故障排除指导。结合设备运行数据和机器学习技术,工业大模型能够预测设备维护需求和潜在问题,然后主动向用户推送维护和服务信息,不仅提高了服务的及时性和个性化,还有助于减少意外停机时间,提高生产效率。
下一篇
已是最新文章