工业多模态大模型亮相进博会

来源: 发布时间: 2023-11-05 发布人:

WechatIMG1829.jpg

缺乏专业领域的知识,是当前许多通用大模型存在的痛点。工业领域对生产工艺、精密度和良率都有严格要求,亟待能够提升和释放生产力的专用大模型出现。在2023中国国际进口博览会虹桥国际经济论坛“智能科技与未来产业发展”分论坛上,思谋集团创始人、董事长,香港中文大学终身教授贾佳亚携团队正式发布了其首个工业多模态大模型IndustryGPT V1.0,并称其为“全球首个工业多模态大模型”。

“GPT4是目前业界公认最先进的通用大模型之一,但它却很难以胜任专业领域的工作,尤其是工业领域。”贾佳亚表示,据测试,GPT4在工业专业领域回答的准确率不足30%。

工业领域需要什么样的大模型?贾佳亚认为,工业领域的大模型,需要把大模型嵌入到数字化管理和数字孪生系统中,让工厂管理变成完全可控的状态,并且能够和人、软件和硬件充分沟通交互。

比如,当工作人员询问某产品的工艺以及当天的生产效率等问题时,大模型要能够根据当天甚至当时的信息给出正确答案和具体的解释;大模型要能自动调配参数,实现自动训练;还要能够“自动操作”硬件,人只要在设备上输入指令,设备就会反复调试自己的状态,在几分钟时间内完成所有系统的设置和安装。因此,针对工业领域,贾佳亚团队致力于基于先进的视觉技术,以深度学习和机器学习来打通行业认知,用光学、机械等硬件设备促进行业发展。

在贾佳亚和团队的展示中,IndustryGPT在与人、与软件、与硬件沟通都相当流畅,以思谋自研的工业智能通用型平台SMore ViMo为例,在一项产品分类检测中,IndustryGPT选择的方案耗时5分钟27秒,且精确率和召回率均达100%,而人工训练下方案耗时长达9分钟31秒,精确率仅50%、召回率66.7%。据悉,正在研发的使用IndustryGPT驱动硬件智能设备的功能,用户使用自然语言下达指令,通过几次简单对话,最快5分钟完成任务。

贾佳亚表示,IndustryGPT将基于V1.0版本上持续开发,并走向真正的智能体。未来,IndustryGPT的加持下,机械系统不再是僵化的实体,而是可根据实时需求和数据变化做出智能决策、实现协作的智能体。