近日,继10月9日宣布与全球智能产品ODM头部企业龙旗科技达成深度战略合作后,智元机器人再次公布一项重大技术突破:其研发的真机强化学习技术,已在与龙旗科技合作的验证产线中成功落地,为消费电子等精密制造领域带来“即插即用”的智能升级方案。
据了解,智元此次落地的真机强化学习方案,实现的突破主要在于:机器人可在真实产线中自主学习、持续优化作业策略,新技能训练与稳定部署仅需数十分钟,且性能全程不降级。在换线、换型或流线调整时,该系统只需最小的硬件改动和标准化部署流程,即可显著提升柔性、压缩部署时间与成本,破解“产线刚性与产能波动”的行业痛点。
长期以来,精密制造产线面临刚性瓶颈,传统机械臂依赖复杂夹具设计与场地改造,调试周期长、换型成本高;“视觉+力控”等柔性方案虽有改进,却存在参数敏感、部署复杂等问题,难以适配消费电子行业高频产品迭代需求。
相较传统方案,该真机强化学习方案具备三大核心优势。一是极速部署,训练周期从“数周”锐减至“数十分钟”,效率实现指数级提升;二是超高适配,自主克服来料位置偏差、尺寸公差等扰动,在长周期运行中持续保持工业级稳定性与100%任务完成率;三是柔性换型,任务变更仅需快速再训练,无需定制夹具或复杂工装,即可适配不同产品与工序,破解消费电子行业长期存在的“产线刚性与产能波动”难题。
智元机器人表示,真机强化学习方案在占用空间、硬件依赖与环境适配方面展现出高度通用性,可在不同工位和产品线上快速迁移与复用。
机器人在十分钟内学会新技能,这一进步背后的技术突破如何?11月3日,智元机器人合伙人兼首席科学家罗剑岚在接受证券时报等媒体采访时表示,机器人实现十分钟学会新技能,主要是通过预训练模型,结合少量示范和纠错,快速点亮策略,并在工业给定范围内微调参数来达成的。
“在工业产线上,能把技术做到50%和做到100%,是完全不同的两件事,智元目前是首个真正将真机强化学习应用在产线上的厂商,这一突破点主要在于性能,在于真正能将AI模型部署在工厂中,实现百分之百的准确率。”罗剑岚指出。
据罗剑岚介绍,与传统的仿真强化学习相比,真机强化学习的核心突破在于直接将学习闭环嵌入产线。“不需要解一个近似目标,而是直接优化最关心的指标,把通过率、节拍、良率这些变成训练时的第一性目标,而不是像传统方法那样去解一个近似目标。真机强化学习使用的是产线原生信号进行判定和奖励,这样就无需解决仿真与现实的差距问题,传统强化学习大多在仿真环境中进行,而我们直接在真实产线中解决这个问题。”
从落地场景来看,智元真机强化学习方案在龙旗科技产线中落地,主要用于上下料这类传统自动化难以完成、需要柔性换线的任务。上下料指的是在工厂中将料品在不同工序间转移、放置的过程,罗剑岚指出,目前整个工业中未被自动化或难以自动化的环节,约80%都集中在上下料,这类任务的主要难点在于工序间的不确定性、有限范围内的变化,以及对精度的要求。
“龙旗内部有很多工序,我们之所以选择上下料这个工序作为起点,是因为它具有代表性,许多工序抽象出来都有共性。比如我们在龙旗科技FCT测试站上看到的iPad放置工序,就是一个要求非常精密、轻柔、稳妥,不能有任何损坏的高精度工序。”罗剑岚进一步解释称。
罗剑岚强调,真机强化学习方案在产线工序上落地,相当于在工序上不断锻炼机器和大脑。每个工序、产线或机台都存在微小差异,比如料盘放置等都有随机性,但其也有共性,智元的做法是最大限度地将共性部分提取和共享,对差异化部分则通过真机强化学习进行优化,最终达到工厂要求的百分百成功率、接近人的节拍数,以及极致的鲁棒性(指系统在面对不确定性、变化和干扰时,能够维持其性能和稳定性的能力)。
此次智元机器人真机强化学习落地工业产线,或为具身智能工业化开启新纪元。智元机器人表示,智元与龙旗科技双方将基于本次成果持续推进技术迭代,推动真机强化学习在消费电子、汽车电子等更多精密制造场景的应用与复制,加速构建具身智能驱动的 AI 制造生态,助力工业智能化的普及化与标准化进程。