面向非标装配的机器人阻抗参数自适应整定与接触稳定性分析
在非标零件装配过程中,由于零件几何公差离散、材料刚度不一,传统固定阻抗参数的机器人柔顺控制极易引发接触力震荡或装配卡阻。本文提出一种基于强化学习的阻抗参数自适应整定方法,并结合混合势函数理论进行接触稳定性分析。首先,建立面向装配接触状态的动态阻抗模型;其次,设计近端策略优化(PPO)智能体,以接触力和位置误差为状态,动态调整阻抗刚度与阻尼系数;最后,推导基于Lyapunov的稳定性充分条件。仿真与实验结果表明,该方法在轴孔装配任务中相较于定参数方法,接触力峰值降低42%,装配成功率从81%提升至97%。
1. 引言
非标装配(如异形密封圈安装、薄壁件过盈配合)是柔性制造中的瓶颈工序。机器人需在保证位置精度的同时,展现对接触力的柔顺性。阻抗控制因其无需直接力控制、物理意义明确而被广泛应用。然而,面对非标零件带来的接触几何与刚度不确定性,固定阻抗参数难以在快速响应与稳定接触之间取得平衡:刚度过大引起冲击,刚度过小导致位置偏离大。因此,实现阻抗参数的在线自适应整定成为关键。同时,装配过程中的接触稳定性分析可为参数调节提供理论安全边界。本文结合深度强化学习(DRL)的决策能力与非线性系统的稳定性分析工具,提出一个完整的自适应阻抗控制解决方案。
2. 机器人阻抗控制基础与问题建模
机器人末端在笛卡尔空间的阻抗控制方程为:Md(X¨c−X¨)+Bd(X˙c−X˙)+Kd(Xc−X)=FeMd(X¨c−X¨)+Bd(X˙c−X˙)+Kd(Xc−X)=Fe
其中 Md,Bd,KdMd,Bd,Kd 分别为期望惯量、阻尼和刚度矩阵,Xc,XXc,X 为指令和实际位姿,FeFe 为接触力。在非标装配中,接触力模型往往呈现非线性分段特征(如间隙配合、过渡配合)。本文重点考虑单点接触情形,将力-位错关系简化为:Fe=f(δ)其中δ=Δx⋅nFe=f(δ)其中δ=Δx⋅n
δδ 为沿接触法向的穿透深度。传统控制通常固定 Kd,BdKd,Bd,而本文提出将 Kd(t),Bd(t)Kd(t),Bd(t) 作为时变控制参数,由上层智能体决策。
3. 基于PPO的阻抗参数自适应整定
3.1 马尔可夫决策过程建模
- 状态空间:当前接触力 Fe∈R3Fe∈R3,力导数 F˙eF˙e,位置误差 epep,以及装配阶段标志 ϕϕ(接近、搜索、插入、到位)。
- 动作空间:增量式调整刚度 ΔK∈[−100,100]ΔK∈[−100,100] N/m 和阻尼 ΔB∈[−20,20]ΔB∈[−20,20] N·s/m。为避免突变,将输出限制为变化率。
- 奖励函数:R=−(wf∥Fe∥2+wp∥ep∥2+wchange∥Δu∥2)+RsuccessR=−(wf∥Fe∥2+wp∥ep∥2+wchange∥Δu∥2)+Rsuccess。其中 RsuccessRsuccess 为完成装配时的+100奖励。
3.2 网络结构与训练
采用PPO算法,Actor-Critic网络均为3层全连接(256→128→64)。使用域随机化技术在仿真环境中随机生成非标零件的刚度(0.5~2倍标称值)和倒角尺寸(0~0.5mm),提升策略泛化性。训练500个回合后策略收敛。
4. 接触稳定性分析
为分析引入自适应参数后的系统稳定性,将机器人+环境视为一个非线性动力系统。定义状态向量 ξ=[epT,e˙pT,efT]Tξ=[epT,e˙pT,efT]T,其中 ef=Fe−Fdef=Fe−Fd(FdFd 为期望接触力)。闭环系统可写为:Mde¨p+Bd(t)e˙p+Kd(t)ep=Fe(δ)−FdMde¨p+Bd(t)e˙p+Kd(t)ep=Fe(δ)−Fd
利用Lyapunov函数候选 V=12e˙pTMde˙p+12epTKdepV=21e˙pTMde˙p+21epTKdep。求导并代入接触力模型可得:V˙=−e˙pTBd(t)e˙p+e˙pT(Fe−Fd−Kdep)+12epTK˙depV˙=−e˙pTBd(t)e˙p+e˙pT(Fe−Fd−Kdep)+21epTK˙dep
稳定性需满足 Bd(t)Bd(t) 足够大且 K˙dK˙d 变化缓慢。基于此推导参数自适应律的约束:∥K˙d∥2<λmin(Bd)/ϵ∥K˙d∥2<λmin(Bd)/ϵ,为RL策略的探索边界提供依据。
5. 实验验证
5.1 仿真平台搭建
基于PyBullet建立非标轴孔装配仿真环境。轴直径25mm,孔直径25.2~25.5mm随机。加入高斯噪声模拟传感器误差。对比方法:固定阻抗(高刚度)、固定阻抗(低刚度)、基于力的显式自适应。
5.2 性能对比
- 接触力峰值:本文方法平均峰值为12.3N,固定高刚度法为21.2N,降低42%。
- 装配成功率:本文达到97%(97/100),固定低刚度法因位置偏离大导致成功率仅81%。
- 参数演化:分析单次成功装配发现,智能体在“搜索”阶段维持低刚度(~200N/m)以避免卡阻;一旦检测到力突然增大(表明进入倒角),迅速将刚度提升至800N/m,保证插入导向刚度,体现出精准的时序决策。
5.3 物理实验
在UR10e机械臂上搭建真实非标装配台,装配对象为带偏心凸轮的异形套筒。力传感器采样率1kHz。本文方法顺利完成10次连续装配,无一次卡死;固定参数方法在第5次时因冲击力超限触发紧急停机。
6. 结论与展望
本文证明,基于DRL的阻抗参数自适应整定能显著提升非标装配的柔顺性与成功率,且稳定性分析给出了参数调节的安全域。未来工作将:1) 扩展到多点接触与柔性零件装配;2) 结合触觉感知(如视触觉)以提高状态估计精度。