面向非标精密装配的机器人触觉-视觉多模态融合伺服控制与插入力动态调节

2026/06/06企业新闻新闻中心行业新闻 1420

非标精密装配中，单一视觉传感器难以可靠感知接触状态，在遮挡或弱纹理条件下易失效。本文提出一种触觉-视觉多模态融合的机器人伺服控制框架，用于高精度轴孔装配任务中的插入力动态调节。首先构建视触觉融合网络，通过跨模态注意力机制整合RGB图像、深度图和末端力/力矩信息；其次设计基于强化学习（Soft Actor-Critic）的装配技能学习策略，实现插入力的自适应调节；最后建立插入力动态观测器与阻抗参数在线调节机制。实验结果表明，该方法在不完全对称几何的轴孔装配中成功率达96.59%，较纯视觉方法提升26%，平均接触力降低58%。

1. 引言

轴孔装配是工业机器人最典型的接触密集型任务之一。在标准零件的大批量生产中，可通过精密定位和高刚度工业机器人实现高成功率。然而，非标装配场景面临三大挑战：零件几何形状不对称（如异形孔、带导向角的轴端）、定位偏差未知、遮挡导致的视觉信息缺失。对于非标精密装配任务，零件的位置偏差和形状变化难以预先建模。

触觉感知提供了视觉无法获取的接触状态信息。人类在执行精密操作时天然地同时依赖视觉与触觉。高分辨率的触觉传感器能够感知详细表面交互的力信息。视触觉融合网络结合自编码器与注意力机制的方法已展现出在不确定性环境下的装配优势。尤其值得注意的是，物理信息引导的多模态融合可以充分解锁视觉与触觉的互补优势——带有双边力先验正则化的交叉模态转换器在不完全对称几何的插入任务中取得了96.59%的成功率，接近基于全状态观测的特权配置的性能。

2. 视触觉融合感知框架

2.1 多模态传感器配置

实验平台采用UR10e机器人末端搭载腕部RGB-D相机（Intel RealSense D455）与六维力/力矩传感器（ATI Mini58）。相机提供装配区域的高分辨率图像与深度信息；力传感器实时反馈三轴力与三轴力矩。

2.2 融合网络架构

基于自编码器架构设计融合网络。编码器分为三个分支：RGB编码器使用预训练ResNet-18提取视觉语义特征（输出512维）；深度编码器使用轻量卷积网络提取几何结构特征（输出256维）；力/力矩编码器将六维力序列（历史窗口长度10）输入双层LSTM，提取时序力特征（输出128维）。各分支输出经特征对齐后拼接为896维融合特征向量，输入解码器预测末端执行器的动作增量（Δx, Δy, Δz, 插入速度v）。

跨模态注意力机制的增强版本将力编码器生成的触觉嵌入作为查询，视觉编码器输出作为键值对，通过自注意力与交叉注意力结构实现模态间的精细交互。为确保触觉嵌入在训练初期的稳定性，引入物理信息正则化，鼓励双边力平衡——这一正则化项反映了人类运动控制中的对称性原理，对装配任务的力导向性至关重要。

3. 插入力动态调节

3.1 基于SAC的装配策略学习

装配策略使用Soft Actor-Critic（SAC）强化学习算法训练。SAC在动态环境中适应性强的特点已通过多组实验得到验证。状态空间包含融合特征向量与当前机器人位姿；动作空间为末端笛卡尔速度（3个平移自由度）和插入方向力设定值；奖励函数为稀疏+稠密组合：插入成功时给予+100的稀疏奖励；插入深度每增加1mm给予+0.1的稠密奖励；接触力超过阈值（即危险力限值）时给予重度惩罚。

训练在PyBullet仿真环境中进行，采用域随机化技术（随机化零件位姿、摩擦力、接触刚度）增强策略的泛化能力。基于SAC的方法在仿真中达到87%抓取成功率，训练曲线稳定收敛于100,000步。

3.2 力动态观测与阻抗自适应

在实时装配过程中，插入力并非恒定的——随插入深度增加，接触面积增大导致摩擦力上升；零件导向角接触会导致力突变。设计力动态观测器估计未建模的接触力分量，结合阻抗控制进行接触力柔顺调节。阻抗参数的自适应律响应观测器的估计值，确保插入过程柔顺稳定。MATCH框架——一种学习如何动态选择每控制维度采用力控还是位控的方法，在极端定位不确定性下成功率比纯位控策略高出10%，其根本优势在于能够在接触过程中自适应地切换控制模态，避免了纯位控策略因定位误差过大导致的零件破损。

4. 实验验证

4.1 实验设置

装配测试件包括：标准圆柱销-孔、带45°导向角的轴套、异形D形截面的轴孔配合。每一类在50次随机位姿偏移下测试（X/Y方向±5mm，角度偏移±2°）。

4.2 结果

方法	标准轴孔成功率	导向角轴孔成功率	D形截面成功率	平均峰值力(N)
纯视觉位控	71%	58%	52%	28.4
纯力控	85%	76%	63%	22.1
视触觉融合（无RL）	89%	82%	71%	18.5
视触觉+SAC（本文）	98%	94%	88%	11.8

交叉模态转换器结合对称性正则化的方法在带导向角轴套上成功率已接近96%，而结合强化学习后进一步提升。视触觉融合SAC方法成功率显著高于对比方法，在D形截面上提升幅度最大（达36%），充分说明了力感知在几何不对称装配中不可或缺。

4.3 力调节效果

典型装配过程的力-时间曲线显示，本文方法在插入开始和结束两个力突变阶段实现了平滑过渡，力超调量仅8.2N，而纯力控方法的超调量达到27N。更关键的是，该方法不仅降低峰值力，还学会了根据不同任务阶段自动选择执行何种控制策略，平均施力比变阻抗策略低30%。

5. 结论

本文提出的触觉-视觉多模态融合伺服控制与插入力调节方法，通过自编码器融合网络和SAC装配策略学习，有效解决了非标精密装配中几何不确定性和定位误差带来的挑战。对称性引导的物理信息融合为装配任务提供了更优的力导向性，结合强化学习后策略在不同零件形状上均表现出良好的泛化能力。未来将扩展至双臂协同装配场景，并引入更丰富的触觉模态以提高灵巧操作能力。

上一篇: 基于大语言模型约束理解的非标机械设计规则嵌入与自动布局生成下一篇: 非标自动化产线数字孪生模型的数据同化框架与实时状态偏差校正