当前位置：首页 > news >正文

可重构机器人无限形态合成：FNN与ANFIS驱动地面清洁全覆盖

news 2026/5/28 21:36:30

1. 项目概述：无限形态重构如何重塑地面清洁机器人

如果你家里用过扫地机器人，大概率遇到过墙角、家具腿旁边那一圈永远扫不干净的“卫生死角”。这不是算法不够聪明，而是机器人的“身体”太“笨拙”——一个固定的圆形或D形底盘，注定无法完美贴合千奇百怪的家具轮廓。这就像试图用一块方砖去填满一个波浪形的缺口，无论如何都会留下缝隙。而今天要深入探讨的hTetro-Infi项目，正是为了解决这个根本性痛点而生。它不再满足于有限的几种预设形态，而是像一团智能的“橡皮泥”，能根据眼前障碍物的形状，实时改变自身构型，真正做到“见缝插针”，实现近乎100%的地面覆盖率。

这个项目的核心，是将“可重构机器人”的概念推向了极致。传统的可重构机器人，比如其前身hTetro，灵感来源于俄罗斯方块（Tetromino），能在七种固定形态（如I、L、T形等）间切换。这已经比固定形态机器人灵活了不少，但面对现实中复杂的弧形、斜角或不规则障碍物时，七种形态依然捉襟见肘。hTetro-Infi的“Infi”（无限）之名，便源于其革命性的目标：通过智能算法，动态合成无限多种形态，使机器人的轮廓能够无限逼近任何障碍物的外缘。

其工程价值远不止于“把地扫得更干净”。它代表了一种机器人设计范式的转变：从让环境适应机器人（如将环境栅格化、简化障碍物为方形），转变为让机器人主动适应环境。这种能力在清洁之外，对于灾难救援（进入废墟狭缝）、工业检测（贴合复杂设备表面）等领域都具有深远意义。项目团队巧妙地选择了地面清洁这个高频、刚需的场景作为技术验证的突破口，使得这项前沿研究有了非常扎实的应用落脚点。

2. 核心原理：从有限形态到无限形态的跨越

要理解hTetro-Infi的飞跃，必须先搞懂传统铺砖（Tiling）理论机器人的工作原理及其局限。

2.1 传统铺砖理论的瓶颈

现有的可重构清洁机器人（如hTetro）其路径规划基于“铺砖理论”。它将清洁区域划分为一个个与机器人单体模块（一个方块）大小相同的栅格。规划时，机器人会尝试用自己有限的几种多边形形态（如七种俄罗斯方块形状）去“铺满”未被障碍物占据的栅格。这里存在一个关键假设：任何被障碍物部分占据的栅格，都被视为完全占据。如图3(a)-(d)所示，一个椭圆形障碍物在栅格地图中会被“像素化”为一系列被标记为“占据”的黑色方格。

这种做法是为了数学上的简便和规划算法的可行性，但代价是产生了“近似误差”。那些被障碍物轻微覆盖的栅格角落（图3(d)中的白色区域），会被机器人直接放弃，成为清洁盲区。当环境中存在大量不规则形状的家具、柱体时，这些盲区累积起来，会显著降低清洁效率。本质上，这是用算法的简化牺牲了物理世界的精度。

2.2 hTetro-Infi的无限形态合成原理

hTetro-Infi的核心思路是打破“有限形态”的枷锁。它的硬件基础与hTetro类似：由四个方块模块通过三个铰链连接而成。每个铰链的转动角度α, β, γ可以在0到180度之间连续变化，而非传统hTetro的0、90、180度三个固定档位。正是铰链的连续可调，构成了无限形态的物理基础。

其工作流程是一个“感知-计算-变形-执行”的闭环：

感知与定位：机器人通过搭载的2D激光雷达（LiDAR）构建环境地图。当按照常规铺砖路径清洁到障碍物附近（通常保持一个栅格的安全距离）时，它会启动高精度轮廓感知。
轮廓参数化：如图4所示，机器人以第一个模块为参考坐标系，测量障碍物边缘到四个模块中心点沿X1轴方向的距离d1, d2, d3, d4。这四个距离值，本质上数字化了障碍物相对于机器人当前位姿的局部轮廓。
计算目标偏移量：机器人需要调整形态，使得四个模块的中心点能“对齐”这个轮廓。计算每个模块相对于参考模块所需的偏移量δ1, δ2, δ3（公式1：δi = d1 - di+1）。这三个偏移量，就是形态合成的“目标”。
逆解算：从偏移量到铰链角：这是最关键的步骤。已知目标偏移量(δ1, δ2, δ3)，需要反推出三个铰链应转动的角度(α, β, γ)。这本质上是一个机器人逆运动学问题，但比机械臂末端定位更复杂，因为它要求所有中间模块（第二、第三块）的位置也同时满足约束。

注意：这里不能使用传统的几何解析法直接求解。原因有三：第一，方程可能无解（硬件运动范围限制）；第二，传感器存在测量噪声；第三，这是一个多解甚至欠约束的优化问题，需要找到一个最可行的解。因此，项目采用了数据驱动的智能方法——前馈神经网络（FNN）和自适应神经模糊推理系统（ANFIS）来学习从偏移量到铰链角之间的复杂非线性映射关系。

形态执行与覆盖：控制器驱动铰链转动到计算出的角度，机器人变形为与障碍物轮廓匹配的形态，然后向前移动，紧密贴合障碍物进行清扫，从而覆盖传统方法留下的盲区。

3. 智能核心：FNN与ANFIS如何驱动形态合成

既然解析法走不通，hTetro-Infi选择让机器“学习”如何变形。这好比教一个孩子用可弯曲的尺子去描摹一个复杂图案，他通过无数次尝试，会逐渐掌握什么样的弯曲角度能匹配什么样的曲线段落。

3.1 前馈神经网络（FNN）方案

FNN是一种经典的监督学习模型，非常适合处理复杂的非线性拟合问题。在本项目中，FNN的输入层是三个神经元，对应三个目标偏移量(δ1, δ2, δ3)；输出层也是三个神经元，对应三个铰链角度(α, β, γ)。

网络构建与训练实操要点：

数据生成：由于没有现成的“障碍物轮廓-铰链角”配对数据，团队通过机器人运动学正解公式（公式2-7），枚举了所有可能的铰链角组合（以5度为步长），计算出对应的偏移量，生成了13,357组“标准答案”用于训练。这是一种利用已知物理模型生成仿真数据的常用方法。
网络结构调优：研究尝试了不同隐藏层神经元数量的网络（如50、100、150个）。最终，包含100个隐藏神经元的单隐藏层网络（FNN-2）在测试集上取得了最小的均方根误差（RMSE = 7.28）。这里遵循了“万能近似定理”，单隐藏层足够拟合连续函数。
训练算法：采用Levenberg-Marquardt反向传播算法，它结合了梯度下降和高斯-牛顿法的优点，在中小型网络上收敛速度快、精度高。
部署推理：训练好的FNN模型被集成到机器人的上位机（Intel计算棒）中。在线运行时，感知模块计算出偏移量后，直接输入FNN，在毫秒级（实测约0.04ms）内即可输出铰链角预测值。

FNN方案的潜在问题与对策： FNN是一个“黑箱”模型，其输出可能超出铰链的物理限位（0-180度）。在实际部署中，必须在控制层加入输出限幅环节，将网络输出的角度值钳制在有效范围内。虽然这可能导致最终形态与理想轮廓有微小偏差，但保证了系统的安全性与可行性。

3.2 自适应神经模糊推理系统（ANFIS）方案

ANFIS可以看作是FNN与模糊逻辑的混合体。它兼具神经网络的学习能力和模糊系统的可解释性。其结构（图6）本质上是将一个“如果-那么”规��的模糊推理系统，用网络层的形式来实现和学习。

ANFIS的工作流程与优势：

模糊化：输入（三个偏移量）被映射到多个模糊集合（如“负大”、“负小”、“零”、“正小”、“正大”），使用三角隶属度函数。
规则层：每个节点代表一条模糊规则（例如：如果δ1是正大，且δ2是负小，且δ3是零，那么...）。
归一化与去模糊化：计算每条规则的激活强度，并归一化。最后，通过加权平均所有规则的结果（输出为铰链角的线性函数），得到清晰的铰链角度值。

ANFIS的实操优势：

可解释性：工程师可以查看和学习后的模糊规则，理解机器人的“决策逻辑”，这在调试和安全性验证时非常有用。
输出范围约束：可以方便地将输出模糊集的论域（范围）预先定义为铰链的实际角度范围（0-180度），从而从根本上避免输出越界，无需后处理限幅。
训练数据利用：项目采用网格划分法初始化模糊规则，然后使用混合学习算法（反向传播调整输入隶属度函数参数，最小二乘法调整输出参数）进行训练。最终，每个输入使用5个三角隶属度函数的ANFIS-2取得了最佳性能（RMSE与最佳FNN相当）。

FNN与ANFIS的选择考量：从表1的对比来看，两者在形态合成的精度（RMSE）上表现相当，都能将未覆盖区域面积降低90%以上。选择哪一个，更多取决于工程偏好：

追求极致速度和轻量部署：可选FNN，它结构简单，推理速度极快。
强调系统可靠性和可解释性：应选ANFIS，它能保证输出不越界，且规则可读，便于故障诊断和后续规则注入（如加入专家经验）。

心得：在机器人嵌入式系统中引入AI模型时，绝不能只盯着测试集精度。推理延迟、内存占用、输出安全性和可调试性，往往是决定项目成败的工程细节。ANFIS在这方面展现出了独特的优势。

4. 系统实现与性能验证全记录

理论再完美，也需要实验的验证。hTetro-Infi团队通过详尽的仿真，证明了其理念的优越性。

4.1 形态合成行为仿真

为了直观展示无限形态的能力，研究设计了一个经典场景：机器人从四个主要方向（左、右、上、下）接近一个不规则障碍物（图7）。对于每个方向，障碍物呈现出的局部轮廓都不同。

仿真过程实录：以从左侧接近为例，机器人通过传感器测得距离：d1=54.6cm, d2=43.1cm, d3=41.7cm, d4=54.6cm。计算得偏移量δ1=11.5cm, δ2=12.9cm, δ3=0cm。

FNN输出：α=41.6°, β=77.6°, γ=0.0°。
ANFIS输出：α=41.7°, β=80.9°, γ=0.0°。

机器人根据这些角度变形后，其右侧轮廓形成了一个与障碍物左侧凹陷处高度匹配的曲线，从而能够深入传统方形机器人无法触及的区域进行清洁。表2完整记录了四个方向上的合成角度，可以看到，针对不同轮廓，铰链角度的组合差异很大，充分体现了“无限形态”的适应性。

4.2 覆盖率性能量化评估

仿真在8个具有不同异形障碍物（模拟柱子、家具等）的测试场景（图8）中进行，对比了三种配置：

基准：传统hTetro（仅7种形态）。
方案一：hTetro-Infi (FNN)。
方案二：hTetro-Infi (ANFIS)。

关键结果分析（表3）：

在所有8个案例中，两种hTetro-Infi方案的未覆盖区域面积均远小于传统hTetro。
统计检验（单因素方差分析及事后Tukey检验）表明（图9）：
- hTetro-Infi (FNN) 与 hTetro-Infi (ANFIS) 之间的性能无显著差异。
- 但两者与传统hTetro之间的性能差异极其显著。
效应量（Cohen‘s d）高达2.96（大于0.8即算大效应），说明hTetro-Infi带来的覆盖率提升不是细微改进，而是巨大的性能飞跃。

这个结果意味着什么？它不仅仅证明了FNN和ANFIS有效，更从根本上验证了“无限形态重构”这一理念的威力。将机器人的形态自由度从离散的几种解放为连续无限多种，为解决非结构化环境下的覆盖问题开辟了一条全新的、有效的技术路径。

5. 工程化思考、局限与未来展望

尽管仿真结果令人振奋，但将一个研究原型推向实用，还有大量的工程挑战需要克服。

5.1 从仿真到实机的挑战与应对

论文提到，硬件平台可直接沿用hTetro，但需进行“微小改动”，这恰恰是工程的关键：

铰链精密控制：需要为三个铰链加装高精度绝对值编码器，实现角度的闭环反馈控制。电机和减速器的选型需平衡扭矩（带动模块变形）、速度（变形耗时）和精度。
同步性与稳定性：四个模块在变形和移动中需严格同步，否则会导致内部应力或打滑。这需要设计鲁棒的多机协同控制算法。
感知与定位精度：形态合成严重依赖LiDAR对障碍物距离d1-d4的精确测量。在近距离、低反射率（如黑色家具腿）情况下，感知误差会被放大，可能导致合成形态失准。可能需要融合近距离TOF传感器或视觉数据进行补偿。
实时性保障：整个“感知-计算-变形”环路必须在机器人接近障碍物的短暂时间内完成。虽然FNN/ANFIS推理仅需毫秒级，但点云处理、坐标变换等步骤也需优化。Intel计算棒的算力需要仔细评估。

5.2 当前方案的局限与改进方向

单障碍物假设：当前工作聚焦于接近单个障碍物时的形态合成。现实中环境是复杂的，存在多个分散、形状各异的障碍物。机器人需要决策：是逐个贴合清扫，还是寻找一个“折中形态”一次性覆盖多个？这需要更高级的全局路径规划和形态优化算法。
铰链配置的优化：hTetro的铰链分布（一侧一个，另一侧两个）导致其向不同方向弯曲的能力不对称。未来的机械设计可以探索更对称或自由度更高的铰链布局（如每个连接处都是双自由度铰链），以解锁更丰富的形态空间。
能耗与时间成本：频繁的形态重构需要耗能，且会中断清洁流程。是否值得为覆盖最后1%的盲区而花费20%的额外时间和电量？这需要在实际场景中建立覆盖率和效率的帕累托最优模型。
狭缝穿越能力：本文主要关注“贴合清扫”，但无限形态的另一个巨大潜力是“变形通过”狭窄通道。这需要研究在保持清洁模块接触地面的同时，如何规划形态序列以挤过狭小空间。

5.3 未来应用拓展

hTetro-Infi的理念具有强大的可扩展性：

多变形机器人：可应用于三模块的hTromino或更多模块的机器人，只需调整网络输入输出维度即可。
其他服务场景：如窗户清洁机器人贴合窗框、管道检测机器人适应不同管径、灾难救援机器人进入废墟缝隙。
集群协作：多个可重构机器人协同工作，甚至可以动态连接组合成更大形态，应对超大规模或复杂区域的覆盖任务。

我个人在研读和复现此类项目时的最深体会是：机器人学的前沿创新，正越来越多地出现在“机械设计”、“感知算法”与“智能决策”的交叉点上。hTetro-Infi正是一个绝佳的例证——没有连续可调的铰链（机械），就没有无限形态的物理可能；没有LiDAR精确测距（感知），就无法获取轮廓信息；没有FNN/ANFIS（智能），就无法解决从轮廓到动作的映射问题。任何一个环节的短板，都会让整个系统失效。因此，从事机器人研发，必须培养这种全栈的、系统级的思维，并在每一个环节都追求极致的工程可靠性。这个项目为我们展示的，不仅是一个更会扫地的机器人，更是一种让机器主动适应物理世界的智能柔性思维，这才是其最宝贵的价值所在。

查看全文

http://www.gsyq.cn/news/1416878.html