当前位置: 首页 > news >正文

【Week 37, 2025】每周阅读三篇论文

Paper 1: Graph Neural Network for Decentralized Multi-Robot Goal Assignment

用图神经网络GNN去解决具有通信约束情况下的Linear Sum Assignment Problem (LSAP)——机器人任务一对一约束下最小化总成本

论文信息

  • 标题:Graph Neural Network for Decentralized Multi-Robot Goal Assignment
  • 作者 / 单位:Manohari Goarin, Giuseppe Loianno / Tandon School of Engineering, New York University, Brooklyn, NY 11201 USA
  • 来源:IEEE ROBOTICS AND AUTOMATION LETTERS, VOL. 9, NO. 5, MAY 2024
  • 原文链接:https://ieeexplore.ieee.org/document/10452797

背景和贡献

  • 解决LSAP思路有:Centralized Method 和 Decentralized Method
  • Decentralied Method 可以有
    • Optimization-based Method:例如分布式匈牙利算法(Hungarian algorithm)
    • Market-based Methods:例如拍卖算法
    • Learning-based Methods:例如GNN
  • 主要贡献:处理了具有通信拓扑约束的情况

方法

网络的输入是一个节点包含机器人r和目标g的异构图,图的边是通信拓扑约束和代价。
网络的输出是机器人是否分配目标的概率
训练采用监督学习(supervised learning),模仿集中式 Hungarian algorithm 的最优 LSAP 解。
image

结果和评价

GNN类方法提供了一个思路,即如何去建模和表征任务与Agent之间的关系


Paper 2:Dynamic Coalition Formation and Routing for Multirobot Task Allocation via Reinforcement Learning

用 attention 网络去解决同构机器人集群的任务分配问题 ST-MR-TA

论文信息

  • 标题:Dynamic Coalition Formation and Routing for Multirobot Task Allocation via Reinforcement Learning
  • 作者 / 单位:Weiheng Dai1, Aditya Bidwai, Guillaume Sartoretti / Department of Mechanical Engineering, College of Design and Engineering, National University of Singapore
  • 来源:2024 IEEE International Conference on Robotics and Automation (ICRA)
  • 原文链接:https://ieeexplore.ieee.org/document/10611244/

背景和贡献

  • Work falls under the category of ST-MR-TA, where each robot can perform only one task at a time (ST), each task can require the cooperation of multiple robots (MR), and task allocation continuously happens across time (TA).
  • Agents learn to reason about their position, the status of all tasks, as well as the position and short-term intent of other agents, to make reactive movement decisions (i.e., which task to travel to and complete next)
  • 提供了一个减少训练时真正用到的决策变量的leader-follower的trick

方法

image
Observation(task state, agent info, task_already_done_flag) --[Linear Projection]--> embeddings --[Multi-head Attentions Encoder]--> contents --[Decoder]--> Probability Distribution of Task

Training: REINFORCE [28] algorithm with greedy rollout baseline

结果和评价

  • 采用Attension网络去构造规划器,提供了一个例子
  • 用到的Agent是全局的信息,不是局部感知信息

Paper 3:Learning Policies for Dynamic Coalition Formation in Multi-Robot Task Allocation

一句话总结

论文信息

  • 标题:Learning Policies for Dynamic Coalition Formation in Multi-Robot Task Allocation
  • 作者 / 单位:Lucas C. D. Bezerra , Ata ́ıde M. G. dos Santos , and Shinkyu Park / Electrical and Computer Engineering, King Abdullah University of Science and Technology (KAUST), Thuwal, 239556900, Kingdom of Saudi Arabia;Department of Electrical Engineering, Federal University of Sergipe (UFS), Sa ̃o Cristo ́va ̃o, Sergipe, 49107-230, Brazil.
  • 来源:IEEE Robotics and Automation Letters ( Volume: 10, Issue: 9, September 2025)
  • 原文来源:https://ieeexplore.ieee.org/document/11091462

背景和贡献

  • Multi-Robot Task Allocation (MRTA), Single-Task robots, Multi-Robot tasks, Timeextended Assignment (ST-MR-TA)
  • The problem of decentralized dynamic coalition formation under partial observability has not been previously addressed
  • Focus on developing policies for a team of robots capable of performing tasks that require coalition in dynamic environments.
  • An end-to-end convolutional neural network based on the U-Net architecture

方法

  • In this framework, the policy selects a task at each time step, while a motion planner handles the low-level actuator control to navigate the robot to the task location —— This abstraction alleviates the learned policy from handling low-level control, allowing it to concentrate on long-term planning.
  • Model the problem as a Decentralized Partially-Observable Markov Decision Process (Dec-POMDP)
  • Adopt MAPPO, a CTDE algorithm designed for MARL, is an Actor-Critic algorithm
    image

结果和评价

  • 用Dec-POMDP建模问题,用Actor-Critic algorithm来训练Policy
http://www.gsyq.cn/news/79411.html

相关文章:

  • 五大值得选择的PMP培训机构研究报告
  • 告别选择困难:2025年锁定与您业务高度匹配的北京审计事务所
  • 2025年复合气体检测仪订做厂家权威推荐榜单:便携式复合气体检测仪‌/便携式复合气体检测仪‌/SF6气体检测仪源头厂家精选
  • 2025年北京审计事务所排行榜:基于专业资质、服务网络与客户口碑的综合测评发布
  • 2025年12月北京审计报告事务所实力排行榜:基于权威排名的专业机构全名单
  • OMS信创迁移中常见的坑
  • 制造业海外营销服务商推荐,涵盖 Google、Facebook、TikTok、 ins、LinkedIn 等海外营销主流平台
  • 2025 年 12 月焊管厂家权威推荐榜:不锈钢/镀锌/光亮/直缝/大口径焊管,精密冷拔与无缝工艺实力品牌深度解析
  • 北京婚姻律师事务所哪家好?多家机构综合实力解析
  • 云监控 2.0 升级:SysOM 系统诊断在 Java 内存问题排查中的应用
  • 飞橙教育 联系方式: 企业短视频营销培训服务选择注意事项提醒
  • U-Mail或成为国内邮件服务器软件行业专业品牌 - U
  • 量子计算研究突破:13篇顶会论文深度解析
  • 2025 年 12 月钢管厂家权威推荐榜:焊接/镀锌/精密/不锈钢/冷拔钢管,汽车油路/高压油路/液压油缸专用管材实力甄选
  • 2025年热门的无极绳绞车压绳轮组厂家最新实力排行
  • 油头细软塌救星:2025 控油去屑洗发水排行榜,洗后清爽不扁塌
  • 2025 清淤机器人厂家 TOP10 推荐:智能科技破解行业痛点,这些品牌值得关注
  • 东城区婚姻律师事务所推荐:本地婚姻家事法律服务机构盘点
  • 火狐安装未签名的离线扩展
  • 能提高免疫力的灵芝品牌哪家好?品质之选推荐
  • 业内推荐!2025年河北十大双片钉箱机厂家口碑排行榜,头部双片钉箱机怎么选择精选优质品牌解析
  • 2025年节油的轮胎推荐:五大专业测评必读
  • 99% 准确率的智能客服Agent设计
  • 2025年如何挑选网站建设公司?严选十大网站设计制作公司重磅推荐助您精准决策
  • 2025年南通装修公司哪家经验丰富、口碑好的公司推荐:装修公
  • 2025年温州家庭装修公司推荐,专业装修公司年度排名解析
  • 深入解析:【数据库基础】SQL与关系型数据库原理
  • 2025年3D砂型打印行业权威品牌综合实力榜 全球粘结剂喷射技术市场深度解析与领先品牌评估
  • 2025年五大海鲜礼盒正规厂家排行榜,新测评精选海鲜礼盒厂家
  • 2025 连云港市买商标必看测评:合规平台 TOP3,效率与安全性双保障