当前位置: 首页 > news >正文

顶刊TPAMI 2026!武大华为提出大尺寸遥感影像地理要素全域矢量化模型

点击下方卡片关注“CVer”公众号AI/CV重磅干货第一时间送达点击进入—【顶会/顶刊】投稿交流群添加微信号CVer2233小助手拉你进群扫描下方二维码加入CVer学术星球可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料及应用发论文/搞科研/涨薪强烈推荐转载自遥感与深度学习题目Full-Scope Vectorization of Geographical Elements from Large-Size Remote Sensing Imagery期刊IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI)论文https://doi.org/10.1109/TPAMI.2026.3660934数据WHU-building、GLH-water、VHR-road代码https://li-99.github.io/project/Vectorization.html年份2026单位武汉大学自然资源部粤港澳大湾区自然资源数据协同应用工程技术创新中心湖北珞珈实验室华为云创新点提出端到端金字塔融合网络PFNet通过多视野信息融合实现大尺寸图像的全局语义分割避免滑窗切块带来的地理要素碎片化问题提出拐点感知网络IPNet利用拐点这一类别无关的轮廓关键点描述对粗粒度边界点进行精细化调整设计点扰动策略缓解IPNet与PFNet在共享训练数据上联合训练时的过拟合问题构建统一的类别无关矢量化框架可同时处理建筑、水体、道路等多类地理要素的矢量提取背景大尺寸超高分辨率VHR遥感图像是高精度地理要素矢量制图的重要数据源但受GPU显存限制现有深度学习方法通常采用滑窗切块策略处理大图这不可避免地造成地理要素的结构破碎无法充分利用图像的全局上下文信息从而导致矢量制图性能下降。现有针对建筑、道路等特定要素的矢量化方法依赖类别专属的几何先验难以迁移至其他要素少数统一化方案也仅能处理小尺寸图像。因此如何在单一框架内实现大尺寸VHR图像上多类地理要素的全局、精细、类别无关的矢量化是亟待解决的问题。数据WHU-building包含400张大尺寸VHR遥感图像及对应高质量建筑标注每张图像尺寸为10000×10000像素空间分辨率0.075米按320/40/40划分训练、验证、测试集GLH-water包含250张全球分布的卫星图像及人工标注的地表水体标注涵盖多种水体类型与形状每张图像尺寸为12800×12800像素空间分辨率0.300米按200/25/25划分训练、验证、测试集VHR-road包含208张图像每张尺寸为12500×12500像素空间分辨率0.200米按166/21/21划分训练、验证、测试集方法整体框架整体框架由两个解耦模块串联构成PFNet负责全局语义分割IPNet负责局部轮廓精化点扰动策略保障两模块在共享数据上的协同训练。PFNet金字塔融合网络图像块金字塔构建对大尺寸图像以不同下采样率构建多层金字塔每层以固定尺寸的图像块作为输入不同层覆盖不同感受野范围底层保持原始分辨率以保留局部细节上层以更大感受野捕获全局上下文多视野融合架构MFA各层图像块分别经过独立的特征编码器和解码头得到各自的特征图与置信度图将各层结果对齐至底层参考位置后通过平均融合得到全局感知的语义分割结果金字塔融合损失对最终融合结果和各层中间结果均施加分割监督通过平衡系数协调各层贡献促进多视野信息的有效利用IPNet拐点感知网络点对点配对构建基于语义分割结果提取实例轮廓经Douglas-Peucker算法简化得到稀疏粗粒度轮廓点训练阶段对粗粒度点施加随机扰动并为每个扰动点在标注轮廓中搜索最近拐点或非拐点作为监督目标语义引导点感知架构SPA以每个扰动点为中心从原始大图中裁取局部图像块经骨干网络提取特征结合语义置信度图与点热图输出该点为拐点的概率及精确拐点坐标从而对粗粒度点执行移动或剪枝操作联合结构-语义损失同时对语义分割结果和点热图施加监督利用高斯核生成结构标签并区分拐点与非拐点引导网络精确感知轮廓关键点结果与分析在建筑、水体、道路三个大尺寸VHR遥感图像数据集上所提方法在绝大多数语义级、实例级和矢量级评估指标上均显著优于现有面向小尺寸图像的矢量化方法。消融实验进一步验证了PFNet的多视野融合、IPNet的拐点感知以及点扰动策略各自对最终性能的有效贡献。更多图表分析可见原文本文系学术转载如有侵权请联系CVer小助手删文何恺明在MIT授课的课件PPT下载在CVer公众号后台回复何恺明即可下载566页课件PPT大家赶紧学起来CVPR 2026 所有论文和代码下载在CVer公众号后台回复CVPR2026即可下载CVPR 2026 所有论文和代码CV垂直方向和论文投稿交流群成立扫描下方二维码或者添加微信号CVer2233即可添加CVer小助手微信便可申请加入CVer-垂直方向和论文投稿微信交流群。另外其他垂直方向已涵盖目标检测、图像分割、目标跟踪、人脸检测识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。 一定要备注研究方向地点学校/公司昵称如Mamba、多模态学习或者论文投稿上海上交卡卡根据格式备注可更快被通过且邀请进群▲扫码或加微信号: CVer2233进交流群 CVer计算机视觉知识星球人数破万如果你想要了解最新最快最好的CV/DL/AI论文、实战项目、行业前沿、从入门到精通学习教程等资料一定要扫描下方二维码加入CVer知识星球最强助力你的科研和工作 ▲扫码加入星球学习▲点击上方卡片关注CVer公众号 整理不易请点赞和在看
http://www.gsyq.cn/news/1390889.html

相关文章:

  • 全域协同 智防应急 | 黎阳之光打造新一代智慧应急平台
  • 表单开发效率断崖式提升?Lovable工具链全拆解:从Schema驱动→动态校验→状态快照→AB测试埋点→灰度发布,一气呵成
  • 联想老本IdeaPad 310S升级记:8G内存+512G固态+Win10/Ubuntu双系统保姆级教程
  • PinyinJS:如何用26KB的JavaScript库解决汉字拼音转换难题?
  • 量子机器学习中的电路切割技术与CutReg方法解析
  • Terraform Import 实战:将存量云资源纳入代码治理
  • 长期使用TaotokenTokenPlan套餐在项目开发中的成本节约感受
  • 如何用3步清理Windows“此电脑“中的顽固快捷方式
  • 新手必看使用Python快速接入Taotoken调用ChatGPT模型
  • 通过Taotoken CLI工具一键配置开发环境中的多个AI工具密钥
  • 如何快速制作Linux启动盘:Deepin Boot Maker完整指南
  • 如何用Pyannote.audio实现高精度说话人日志分析
  • GTA5线上小助手:完全免费的洛圣都终极游戏增强工具
  • openMES:如何用开源制造执行系统实现工厂数字化转型?
  • ArcGIS坐标转换实战:从原理到精准操作指南
  • SQL触发器设计指南:强一致性场景下的安全实践
  • HTTP 500错误根因排查:Content-Type与Authorization头部配置指南
  • XCOM 2模组管理革命:Alternative Mod Launcher让你的游戏体验提升300%
  • 手写 Flash Attention:从算法原理到高性能实现
  • Arduino电磁铁驱动磁力运动装置:从原理到DIY桌面动态摆件
  • RH850的TAUB时钟玩转PWM:Master/Slave架构详解与一个实战配置误区
  • 告别限速!9大网盘直链下载助手终极指南
  • 猫抓浏览器扩展:高效网页媒体资源嗅探与下载技术方案
  • 告别官方启动器!XCOM 2模组管理神器Alternative Mod Launcher完全指南
  • AArch64内存模型:端序与内存类型详解
  • 别再只盯着Offboard了!用Mavros玩转PX4无人机的5个实战场景(附Python/ROS2代码)
  • FBG传感柔性针穿刺机器人:精准绕障与闭环控制技术解析
  • 科研绘图小白的逆袭方法
  • 旅游多语言动态路由失效事故(Lovable上线前72小时紧急修复纪实):Next.js i18n配置避坑红宝书
  • PPTist深度解析:构建现代化在线演示文稿编辑器的实战指南