点击下方卡片关注“CVer”公众号AI/CV重磅干货第一时间送达点击进入—【顶会/顶刊】投稿交流群添加微信号CVer2233小助手拉你进群扫描下方二维码加入CVer学术星球可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料及应用发论文/搞科研/涨薪强烈推荐转载自遥感与深度学习题目Full-Scope Vectorization of Geographical Elements from Large-Size Remote Sensing Imagery期刊IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI)论文https://doi.org/10.1109/TPAMI.2026.3660934数据WHU-building、GLH-water、VHR-road代码https://li-99.github.io/project/Vectorization.html年份2026单位武汉大学自然资源部粤港澳大湾区自然资源数据协同应用工程技术创新中心湖北珞珈实验室华为云创新点提出端到端金字塔融合网络PFNet通过多视野信息融合实现大尺寸图像的全局语义分割避免滑窗切块带来的地理要素碎片化问题提出拐点感知网络IPNet利用拐点这一类别无关的轮廓关键点描述对粗粒度边界点进行精细化调整设计点扰动策略缓解IPNet与PFNet在共享训练数据上联合训练时的过拟合问题构建统一的类别无关矢量化框架可同时处理建筑、水体、道路等多类地理要素的矢量提取背景大尺寸超高分辨率VHR遥感图像是高精度地理要素矢量制图的重要数据源但受GPU显存限制现有深度学习方法通常采用滑窗切块策略处理大图这不可避免地造成地理要素的结构破碎无法充分利用图像的全局上下文信息从而导致矢量制图性能下降。现有针对建筑、道路等特定要素的矢量化方法依赖类别专属的几何先验难以迁移至其他要素少数统一化方案也仅能处理小尺寸图像。因此如何在单一框架内实现大尺寸VHR图像上多类地理要素的全局、精细、类别无关的矢量化是亟待解决的问题。数据WHU-building包含400张大尺寸VHR遥感图像及对应高质量建筑标注每张图像尺寸为10000×10000像素空间分辨率0.075米按320/40/40划分训练、验证、测试集GLH-water包含250张全球分布的卫星图像及人工标注的地表水体标注涵盖多种水体类型与形状每张图像尺寸为12800×12800像素空间分辨率0.300米按200/25/25划分训练、验证、测试集VHR-road包含208张图像每张尺寸为12500×12500像素空间分辨率0.200米按166/21/21划分训练、验证、测试集方法整体框架整体框架由两个解耦模块串联构成PFNet负责全局语义分割IPNet负责局部轮廓精化点扰动策略保障两模块在共享数据上的协同训练。PFNet金字塔融合网络图像块金字塔构建对大尺寸图像以不同下采样率构建多层金字塔每层以固定尺寸的图像块作为输入不同层覆盖不同感受野范围底层保持原始分辨率以保留局部细节上层以更大感受野捕获全局上下文多视野融合架构MFA各层图像块分别经过独立的特征编码器和解码头得到各自的特征图与置信度图将各层结果对齐至底层参考位置后通过平均融合得到全局感知的语义分割结果金字塔融合损失对最终融合结果和各层中间结果均施加分割监督通过平衡系数协调各层贡献促进多视野信息的有效利用IPNet拐点感知网络点对点配对构建基于语义分割结果提取实例轮廓经Douglas-Peucker算法简化得到稀疏粗粒度轮廓点训练阶段对粗粒度点施加随机扰动并为每个扰动点在标注轮廓中搜索最近拐点或非拐点作为监督目标语义引导点感知架构SPA以每个扰动点为中心从原始大图中裁取局部图像块经骨干网络提取特征结合语义置信度图与点热图输出该点为拐点的概率及精确拐点坐标从而对粗粒度点执行移动或剪枝操作联合结构-语义损失同时对语义分割结果和点热图施加监督利用高斯核生成结构标签并区分拐点与非拐点引导网络精确感知轮廓关键点结果与分析在建筑、水体、道路三个大尺寸VHR遥感图像数据集上所提方法在绝大多数语义级、实例级和矢量级评估指标上均显著优于现有面向小尺寸图像的矢量化方法。消融实验进一步验证了PFNet的多视野融合、IPNet的拐点感知以及点扰动策略各自对最终性能的有效贡献。更多图表分析可见原文本文系学术转载如有侵权请联系CVer小助手删文何恺明在MIT授课的课件PPT下载在CVer公众号后台回复何恺明即可下载566页课件PPT大家赶紧学起来CVPR 2026 所有论文和代码下载在CVer公众号后台回复CVPR2026即可下载CVPR 2026 所有论文和代码CV垂直方向和论文投稿交流群成立扫描下方二维码或者添加微信号CVer2233即可添加CVer小助手微信便可申请加入CVer-垂直方向和论文投稿微信交流群。另外其他垂直方向已涵盖目标检测、图像分割、目标跟踪、人脸检测识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。 一定要备注研究方向地点学校/公司昵称如Mamba、多模态学习或者论文投稿上海上交卡卡根据格式备注可更快被通过且邀请进群▲扫码或加微信号: CVer2233进交流群 CVer计算机视觉知识星球人数破万如果你想要了解最新最快最好的CV/DL/AI论文、实战项目、行业前沿、从入门到精通学习教程等资料一定要扫描下方二维码加入CVer知识星球最强助力你的科研和工作 ▲扫码加入星球学习▲点击上方卡片关注CVer公众号 整理不易请点赞和在看