当前位置：首页 > news >正文

神经算子：从PDE求解到生物医学工程应用的AI新范式

news 2026/5/25 7:59:28

1. 神经算子从抽象概念到生物医学的“超级翻译器”在科学计算和工程仿真领域我们长期面临一个核心矛盾一方面物理世界的规律如流体流动、组织形变、药物扩散本质上是连续的由偏微分方程PDE描述另一方面计算机只能处理离散的数据点。传统的高保真数值方法如有限元法虽然精确但计算成本高昂难以满足实时或大规模参数化分析的需求。而降阶模型ROM虽然快速但其极度简化的特性往往牺牲了泛化能力一旦问题参数或边界条件超出预设范围预测就可能失效。大约五年前一种名为“神经算子”的机器学习范式开始进入我们的视野。它试图从根本上解决这个矛盾不学习单个问题的解而是学习从问题参数如边界条件、外力、材料属性到PDE解的“映射规则”本身。你可以把它想象成一个精通所有PDE语言的“超级翻译器”。一旦训练完成给定一个新的、从未见过的“问题描述”输入函数这个翻译器几乎能瞬间“译出”对应的“解”输出函数无需重新进行昂贵的数值求解。我第一次接触这个概念是在一篇关于非局部材料建模的论文中当时团队正苦于如何从有限的生物组织实验数据中反推出其复杂的本构关系。传统方法要么需要强假设要么计算量巨大。神经算子的出现尤其是像DeepONet这样的架构让我们看到了曙光——它承诺了一种数据驱动且高效的方法来学习这种从载荷到响应的复杂物理映射。在生物医学工程这个数据往往稀疏、昂贵但物理规律又至关重要的领域这种能力显得尤为珍贵。它不仅仅是加速计算更是开启了一扇从数据中直接发现物理规律、构建可解释模型的新大门。2. 核心架构解析神经算子如何“学会”映射神经算子的核心思想是学习两个无限维函数空间之间的算子。用更直白的话说传统神经网络学习的是“点对点”的映射如输入一个向量输出一个标量或向量而神经算子学习的是“函数对函数”的映射。这使其天生适合处理PDE问题因为PDE的解本身就是一个函数如空间中的温度场、位移场。2.1 两大主流范式DeepONet与积分神经算子目前神经算子家族主要有两大分支它们从不同的数学视角实现了函数到函数的映射。2.1.1 DeepONet分支与主干的精巧分工DeepONetDeep Operator Network是首个具有严格数学基础的深度神经算子其设计非常直观且巧妙。它由两个并行的子网络构成分支网络负责处理输入函数f。通常我们将输入函数在一组固定的传感器点{x1, x2, ..., xm}上进行离散采样得到一个向量[f(x1), f(x2), ..., f(xm)]输入给分支网络。该网络的任务是从这个离散表示中提炼出能够刻画整个输入函数全局特征的隐式编码b(f) [b1(f), b2(f), ..., bp(f)]。你可以把它理解为一个“问题特征提取器”。主干网络负责处理输出函数的查询位置y。它接收一个空间坐标y作为输入输出一个相同维度的向量t(y) [t1(y), t2(y), ..., tp(y)]。这个网络学习的是解函数在空间中的基函数模式是一个“空间模式编码器”。最终的预测输出Gθ(f)(y)就是这两个向量在隐空间中的内积Gθ(f)(y) Σ_{k1}^{p} bk(f) · tk(y)这实际上是用一组由主干网络生成的、与位置相关的基函数tk(y)以及由分支网络确定的、与输入函数相关的系数bk(f)来线性组合出最终的解函数。这种“系数-基函数”的分解思想与许多经典的数值方法如谱方法有异曲同工之妙。注意DeepONet的训练完全依赖于数据。损失函数就是预测解与真实解在所有训练样本和所有传感器位置上的均方误差。它不显式地编码物理方程因此是一个“黑箱”模型但其强大的函数逼近能力已被理论证明。2.1.2 基于空间的积分神经算子迭代式的特征演化另一大类神经算子采用了一种迭代架构灵感来源于求解PDE的迭代方法如不动点迭代。其通用形式可以写作u_{t1}(x) σ( W u_t(x) ∫ κ_φ(x, y, a(x), a(y)) u_t(y) dy )这里u_t(x)是第t层或迭代步的特征函数。σ是非线性激活函数。W是一个线性变换矩阵可学习参数。积分核κ_φ是整个架构的灵魂。它是一个由神经网络参数化的函数定义了空间中任意两点x和y之间的“相互作用”。通过积分操作模型能够捕获解函数的非局部依赖关系这是处理许多复杂物理现象如长程力、扩散的关键。a(x)和a(y)是可选的附加信息如空间相关的参数或系数。这个公式描述了一个过程每一层节点x处的特征由其自身经过线性变换后的特征加上其“邻居”节点y的特征通过核函数加权求和后的结果共同经过非线性激活得到。通过多层堆叠信息在空间中传播和融合最终逼近PDE的解。2.1.3 谱域实现的“三剑客”直接计算上述积分在连续空间中是不现实的。因此研究者们利用变换域方法来实现高效的积分操作其中最著名的三种是傅里叶神经算子在傅里叶频域进行积分核与函数的卷积。由于卷积在频域变为逐点乘法且快速傅里叶变换效率极高FNO在处理具有平移不变性的问题上如均匀介质中的波动速度极快成为目前最流行的神经算子之一。小波神经算子使用小波变换替代傅里叶变换。小波能同时提供空间和频率的局部化信息因此WNO特别擅长处理多尺度问题和奇异性如尖锐界面、裂纹这在生物组织具有多层次结构的力学分析中很有优势。拉普拉斯神经算子在拉普拉斯域或更广义的复频域表示解。它采用一种“极点-留数”的公式特别适合描述具有衰减、振荡等动态特性的系统例如阻尼振动、生物电信号传播等。实操心得选择哪种神经算子很大程度上取决于问题的物理本质。对于周期性或均匀性问题FNO是首选对于多尺度、异质性强的生物组织WNO可能更佳而对于动态系统响应分析LNO值得尝试。在实际项目中我们常常会先用FNO做基线模型因为其实现成熟、计算快再根据效果尝试更专门的架构。2.2 物理信息神经算子给黑箱装上“物理指南针”纯粹的数据驱动神经算子虽然强大但在数据稀缺的生物医学场景下容易过拟合或产生物理上不合理的预测。这催生了物理信息神经算子的概念。其核心思想非常简单却有效在损失函数中除了衡量预测与观测数据吻合程度的数据损失L_data额外增加一个物理损失L_physics。这个物理损失强制要求神经算子预测出的函数必须近似满足其背后潜在的物理定律通常是PDE及其边界/初始条件。L(θ) L_data(θ) λ * L_physics(θ)其中λ是一个权衡超参数。例如如果我们知道某个过程受扩散方程支配那么L_physics就会计算预测解代入扩散方程算子后的残差。通过同时最小化数据误差和物理残差PINOs能够显著减对大量标注数据的依赖物理定律提供了强大的正则化。提升外推泛化能力即使在训练数据分布之外预测也倾向于遵守物理规律。增强模型的可解释性模型不再是一个纯粹的黑箱其行为受到已知物理的约束。在我参与的一个心脏电生理模拟项目中我们仅有少数几个病人的心脏表面电位映射数据。直接训练DeepONet来预测整个心脏的电位传播效果很差。引入基于反应-扩散方程的物理损失后模型不仅能用少得多的数据拟合出观测点还能合理预测未测量区域的电活动其预测的波前传播速度与生理常识相符这让我们对模型的可靠性有了更大信心。3. 从公式到实践Peridynamic Neural Operator (PNO) 案例深潜理论需要落地才能体现价值。在生物医学工程中一个极具代表性的应用是Peridynamic Neural Operator。它完美展示了如何将领域知识非局部力学与神经算子架构深度融合解决从实验数据中发现本构定律这一经典逆问题。3.1 问题背景生物组织力学与数字图像相关技术生物软组织如心脏瓣膜、血管、皮肤的力学行为极其复杂表现为非线性、超弹性、各向异性且常具有非局部效应。其本构关系应力-应变关系很难用传统的唯象模型精确描述。另一方面数字图像相关技术已成为实验力学的主流手段它能通过对比变形前后的图像高精度地测量物体表面的全场位移。然而DIC给出的是“结果”位移场我们如何从中反推出“原因”材料本构关系传统反演方法通常需要假设一个本构模型的形式如Fung模型、Holzapfel模型然后优化其参数。这种方法严重依赖于模型假设的正确性且计算成本高。PNO提供了一条新路径不预设本构方程的具体形式而是用一个神经算子来直接学习从位移历史到材料点所受合力的映射。3.2 PNO架构设计与物理编码PNO的灵感来源于近场动力学这是一种非局部连续介质力学理论。其基本思想是材料点x的力学状态不仅取决于其直接邻居还取决于其有限半径δ内所有点的相互作用。PNO的目标是学习一个算子G该算子将位移场u(x,t)映射到运动方程中的残差即惯性力与内力之差。其核心公式体现了物理编码G[u](x,t) : ∫_{B_δ(0)} ( t[u,x,t]⟨ξ⟩ t[u,xξ,t]⟨-ξ⟩ ) · M[u,x,t]⟨ξ⟩ dξ这个公式保证了动量守恒等基本物理定律的自动满足。其中t[u,x,t]⟨ξ⟩是一个标量力状态描述了从点x指向点xξ的“键”上的力。它由一个浅层MLPσ_NN参数化输入是物理量如键的伸长率e、非局部膨胀ϑ等和可学习的材料参数θ_t。ω(x,ξ)是一个非局部核函数决定了相互作用的权重随距离和方向的变化。它也由一个神经网络ω_NN参数化。M是变形后键的方向向量。最关键的一步是异质性编码对于像心血管组织这样具有胶原纤维定向排列的材料其力学性能是各向异性的。PNO通过引入一个可学习的、空间变化的旋转角场α(x)来刻画这种异质性。核函数变为ω(R(-α(x))ξ)其中R是旋转矩阵。这意味着模型在学习力学响应的同时可以一并推断出胶原纤维的微观取向场。3.3 训练、验证与物理发现训练PNO需要一组时序的DIC测量数据{ 位移场 u^s(x, t_k), 体力 b^s(x, t_k), 边界条件 u^s_BC(x, t_k) }其中s代表不同的加载协议如双轴测试中不同的应力比例。损失函数定义为预测位移与实测位移的相对L2误差。训练过程即优化力状态网络和核函数网络的参数θ_t,θ_ω以及纤维角场参数θ_α。在一项针对猪三尖瓣前叶的双轴测试实验中研究团队使用了7种不同的应力比例协议共采集了1398个时间点的数据。他们用其中120个点训练PNO用剩余的1278个点测试。结果令人印象深刻预测精度能够学习异质性纤维取向的PNO模型其测试误差比假设材料均匀的模型降低了约75%也显著优于传统的Fung模型拟合。这说明从数据中同时学习力学本构和微观结构是可行且必要的。物理发现训练好的PNO不仅仅是一个预测工具。它可以被用来计算无法直接测量的场例如从DIC位移场计算出第一Piola-Kirchhoff应力场图4d这是实验无法直接提供的。揭示微观结构模型预测的胶原纤维取向场α(x)与通过偏振空间频域成像技术独立测量的结果高度吻合图4e。这意味着PNO仅从宏观力学测试数据中“发现”了组织的微观结构特征。避坑指南在实际操作中成功应用PNO有几个关键点。第一数据质量至关重要。DIC的位移场噪声需要预处理否则会严重影响核函数的学习。我们通常会用简单的滑动平均或基于物理的光滑先验进行滤波。第二非局部半径δ的选择。太小则退化为局部模型太大则计算量激增且可能引入不必要的长程耦合。需要通过网格搜索或基于材料特征长度如纤维束间距来初步确定。第三力状态网络σ_NN不宜过深。由于其输入是明确的物理量应变、伸长率一个2-3层的MLP通常足以捕捉复杂的非线性过深反而容易导致训练不稳定和过拟合。4. 生物医学工程中的全景式应用图谱神经算子在生物医学工程中的应用已远远超出组织力学正在渗透到成像、动力学、疾病预测等多个前沿领域。4.1 组织力学与生物医学成像在这个领域神经算子主要扮演着“增强器”和“求解器”的角色。弹性成像超声弹性成像通过测量组织在声辐射力下的位移来反演其弹性模量分布这是一个典型的病态逆问题。基于WNO的弹性成像方法能够直接从稀疏或含噪的位移场中稳定、快速地重建出组织的弹性图甚至不需要显式求解复杂的PDE反问题。血流动力学从稀疏的边界测量如血管入口流速波形预测整个血管网络的压力和流速场。DeepONet和FNO已被用于构建从流速到压力的映射算子这对于无创评估血管功能如主动脉扩张性具有重要意义。医学图像处理图像配准将不同时间点或不同模态的医学图像进行对齐。传统方法迭代求解优化问题速度慢。FNO-based的配准方法如FNOReg学习从图像对到形变场的算子实现近乎实时的配准。图像生成与增强直接从原始超声射频信号生成聚焦超声的压力分布图或肺部通气图绕过了复杂的声波传播正演模拟。4.2 生物医学动力学与疾病进展预测这里神经算子用于学习时空演化动力学是“预测器”。心血管力学预测主动脉壁内损伤场的演化模拟动脉夹层的发生和发展过程。这对于评估动脉瘤破裂风险至关重要。肿瘤生长预测将肿瘤生长模型如反应-扩散方程与神经算子结合构建从初始条件、微环境参数到长期肿瘤形态演化的算子。这类模型能够整合多模态影像数据CT, MRI进行个性化预后模拟。心脏电生理学习从心肌组织特性、离子通道参数到心脏表面电位时传播的算子。可以用于快速筛查致心律失常基质或评估药物对心脏电活动的影响。药物动力学在数据稀缺的情况下如早期临床试验利用神经算子学习药物在体内浓度随时间变化的规律可以更准确地预测新给药方案下的药效。4.3 前沿扩展与融合模型基础的神经算子架构正在被扩展以应对更复杂的挑战时序图模型对于肿瘤、血管网络等具有不规则几何形状的结构图神经网络与神经算子的结合图神经算子显示出巨大潜力。它将计算域视为图节点间的消息传递机制天然适合建模非均匀的相互作用。多保真度学习生物医学数据常呈现多保真度特性——高保真数据如动物实验、高分辨率仿真精确但稀少低保真数据如简化模型、历史数据丰富但粗糙。构建能够同时利用多保真度数据的神经算子是提升数据利用效率的关键。例如可以用大量低保真数据预训练算子再用少量高保真数据微调。与生成式AI结合一个令人兴奋的方向是使用大型语言模型作为“ orchestrator ”将用自然语言描述的临床问题如“模拟缺氧条件下肿瘤中的氧扩散”自动转化为神经算子的数学表述和训练设置。反之神经算子可以作为物理模拟模块被AI智能体调用用于自动化实验设计或药物发现流程。5. 挑战、对策与未来展望尽管前景广阔将神经算子应用于生物医学工程仍面临诸多挑战这也是我们一线研究者每天在攻克的问题。5.1 核心挑战与应对策略数据稀缺与异质性这是生物医学领域的常态。应对策略包括物理信息正则化如前所述的PINO是当前最主流且有效的方法。迁移学习与元学习在一个大型、多样的生物力学数据集上预训练一个“基础神经算子”然后针对特定器官或疾病用少量数据快速微调。多任务学习让一个算子同时学习多个相关任务如同时预测位移场和应力场共享的表征学习可以提高数据效率。外推泛化能力模型在训练数据分布内表现良好但面对全新的病理状态或极端加载条件时可能失效。不确定性量化为神经算子的预测提供置信区间。贝叶斯神经算子或深度集成方法可以估计预测中的认知不确定性和偶然不确定性这对于临床决策至关重要。纳入更广泛的物理约束除了守恒律还可以编码诸如材料稳定性 Drucker 公设、热力学第二定律等更基本的原理确保预测在物理上是“合理”的即使外推。计算效率与部署虽然推理快但训练大型神经算子尤其是3D时间问题仍需要大量计算资源。模型压缩与蒸馏训练一个大型、精确的教师网络然后将其知识蒸馏到一个更轻量化的学生网络中便于在边缘设备如超声仪上部署。专用硬件与编译器优化利用GPU、TPU甚至神经形态计算芯片的并行能力并针对FNO中的FFT等操作进行底层优化。5.2 构建生物力学基础模型一个可行的愿景我认为神经算子发展的一个终极形态是构建生物力学基础模型。这类似于自然语言处理中的GPT或视觉领域的CLIP。我们可以设想这样一个框架大规模预训练在一个极其庞大和多样化的生物力学数据集上进行预训练这个数据集包含多器官心脏、血管、肝脏、骨骼、皮肤等的力学响应数据来自仿真、实验。多尺度从分子胶原蛋白拉伸到组织瓣膜变形到器官心脏泵血的数据。多模态整合力学数据与影像、组学、电生理数据。多物理场耦合力学、流体、传热、化学反应。任务适配与微调这个预训练好的基础算子已经内化了广泛的生物力学“常识”。当面对一个新的特定任务时例如为某个患者预测主动脉瘤的生长我们只需要提供该患者有限的个性化数据如一次CT影像和血压测量对基础模型进行轻量级的微调即可获得一个高精度的个性化模型。可解释性与知识发现基础模型不仅用于预测其内部表示可能编码了深层次的生物力学规律。通过分析模型在不同刺激下的响应我们或许能发现新的生物标志物或者对疾病机制产生新的假设。这条路充满挑战涉及数据标准化、模型架构设计、伦理等诸多问题。但回顾从DeepONet诞生至今短短几年的发展神经算子已经从一个新颖的数学概念迅速成长为解决生物医学工程中高维、多物理场、数据驱动建模问题的有力工具。它正在改变我们理解生命系统力学、设计医疗设备、规划手术方案乃至发现新药的方式。作为一名从业者我的体会是拥抱这种“学习算子”的范式意味着我们从“解决单个问题”转向“学习解决一类问题的方法”这或许是通往更智能、更通用的科学计算引擎的关键一步。最后分享一个实用建议对于刚入门的研究者或工程师不要试图从头实现最复杂的变体。从成熟的库如DeepXDE, NeuralOperators中调用标准的DeepONet或FNO在一个自己熟悉的、定义清晰的小规模PDE问题上比如一维Burgers方程跑通整个流程亲手调试参数、观察效果是理解其精髓最快的方式。

查看全文

http://www.gsyq.cn/news/1376169.html