当前位置：首页 > news >正文

硬件木马检测中边界网络标签污染的对抗攻击与防御

news 2026/5/26 16:13:57

1. 项目概述当硬件木马检测遇上“毒标签”在集成电路IC设计的漫长流水线中硬件木马Hardware Trojan, HT检测一直是悬在安全工程师头顶的达摩克利斯之剑。随着第三方IP核和外包设计成为行业常态一颗芯片从架构到流片可能经过无数双并非完全可信的手。传统的功能测试和形式化验证方法在面对精心设计、只在特定罕见条件下激活的木马电路时往往力不从心。于是基于机器学习ML的检测技术近年来备受瞩目它通过分析门级网表的拓扑、时序等特征试图从海量逻辑门和连线中揪出那些“图谋不轨”的恶意电路听起来就像是给芯片做一次智能的“CT扫描”。然而安全领域永远是一场攻防的螺旋上升。当我们开始依赖数据驱动的模型时攻击者的矛头也自然转向了数据本身。最近读到一篇挺有意思的研究它没有去攻击模型本身的结构也没有去生成对抗样本干扰推理而是瞄准了机器学习模型训练的“源头活水”——训练数据的标签。更具体地说它盯上了一个在硬件木马检测中特有的、有点“灰色”的地带边界网络。所谓边界网络就是那些一脚踩在木马电路里另一脚连着正常逻辑的连线。该研究揭示攻击者只需极轻微地“污染”这个区域的标签——在训练数据中把少数边界网络的标签从“木马”翻转为“正常”或者反之——就能像滴入一滴毒药般显著毒化整个分类器的性能导致其在后续检测中“失明”。这种攻击被称为对抗性标签翻转攻击而边界网络在其中扮演了“毒性放大器”的角色。这让我想起早年在做电路验证时的经历标注的模糊地带往往是错误和漏洞的温床。这项研究把这个问题量化并提升到了对抗性攻击的高度对于所有从事硬件安全、特别是依赖机器学习工具链的工程师来说都是一个必须正视的警示。它意味着我们的检测防线可能比想象中更脆弱攻击的成本也可能低得惊人。本文将深入拆解这项研究不仅复现其核心发现更结合工程实践探讨其背后的原理、攻击的实施细节以及我们作为防御方该如何应对。2. 核心原理为什么边界网络是“阿喀琉斯之踵”要理解边界网络的毒性首先得弄清楚基于机器学习的硬件木马检测是如何工作的以及边界网络在这个流程中处于什么尴尬位置。2.1 机器学习检测流程与标签依赖典型的基于监督学习的HT检测流程可以概括为“特征提取-标注-训练-推理”四步曲。验证工程师首先需要准备一批已知感染了木马的网表作为训练集。对于网表中的每一条“线”即网络需要提取一系列特征例如结构特征该网络的扇入扇出数、连接的逻辑门类型与门、或门、触发器等、在电路逻辑深度中的层级。时序特征信号传播延迟、切换活性等。拓扑特征该网络在图论中的中心性指标、与特定电路模块如时钟网络、复位网络的距离等。提取出高维特征向量后最关键的一步来了给每一条网络打上标签。标签通常是二元的“Trojan”属于木马电路或“Normal”属于正常电路。这个标签是基于对木马电路的先验知识即你知道木马具体由哪些门和连线构成来手动或半自动标注的。随后这些带标签的特征数据被送入分类器如随机森林、支持向量机进行训练最终得到一个能区分“Trojan”和“Normal”网络的模型。当需要检测一个新的未知网表时提取其特征并输入该模型即可得到预测结果。注意这里存在一个根本性的假设——训练数据的标签是绝对正确且可靠的。整个监督学习大厦都建立在这个基石之上。如果标签错了模型学到的就是错误的知识。2.2 边界网络标签的“灰色地带”那么边界网络究竟是什么为什么它的标签会成为问题我们可以把一个植入木马的电路想象成在一幅正常城市地图正常电路上强行嵌入了一个秘密基地木马电路。秘密基地有自己的内部道路内部木马网络城市有其他道路正常网络。而边界网络就是连接秘密基地出入口与城市主干道的那些“交界道路”。从电路结构上看内部木马网络完全位于木马电路内部只与木马逻辑门相连。正常网络完全位于正常电路内部只与正常逻辑门相连。边界网络一端连接着木马电路中的逻辑门另一端连接着正常电路中的逻辑门。它是两者通信和数据交换的唯一通道。现在标注的困境出现了这条“交界道路”到底该算作秘密基地的一部分还是城市的一部分从功能上看它服务于木马从物理连接上看它一半属于木马一半属于正常电路。这就是边界木马网络标注问题。在研究中通常有两种处理策略但各有缺陷策略A全部标为“正常”。这是早期一些研究采用的方法理由可能是“它毕竟连着正常电路”。但这样做模型在学习时就会把许多本应视为可疑的木马连接特征当作正常特征学进去导致模型对木马边界的感知能力变弱在推理时容易将真实的木马边界网络误判为正常漏报。策略B全部标为“木马”。这能提高木马检测的召回率但代价是会将大量正常的连接误标为木马。这相当于扩大了木马电路的“嫌疑范围”虽然可能抓得更全但也会带来大量的误报并且扭曲了模型对木马电路真实规模的认识。2.3 毒性作用的机理数据污染如何被放大攻击者正是利用了这种标注的模糊性和强制性选择。在对抗性标签翻转攻击场景下我们假设攻击者有能力在数据标注阶段做手脚例如通过植入恶意脚本、篡改标注工具或利用不安全的EDA工具链。他不需要攻击所有数据只需要精心选择那些边界网络的标签进行翻转。其毒性放大机制在于特征混淆性边界网络本身在特征空间中就处于“Trojan”和“Normal”类别的边界区域。它们的特征可能同时具备两类电路的一些特点。翻转其标签相当于强行移动了分类决策边界在特征空间中最模糊、最不确定区域的一个关键锚点。影响传播性在基于树的模型如随机森林或基于核函数的模型如SVM中一个位于决策边界的关键样本标签错误会影响其周围一大片特征相似区域的分类结果。模型会基于这个错误标签重新调整划分“楚河汉界”的规则。极低的攻击成本关键在于边界网络的数量相对于整个网表的网络总数来说占比极小。研究数据显示在某些基准电路中边界网络仅占总网络数的约0.09%。攻击者只需污染这极少比例的数据就能达成目标。这是因为攻击精准地命中了模型学习的“要害”——那些最难分类、对决策边界形成至关重要的样本。用一个类比来说训练分类器就像教一个孩子识别猫和狗。如果拿一张看起来既像猫又像狗的动物图片边界样本却告诉孩子这是“猫”那么孩子以后看到所有具有类似模糊特征的动物都可能认作猫。攻击者不需要篡改大量的纯猫或纯狗图片只需要篡改这几张关键的“混淆图片”就能系统性带偏孩子的认知。边界网络就是硬件木马检测中的这些“混淆图片”。3. 攻击场景拆解四种“下毒”方式原论文中设计了四种具体的标签翻转攻击场景来实证边界网络的毒性。我们可以把这看作攻击者四种不同的“下毒”策略。3.1 确定性攻击策略这两种策略基于明确的规则攻击意图明显。ALFA.1将所有边界网络标签翻转为“木马”攻击操作无论边界网络原本根据何种规则标注攻击者强制将数据集中所有边界网络的标签都改为“Trojan”。攻击意图与预期影响这是一种“宁可错杀一千”的污染方式。它会显著扩大训练数据中“木马”类的样本空间特别是加入了许多特征上更接近“正常”的样本那些原本可能被标为正常的边界网络。预期会导致训练出的模型对“木马”的判定标准变得宽松增加误报率。在实际检测中模型可能将更多正常网络怀疑为木马。ALFA.2将所有边界网络标签翻转为“正常”攻击操作强制将数据集中所有边界网络的标签都改为“Normal”。攻击意图与预期影响与ALFA.1相反这是一种“掩人耳目”的污染方式。它将木马与正常电路交界处的关键证据“洗白”。模型在学习时会认为这些具有混合特征的网络是正常的从而降低对真实木马边界网络的敏感度导致漏报率上升。木马电路更容易“隐身”。3.2 随机性攻击策略这两种策略引入了不确定性模拟了更隐蔽或更无目标的攻击。ALFA.3基于简单规则的随机翻转攻击操作攻击者制定一些简单的、看似合理的随机规则来翻转标签。例如“所有连接到触发器Flip-Flop的边界网络其标签翻转为‘正常’”。这模仿了一种有特定偏向性但非全局的攻击。攻击意图与预期影响这种攻击比完全随机更有针对性可能针对特定类型的木马如基于时序触发的木马。其影响取决于所定规则与木马电路功能的相关性可能导致模型对某类木马的检测能力出现特定盲区。ALFA.4完全随机翻转攻击操作对每个边界网络以50%的概率随机决定是否翻转其标签翻转时随机将其改为“木马”或“正常”。攻击意图与预期影响模拟一种无差别、盲目的数据污染。它不追求最大破坏而是测试模型对随机标签噪声的鲁棒性。由于边界网络样本本就关键即使是随机扰动也预期会对模型性能产生显著的负面影响这恰恰证明了该区域样本的脆弱性。实操心得在安全评估中ALFA.2全部标正常往往是最危险的因为它直接帮助木马隐藏符合攻击者利益。而ALFA.4随机翻转的结果可以作为模型鲁棒性的一个底线参考。如果随机污染都能造成显著伤害说明模型的稳定性严重依赖少数关键样本的标签质量。4. 实验复现与影响深度分析为了直观理解这种攻击的效果我们结合论文数据并加以解读看看这“0.09%”的污染能掀起多大风浪。4.1 实验设置与评估指标研究使用了公开的硬件木马基准电路集如Trust-Hub上的资源采用了一种改进的基础标注流程。他们选取了多种经典的分类器进行测试其中重点分析了随机森林和支持向量机的结果。评估没有只看常见的准确率或F1分数而是采用了更全面的指标组合这很关键真正率实际是木马且被正确检出的比例。低TPR意味着漏报多木马被放行。真负率实际是正常且被正确判断为正常的比例。低TNR意味着误报多正常电路被冤枉。马修斯相关系数这是一个在样本类别不均衡时木马网络通常远少于正常网络比F1分数更可靠的指标其值在-1到1之间1表示完美预测0表示随机预测-1表示完全反向预测。MCC综合考虑了TP、TN、FP、FN能更好地反映整体分类质量。4.2 攻击效果数据解读下表综合了论文中对随机森林分类器在遭受不同攻击后的性能影响攻击场景TPR 变化趋势TNR 变化趋势MCC 变化趋势核心影响解读基础标注基准基准基准作为性能对照基线。ALFA.1 (全标木马)显著下降保持极高 (99%)显著下降模型变得“疑神疑鬼”TPR下降意味着很多真木马没检出漏报但TNR高说明它对正常电路判断还行。MCC下降表明整体分类质量恶化。ALFA.2 (全标正常)剧烈下降保持极高 (99%)剧烈下降最危险的攻击。TPR暴跌意味着木马检测能力严重受损木马极易漏网。模型学会了将边界特征视为正常。ALFA.3 (规则随机)中度下降保持极高 (99%)中度下降有针对性的规则破坏了模型对特定模式的学习性能出现可观的下降。ALFA.4 (完全随机)下降轻微下降 (~97.8%)下降即使是随机噪声由于击中关键样本也能造成明显伤害。TNR的轻微下降说明开始出现误报。关键发现攻击效率极高仅污染约0.09%的样本边界网络就能导致SVM和RFC的分类器MCC值下降超过9个百分点。在某些场景下TPR的下降幅度更为惊人。TNR的“欺骗性”稳定一个有趣的现象是除了完全随机攻击其他攻击下TNR都保持在99%以上。这可能会给工程师一种错觉“我的模型在识别正常电路方面依然很准”。但实际上木马检测的核心能力已经严重受损。这凸显了仅依赖少数指标如整体准确率或TNR评估安全检测模型的危险性。不同分类器的脆弱性差异SVM和RFC都受到了显著影响但影响模式略有不同。例如ALFA.1对SVM的TNR破坏更大说明SVM的决策边界对“木马”类样本的扩张更敏感。4.3 毒性本质为什么这么小的污染能造成大破坏这背后的本质是机器学习模型特别是复杂模型在拟合数据时会极力去学习训练集中的每一个模式包括那些由错误标签产生的“虚假模式”。边界网络样本数量虽少但它们在特征空间中的位置至关重要——它们定义了“木马”与“正常”之间那条模糊的过渡带。当这些关键样本的标签被翻转对于线性模型或基于距离的模型决策边界会直接向错误标签的方向偏移以容纳这些被误标的点。对于树模型构建树的分裂规则会因为这些关键点的标签变化而改变可能导致在特征空间的关键区域生成完全不同的分支。由于边界网络的特征本身具有二象性模型很难通过其他大量正确样本的信息来“纠正”这几个点的错误。相反模型会认为这是一种合法的、需要学习的“例外情况”或“特殊模式”从而将错误内化到其参数中。这种对关键边界样本的过度依赖使得攻击者可以用极低的成本实现“四两拨千斤”的效果。5. 工程实践中的挑战与防御思考这项研究并非只是展示一种攻击更是对当前基于ML的硬件木马检测工业实践提出了严峻挑战。作为安全工程师我们必须思考如何应对。5.1 现实世界中的攻击路径攻击者如何实施这种标签翻转攻击论文提到了几种可能的威胁模型内部恶意人员在数据标注阶段拥有访问权限的工程师故意错误标注。供应链攻击通过污染第三方提供的EDA工具或IP核中的标注脚本、插件。恶意软件入侵用于训练的数据存储或处理服务器篡改标签文件。这些路径在复杂的IC设计供应链中并非天方夜谭使得这种攻击具有现实可行性。5.2 现有防御措施的局限性面对这种攻击一些直观的防御方法可能效果有限简单数据清洗/去噪由于边界网络数量极少0.09%它们很容易被当作正常的“噪声”或“边缘案例”而忽略难以通过常规的离群值检测方法发现。使用更鲁棒的模型虽然一些对噪声不敏感的模型如某些集成方法可能表现稍好但研究显示主流的RFC和SVM均已中招说明这不是某个特定模型的缺陷而是这种监督学习范式在面临针对性数据污染时的结构性弱点。人工复查标签理论上可行但成本极高。面对数百万甚至上亿个网络人工逐一核对边界网络标签不现实。更何况边界网络的标注本身就有模糊性不同工程师的判断可能不一致。5.3 可行的缓解与防御思路结合论文的启示和工程经验我们可以从以下几个方向探索采用半监督或无监督学习从根本上减少对大量精确标签的依赖。例如使用异常检测算法只将明显偏离“正常”电路模式的网络标记为可疑而不需要预先定义“木马”样本。或者利用少量干净标签进行引导的半监督学习。开发对标签噪声鲁棒的训练算法研究社区已在开发能容忍一定比例错误标签的机器学习算法。我们可以尝试将这些算法适配到硬件安全领域。例如在损失函数中引入对疑似错误标签样本的惩罚降低机制。多分类器集成与投票训练多个使用不同标注假设例如有的默认边界网络为正常有的默认其为木马或不同算法的分类器。在推理时综合所有分类器的结果进行判断。单一攻击很难同时毒化所有分类器。但正如论文所指出的如果攻击者知道所有分类器类型理论上可以针对性地设计攻击且组合爆炸问题使得穷举所有标注场景不现实。引入可解释性与人工核查闭环不将ML模型作为“黑盒”判决工具而是作为“可疑度排序”工具。模型输出每个网络的“木马概率”工程师可以重点审查概率处于中间值例如0.3-0.7的网络这些很可能就是边界网络或模型不确定的区域。结合电路功能分析进行最终判断。强化数据供应链安全将训练数据的完整性、标注过程的可审计性纳入安全开发生命周期。对标注工具、脚本进行代码审计和完整性校验对参与标注的人员进行最小权限管理和操作日志记录。注意事项最根本的或许是改变我们对“一次性训练永久性使用”的ML检测模型的依赖。硬件木马检测应该是一个动态的、持续学习的过程。需要建立反馈机制将线上检测到的可疑案例经过人工确认后不断反馈到训练集中更新模型使其能够适应新的攻击模式和纠正过去的认知偏差。6. 总结与展望回顾这项关于边界网络毒性影响的研究它像一束探照灯照亮了基于机器学习的硬件木马检测方法中一个长期被忽视的暗角。它告诉我们即使模型结构再精巧特征工程再出色如果喂养它的“粮食”——训练数据——在源头被下了毒那么整个检测系统就会从根子上变得不可靠。攻击者无需破解复杂的模型只需在数据标注的模糊地带轻轻一推就能让我们的安全防线出现巨大裂痕。这项研究的价值不仅在于揭示了一种高效的攻击方法更在于它迫使我们重新审视整个检测流程的信任链。它提醒硬件安全工程师没有银弹机器学习是强大的工具但不是万能且绝对安全的。必须对其脆弱性保持清醒认识。关注数据质量在追求更高精度模型的同时必须投入同等甚至更多的精力来保证训练数据的质量和安全特别是那些对模型决策有关键影响的“边界样本”。评估指标要全面不能只看整体准确率或某个单一指标。TPR、TNR、MCC等综合评估尤其是关注在遭受潜在数据污染后的性能变化至关重要。走向动态防御静态的、训练完就固化的检测模型难以应对持续演变的威胁。需要构建包含数据验证、模型更新、人工研判在内的动态安全检测体系。从我个人的工程实践角度看未来有希望的方向可能是将形式化方法的一些思想与机器学习结合。例如利用电路的结构化先验知识对边界网络的标注生成一个“合理范围”而不是一个绝对标签或者开发能够同时处理模糊标签和逻辑约束的机器学习模型。这条路虽然艰难但或许是构建下一代高可靠、高鲁棒性硬件安全检测技术的必经之路。安全永远是攻防对抗的动态平衡而这项研究让我们对“防”的这一侧有了更深刻也更紧迫的认识。

查看全文

http://www.gsyq.cn/news/1393398.html