当前位置：首页 > news >正文

工控CTF流量分析实战：Wireshark定位异常与Base64解码技巧

news 2026/7/6 4:48:51

1. 项目概述：从一道工控CTF题看流量分析的实战价值

最近在复盘一些经典的工控安全竞赛（CTF）题目，2020年之江杯的一道异常流量分析题让我印象很深。这道题没有复杂的漏洞利用，核心就是考验选手对网络流量抓包文件（PCAP）的分析能力，以及从海量数据中抽丝剥茧、定位并解码关键信息的基本功。题目场景模拟了工业控制网络中的异常通信，最终的Flag就藏在一串经过Base64编码的数据流里。听起来简单？但很多新手面对一个几百兆的抓包文件，打开Wireshark看到满屏的协议和十六进制数据，直接就懵了。这道题恰恰是检验你是否具备安全分析师“数据感”的绝佳试金石。

工控CTF和传统的Web、Pwn类题目不同，它更贴近实际工业环境。工业协议（如Modbus、S7comm、DNP3）的流量、专有的通信模式，以及为了绕过简单检测而采用的编码混淆（比如Base64），都是常见的出题手法。掌握Wireshark这个“网络显微镜”的进阶用法，并理解Base64这类编码的识别与处理技巧，是解开这类谜题的关键。这不仅是为了比赛得分，更是现实中进行工业网络取证、威胁狩猎的必备技能。接下来，我就以这道真题为例，带你完整走一遍从拿到PCAP文件到最终提取Flag的全过程，并分享我总结的一套通用分析框架和避坑心得。

2. 解题思路与核心工具链解析

2.1 题目场景与核心需求拆解

首先，我们需要明确这道题的目标。通常，CTF流量分析题的最终目的是找到一个格式为flag{...}或类似形式的字符串。题目提供的唯一材料是一个网络数据包捕获文件（.pcap或.pcapng）。我们的任务就是扮演安全分析员的角色，在这个数据包中寻找异常、可疑或隐藏了信息的通信流。

对于2020之江杯的这道题，结合“异常流量”和“Base64解码”这两个关键词，我们可以初步构建解题思路：

整体概览：用Wireshark打开数据包，快速浏览协议统计、会话列表，寻找流量模式上的“异常点”。比如，是否存在大量重复的、小尺寸的TCP/UDP包？是否有非标准端口的通信？是否有大量某种特定协议（可能是工控协议，也可能是HTTP承载着奇怪数据）的流量？
协议聚焦：工控环境常见Modbus/TCP（端口502）、S7comm（端口102）、IEC 104等。但出题人也可能将数据隐藏在更通用的协议中，如HTTP、DNS甚至ICMP的载荷里。需要根据流量特征判断。
数据提取：找到可疑流量后，需要将其应用层数据（Payload）提取出来。Wireshark的“追踪流”功能（Follow TCP/UDP/SSL Stream）在这里至关重要。
编码识别与解码：提取出的数据很可能不是明文。Base64编码因其特征明显（常以=结尾，字符集为A-Z,a-z,0-9,+,/）且易于在文本协议中传输，成为CTF隐写的常客。我们需要识别出Base64字符串并进行解码。
Flag呈现：解码后的数据可能是文本形式的Flag，也可能是一段指令、一个文件名，甚至是另一种编码或加密形式，需要进一步处理。

2.2 工具选型：为什么是Wireshark+命令行？

工欲善其事，必先利其器。我们的核心工具链非常简单：

主分析工具：Wireshark。它是事实上的网络协议分析标准，支持上千种协议解码，过滤功能强大，可视化做得好。相比tcpdump等命令行工具，Wireshark的图形界面和集成化功能（如追踪流、导出对象）对于CTF这种需要深度交互分析的场景效率更高。
辅助解码工具：系统命令行/脚本（base64、python）。Wireshark内置的“工具”菜单下有“从Base64转换”功能，但有时不好用或无法处理复杂情况。系统自带的base64命令（Linux/macOS）或certutil（Windows），以及万能的Python，是更灵活可靠的选择。

注意：不要过于依赖图形化工具的自动解码功能。CTF题目经常会对Base64字符串进行裁剪、拼接或嵌套，手动用命令行处理能让你更清晰地看到每一步的输入输出，避免被工具“黑盒”操作带偏。

3. Wireshark深度操作：从海量数据中定位异常流

拿到一个CTF的PCAP文件，切忌毫无目的地滚动浏览。下面是我的标准操作流程。

3.1 初窥全貌：统计信息与会话分析

打开Wireshark加载数据包后，第一件事不是看包列表，而是点击菜单栏的“统计” (Statistics)。

协议分级：查看“协议分级统计”。这里会以树状图形式展示所有流量的协议分布。如果工控协议（如MODBUS/TCP）占比异常高，或者出现了本不该在工控网络出现的协议（如大量的HTTP），这就是一个强烈的异常信号。
端点与会话：查看“端点”（Endpoints）和“会话”（Conversations）。这里列出了所有通信的IP地址和端口。你需要关注：
- 非标准端口上的大量通信：比如一个内部IP在某个高位端口（如8888、9999）上与外部IP持续通信。
- 会话流量不对称：一方发送了大量数据，另一方回复很少，这可能是在执行命令或外传数据。
- 短时间内的密集连接：这可能是扫描行为或心跳包，但也可能是分片传输隐藏数据。

以我复盘的这个题目为例，在协议分级中，除了常见的TCP和部分工控协议外，我注意到有相当比例的流量被识别为“数据”（Data）或某种应用层协议，但解码不完全。而在会话列表中，发现了一个内部IP（例如192.168.1.100）与一个外部IP在某个特定端口（假设是8080）上有持续的、大小相近的TCP数据包交换，这很像在通过HTTP POST上传数据。

3.2 过滤与追踪：缩小侦查范围

基于上面的观察，我们可以构建Wireshark显示过滤器。比如，如果我们怀疑流量走的是HTTP，可以过滤http。如果想看特定IP对的通信，可以过滤ip.src==192.168.1.100 and ip.dst==目标IP。

更关键的一步是“追踪流”。在包列表中找到任何一个属于可疑会话的数据包，右键 ->追踪流->TCP流（或UDP流）。这个功能会将这个TCP会话的所有数据（包括请求和响应）重组，并以ASCII、十六进制等形式在一个窗口里展示出来。

这里是第一个实操要点：在“追踪TCP流”的窗口左下角，有一个显示格式的选择框。默认是“ASCII”。这对于查看文本协议（如HTTP）非常友好。但如果数据是二进制或经过编码的，你可能会看到一堆乱码。这时需要切换到“原始数据”（Raw），以便将整个流的内容保存下来进行后续分析。对于这道题，在追踪某个可疑端口的TCP流时，我在ASCII视图下看到了类似这样的内容片段：

POST /upload HTTP/1.1 ... Content-Type: application/octet-stream VGhpcyBpcyBhIHNlY3JldCBtZXNzYWdlLg== ...

很明显，VGhpcyBpcyBhIHNlY3JldCBtZXNzYWdlLg==是一段典型的Base64编码字符串（以==结尾）。我们的目标很可能就藏在这样的数据块里。

3.3 数据导出：为解码做准备

找到包含Base64数据的流之后，我们需要把它提取出来。在“追踪TCP流”窗口，确保显示格式为“原始数据”，然后点击旁边的“另存为”按钮，保存为一个二进制文件（比如raw_stream.bin）。这个文件包含了该TCP流的所有原始字节。

但是，这里有一个常见的坑：你保存的“原始数据”可能包含了整个TCP会话的原始字节，包括IP头、TCP头和应用层数据。而“追踪流”窗口显示的“原始数据”视图通常已经去掉了下层包头，只展示应用层载荷。为了精确，更推荐的做法是：

在包列表界面，使用过滤条件精确筛选出携带应用层数据的数据包（例如tcp.payload）。
选中这些包，然后点击“文件” -> “导出特定分组”。
在导出窗口中，选择“所选分组”，并勾选“分组字节范围”为“应用层数据”。这样导出的才是纯净的Payload。

对于这道题，由于我们已经通过追踪流确认了Base64数据在HTTP的POST正文里，我们可以直接在那个流的ASCII视图里，手动复制Base64字符串部分（从VGhp...开始到结束），粘贴到文本编辑器中，这往往是最快的方法。但如果数据分散在多个包或夹杂着其他信息，导出整个应用层数据再处理会更稳妥。

4. Base64解码实战：从字符串到Flag

拿到了疑似Base64的字符串，接下来就是解码。但CTF中的Base64 rarely comes alone。

4.1 基础解码与工具选择

最直接的解码方式是使用命令行。在Linux或macOS的终端，或者Windows的PowerShell（安装有base64模块或使用certutil）中：

# Linux/macOS echo -n "VGhpcyBpcyBhIHNlY3JldCBtZXNzYWdlLg==" | base64 --decode # Windows PowerShell (较新版本) [System.Text.Encoding]::UTF8.GetString([System.Convert]::FromBase64String("VGhpcyBpcyBhIHNlY3JldCBtZXNzYWdlLg==")) # Windows cmd (使用certutil，注意需要先写入文件) echo VGhpcyBpcyBhIHNlY3JldCBtZXNzYWdlLg== > encoded.txt certutil -decode encoded.txt decoded.txt type decoded.txt

执行后，上述例子会输出：This is a secret message.

对于题目中提取的长字符串，我们就用这种方式进行解码。但直接解码可能得不到可读文本，而是乱码或二进制数据。这引出了下一个关键点。

4.2 处理嵌套编码与文件类型识别

Base64编码的可以是任何二进制数据。解码后如果得到乱码，你需要考虑：

是否是另一种编码？解码后的数据可能又是一串Base64，或者是一串十六进制（Hex）字符串。你需要用file命令（Linux）或观察特征来判断。如果是Hex，可以继续用xxd -r -p或在线工具转换。
是否是一个文件？这是CTF中更常见的情况。Base64常用来在文本协议中传输文件。解码后的二进制数据可能是一个图片（PNG/JPG）、一个ZIP压缩包、一个PDF，甚至是一个可执行文件。

如何判断？

看文件头（Magic Bytes）：将解码后的二进制数据保存为文件（如output.bin），然后用file output.bin命令。这个命令会通过文件头识别文件类型。
观察解码后字符串：如果解码后看到PK开头，那很可能是ZIP文件；看到%PDF，那就是PDF；看到PNG，那就是PNG图片。

在这道之江杯的题目中，我将提取出的长Base64字符串解码后，file命令显示它是一个ZIP压缩包。这非常典型——Flag可能藏在压缩包里的一个文本文件中。

4.3 自动化脚本处理与复杂情况

当需要处理多个、分散的Base64块，或者解码过程需要多步（如Base64 -> Hex -> 反转字符串 -> 再Base64）时，手动操作就太慢了。这时Python脚本是绝佳选择。

例如，假设我们从Wireshark中提取出的数据是一个文本文件，里面混杂着日志和多个Base64字符串，我们可以写一个简单的Python脚本：

import re import base64 with open('extracted_data.txt', 'r') as f: content = f.read() # 使用正则表达式查找所有可能的Base64字符串 # Base64正则表达式（简化版，匹配以=结尾的4的倍数长度的字符组） b64_pattern = r'[A-Za-z0-9+/]+={0,2}' potential_b64_strings = re.findall(b64_pattern, content) for b64_str in potential_b64_strings: # 确保长度合理，避免匹配到普通单词 if len(b64_str) > 20: # 设定一个最小长度阈值 try: # 尝试解码 decoded = base64.b64decode(b64_str) # 尝试以UTF-8解码，如果不是文本会抛出异常 print(f"尝试解码字符串: {b64_str[:50]}...") print(f"解码结果(UTF-8): {decoded.decode('utf-8')}") print("-"*40) except: # 如果不是UTF-8文本，可能是二进制文件 try: # 可以尝试保存为文件 with open(f'decoded_{potential_b64_strings.index(b64_str)}.bin', 'wb') as out_f: out_f.write(decoded) print(f"解码成功，已保存为二进制文件: decoded_{potential_b64_strings.index(b64_str)}.bin") except Exception as e: print(f"解码失败: {e}")

这个脚本能自动化地尝试解码所有长得像Base64的字符串，并智能地处理文本和二进制结果。在实际比赛中，这种脚本能节省大量时间。

5. 实战复盘：2020之江杯真题逐步拆解

现在，让我们把上面的技巧串联起来，还原这道题的完整解题过程。

步骤一：加载与初筛

用Wireshark打开题目提供的industrial_traffic.pcapng文件。
查看“统计”->“协议分级”，发现除了ARP、TCP外，有显著的“HTTP”协议流量，且目标端口集中在8080。
查看“统计”->“会话”->“IPv4”，按字节数排序，发现192.168.1.105:某随机端口与10.0.0.2:8080的通信数据量突出。

步骤二：深入探查

在显示过滤器输入tcp.port == 8080，过滤出所有与8080端口相关的流量。
随机选择一个数据包，右键“追踪流”->“TCP流”。在弹出窗口中，滚动查看。
很快发现一个HTTP POST请求，其Content-Type为application/octet-stream，正文部分是一长串Base64编码的字符。这就是可疑数据。

步骤三：数据提取

在“追踪TCP流”窗口，将显示格式切换为“ASCII”（如果已经是则保持），这样Base64字符串清晰可见。
用鼠标精确选中从第一个Base64字符（不包括前面的空行或HTTP头）到最后一个字符（通常是=）的整个字符串。复制（Ctrl+C）。
打开一个文本编辑器（如VS Code、Notepad++），粘贴。保存文件为encoded_b64.txt。

步骤四：解码与发现

在终端，使用命令解码：

base64 -d encoded_b64.txt > decoded_output.bin

使用file命令检查解码后的文件类型：
```
file decoded_output.bin
```
输出显示：decoded_output.bin: Zip archive data, at least v2.0 to extract
果然是一个ZIP文件！重命名文件：
```
mv decoded_output.bin flag.zip
```
尝试解压：
```
unzip flag.zip
```
可能会提示输入密码。在CTF中，密码有时会藏在流量其他地方（如另一个HTTP请求的响应里），有时是弱密码（如123456、password、flag）。这道题经过尝试，发现密码就是flag。
解压后得到一个flag.txt文件，打开它，内容正是：flag{Th1s_1s_4n_1ndustr1al_CTF_Fl4g}。

6. 常见问题排查与高阶技巧

即使掌握了流程，实战中还是会遇到各种问题。下面是我总结的一些“坑点”和应对技巧。

6.1 Wireshark分析中的常见问题

问题1：找不到可疑流量，协议全是TCP/UDP。
- 排查：检查Wireshark是否启用了所有协议解析。有时工控协议需要手动启用或安装插件。但更多时候，数据可能被封装在常规TCP载荷中。尝试过滤tcp.payload并查看长度异常的包，或者使用“文件”->“导出对象”->“HTTP”来查看所有HTTP传输的文件。
问题2：“追踪流”窗口显示乱码，看不到Base64。
- 排查：切换显示格式。尝试“ASCII”、“EBCDIC”、“十六进制转储”。有时数据被压缩或加密了。观察十六进制视图，看是否有规律的可打印字符（20-7E范围）。Base64在十六进制下，其对应字符的ASCII码也是连续的。
问题3：Base64字符串被分割在多个TCP包中。
- 解决方案：不要只复制一个包的数据。使用“追踪流”功能，它已经帮你把整个会话的数据重组好了。在流的视图里复制完整的字符串。或者，导出整个会话的应用层数据再处理。

6.2 Base64解码中的陷阱

陷阱1：解码失败，提示“无效字符”。
- 原因：复制的字符串可能包含换行符、空格或其他不可见字符。Base64解码器要求纯字符。
- 解决：在文本编辑器中使用“替换”功能，删除所有空格（）、换行符（\n、\r）和制表符（\t）。确保字符串是连续的一行。
陷阱2：解码后是乱码，file命令也识别不出。
- 原因：可能是多层编码（如Base64 -> ROT13 -> Base64），或者需要先进行字节操作（如异或、循环移位）。
- 解决：写Python脚本进行自动化尝试。先尝试Base64解码，然后对解码后的字节进行常见操作（如bytes([b ^ 0xff for b in data])进行取反），再尝试用file识别或打印为字符串看看。
陷阱3：解码后得到ZIP但需要密码。
- 解决：
  1. 在流量中继续找：密码可能以明文形式出现在其他请求/响应中，或者藏在图片的EXIF信息里。
  2. 尝试弱密码/常见密码：password,123456,admin,flag,ctf, 比赛名称，题目名称等。
  3. 使用zip2john和john进行破解：如果密码不强，这是可行的。但这通常需要线下准备工具。

6.3 效率提升技巧

使用Tshark（命令行版Wireshark）进行初步过滤：对于非常大的PCAP文件，先用tshark -r file.pcap -Y "http.request.method==POST" -T fields -e http.file_data > post_data.txt这样的命令快速提取所有POST数据，可以节省在GUI中加载和过滤的时间。
善用Wireshark的“导出对象”功能：对于HTTP、SMB等协议，Wireshark能直接列出所有传输的文件。点击“文件”->“导出对象”->“HTTP”，可能会直接看到被传输的疑似包含Flag的文件，省去手动追踪流的步骤。
建立自己的解码工具库：准备一个Python脚本集，里面包含Base64、Hex、URL编码、ROT、异或、常见古典密码等编解码函数。遇到题目时，可以快速组合调用。
留意协议细节：工控协议有固定的功能码和地址范围。一个读保持寄存器的请求，地址却异常大；或者一个写线圈的请求，值不符合常理，这都可能是在传递数据。熟悉常见工控协议的格式，能帮你更快定位异常点。

这道2020之江杯的题目，本质上是一个“流量分析+编码识别+文件还原”的经典套路。它不涉及复杂的漏洞，但完整地考察了安全分析人员最基础也最重要的能力：从嘈杂的网络数据中，找到那一点不和谐的信号，并把它还原成有价值的信息。掌握Wireshark的进阶过滤和“追踪流”，理解Base64的识别与处理方法，再辅以一些文件格式分析和脚本自动化技巧，你就能应对绝大多数同类题型。工控安全的路很长，从看懂每一个数据包开始。

查看全文

http://www.gsyq.cn/news/1644580.html