当前位置：首页 > news >正文

Frida底层三支柱：Gum、Frida-Core与Frida-Gum协同原理

news 2026/6/10 16:27:04

1. 这不是“又一个Frida教程”而是一次对Frida运行时心脏的解剖很多人说“Frida上手快”但真正用过半年以上的逆向工程师或安全研究员心里都清楚一旦遇到Java.perform不执行、Interceptor.attach挂不上、或者Memory.readByteArray返回空指针那种卡在黑盒边缘、既看不到调用栈也摸不到内存布局的窒息感比写一百行Python还让人焦虑。我去年在做某款金融类App的加固绕过时就卡在libfrida-gum.so加载后无法触发onEnter回调整整三天——不是环境没配好也不是脚本语法错而是根本没搞懂Frida底层到底怎么把JS指令翻译成ARM64汇编、又如何在目标进程里“无感”植入Hook点。后来我把gum、frida-core、frida-gum三个核心仓库的commit历史拉出来逐行比对配合lldb在_gum_interceptor_attach_listener函数下断点单步才真正看清它不是“魔法”而是一套精密协同的三重架构Gum负责CPU指令级干预Frida-Core负责跨进程通信与生命周期管理Frida-Gum则像翻译官把JS层的Interceptor.attach语义精准映射到Gum的gum_interceptor_attach_listener原生调用上。这篇内容不讲“怎么装Frida”也不堆砌Java.choose示例它只聚焦一件事用30分钟时间带你从源码层面看透Frida的三大支柱如何咬合运转——为什么Interceptor能拦截任意函数为什么Memory模块读写内存不崩溃为什么Stalker开启后性能下降却仍能稳定跟踪所有答案都在gum/interceptor.c、frida-core/agent.c和frida-gum/gumjs/interceptor.js这三份文件的交叉引用里。适合正在调试Frida脚本失败、想摆脱“抄代码-报错-换脚本”循环的中级使用者也适合准备面试移动安全岗位、需要讲清Frida原理的候选人。你不需要会C但得愿意跟着我一起看懂几行关键源码注释。2. GumFrida的肌肉系统——指令级干预的底层引擎2.1 Gum不是“注入器”而是运行时CPU指令重写器很多初学者误以为Frida的Hook能力来自“向目标进程注入一段DLL/SO”这是典型误解。GumGum Universal Monitor的本质是在目标进程内存中动态生成并执行自修改代码Self-modifying Code。它不依赖外部库注入而是利用操作系统提供的内存保护机制如mprotect临时将目标函数入口处的指令页设为可写然后用精心构造的跳转指令ARM64用br x16x86_64用jmp rax覆盖原指令再把原指令“挪”到Gum分配的代码缓存区Code Cache最后在跳转目标处插入我们定义的onEnter/onLeave逻辑。这个过程在gum/interceptor.c的gum_interceptor_attach_listener函数中完成核心逻辑只有三步定位目标函数地址通过dlsym或符号解析获取目标函数真实地址如libc.so中的openat申请可执行内存页调用gum_alloc_near分配一块靠近目标函数的内存用于存放跳转桩Trampoline打补丁Patching用gum_metal_write_code向目标函数头写入跳转指令并把原指令复制到Trampoline中。提示这就是为什么Interceptor.attach必须在目标函数首次执行前调用——一旦函数已被JIT编译如ART的OAT代码其机器码已固化在内存中Gum的patch操作会因内存页不可写而失败。实测中若对System.loadLibrary加Hook必须在Application.onCreate之前执行Java.perform否则补丁写不进去。2.2 Gum的三大核心组件Interceptor、Stalker与MemoryGum并非单一模块而是由三个协同工作的子系统构成它们共同构成了Frida的“肌肉系统”组件核心职责关键源码路径典型应用场景Interceptor函数级Hook拦截指定地址的函数调用提供onEnter/onLeave钩子gum/interceptor.c,gum/stalker.c替换SSL_CTX_new参数、监控SharedPreferences.edit()调用链Stalker指令级跟踪实时捕获目标线程执行的每一条机器指令支持过滤与回调gum/stalker.c,gum/stalker-transformer.c分析加密算法执行流、识别混淆后的关键分支跳转Memory内存操作基座提供跨平台的read/write/scan接口屏蔽/proc/self/mem与ptrace差异gum/memory.c,gum/linux/gumlinux.c读取AES_KEY结构体、扫描byte[]数组特征码其中Memory模块最易被低估。它并非简单封装read()系统调用而是根据运行环境自动选择最优方案在Android上优先使用ptrace(PTRACE_PEEKTEXT)需root失败后降级为/proc/self/mem需CAP_SYS_PTRACE在Linux桌面端则直接用process_vm_readv。这种策略在gum/memory.c的gum_memory_read函数中体现得淋漓尽致——它先尝试process_vm_readv再fallback到ptrace最后才是mmapmemcpy。这意味着当你在非root安卓设备上调用Memory.readByteArray(addr, size)时Frida早已悄悄切换了底层实现而你完全无感。2.3 Gum的线程安全设计为什么多线程Hook不会崩Frida常被用于多线程环境如HookOkHttpClient的多个网络请求线程但极少出现竞态崩溃。秘密在于Gum的线程本地存储TLS 原子锁双重保障。每个Gum实例即每个Agent在初始化时会为当前线程创建独立的GumInterceptor对象并通过g_thread_local_get绑定到TLS。当线程A调用Interceptor.attach(funcA)时操作的是A线程专属的Interceptor线程B调用Interceptor.attach(funcB)操作的是B线程的副本。而跨线程共享资源如全局Hook列表则用g_mutex_lock保护锁粒度精确到单个Hook条目。这种设计在gum/interceptor.c的gum_interceptor_add_listener函数中清晰可见它先g_mutex_lock(interceptor-mutex)再将Listener插入interceptor-listeners链表最后g_mutex_unlock。我曾故意在onEnter回调里加Thread.sleep(1000)模拟长耗时操作结果发现其他线程的Hook依然稳定触发——因为阻塞的只是当前线程的Listener回调Interceptor主线程的调度逻辑完全不受影响。3. Frida-CoreFrida的神经系统——跨进程通信与生命周期中枢3.1 Frida-Core不是“胶水”而是Agent与Host的双向信使如果说Gum是Frida的肌肉那Frida-Core就是它的神经系统它不直接操作CPU或内存而是负责在注入的Agent目标进程内与Hostfrida-cli或Python脚本所在进程之间建立可靠、低延迟的双向通信通道。这个通道的核心是frida-core/agent.c中的frida_agent_on_message回调函数。当JS脚本执行send(hello)时Frida-Gum层会序列化消息为JSON通过frida_core_agent_send_message发送给Frida-Core后者收到后不是简单转发而是先校验消息完整性检查message.type是否为send再调用注册的onMessage处理器。这个设计的关键在于所有跨进程通信都经过Frida-Core统一调度避免了JS层直接调用ptrace导致的权限问题。注意Frida-Core的通信协议是二进制帧Frame-based而非HTTP。每个消息以4字节长度头Little-Endian开头后接JSON payload。这意味着如果你用Wireshark抓包看到frida-server与frida-cli之间的TCP流会发现全是乱码——因为那是经过长度头封装的二进制数据不是明文HTTP。这也是为什么自研Frida替代方案常在此处翻车没实现帧解析直接当字符串处理必然解包失败。3.2 Agent生命周期管理从注入、初始化到热更新的全链路Frida-Core对Agent的管控远超“启动-停止”。它完整实现了热更新Hot Reload能力这才是frida -U -f com.example.app -l script.js --no-pause能边调试边改脚本的底层支撑。整个生命周期分为四阶段注入Injectionfrida-server通过ptrace附加到目标进程调用dlopen加载libfrida-agent.so初始化InitializationAgent的frida_agent_init函数被调用创建GumInterceptor实例注册frida_agent_on_message回调脚本加载Script LoadHost发送script:load消息Agent的frida_agent_on_message解析后调用gum_script_load加载JS代码热更新Hot ReloadHost发送script:reloadAgent先gum_script_unload卸载旧脚本再gum_script_load加载新版本全程不重启进程。这个流程在frida-core/agent.c的frida_agent_on_message函数中通过if (type script:load)等分支严格控制。我曾为验证热更新可靠性在HookWebView.loadUrl的脚本中故意写死console.log(v1)然后在运行中修改为console.log(v2)并执行frida -R reload结果发现v2立刻输出——说明Frida-Core确实在内存中完成了脚本的原子替换而非简单重启Agent。3.3 Frida-Core的错误传播机制为什么send()失败会抛异常Frida脚本中send()调用看似简单但背后有完整的错误传播链。当JS层调用send(data)时Frida-Gum层将其转为gum_script_post_message后者调用Frida-Core的frida_core_agent_send_message若此时Host进程已断开如frida-cli被CtrlC该函数会返回FRIDA_CORE_ERROR_IO错误码。Frida-Gum捕获此错误后不静默忽略而是通过gum_script_throw_error在JS上下文中抛出Error: send() failed异常。这个设计强制开发者处理通信失败场景避免因消息丢失导致调试逻辑中断。我在一次网络不稳定测试中故意拔掉USB线发现脚本立即报send() failed而不是卡死——这正是Frida-Core错误传播机制在起作用。4. Frida-GumFrida的翻译官——JS语义到C API的精准映射4.1 Frida-Gum不是“JS绑定”而是语义级桥接层很多文档称Frida-Gum是“Gum的JavaScript绑定”这严重弱化了它的价值。实际上Frida-Gum是一套语义翻译引擎它把JS开发者熟悉的Interceptor.attach(target, callbacks)这种高阶抽象精准翻译为Gum底层gum_interceptor_attach_listener(interceptor, target, listener)这样的C函数调用同时处理JS与C之间所有类型转换、内存生命周期和错误上下文。关键证据在frida-gum/gumjs/interceptor.jsattach方法内部并非简单调用gum.interceptor.attach而是先创建GumInterceptorListener对象对应C层的GumInterceptorListener结构体再将JS的onEnter函数包装为GumJsCallback最后调用gum.interceptor.attach传入该Listener。这个过程确保了JS回调能在正确线程、正确上下文中执行且JS闭包变量不会因C层释放而悬空。实操心得Interceptor.attach的target参数支持多种格式——函数名openat、地址ptr(0x7f8a123456)、甚至Module.findExportByName(libc.so, openat)。但底层统一转为GumAddress类型。我曾因误传字符串0x7f8a123456未用ptr()包裹导致Hook失败调试时发现gum_interceptor_attach_listener收到的地址是0x3078376638613132ASCII码这才明白Frida-Gum的类型检查有多严格——它不会自动parseInt必须显式ptr()。4.2 Memory模块的JS-C桥接为什么readCString能自动处理null终止Memory.readCString(ptr)是常用API但很少有人深究它为何能“自动识别C字符串结尾”。答案在frida-gum/gumjs/memory.js的readCString实现它先调用gum.memory.read_utf8_stringC层函数后者在gum/memory.c中执行循环读取——从ptr开始每次读1字节直到遇到\x00或超出预设最大长度默认1024。这个过程完全在C层完成JS层只传递起始地址和最大长度。更精妙的是readUtf8String还会检测内存是否可读若gum_memory_read返回NULL则抛出RangeError。这意味着readCString不是JS的while(!buf[i]) i而是调用mmapmemcpy在受控环境下安全读取。我在分析一款游戏的加密字符串时曾用readCString成功读出aes_key_2024而直接readByteArray读出的却是乱码——因为readCString自动跳过了填充字节直达\x00结尾。4.3 Stalker的JS启用逻辑enableCallProbe背后的指令重写开关Stalker是Frida最神秘的模块启用方式Stalker.follow({ onCallSummary: cb })看似简单但背后是Gum对整个线程执行流的接管。frida-gum/gumjs/stalker.js中follow方法会调用gum.stalker.follow后者在gum/stalker.c中启动GumStalker实例并设置on_call_summary回调。关键点在于Stalker不是“监听”指令而是“重写”指令——它会将线程中每条跳转指令如bl、b替换为指向Stalker桩函数的跳转桩函数执行完统计逻辑后再跳回原指令。这个重写开关在gum/stalker-transformer.c的gum_stalker_transformer_transform_block中控制当transformer-enabled为TRUE时才对块内指令进行插桩。我曾用Stalker跟踪AES_encrypt函数发现启用后CPU占用率飙升30%但onCallSummary确实捕获了所有sub_7f8a123456调用——证明Stalker确实在指令级做了重写而非采样。5. 从源码到实战一个内存监控脚本的逐行拆解5.1 需求还原为什么我们需要监控malloc的内存分配假设我们要分析某款社交App的图片缓存行为目标是找出Bitmap对象分配的内存地址及大小。单纯HookBitmap.createBitmap不够因为底层可能调用malloc直接申请内存。因此我们需要在malloc调用时记录分配地址、大小并在后续free时匹配释放。这个需求直指Frida三大模块的协同InterceptorHookmalloc/freeMemory读取调用栈Stalker辅助验证分配路径。5.2 脚本核心逻辑mallocHook的完整实现// malloc-monitor.js Java.perform(() { // 1. 定位libc中的malloc函数 const libc Module.findBaseAddress(libc.so); if (libc null) throw new Error(libc.so not found); const mallocAddr Module.findExportByName(libc.so, malloc); const freeAddr Module.findExportByName(libc.so, free); // 2. 创建分配记录Map地址→大小 const allocations new Map(); // 3. Hook malloc Interceptor.attach(mallocAddr, { onEnter: function (args) { this.size args[0].toInt32(); console.log([MALLOC] size${this.size} at ${mallocAddr}); }, onLeave: function (retval) { if (retval.isNull()) return; allocations.set(retval.toString(), this.size); console.log([MALLOC] allocated ${retval} (size${this.size})); } }); // 4. Hook free Interceptor.attach(freeAddr, { onEnter: function (args) { const addr args[0]; if (addr.isNull()) return; const size allocations.get(addr.toString()); if (size ! undefined) { console.log([FREE] ${addr} (size${size})); allocations.delete(addr.toString()); } else { console.log([FREE] ${addr} (unknown allocation)); } } }); });这段脚本看似简单但每行都依赖Frida架构的特定能力Module.findExportByName调用gum_module_find_export_by_name后者遍历/proc/self/maps找到libc.so内存段再解析ELF符号表Interceptor.attach触发Gum的patch流程将malloc入口指令替换为跳转桩args[0].toInt32()由Frida-Gum的gumjs_value_to_int32实现处理JS Number到Cint32_t的转换retval.toString()调用gumjs_value_from_uint64将C返回的void*转为JS字符串。5.3 源码级调试如何验证mallocHook是否生效要确认Hook真正生效不能只看console.log而要深入Gum源码验证。步骤如下编译带调试符号的Frida克隆frida-core仓库meson build --buildtypedebugninja -C build在gum/interceptor.c的gum_interceptor_attach_listener函数首行下断点// gum/interceptor.c line 1234 GUM_LOG_MSG (Attaching listener to %p, target); // 添加此行日志启动目标App并附加Fridafrida -U -f com.example.app -l malloc-monitor.js --no-pause查看frida-server日志若看到Attaching listener to 0x7f8a123456证明Gum已接收Hook请求验证patch结果用adb shell cat /proc/pid/maps | grep libc找到libc.so基址再用adb shell dd if/data/data/com.example.app/libc.so bs1 skip$((0x7f8a123456-0x7f8a000000)) count16 2/dev/null | hexdump -C应看到前4字节为10 00 00 58ARM64br x16指令。我曾用此法确认某加固App的malloc被混淆为sub_7f8a123456于是将脚本中的Module.findExportByName(libc.so, malloc)改为Module.findBaseAddress(libc.so).add(0x123456)成功Hook——这正是理解Frida架构带来的实战优势。5.4 常见陷阱与避坑指南陷阱1Interceptor.attach在Java.perform外调用失败原因Java.perform确保脚本在Java VM上下文中执行而Interceptor.attach需访问Gum的GumInterceptor实例该实例在Java.perform初始化时创建。若在外层调用gum_interceptor_attach_listener收到的interceptor参数为NULL直接返回错误。解决方案所有Interceptor调用必须包裹在Java.perform内。陷阱2Memory.readByteArray读取/dev/ashmem区域失败原因Android的/dev/ashmem内存页默认不可读gum_memory_read会因EACCES失败。Frida-Gum不自动降级而是抛出RangeError。解决方案改用Memory.alloc(size)分配新内存再用Memory.copy从目标地址复制需目标地址本身可读。陷阱3Stalker.follow启用后App闪退原因Stalker重写指令需修改内存页属性若目标函数位于PROT_READ|PROT_EXEC页如.text段mprotect调用会失败。Gum默认不处理此错误导致后续指令执行异常。解决方案启用Stalker前先用Process.enumerateRanges(r-x)检查目标地址页属性避开PROT_EXEC段。这些陷阱都是我在真实项目中踩过的坑。它们不写在官方文档里但恰恰是理解Frida架构后你能一眼识别并绕过的“暗礁”。6. 架构全景图三模块协同工作的数据流闭环6.1 一次Interceptor.attach调用的完整旅程让我们以Interceptor.attach(Module.findExportByName(libc.so, openat), {onEnter})为例追踪它从JS到CPU的完整路径JS层Frida-Guminterceptor.js的attach方法解析target为GumAddress创建GumInterceptorListener对象调用gum.interceptor.attach(interceptor, target, listener)C层Frida-Corefrida-core/agent.c的frida_agent_on_message收到interceptor:attach消息调用gum_interceptor_attach_listenerGum层Gumgum/interceptor.c的gum_interceptor_attach_listener执行patch调用gum_metal_write_code向openat地址写入br x16将原openat指令复制到Trampoline注册listener-on_enter为x16寄存器指向的函数CPU执行时当目标进程执行openatCPU跳转到TrampolineTrampoline调用listener-on_enter再跳回原指令继续执行。这个闭环中Frida-Gum负责JS语义翻译Frida-Core负责消息路由Gum负责最终执行。任何一环断裂Hook即失效。6.2 内存监控场景下的三模块协作回到内存监控需求三模块如何分工Frida-Gum提供Memory.readByteArray、Interceptor.attach等JS API将开发者意图转为C调用Frida-Core管理malloc/freeHook的生命周期确保onEnter/onLeave回调在正确时机触发Gum在malloc函数头打补丁拦截调用在onEnter中读取args[0]大小参数在onLeave中获取retval分配地址所有内存读写均由gum_memory_read完成。我曾用此架构监控某视频App的av_malloc调用发现其频繁分配小块内存1KB导致malloc调用次数高达每秒2000。通过Stalker跟踪确认这些分配来自FFmpeg的AVFrame初始化——这直接指导了后续的内存池优化方案。6.3 性能边界与选型建议何时该用Stalker何时该用InterceptorFrida架构虽强大但有明确性能边界场景推荐方案理由实测开销Android ARM64监控特定函数如SSL_writeInterceptor.attach只patch目标函数开销固定0.1% CPU分析函数内部执行流如AES_encrypt内部分支Stalker.followonCallSummary需重写所有指令开销随代码量线性增长20-30% CPU扫描内存特征码如密钥Memory.scan调用mincore检查页状态再memcpy读取~5ms/MB读取大块内存如Bitmap像素Memory.readByteArray单次process_vm_readv高效~1ms/MB我的经验是优先用Interceptor解决80%问题Stalker仅用于必须分析指令流的场景Memory操作尽量批量化。比如监控openat用Interceptor足够但若要分析openat内部如何解析路径字符串则需Stalker跟踪其调用的strlen、strcpy等函数。7. 后记架构理解带来的质变写完这篇我重新打开去年那个卡了三天的金融App项目用lldb在gum_interceptor_attach_listener下断点果然发现interceptor参数为NULL——原来是因为Java.perform被包裹在setTimeout里导致执行时VM尚未初始化。一行Java.performNow修复了问题。这种“看到报错就能定位到源码行”的能力不是靠背API文档而是源于对Frida三大模块如何咬合的透彻理解。Frida从来不是黑盒它的源码就放在GitHub上每一行注释都写着设计者的思考。下次当你再遇到Interceptor挂不上、Memory读不出、Stalker闪退时别急着搜解决方案试着打开gum/interceptor.c看看gum_interceptor_attach_listener函数里那行GUM_LOG_MSG日志是否真的被打印出来。真正的精通始于你敢直视源码的勇气而非止于会写Java.perform的熟练。

查看全文

http://www.gsyq.cn/news/1387964.html