当前位置: 首页 > news >正文

专为AI研究设计的浏览器安卓模拟器,内置28个模拟应用和416个任务模板,单机可并行256个实例

搞 mobile agent 研究的朋友跟我吐槽过,拿真机训练 AI 操控手机,成本高得离谱。你想啊,AI 在手机上点错一下,可能钱就转出去了,账号就注销了,根本没有后悔的机会。更头疼的是,真机环境下 AI 只能看到 UI 树,余额、订单状态这些关键信息根本读不到,研究者只能让 VLM “看图猜话”来做评判,错误率能到 10.2%。

把安卓搬进浏览器里

MobileGym 的思路挺有意思的,它不是在你手机上跑,而是直接在浏览器里模拟了整个安卓环境。说白了就是用结构化的 JSON 状态替代了真实设备,内置了 28 个模拟应用和 416 个任务模板。评判器直接读取环境状态,毫秒级出结果,百万次评判也不会崩。每个实例大概 400 MB 内存、50 MB 磁盘,256 个实例并行跑起来 CPU 占用不到 10%,完整评估六分钟就搞定了。

强化学习的并行难题

说到这儿你可能想问,为什么不直接在真机上跑强化学习?其实道理很简单,真实 App 的数据存在加密数据库和服务器后端,重置不了也克隆不了。GRPO 这类群体强化学习需要大量并行 rollout,在真机上基本是幻想。MobileGym 使朋了状态快照和克隆机制,256 个并行实例在一台服务器上轻松运行。而且它能做全环境状态比对,AI 误操作产生的副作用都能被捕捉到。

模拟到真实的迁移效果

最让我信服的是实测数据。在 59 个信号任务上,模拟训练后的模型部署到真实的 Redmi Note 12 Turbo,成功率达到了 72.9%,而真机基线只有 32.2%,提升了 40.7 个百分点。模拟端 76.7%,真实端 72.9%,保留率 95.1%——这个 sim-to-real 的差距确实很小了。

不过话说回来

28 个模拟应用的覆盖面毕竟有限,涉及复杂网络请求或支付流程的场景基本没有模拟。而且确定性评判器需要预先定义成功条件,灵活性不如 VLM 评判。另外整个项目的部署配置对非系统背景的研究者来说有一定门槛,上手需要花点时间。如果你在做 mobile agent 方向的研究,可以试试,有在线体验地址可以先看看再决定要不要本地部署。

下载链接:https://pan.quark.cn/s/64277de55392

http://www.gsyq.cn/news/1539907.html

相关文章:

  • Wan2.2:5分钟看懂如何用消费级显卡生成720P电影级视频
  • 2026年绍兴大学成人教育服务口碑机构推荐 - mypinpai
  • 高效智能的原神自动化助手:让程序替你玩游戏的完整解决方案
  • ARP代理--工作原理
  • GPT-4结构化输出实战:JSON Schema与多模态工作流嵌入指南
  • 双核心可控释能圈层能源系统完整技术(期待有能力的人进行研发)
  • 2026年碾米机行业口碑甄选:多家靠谱厂商横向对比与案例解析 - 优质品牌商家
  • 2026年通风降温厂家选购指南:厂房/车间/工厂/仓库通风降温设备厂家、冷风机厂家选择指南,产能、工艺、品控三维度权威解析 - 海棠依旧大
  • 5款实用的监控管理电脑软件推荐:实时监控管理电脑的神器,个个都实用
  • Subnautica Nitrox多人联机模组:终极指南带你告别孤独深海探险
  • 2026 远程桌面软件横评:连连控、ToDesk、向日葵深度对比
  • YTPro与其他YouTube客户端对比:功能、性能与兼容性全面分析
  • 生物医药→生物兽药→生物农药:这三个赛道的本质是同一个技术平台
  • 2026年控制柜升级改造公司怎么选?这份官方甄选指南请收好 - 优质品牌商家
  • 2026年武汉漏水检测公司选购指南:暗管/地埋管道/消防管道漏水检测、查漏水点服务商选择指南,产能、工艺、品控三维度解析 - 海棠依旧大
  • 2026年软磁不锈钢材料行业观察:铁磁性研磨棒供应商多维实力对比与甄选指南 - 优质品牌商家
  • [智能体-437]:英伟达链(NVIDIA 全产业链)完整详解
  • Cadence 17.4 安装全攻略:从下载到破解,手把手解决PCB设计环境搭建
  • Multi-Agent 系统中的死锁问题与解决方案
  • SimG4+周期精确仿真器:从编译到流水线可视化的性能调优实战
  • SH9脑机协同中的注意力分配与认知负荷优化机制研究——基于“仁爱“导向的人机共生视角(世毫九实验室原创研究)
  • 性能优化困局:3个技术突破点助你提升50%开发效率
  • C语言文件结构
  • Rescuezilla:你的终极系统恢复瑞士军刀,图形化克隆备份解决方案
  • 掌握 ViT(Vision Transformer)模型结构——Transformer 如何征服计算机视觉领域
  • 有实力的开袋真空吸盘品牌有哪些?聚昌利怎么样 - mypinpai
  • 猫抓浏览器插件:5分钟学会免费资源嗅探终极指南
  • Harmonyos pc实战之ArkUI 组件详解
  • 豆包2.0+扣子编程:零成本AI Bot开发实战指南
  • 端侧Qwen3轻量化部署与Skill开发实战