当前位置: 首页 > news >正文

Mobile GUI Agent相关学习资料整理

Mobile GUI Agent

通用 GUI 智能体基座 MAI-UI

大佬说

唐杰THU

实践派

大润发杀鱼工:RL的一整年

天晴:用 RL 做 LLM 后训练:半年踩过的坑与心得

周星星:Agent 元年复盘

无大算力时,LLM 还有哪些值得做的研究

论文

自所&腾讯团队首次揭示大模型RL新机制

RL、Pre-training、Mid-training 对模型能力提升的区别

理解 LLM RL 稳定性的 insight 和实用 recipe

GPT-5-Thinking新训练方法

总结内容

深挖PPO,聊聊前身TRPO

大模型强化学习算法的演进与对比 (PPO, GRPO, DAPO, GSPO, SAPO)

LLM模型评估方法

青稞AI:唐杰和 Karpathy 的共识:AI 应用的本质是替代或增强人类工种,而不是为了做 App 而做 App
深入理解 KL 散度

多模态大模型主流架构

http://www.gsyq.cn/news/182743.html

相关文章:

  • 《代码大全2》前三分之二读后感
  • 人工智能之核心基础 机器学习 第二章 监督学习
  • GitHub Actions集成Miniconda-Python3.10实现CI/CD自动化测试
  • 绍兴企业如何选择靠谱的AI全网营销系统?超越功能清单的深度洞察
  • 【拯救HMI】HMI “卡成 PPT” 怎么办?—— 性能优化指南
  • 运势运程算命程序源码公开:PHP无依赖版开箱体验
  • 不同地区研发中心的角色如何进行定位
  • 1994-2024年上市公司气候变化减缓专利技术专利数量数据(附原始专利)
  • Token计费模型设计:Miniconda-Python3.10支撑高并发API服务
  • 靠谱的应急事故池清淤压滤干化施工哪个好
  • 大模型学习全流程:从入门到项目实战,附免费学习资源_大模型零基础教程(非常详细),大模型入门到精通
  • Linux系统AI开发入门:Miniconda-Python3.10带你迈出第一步
  • 人形机器人肢体通信与驱动的最佳技术方案
  • Markdown转技术博客自动化流程:基于Miniconda-Python3.10的大规模内容生成
  • Alexa AI在Interspeech会议组织技术专题研讨会
  • 【拯救HMI】工业 HMI 交互逻辑这么搞!工程师夸爆
  • 2025国内最新化妆品贴牌加工企业top6榜单公布!广东、广州等地区行业优质公司专业解析及选择指南,全链路赋能品牌高效成长 - 全局中转站
  • ARM 汇编指令:LDM
  • 使用pip和conda混合安装PyTorch时的注意事项与优化建议
  • SSH隧道转发可视化界面:远程操控Miniconda-Python3.10 GPU容器
  • Docker容器资源限制:为Miniconda-Python3.10分配GPU与内存配额
  • GitHub项目部署加速:使用Miniconda-Python3.10镜像减少环境配置时间
  • 谷歌AI智能体开发指南:从预测式AI到自主问题解决系统的完整构建框架
  • 不再问东答西:一文详解大模型如何理解你的指令
  • HarmonyOS 广告 SDK 封装实战:从原生 Ads Kit 到可复用广告组件
  • 虹科答疑 | PCAN-Basic通讯接口配置不踩坑,关键就3步!
  • 零基础转AI大模型:数据分析人员的4个黄金岗位选择,建议收藏!_想转岗AI大模型?看这篇就够了!
  • ESP-IDF 如何使用components和自定义工程目录
  • 使用Docker Run运行Miniconda-Python3.10镜像,快速接入AI算力市场
  • 使用Miniconda-Python3.10轻松实现CUDA与PyTorch环境集成