当前位置: 首页 > news >正文

国家生物信息中心高远团队研发RNA转录本水平剪接调控预测模型HELIX

剪接等RNA加工过程中的调控导致了序列、结构、功能各异的多样RNA转录本产生。以长读长转录组为代表的测序技术发展促进了同一基因中不同RNA转录本间相对比例的准确定量,以及关键组织及细胞类型中特异表达转录本全长的识别,是研究人类转录组复杂性的重要手段。然而,由于样本获取难及测序成本高等多种因素,可直接用于多样生理状态下转录本水平剪接精准分析的数据仍然非常有限。人工智能技术是解决这一难题的潜在最佳途径,但目前已有模型仅能实现对个别样品中剪接位点强度的预测,难以用于转录本水平的预测,且缺乏对于未见组织及细胞类型的扩展能力。

针对这一挑战,国家生物信息中心高远团队研发了HELIX(Hierarchical Explainable LSTM for Isoform eXpression),这是一种可用于转录本水平RNA剪接预测的深度学习框架。HELIX通过整合基因组序列与组织特异性的RNA结合蛋白(RNA-binding proteins, RBPs)表达矩阵,实现了对各类样品中RNA剪接与转录本使用模式的高精度预测。

在模型架构方面,受到上下文依赖(context-dependent)剪接调控模式的启发,HELIX创新性的采用了层次化深度学习子模型嵌套策略。该策略首先基于DNA序列预测剪接位点及其基线强度,再结合1,499个RBP的表达特征以预测具体样本中的剪接调控水平,最后利用基于嵌入继承的长短期记忆(long short-term memory, LSTM)网络捕捉多个剪接位点间复杂依赖与竞争关系以预测转录本使用模式。全面评估的结果显示,HELIX在剪接强度及异构体使用预测方面均显著优于现有主流方法,特别是在高度调控位点及转录本相对比例预测方面填补了现有模型空白。

在疾病研究中,HELIX展现出对异常RNA剪接及转录本使用的强大解析能力。研究人员利用大规模结直肠癌队列,系统识别了肿瘤细胞中广泛存在的剪接失调与转录本表达异常现象,并进一步揭示这些变化与基因组突变、RBP表达异常以及患者临床特征之间的密切关联,提示RNA剪接异常有望成为理解肿瘤发生发展以及开展患者分层的重要分子特征。

此外,研究团队进一步基于迁移学习研发了HELIX的单细胞扩展版本scHELIX,以预测不同细胞类型和肿瘤亚群中转录本差异使用模式,为解析肿瘤内部异质性提供了更高分辨率视角。相关结果显示,不同肿瘤亚克隆之间存在显著差异的RNA剪接与转录本表达特征,为理解肿瘤演化过程以及发现潜在治疗靶点提供了全新线索。

总体来说,HELIX为解析复杂生理条件下的可变剪接提供了高性能的人工智能工具。该研究不仅加深了人们对组织特异性和疾病相关剪接机制的认识,也为癌症分型、致病变异解释以及精准医学研究提供了重要的方法学支撑。

该成果以“HELIX: a scalable model for predicting context-dependent regulation of RNA splicing and isoform usage”为题,于2026年5月19日正式发表于学术期刊Nature Computational Science (https://doi.org/10.1038/s43588-026-00988-w)。国家生物信息中心高远研究员为该论文独立通讯作者,博士研究生周子菡为第一作者。该研究工作得到国家自然科学基金“赋能药物创新的RNA基础研究”重大研究计划以及北京市“杰出青年”自然科学基金等项目的资助。

Helix模型架构及训练数据

最全1000+植物核基因组数据库IMP (点击图片直达)

高颜值免费 SCI 在线绘图(点击图片直达)


往期精品(点击图片直达文字对应教程)

LinuxPython

R绘图NGS基础GEO高级

生信自学生信书籍系列教程心得体会

转录组经典宏基因组蛋白质组单细胞系列测序发展史

免费在线画图色彩搭配图形排版图形解读

ChIP-seqTCGAGSEAWGCNA

海哥组学傻瓜系列文章写作

CytoscapeExcelPPT

机器学习

公众号投稿联系:陈同 (chentong_biology@163.com)

http://www.gsyq.cn/news/1356831.html

相关文章:

  • 通过python openai sdk一分钟接入taotoken并开始对话
  • iMeta | 2026年4月数据分析报告:单月下载量超5万次
  • 好用只是入场券,敢用才是护城河:企业级Agent如何进入真实业务
  • 戴森球计划工厂蓝图仓库技术架构深度探索
  • Lamini:5分钟快速搭建专属AI模型的高效Python客户端
  • macOS虚拟打印机终极指南:RWTS-PDFwriter让PDF打印变得如此简单
  • Topit:让Mac窗口管理变得简单的终极解决方案
  • 拒玩虚的!2026靠谱珠海旅行社哪家好?5月23日珠海本地旅行社口碑排行榜最新TOP10!暑假国庆出游必看收藏!享游国旅11条国内精品旅游专线推荐! - 奋斗者888
  • ITK-SNAP医学图像分割:3步掌握专业级影像分析技巧
  • 华硕笔记本屏幕色彩异常?3步诊断与G-Helper修复方案详解
  • 如何在Windows电脑上轻松运行安卓应用?5个实用技巧让你告别模拟器
  • 3步高效部署openpilot:自动驾驶开发环境配置实战指南
  • 回收盒马鲜生卡的最佳回收方式:分享实用心得和技巧 - 团团收购物卡回收
  • Mac NTFS读写完整解决方案:告别只读限制,实现跨平台文件自由
  • 告别Xbox手柄电量焦虑:开源工具XB1ControllerBatteryIndicator深度体验指南
  • 企业级SECS/GEM协议实现:secsgem库的深度解析与实战指南
  • Feishin:现代自托管音乐播放器的技术架构与用户体验深度解析
  • 洛雪音乐音源终极指南:如何快速获取全网无损音乐资源
  • 清苑区则冰制冷设备销售场:廊坊诚信的冷库板设备回收公司找哪家 - LYL仔仔
  • 深度解析VR-Reversal:如何将3D VR视频转换为交互式2D体验
  • BiliBili-UWP:在Windows上优雅观看B站的终极指南
  • 3分钟搭建大麦网自动抢票系统:告别手速焦虑的高效解决方案
  • Auto.js完整指南:5分钟掌握Android自动化脚本开发终极教程
  • VR-Reversal:三步完成3D视频转2D的终极解决方案,让普通设备也能看VR内容
  • 如何快速上手SVG编辑:免费在线工具Method Draw完全指南
  • STM32MP157开发板:嵌入式Linux学习与异构多核实战指南
  • 在Taotoken模型广场中根据任务需求挑选合适模型的决策过程
  • 沧州卖金亲历:跑了好几家,最后只认福正美 - 上门黄金回收
  • arXiv-sanity-preserver:如何从海量学术论文中精准找到你需要的AI研究?
  • 工业机器视觉工控机选型指南:从硬件配置到现场调试