当前位置: 首页 > news >正文

转录组分析(一):比对、表达定量、标准化

一、准备

1. 三张表:样本特征信息、表达矩阵、基因注释信息

image

2. 表达矩阵

获得方法:

  • 表达芯片:敏感度低、范围小、只检测已知转录本、低成本
  • RNA-seq:

二、测序数据标准分析:获得表达矩阵

1.spliced alignment比对

image

(1)比对到基因组

将转录本(RNA)比对到参考基因组(DNA),有的read比对到上一段外显子末尾、下一段开始,中间的内含子把read切开

image

bwa、tophat->hisat->hisat2(推荐用最新的hisat2)、STAR[效果非常好,比对慢、耗内存]

主流软件:

  • hisat2:做动植物方向,基因组本身精度不高,再提升精度意义小
  • STAR:做人的方向,对精度要求高,推荐

(2)比对到转录组:Bowtie2

image

(3)比对结果统计

image

mapped reads:使用现有主流软件比对率>80% ,低的原因:

  • ①参考基因组质量差;
  • ②测序样本污染,测到细菌RNA;
  • ③参考基因组品种与测序品种差异大

uniquely mapped reads:只在参考基因组/转录组匹配到唯一位置,基因表达定量分析(如使用featureCounts、HTSeq、RSEM等工具)中,通常只使用uniquely mapped reads来计算每个基因或转录本的计数。

2. quantification表达定量

比对时只是将测序数据和参考基因组比对,未统计比对到哪一个基因

问题1:多处比对的reads如何分配?一个reads比对到两个以上的基因位置,

  • 扔掉:多拷贝基因表达量被低估
  • 一边各一半:0.5+0.5
  • 计算概率,按概率分配:0.7+0.3

image

问题2:在基因层次还是isoform层次定量?

一般不同isoform功能相似,建议在基因层次定量

3. normalization标准化

reads counts:比对和定量完后,被明确归属于某个特定基因(或转录本、外显子等基因组特征)的测序读数(reads)的数量。

image

问题1:在样本1中,基因B的表达量比基因A高?
不确定,因为基因长度不同。越长碎片越多

问题2:基因A在样本3中的表达比样本2中高?
不确定,测序深度不一样。

(1)标准化

  • fpkm:比对到基因的片段数/基因长度/总片段数
  • tpm:比对到基因的片段数/基因长度/标准化后的总片段数

image

(2)校正

问题3:一个基因表达异常高导致其他基因表达低,解决方法:

  • 内参基因:不同组织、不同条件下表达稳定。计算使各个样本中数值一样,如样本一:3,样本二:6,所有样本一数据都×系数2
  • 非常见物种,未研究内参基因。假设大多基因是没有差异表达的(TMM),×校正系数后使多数基因表达水平相同

 

http://www.gsyq.cn/news/100771.html

相关文章:

  • Luckysheet性能突破:轻松驾驭百万行数据的实战指南
  • 2、滑翔伞设计与模拟技术全解析
  • 游戏中的抛物线:从手雷到弓箭的物理轨迹
  • TouchGAL终极指南:快速搭建纯净Galgame社区的完整教程
  • 35、SMB和Net命令的使用指南
  • 37、Samba故障排除指南
  • 39、深入探索vi编辑器:从基础到高级应用
  • 微信小程序大文件上传解决方案:miniprogram-file-uploader实战指南
  • 重磅发布:Wan2.2-TI2V-5B-Diffusers双模态视频生成模型横空出世,消费级GPU也能玩转高质量视频创作
  • 语音AI技术突破:从实时合成到情感克隆,多模态交互迎来新纪元
  • HiPO:革新LLM动态推理能力的混合策略优化框架,实现效率与准确性的完美平衡
  • Zotero Linter插件终极使用指南:快速整理文献库的完整方案
  • 多模态AI新纪元:Qwen2.5-Omni-7B-AWQ模型重新定义端侧智能交互
  • Vue的组件通信方式
  • 48、不确定性量化中的多项式混沌展开与实验设计
  • 50、不确定性量化实验设计:采样策略与桁架结构分析
  • 51、张拉膜结构的不确定性量化设计
  • 52、物理系统不确定性量化与结构随机响应分析
  • 57、随机响应分析与结构建模相关知识解析
  • 58、结构随机响应分析与 gPC 方法应用
  • BlenderGIS地形生成终极指南:从零到专业级3D场景
  • 59、结构随机响应分析:固定基础与隔震结构对比研究
  • 60、随机优化:随机扩散搜索算法解析
  • 百度网盘加速工具BaiduPCS-Web:突破限速的技术实现与实战指南
  • 开源突破!Step1X-Edit v1.2重构AI图像编辑逻辑,语义级创作效率提升40%
  • Nugget命令行工具:极简文件下载的终极解决方案
  • AssetStudio GUI界面深度解析:从资源提取到项目管理实战指南
  • 2025年B站视频下载实用指南:从入门到精通全攻略
  • 腾讯HunyuanVideo-PromptRewrite革新:双引擎驱动应对AIGC视频创作指令理解困局
  • Obsidian Git终极配置指南:打造坚不可摧的笔记版本控制系统