02-Hi-C辅助基因组安装

02-Hi-C辅助基因组安装,第1张

基因组是怎么组装的,目前的方法有什么局限性?

为什么要进行基因组组装?是因为目前的测序方法,无论是一代、二代、三代都是借助于全基因组鸟q法(Whole genome shotgun)将基因组打断成小片段进行测序,因此需要将这些小片段重新拼接起来还原基因组信息。基因组组装的过程是将DNA小片段(reads)拼接成小重叠群(contigs),再将contigs组装成长的scaffolds,最核首携后将scaffolds定位到染色体。常用的算法通常是基于序列的overlap构建可能的组合路径,然后找出最优路径,构建contigs和scaffolds。

局限性

Hi-C技术可以辅scaffolds快速定位在染色体。

Hi-C技术怎么辅助基因组组装?

Hi-C技术依据染色质间的相互作用随着距离越远递减的规律,对scaffolds 的进行聚类分群,计算其相邻关系,然后基于染色体的交互信息对scaffolds进行排序和定向。

优点

相比于遗传图谱和物理图谱,基于Hi-C的基因组组装具有更高的覆盖率和特异性,避免了繁琐的群体构建工作,改伏实验周期短,成本减少。

缺点

SALSA2 是2018年新开发的基于Hi-C数据辅助组装的芹如分析软件,该分析软件不需要预先设定染色体的数目,提高了精确度。此外在数据输入上还兼容GAF的数据拼接格式,同时还利用Hi-C数据对错误的组装结果进行矫正。 github地址 :SALSA: A tool to scaffold long read assemblies with Hi-C( https://github.com/machinegun/SALSA )。

HiC-Pro

1.

底物:dATP、dTTP、dCTP、dGTP

2.

模板:解开成单链的DNA母链

3.

引物:用于提供3'端的羟基,供DNA聚合酶识别,使dNTP可以继续结合,在DNA的生物合成中一般引物为RNA。

4.

酶:拓扑异构酶(用于解开DNA超螺旋),DNA解旋酶(也称dnaB蛋白,解开DNA双螺旋用于复制),引物酶(用于合成一小段RNA作为DNA合成的起始引物),伏纳亮DNA聚合酶III(用于DNA链的延伸),DNA聚合酶I(用于切除冈崎片段中的RNA引物,并以前一片段的3'端羟基继续合成DNA),DNA链接酶(用于链接DNA之间的磷酸二酯键)。

5.

蛋白因子:dnaA蛋白(用于识别复制起点9bp重复序列,DNA在其周围缠绕,茄判并促使DNA双链在13bp重复序列区解开),单链结合蛋白(SSB,与单链DNA结合形成复制叉),复制因子X(n蛋白),复制因子Y(n'蛋白),n"蛋白,i蛋白,蛋白和dnaC(这五种蛋白与dnaB蛋白和引物酶组装成引发体)。

由于DNA的半不连续复制,使得在每次的复制过程中都会因为在切除末端的RNA引物后,由于缺少3'端羟基会缺失一小段DNA,为保证DNA的完整缺宽性,生物体内的一种逆转录酶端粒酶会以其中的RNA为模板,逆转录出重复的DNA序列用于维持DNA的稳定。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://www.outofmemory.cn/tougao/12487518.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-25
下一篇 2023-05-25

发表评论

登录后才能评论

评论列表(0条)

保存