怎样用 NCBIblast 做蛋白质同源性分析详细点

怎样用 NCBIblast 做蛋白质同源性分析详细点,第1张

将需要比对的蛋白质序列选中,在BLAST界面Enter Query Sequence下面的大框中输入,如果是和数据库所有的蛋白质序列进行比对,再下面的Choose Search Set中选择需要比对的数据库。Program Selection中的比对可根据个人需要进行选择。

如果进行两两比对,或者多个序列的比对,在Enter Query Sequence框中选中Align two or more sequences,在d出的框中,输入你需要比对的序列,最后点击BLAST即可。

结果得分越高,同源性越高,E值是期望值,得分越低同源性越高

扩展资料:

由于进化上或个体发育上的共同来源而呈现的本质上的相似性,但其功能不一定相同,如狗的前肢和鸟的翅。从分子水平讲则是指两个核酸分子的核苷酸序列或两个蛋白质分子的氨基酸序列间的相似程度。虽然同源性须通过序列测定来检验,但是DNA-DNA或DNA-RNA杂交可提供有价值的估计。

参考资料来源:百度百科-同源性

1、电脑浏览器百度搜索NCBI,直接点击图示链接进入。

2、下一步打开其中的首页,需要搜索对象并选择跳转。

3、这个时候如果没问题,就继续确定浏览所查询的蛋白质。

4、这样一来等得到相关的结果以后,即可实现要求了。

在NCBI主页上方search栏左边有一个database选择框,点击下拉三角形选择nucleotide(如图红框)在search栏输入基因名搜索即可以人的orc1基因为例,在搜索结果中选择mRNA和complete

cds序列的结果都可以,如下点击进入序

因此NCBI 的分类学数据库不是一个系统发育或分类学的“专家数据库”(Wheeler et al, 2000)。

获取序列所对应的分类学信息有两种方法。

一种方法,从NCBI 网站下载gi与taxid 对应表,在Taxonomy 数据库的FTP 地址下载。这个目录下有多个压缩文件,其中针对Windows *** 作系统的两个针对蛋白质序列和核苷酸序列的压缩文件分别是gi_taxid_protdmpgz 和gi_taxid_nucldmpgz 文件。这两个文件都只有两列,左边为gi 号,右边为Taxid。由于这些文件非常大,因此用浏览器来打开这些文件几乎是不可能的。随着时间的推移,这两个文件会越来越大,不过速度不会是指数增长的,并且在美国东部时间的每个星期一2:00 am NCBI 会对其进行更新。

对于Windows 用户还有一个文件称为taxdumpzip 文件。文件解压缩后包括1 个prt 文件和6 个dmp 文件。Gencodedmp 文件保存有不同的密码子表,与同目录的gcprt 联合使用;mergeddmp 是保存有合并的taxid 号的对应表;nodesdmp 是结点信息;divisiondmp 是较大的几个分类;namesdmp 结点名称信息,每个id 对应多行。这些数据被Phylogenie 软件包中的blammer 程序用于构建进化树。

利用ftp 地址的连接利用>

GI编号是NCBI网站的所有序列相关数据库的流水编号,其最有用的特征就是唯一性。对于每一条递交给NCBI的序列,都会付给一个编号,而且这个编号对应的序列不可更改。这个编号对应这个唯一的一条序列,类似与我们用的身份z号。因此,利用GI在NCBI中查询时,你只要把数据库(蛋白质/核苷酸)选对,只要输入这个号码就可以把相应的序列调出来。

值得一提的是登录号(Accession

Number)。每一个递交的序列,除了获得一个GI号,还会被赋予一个登录号。递交序列的作者利用登录号对序列进行修改和完善。每一次修改的序列会获得一个新的GI号,登录号不变,但会追加一个流水的版本号。

因此,GI号和带版本号的登录号都唯一定位到唯一条序列。

sisichen �

关注

国家基因组科学数据中心(NGDC)---组学原始数据如何上传GSA 原创

2022-04-25 14:44:31

sisichen �

码龄4年

关注

文章目录

前言

一、什么是NGDC?

二、NGDC的发展历程

三、什么是GSA?

四、为什么选择上传数据到GSA?

五、如何上传测序原始数据至GSA?(重点!!附详细步骤!!)

1 准备要上传的数据

2 计算MD5码

3进入NGDC主页,登入账户

4 填写数据信息

第一步:建立Bioproject。

第二步:建立BioSample。

第三步:创建GSA。

进入GSA数据库

新建GSA

填写信息

下载表格文件

5 数据上传:

(1) 通过FTP软件 上传(上传需要流量!!如果小数据可以用)

(2) 通过服务器上传(推荐!!):如果实验室有服务器的话,推荐服务器上传,步骤如下:(服务器上要先安装ftp )

(3)邮寄硬盘

6等待审核

总结

前言

在发表文章之前我们需要将测序的原始数据上传到一个公共库,并在文中提供accession number,实现数据的公开共享,这是国际惯例。以前我们上传数据时只能上传到美国国立生物技术信息中心(NCBI)、欧洲生物信息学研究所(EBI)、日本核酸数据库(DDBJ),现在中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心 (CNCB-NGDC)—中国的 “NCBI” 已经建立并日渐完善。组学原始数据归档库(GSA)是组学原始数据汇交、存储、管理与共享系统,是国内首个被国际期刊认可的组学数据发布平台。GSA已获得多个国际期刊认可,并已被国际著名出版商Elsevier收录为指定的基因数据归档库,其权威性得到国内外100余家学术杂志的认可。GSA已通过FAIRsharing认证,获得Wiley出版集团认可,因此我们不用担心上传数据到GSA不被期刊认可,也不用再舍近求远上传数据到NCBI,作为中国人,我们一定要支持我们NGDC中的数据库。本文介绍了如何上传测序原始数据到GSA,附详细 *** 作步骤。

一、什么是NGDC?

国家基因组科学数据中心(>

以上就是关于怎样用 NCBI/blast 做蛋白质同源性分析 详细点全部的内容,包括:怎样用 NCBI/blast 做蛋白质同源性分析 详细点、如何用NCBI查询一种蛋白质的分子量、ncbi数据库怎么查找基因序列等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: https://www.outofmemory.cn/sjk/9672859.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-30
下一篇 2023-04-30

发表评论

登录后才能评论

评论列表(0条)

保存