生物信息学是融合生物学、计算机科学和信息技术的新兴交叉学科,其核心在于利用数据库和算法工具对生物数据进行存储、检索和分析。本文系统整理了全球主要的生物信息学资源,涵盖基因组数据库、序列检索工具、比对软件、蛋白质分析平台等,为研究人员提供一站式导航。
重要主页
欧洲分子生物学实验室(EMBL):http://www.ebi.ac.uk/ebi_docs/embl_db/ebi/topembl.html(英国剑桥)
英国人类基因组图谱项目资源中心(HGMP-RC):http://www.hgmp.mrc.ac.uk/
SeqNet:欧洲分子生物学网络(EMBNet)英国节点:http://www.seqnet.dl.ac.uk/
GenBank:http://www.ncbi.nlm.nih.gov/Web/Search/index.html(美国国立卫生研究院国家生物技术信息中心)
日本DNA数据库(DDBJ):http://www.ddbj.nig.ac.jp
基因组序列数据库(GSDB):http://seqsim.ncgr.org/(美国国家基因组资源中心,采用超级计算机加速基因组算法)
人类孟德尔遗传在线(OMIM):http://www3.ncbi.nlm.nih.gov/Omim/searchomim.html(人类基因及其疾病数据库,包含文本、图像和参考文献,链接至Entrez和MedLine)
欧洲果蝇基因组计划:http://edgp.ebi.ac.uk/
基因组研究所(TIGR):http://www.tigr.org/
瑞士生物信息学研究所(Expasy):http://www.expasy.ch/
GenomeNet(日本):http://www.genome.ad.jp/
澳大利亚国家基因组信息服务(ANGIS):http://morgan.angis.su.oz.au
生物信息学与生物学网络资源:http://aeiveos.wa.com/biology/index.html(优秀站点)
其他基因组站点列表:http://www.hgmp.mrc.ac.uk/GenomeWeb/(简洁清晰)
布鲁内尔大学在线教学项目:http://www.brunel.ac.uk/depts/bl/project/front.htm
手册
EMBL:http://www.ebi.ac.uk/ebi_docs/embl_db/usrman/usrman.html
GenBank:ftp://ncbi.nlm.nih.gov/genbank/gbrel.txt
SRS:http://www.sanger.ac.uk/srs/srsman.html
其他指南与教程
生物计算超文本课程:http://www.techfak.uni-bielefeld.de/bcd/Curric/(详尽的学习资源)
分子遗传信息
Gene Cards:http://bioinfo.weizmann.ac.il/cards/(提供全面信息与链接,直接链接至GenBank、SWISS-PROT和MedLine)
Gene Cards:遗传相关疾病:http://bioinfo.weizmann.ac.il/cards-bin/listdiseasecards
生命科学词典:http://biotech.chem.indiana.edu/pages/dictionary.html
基因组序列数据库
四大主要序列数据库(每日交换序列信息):
EMBL:http://www.ebi.ac.uk/ebi_docs/embl_db/ebi/topembl.html
GenBank:http://www.ncbi.nlm.nih.gov/Web/Search/index.html
DDBJ:http://www.ddbj.nig.ac.jp
其他基因组数据库与工具
国际免疫遗传学数据库(IMGT):http://imgt.cnusc.fr:8104(包含Ig、TCR和MHC序列的专家注释)
人类基因组图谱数据库(HuGeMap):http://www.infobiogen.fr/services/Hugemap(遗传与物理图谱)
UTR主页:http://bigarea.area.ba.cnr.it:8000/EmbIT/UTRHome/(真核mRNA非翻译区分析资源)
序列搜索与检索
集成数据库检索系统:
Entrez:http://www.ncbi.nlm.nih.gov/Entrez/(一站式入口)
序列检索系统(SRS):http://www.seqnet.dl.ac.uk/srs/srsc
TIGR人类基因索引(HGI)序列搜索:http://www.tigr.org/tdb/hgi/searching/hgi_seq_search.html
TIGR HGI报告:http://www.tigr.org/tdb/hgi/hgi_info.html
TIGR HGI基因表达数据:http://www.tigr.org/tdb/hgi/searching/hgi_xpress_search.html
TIGR HGI名称搜索:http://www.tigr.org/tdb/hgi/searching/hgi_name_search.html
基因组数据库(GDB):http://hgmp.mrc.ac.uk/gdb 或 http://gdbwww.gdb.org/(已停止更新)
GENATLAS:http://bisance.citi2.fr/GENATLAS/(全面易用,支持图形化染色体定位)
Gene Cards:http://bioinfo.weizmann.ac.il/cards/
序列鉴定(BLAST、FASTA等)
桑格中心数据库搜索服务:http://www.sanger.ac.uk/DataSearch/(BLAST和WU-BLAST 2.0)
BLAST 2相似性搜索(EMBNet):http://www.ch.embnet.org/software/frameBLAST.html
BLAST2搜索与后处理(EMBL):http://dove.embl-heidelberg.de/Blast2/
FASTA 3(EMBL):http://www2.ebi.ac.uk/fasta3/
FASTA:http://www2.igh.cnrs.fr/bin/fasta-guess.cgi
Blitz:http://www.ebi.ac.uk/searches/blitz.html
Beauty:http://dot.imgen.bcm.tmc.edu:9331/seq-search/protein-search.html(增强型BLAST,预测蛋白质功能)
序列比对
基因发现分析与注释工具:http://genome.cs.mtu.edu/aat.html(通过cDNA和蛋白质数据库鉴定基因)
成对序列比对:http://genome.cs.mtu.edu/align/align.html
多重序列比对(MAP):http://genome.cs.mtu.edu/map/map.html
网络蛋白质序列分析:http://pbil.ibcp.fr/NPSA/npsa_clustalw.html(ClustalW)
ALIGN:http://www2.igh.cnrs.fr/bin/align-guess.cgi 或 http://genome.eerie.fr/fasta/align-query.html
多重序列比对与层次聚类:http://www.toulouse.inra.fr/multalin.html(彩色输出)
多重比对交互式彩色编辑器(CINEMA):http://www.biochem.ucl.ac.uk/bsm/dbbrowser/CINEMA2.1/(基于Java)
VSNS生物计算分部多重比对资源页:http://www.techfak.uni-bielefeld.de/bcd/Curric/MulAli/
cDNA数据库
TIGR人类cDNA图谱项目:http://www.tigr.org/tdb/hummap/hummap.html
通过OMIM:http://www.nih.gov
突变数据库
人类基因突变数据库:http://www.uwcm.ac.uk/search/mg/allgenes?
蛋白质突变数据库:http://www.genome.ad.jp/htbin/bfind_pmd
MITOMAP:http://infinity.gen.emory.edu/mitomap.html(线粒体DNA数据库)
乳腺癌突变数据库:http://www.nchgr.nih.gov/Intramural-research/lab_transfer/bic/
新序列提交
EMBL:http://www.ebi.ac.uk/subs/emblsubs.html
BankIt(GenBank):http://ncbi.nlm.nih.gov/
开放阅读框(ORF)查找
ORF Finder:http://www.ncbi.nlm.nih.gov/gorf/gorf.html
序列翻译
核苷酸到蛋白质(Expasy):http://www.expasy.ch/www/dna.html
核苷酸到蛋白质(EMBL):http://www.ebi.ac.uk/contrib/tommaso/translate.html
正向和反向翻译:http://www.sanger.ac.uk/Software/Wise2/genewiseform.shtml
蛋白质和cDNA翻译:http://www.sanger.ac.uk/Software/Wise2/protein2cdna.shtml
蛋白质序列数据库
翻译的EMBL(TrEMBL):http://www.ebi.ac.uk/pub/databases/trembl
SWISS-PROT:http://expasy.hcuge.ch/sprot/sprot-top.html
PIR:http://www_nbrf.georgetown.edu/pir/
基序数据库
Pratt搜索(EMBL):http://www2.ebi.ac.uk/pratt/
PROSITE(通过EBI):http://www2.ebi.ac.uk/ppsearch/
PROSITE:http://expasy.hcuge.ch/sprot/prosite.html
蛋白质基序指纹:http://www.biochem.ucl.ac.uk/bsm/dbbrowser/PRINTS.html
蛋白质三维结构数据库
蛋白质数据库:http://www2.ebi.ac.uk/pdb/index.shtml
蛋白质分析工具
Web Cutter - 限制性酶切图谱工具:http://www.medkem.gu.se/cutter/