本手册详细介绍了中国核酸序列数据库(Biosino)的使用方法,包括数据搜索、序列递交和BLAST运算等核心功能。该数据库是中国生物信息学的重要基础设施,为科研人员提供核酸序列的存储、检索和分析服务。
数据搜索:用户可通过以下条件进行序列搜索:
1. Submitter:按递交者用户名搜索。
2. Sequence No.:按Biosino序列号(CN+10位数字)搜索。
3. Sequence Name:按序列名称搜索。
4. Sequence Length:按长度范围搜索,格式为[a,b],可用“&”表示与、“|”表示或。
5. Divisions:按分类搜索。
6. Molecule:按分子类型搜索。
7. Organism:按物种搜索。
8. Key words:按关键词搜索,支持“&”和“|”。
9. Between:按递交日期范围搜索,格式为YYYY-MM-DD。
10. International ID:按国际序列号(GenBank/EMBL/DDBJ)搜索。
11. One page contains XX records:设置每页显示条数。
操作:勾选条件后点击“Submit”搜索,点击“Clear”清除条件。
搜索结果以表格形式显示,包含Sequence ID、Sequence Name、Version、Submitter、Detail、Description、Division和Molecule栏。点击Submitter可查看联系方式,点击Biosino序列号可查看详细信息,点击Detail可选择显示格式(Biosino、GenBank、EMBL、DDBJ)。
BLAST运算:支持blastp、blastn、blastx、tblastn和tblastx五种程序。输入FASTA格式序列,可选择通过email发送结果。任务队列显示Task Code、Submit Date、Status和Complete Date,结果保留5天。
序列递交:需填写Sequence Name、Sequence Length、Organism、Molecule、Division、Release Date、Public?、Topology、Molecular type、Sequence Description和Sequence。序列需为IUPAC单字符,避免含NN或载体序列。提供IUPAC碱基代码、修饰碱基缩写和氨基酸缩写表。