我参考了网上的一个贴子里面描述了如何用aspera来进行下载,在使用它下载单个数据的时候成功了批量下载一个ftp查看文件内容中所有数据时未能成功,后来我尝试使用wget命囹;
根据我要寻找的sra数据去ncbi上进行搜索
ftp查看文件内容中的格式如下所示,每一行表示一个URL地址:
你可以切换当前目錄到你需要下载到的目录这时候默认下载目录就是当前目录。
下载文献中提及的基因组信息囿Assembly No可以直接找到FTP对应的位置;没有则需使用提供的Genebank No到Genome数据库中搜索。在Genome list搜索目标基因组不支持模糊搜索但是NCBI提供上下键信息补齐。
NCBI
的 FTP
里下载需要的基因组数据
25922
之后按 上下箭头
会自动补齐。
此时你应当在表中找到:
如果原文提供的是 Assembly No
你就不需要再去 NCBI 查找了,直接能通过 FTP
地址找到我一般使用 FileZilla
来下载。
而 WGS
里面你可以单独的看到每个蛋白质cotig 等的信息,实际上就是把 FTP
里面能下的内容拆开了并且是页面下载的。
NCBI 里面新旧命名系统一个东西在不同的库里面有不一样的名字很是讓新手头痛。
所有大肠杆菌基因组汇总此次使用25922补齐信息搜索。
NCBI提供的如何下载基因组说明