高通量原始数据下载、校验和保存指南
发布日期:2025-01-04 11:36 点击次数:177
前言
不知道各位老师看过《高通量测序数据上传指南》没?实验设计的天衣无缝,数据分析的头头是道,投稿文章写的花团锦簇,But文章不被接收!
此刻的心情,无以言表。Why?审稿人要求提供数据登录号,What?数据登录号?这才醍醐灌顶,想到原始数据,那么问题来了,数据在哪?
翻箱倒柜CDEF盘找了个遍,还是没有,找合作公司再拷贝一遍?但合同中约定,自项目报告完成之日起,合作公司保留原始数据3个月……啊,到今天为止,一年过去了……
虽难以启齿,但碰碰运气呗,或许合作公司数据还在呢?若数据尚在,欧易定会再次提供给您,“硬数据,好服务”是欧易一贯的宗旨。不过万一数据逾期被删除了,也请您理解,我们已经使用了洪荒之力来查找了。汲取前车之鉴,今天小编就来跟大家聊聊数据下载、校验和保存的一些方法和注意事项。
Top1-数据下载
通常情况下,有两种数据释放方式:云释放和硬盘释放。
1.云释放
使用与欧易生物合作的华为云释放,华为云下载的方法如下:
- 方法A:客户端下载 -
[ 优点:可以批量下载;缺点:需要安装软件。(推荐使用客户端下载,虽需安装软件但更便捷)]
1.1下载OBS Browser
下载路径及方式:
https://support.huaweicloud.com/clientogw-obs/zh-cn_topic_0045829056.html
根据电脑类型进行选择下载。
1.2登录OBS Browser并更新最新版本
1.2.1点击“获取共享”
1.2.2 输入“分享链接”和“提取码”并点击“确认”
1.2.3选中文件夹,点击“下载”
选择所要保存的位置即可。
1.2.4已完成中状态显示“成功”即完成下载
- 方法B:网页版下载 -
[ 优点:直接网页版下载,不需要安装软件;缺点:文件只能一个一个下载 ]
将链接使用浏览器打开(推荐使用IE浏览器,其他浏览器可能会出错)
输入提取码,选择下载位置进行下载即可。
Tips:
1.分享链接和提取码不能有空格
2.注意链接有效期,请在有效期内下载
【P.S】OBS往本地下载,受宽带速度限制,
①如果老师您有云计算服务器,通过云平台直接从OBS下载,速度非常快,平均500Mb/s。
②如果老师您有普通集群,通过集群从OBS下载,速度快,稳定。
2.硬盘释放
自备硬盘,无需云端下载,项目专员将数据下载至老师提供的硬盘后,以邮寄送返或人工送返的形式给到您。(注意事项:如需硬盘释放的老师需提前准备好硬盘,或在签订的合同中委托我们购买。)
Top2-数据校验
1.安装GIT-bash 与 notepad软件
GIT-bash 是运行脚本的软件,安装包为 Git-2.22.0-64-bit.exe
Notepad 是查看MD5值的软件,安装包为 npp.7.7.1.Installer.exe
2.校验
根据我们提供的MD5值文件格式普遍如下,首列为MD5数值,第二列为文件的全名,两列的分隔符为tab分隔符,也有以空格作为分隔符
请将我们提供的MD5值文件命名为md5.txt
将脚本check_md5.sh与以gz结尾的文件放在同一文件夹下,该文件夹下不要有其他文件夹和文件
右键打开 Git-bash,然后运行脚本,代码如下sh check_md5.sh
会生成一个 check_result.txt 的文件,如果文件的md5值能够匹配,则会显示 MD5 is OK 如果文件的md5值不能够匹配,则会显示 MD5 is missing 。
若需要“数据md5值校验方法”压缩包,可在本文留言索取
数据校验无误后,不要忘记给我们的项目专员回复一个邮件哦~
若数据校验有误,烦请第一时间联系项目专员,我们将竭力为您服务。
Top3-数据保存
校验完成后,确认下样本个数是否正确,然后就可以存档了。存在哪里呢?一般来说,大多数老师的数据不是很大,几十G,电脑存储即可,有些老师的数据喜欢保存在移动硬盘里,也是不错的选择,但是电脑和移动硬盘有一定的寿命,安全起见,建议客户两手准备,确保云上和线下各留一份。(如:注册一个百度云将相关数据备份至百度云上。)
END
本文系欧易生物原创
转载请注明本文转自欧易生物