news 2026/4/27 11:56:20

UKB数据库/RAP平台批量下载数据教程

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
UKB数据库/RAP平台批量下载数据教程

使用 Table Exporter方法
第一步:
通过在本地终端(请确保你的机器上安装了dx-toolkit)或ttyd终端,执行以下命令,获取包含你数据集中所有可用数据字段的文件:

dx extract_dataset project-xxxx:record-yyyy -ddd --delimiter ","
where project-xxxx:record-yyyy is ID of your Dataset

【安装dx-toolkit】打开本地电脑中的Anaconda Prompt
【安装dx-toolkit】在Anaconda Prompt中输入

pip install dxpy

系统会进行自动安装。

假如出现类似以下报错:

WARNING: The scripts dx, dx-app-wizard, dx-build-app and dx-build-applet are installed in '/Users/user-amy/Library/Python/3.9/bin' which is not on PATH. Consider adding this directory to PATH

说明需要更新电脑的PATH环境变量配置,以包括pip安装新命令的路径(具体解决方案自行百度)。

【CLI登录】在Anaconda Prompt中输入

dx login

服务器连接成功后按提示输入RAP的用户名和密码即可

现在输入:

dx extract_dataset project-xxxx:record-yyyy -ddd --delimiter ","

注意!

project-xxxx:record-yyyy为你的数据库 例如xxxxx.dataset

完成后有三个文件

上述命令将生成3个*.csv文件,其中*.dataset.data_dictionary.csv文件包含所有可用数据字段的完整信息(字段名称位于称为 的第二列name)。

where project-xxxx:record-yyyy is ID of your Dataset

【登出/注销CLI】使用完毕养成好习惯需要登出/注销,在Anaconda Prompt中输入:

dx logout

第二步:
接下来使用Table Exporter

收集所有感兴趣的数据字段名称,并写入field_name.txt文件。文件应有1列,每行只有1个数据字段名称。上述文件应仅包含同一实体中的数据字段(例如“参与者”、“olink_instance_0”等)。不同实体中的数据字段应写入独立文件。用于的值可以在.dataset.data_dictionary.csv文件的第一列中找到(注:这与entity_dictionary.csv文件中的不同)

注意这一步:
可以在自己电脑上新建txt,
但是!
需要用Visual Studio Code软件将txt转化为unix格式的txt !!!
也可,自行百度查看其他方法windows的txt转unix的txt.

用 VS Code 打开文件 查看右下角状态栏,会显示 "CRLF" 或 "LF" 点击 "CRLF" 或 "LF",选择 "LF" 保存文件

第三步
将field_name.txt文件上传到RAP项目

根据需要,
我用这个

注意:指定实体会快更多!


到这个就批量下载完成!

RAP官网下载教程如下:

https://dnanexus.gitbook.io/uk-biobank-rap/working-on-the-research-analysis-platform/accessing-data/accessing-phenotypic-data
https://documentation.dnanexus.com/developer/apps/developing-spark-apps/table-exporter-application

可进行进一步参考!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/22 15:52:23

java基于SpringBoot校园快递代取系统-vue三端

目录已开发项目效果实现截图关于博主开发技术介绍核心代码参考示例1.建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度系统测试总结源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!已开发…

作者头像 李华
网站建设 2026/4/26 10:54:00

CCF-GESP计算机学会等级考试2025年12月三级C++T2 小杨的智慧购物

B4450 [GESP202512 三级] 小杨的智慧购物 题目描述 小杨的班级要举办一个环保手工作品展览,老师请小杨去文具店购买 MMM 种不同的文具(例如:铅笔、橡皮、尺子等)。 商店里共有 NNN 件文具,每件文具都有一个种类编号&am…

作者头像 李华
网站建设 2026/4/22 19:37:40

良心插件,办公神器

今天给大家介绍一款强大的word插件,插件功能强大丰富包含122个功能。可以批量合并文档、批量拆分文档、批量导出Word数据到Excel、批量转数据值转换成大写金额、批量插入图片、批量另存图片、批量统一图片尺寸、批量调整Word表格的格式、批量打印文件、批量生成PDF、…

作者头像 李华
网站建设 2026/4/21 17:47:24

日语时间相关

下面把“日语时间相关”按 可直接套用的规则体系讲细:从“时间点、时间段、截止、先后、同时、频率、相对时间、书面/口语差异、易错点”逐一说明,并配对比例句。1) 时间点:表示“什么时候发生” 1.1 最核心:时间点通常用「に」 规…

作者头像 李华
网站建设 2026/4/21 21:58:40

vue基于Python+Django的高校考培中心考试培训管理服务系统

目录已开发项目效果实现截图关于博主开发技术介绍核心代码参考示例1.建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度系统测试总结源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!已开发…

作者头像 李华