在正式介绍MIMIC数据库之前,我们先简单的介绍获得MIMIC数据库的两个网站:CITI与PhysioNet。
CITI是国际知名的网络训练课程,内容相当丰富。除了最早开发生物医学研究及社会行为研究的受试者保护课程外,还有药物临床试验质量管理规范(GCP,Good Clinical Practice)、动物权益保护课程、研究诚信(Reasearch Integrity)课程等。通过完成CITI Program课程,可以获取美国的医师继续教育学分(CME credits)。
PhysioNet中文全称为:复杂生理信号研究资源,这是由美国国立卫生研究院(NIH)资助,现在由MIT的计算生理学实验室管理。在这个资源网站中,管理的医疗数据库主要包括三类:
临床数据库(Clinical Database)
波形数据库(Waveform Database)
图像数据库(Image Database)
在CITI上通过相关课程考核后,基本都可以得到免费访问。这里简单说一下,临床数据库中不仅仅只有MIMIC数据库,还有eICU(Collaborative Research Database, Paediatric Intersive Care Database)等,与MIMIC数据不同,eICU是一个多中心的ICU数据集,数据采集自飞利浦eICU系统,包含了200000次入院病例,数据内容包括生理体征测量、护理计划文档、疾病严重程度评估、诊断信息和治疗信息。
MIMIC全称是Medical Information Mart for Intensive Care, 是一个重症医学数据库,包含了与波士顿贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center)重症监护病房患者健康相关的匿名数据,主要是通过麻省理工学院的计算机生理学的科研人员提供。MIMIC-IV包含了每一位患者在医院期间的全面信息,其中有实验室测量、给药、记录的生命体征等。
MIMIC-II收集的是2001年到2008年期间在贝斯以色列医院的重症监护中心,包括了约3万名患者的医疗记录。MIMIC-III收集的是2001年到2012年期间在贝斯以色列医院的重症监护中心患者。MIMIC-IV收集并整合了多个医院在2008年到2019年期间的数据,拥有更广泛的时间范围。
MIMIC-II的数据量较少,MIMIC-III大约拥有5.8万名患者数据,MIMIC-IV是目前最大规模的版本,包含了超过30万名患者的数据。
MIMIC-II、III、IV数据库都包含了临床数据、实验室结果和医嘱信息,但是MIMIC-III和IV还包含了生理信号数据,例如心电图、呼吸数据等。
MIMIC-IV与MIMIC-III结构不同,MIMIC-IV澄清了数据来源,并且回答了许多有关数据覆盖率的问题。例如chartevents这个表是来自ICU临床信息系统,那么它便只会存储ICU患者的数据;labevents表是来自医院的数据库,因此它包含了整个住院的信息。
首先打开CITI注册网址,进入之后右上角可以转成中文界面,针对下面的问题进行回答:
加入的组织统一写成Massachusetts Institute of Technology Affiliates(麻省理工学院),并同意服务条款和隐私政策。
姓名写真实的自己姓名,邮箱同样。
使用者名称,账号密码,密保都自己随意设定就好。
居住地写China,完成后联系勾选是的。
(特别重要)
这一步就是加入机构了,邮箱正常填写,与前面保持一致,Department填写自己所在科室,Role写Clinical Research(临床研究人员)。
这一步我们只需要回答必须回答的问题足以,一个是选择Basic IRB Data or Specimens Only Research这个答案,另一个如果想省去麻烦,选择No,最后Submit。
然后会跳转到一个新的界面点击Start Now就可以开始考试了(里面会让你签同意书)。
完成9项考试,我们会获得相应的证书,一个是Completion Report证书,另一个是Completion Certificate证书,都下载并保存到自己电脑中。
通过PhysioNet官网注册PhysioNet账号。
点击个人设置Setting,如图点击左侧Training,将CITI其中有一个成绩单的证书上传上去(Complete Report)。
再通过左侧Credentialing,提交自己的申请(主要是用MIMIC数据做什么),等待一段时间获得许可。
接下来下载的东西比较杂,建议先在内存比较大的盘建一个文件夹,把所有的文件都放入其中,安装的路径也放在其中。
获得许可后就可以在physionet网站上搜索MIMIC,如图然后点击MIMIC-IV,跳转到另一个界面,划至底端,提交你的申请即可获得MIMIC-IV数据集下载权限,在这个界面就可以下载到MIMIC-IV数据集的压缩包。
第二步则需要下载后面安装MIMIC-IV数据库的代码,从这个github_MIMIC安装代码网站下载安装的代码的压缩包。所有的sql代码都在/MIMIC/mimic-code-main/mimic-iv/buildmimic/postgres路径下。
由于MIMIC-IV的数据表很大,windows系统不能直接解压缩csv文件(Mac系统可以),需要下载7-zip,使用第二步中的解压缩后的文件load_7z.sql导入,这一步就是解压缩7-zip。
安装7-zip后,配置环境变量,右击我的电脑、属性、高级设置,再点环境变量,进入之后找到系统变量的Path,点击并新建路径,新的路径是刚刚安装7zip的路径。
下面以windows为例:
首先下载postgreSQL,然后下载自身对应系统的最新版本。
以管理员身份运行安装包,安装目录就放在C盘里,后面还有一个数据存放地址,放在一个比较大的磁盘里,创建自己的账号和密码,端口号默认就可以。在开始菜单里运行SQL Shell(psql),一直回车直至出现让你输入密码的password。
出现postgres=#代表安装成功。
现在开始正式安装:
在SQL Shell(psql)输完密码的窗口继续打下面的指令,1、DROP DATABASE IF EXISTS mimiciv;# 删除曾经存在的MIMIC数据库2、CREATE DATABASE mimiciv OWNER postgres;# 创建一个数据库mimiciv
再输入\c mimiciv进入到刚刚新建的数据库中。
再使用MIMIC安装包的文件,这个文件在mimic-iv/buildmimic/postgres/文件里,里面有一个文件名是create.sql。接着步骤2指令输入:\i (这里输入create.sql文件所在地)
设置mimic-iv数据存放的路径,输入:\set mimi_data_dir '(这里输入的是MIMC-IV数据集的位置)'
windows系统要设置编码方式UTF-8,输入:\encoding 'UTF8'
最后一步使用到load_7z.sql文件记载数据到刚刚建立的mimiciv数据库中,输入:\i (load_7z.sql文件所在地)(建立加载数据库的都在mimic-iv/buildmimic/postgres/)
最后打开postgre SQL官方使用的查询软件pgAdmin 4查询数据,打开pgAdmin 4输入之前设置的密码,左侧就会显示出之前我们所连接的mimiciv数据库。
1.7-zip安装:
2.环境变量设置:
3.利用postgresql安装mimic
创建数据库+创建MIMIC表
设置数据路径+格式+加载MIMIC数据
加载的过程
建立索引