Cases of AI+Biomedicine

Posted by Denghui Liu on January 4, 2019

总结更新目前结合人工智能和生物医疗的一些研究案例。

一. 医疗图像类

1.1. 通过小样本学习诊断颅内出血

文献

新闻报道

数据:904个颅内出血的CT,包含五种类型

模型:Ensemble model: VGG167, ResNet-508, Inception-v39 and Inception-ResNet-v2

亮点:在测试集上面达到了98%的灵敏度和95%的精确度;同时添加了一个attention map用于特异的检测出血点

Figure1.1.1

1.2. 谷歌AI从视网膜图像识别心血管疾病

新闻报道

文献

数据: 284335志愿者的视网膜眼底图像

模型: CNN模型

亮点:能够高准确度预测病人的性别,年龄,心血管疾病风险因素等

Figure1.2.1

1.3. 通过病理图片诊断非小细胞癌症,以及通过病理图片预测基因突变类型 (Inception V3)

文献

数据: 总共1,634个从TCGA上下载的病理学数据

模型: 先从高清病理图随机取样,再通过 Inception V3进行三分类,AUC达到0.97;另外,针对每一个位点的突变,分别做了一个通过图像鉴别mutation的分类模型。

亮点:分类精度比较高;同时结合了图像和突变的数据

Figure1.3.1

1.4 通过OCT图像鉴别诊断眼部疾病

文献

数据: 总共207,130个OCT图像

模型:通过迁移学习,将imageNet的参数迁移到新数据上

亮点: 数据量大;精确度很高,达到了95%;比较早的做医疗图像的文章,所以可以发表在cell上面

Fig.1.4.1

1.5 通过面部图像诊断遗传疾病(DeepGestalt)

文献 新闻报道

数据: 超过17,000个图像;包含上百种遗传病

模型:首先在Casia-WebFace数据上pretrain,然后在fune-tunning

亮点: 数据量大;精确度很高;同时找了phenotype和genetype之间的关联 Fig.1.5.1

1.6 通过心电图数据监测心律失常 (斯坦福大学)

文献

新闻报道

数据: 包含53549名患者的91232的心电图数据,分(1s)时间段切割

模型: CNN网络,总共34层

亮点: Andrew NG的工作;首次对心电图构建了神经网络,达到了超过人类的精确度;心电图在医学中应用中很多,可以方便的智能检测或者智能监护

1.7 人工智能的心电图筛查心脏收缩功能障碍 (梅奥诊所)

[文献](https://github.com/snower2010/snower2010.github.io/blob/master/img/Screening%20for%20cardiac%20contractile%20dysfunction%20using%20an%20artificial%20intelligence%E2%80%93enabled%20electrocardiogram.pdf)

新闻报道

数据: 来自梅奥诊所的44,959名患者心电图谱

模型:CNN网络

亮点:便宜快速的检测心脏疾病;数据量大

1.8 通过病理图像鉴别转移性乳腺癌

新闻报道

文献

数据: 399张淋巴结图片

模型: Inception V3

亮点: 达到了比较高的准确度99.3%;并且可以识别出肿瘤区域

Figure.1.8.1

1.9 针对X光胸片诊断

文献

数据: 47万张胸片X光图像和对应的诊断报告

模型:结合CNN和LSTM的模型,学习X光图像和诊断报告的关系,将X光片分为了四种等级:危险、紧急、不紧急、正常

亮点: AI报告的阴性预测率高达99%,也就是说,AI基本不会漏掉有问题的胸片,并确保这些有问题的胸片优先被医生查看。在AI系统的帮助下,紧急状况的胸片病例处理时间从11.2天缩短至2.7天,所需时间仅为原来的1/4。

Figure.1.9.1

二. 组学数据类

2.1 基于基因组数据通过随机森林寻找腹泻中的病菌

文献

新闻报道

数据: 1,400多种沙门氏菌的基因组的序列

模型: 随机森林做分类和特征提取

亮点: 通过基因组进行分类,找到干扰源

2.2 通过VAE对转录组数据进行降维

文献

数据: TCGA下载的转录组数据

模型: 通过一层/两层的VAE模型将转录组数据降维,并进而进行分类,找到对应的coding的的基因

亮点: 提供了一个转录组学降维的学习框架

Figure.2.2.1

2.3 构建人类大脑的多组学数据

文献

数据: 包含有RNA-seq, ATAC-seq,modification等

模型: genetic variants来预测brain disease phenotypes

三. 其他类数据

3.1 通过指甲判断检测身体状况

文献

新闻报道

数据: 通过可穿戴传感器采集指甲盖上面的信息

模型: 传统机器学习方法,类似最近邻

亮点: 可穿戴设备的健康监测

3.2 谷歌通过电子病历做预测

新闻报道

文献

数据: 114,003个病人的216,221条住院记录

模型: 首先将数据投影到低维空间,接下来分别采用了LSTM,前馈神经网络和决策树

亮点:首先用了FHIR组件将数据标准化,并在CSF和UChicago的电子病历数据上,用深度学习模型预测四件事情:住院期间的死亡风险、规划之外的再住院风险、长时间的住院天数以及出院的疾病诊断。 Figure.3.2.1

3.3 AI儿科医生

新闻报道

Paper

数据: 1362559名儿科患者就诊于某大型转诊中心的10160万个数据点

Figure.3.3.1

模型: LSTM模型

Figure.3.3.2

亮点: 准确度和初级儿科医生相当,AI程序诊断出呼吸道感染和鼻窦炎准确率为95%

四. Drug discovery

4.0 综述

The rise of deep learning in drug discovery

CNN模型 Figure4.0.1

VAE模型 Fig.4.0.2

RNN模型 Fig.4.0.3

4.1 AtomNet

文献

数据: 分子的空间结构数据

模型: 4层CNN模型

亮点: 基于空间结构的drug discovery,准确率比较高

五. 其他

5.1 Nature medicine综述AI+医疗

文献 新闻报道

Fig.5.1.1

5.2 Nature medicine 综述AI医疗

文献

文献