总结更新目前结合人工智能和生物医疗的一些研究案例。
一. 医疗图像类
1.1. 通过小样本学习诊断颅内出血
数据:904个颅内出血的CT,包含五种类型
模型:Ensemble model: VGG167, ResNet-508, Inception-v39 and Inception-ResNet-v2
亮点:在测试集上面达到了98%的灵敏度和95%的精确度;同时添加了一个attention map用于特异的检测出血点

1.2. 谷歌AI从视网膜图像识别心血管疾病
数据: 284335志愿者的视网膜眼底图像
模型: CNN模型
亮点:能够高准确度预测病人的性别,年龄,心血管疾病风险因素等

1.3. 通过病理图片诊断非小细胞癌症,以及通过病理图片预测基因突变类型 (Inception V3)
数据: 总共1,634个从TCGA上下载的病理学数据
模型: 先从高清病理图随机取样,再通过 Inception V3进行三分类,AUC达到0.97;另外,针对每一个位点的突变,分别做了一个通过图像鉴别mutation的分类模型。
亮点:分类精度比较高;同时结合了图像和突变的数据

1.4 通过OCT图像鉴别诊断眼部疾病
数据: 总共207,130个OCT图像
模型:通过迁移学习,将imageNet的参数迁移到新数据上
亮点: 数据量大;精确度很高,达到了95%;比较早的做医疗图像的文章,所以可以发表在cell上面

1.5 通过面部图像诊断遗传疾病(DeepGestalt)
数据: 超过17,000个图像;包含上百种遗传病
模型:首先在Casia-WebFace数据上pretrain,然后在fune-tunning
亮点: 数据量大;精确度很高;同时找了phenotype和genetype之间的关联

1.6 通过心电图数据监测心律失常 (斯坦福大学)
数据: 包含53549名患者的91232的心电图数据,分(1s)时间段切割
模型: CNN网络,总共34层
亮点: Andrew NG的工作;首次对心电图构建了神经网络,达到了超过人类的精确度;心电图在医学中应用中很多,可以方便的智能检测或者智能监护
1.7 人工智能的心电图筛查心脏收缩功能障碍 (梅奥诊所)
[文献](https://github.com/snower2010/snower2010.github.io/blob/master/img/Screening%20for%20cardiac%20contractile%20dysfunction%20using%20an%20artificial%20intelligence%E2%80%93enabled%20electrocardiogram.pdf)
数据: 来自梅奥诊所的44,959名患者心电图谱
模型:CNN网络
亮点:便宜快速的检测心脏疾病;数据量大
1.8 通过病理图像鉴别转移性乳腺癌
数据: 399张淋巴结图片
模型: Inception V3
亮点: 达到了比较高的准确度99.3%;并且可以识别出肿瘤区域

1.9 针对X光胸片诊断
数据: 47万张胸片X光图像和对应的诊断报告
模型:结合CNN和LSTM的模型,学习X光图像和诊断报告的关系,将X光片分为了四种等级:危险、紧急、不紧急、正常
亮点: AI报告的阴性预测率高达99%,也就是说,AI基本不会漏掉有问题的胸片,并确保这些有问题的胸片优先被医生查看。在AI系统的帮助下,紧急状况的胸片病例处理时间从11.2天缩短至2.7天,所需时间仅为原来的1/4。

二. 组学数据类
2.1 基于基因组数据通过随机森林寻找腹泻中的病菌
数据: 1,400多种沙门氏菌的基因组的序列
模型: 随机森林做分类和特征提取
亮点: 通过基因组进行分类,找到干扰源
2.2 通过VAE对转录组数据进行降维
数据: TCGA下载的转录组数据
模型: 通过一层/两层的VAE模型将转录组数据降维,并进而进行分类,找到对应的coding的的基因
亮点: 提供了一个转录组学降维的学习框架

2.3 构建人类大脑的多组学数据
数据: 包含有RNA-seq, ATAC-seq,modification等
模型: genetic variants来预测brain disease phenotypes
三. 其他类数据
3.1 通过指甲判断检测身体状况
数据: 通过可穿戴传感器采集指甲盖上面的信息
模型: 传统机器学习方法,类似最近邻
亮点: 可穿戴设备的健康监测
3.2 谷歌通过电子病历做预测
数据: 114,003个病人的216,221条住院记录
模型: 首先将数据投影到低维空间,接下来分别采用了LSTM,前馈神经网络和决策树
亮点:首先用了FHIR组件将数据标准化,并在CSF和UChicago的电子病历数据上,用深度学习模型预测四件事情:住院期间的死亡风险、规划之外的再住院风险、长时间的住院天数以及出院的疾病诊断。

3.3 AI儿科医生
数据: 1362559名儿科患者就诊于某大型转诊中心的10160万个数据点

模型: LSTM模型

亮点: 准确度和初级儿科医生相当,AI程序诊断出呼吸道感染和鼻窦炎准确率为95%
四. Drug discovery
4.0 综述
The rise of deep learning in drug discovery
CNN模型

VAE模型

RNN模型

4.1 AtomNet
数据: 分子的空间结构数据
模型: 4层CNN模型
亮点: 基于空间结构的drug discovery,准确率比较高
五. 其他
5.1 Nature medicine综述AI+医疗
