为了数据也是拼了！多伦多大学用人造X射线训练人工智能

高层速读

关键信息：为了解决罕见疾病X射线数据较少的问题，多伦多大学工程师们设计了一种新的方法，利用机器学习创造出人造X射线来增强人工智能训练集，他们使用深度卷积生成对抗网络（DCGAN）来生成并持续改进模拟图像。

关键数据：在一般情况下，结合了人造X射线的增强数据集的分类精度提高了20%，在一些罕见疾病中，准确率提高到40%左右。

关键意义：从某种意义上说，我们正在利用机器学习来进行机器学习。

在象限的左边是病人胸部的真实X射线图像，旁边是由人造的合成X射线

人工智能可以提高医学诊断速度和准确性，但在临床医生利用人工智能来识别X射线等图像的情况之前，他们必须“教”会算法寻找什么。

在医学图像中识别罕见的病理现象，给研究人员带来了持续的挑战，因为在监督学习环境中，可以用来训练人工智能系统的图像十分缺乏。

多伦多大学电子与计算机工程系（ECE）Shahrokh Valaee教授和他的团队设计了一种新的方法：利用机器学习创造计算机生成的X射线来增强人工智能训练集。“从某种意义上说，我们正在利用机器学习来进行机器学习”，Valaee说。

“我们正在通过计算机制造某些罕见疾病的X射线，我们可以将它们与真实的X射线结合起来，从而拥有足够大的数据库来训练神经网络，以便此后从其他X射线中识别出有异常情况的数据。”

Valaee是医学实验室（MIMLab）机器智能的一员，这是一个内科医生、科学家和工程研究人员组成的团队，他们将自己在图像处理、人工智能和医学方面的专业知识结合起来，以解决医疗挑战。

“人工智能有潜力在医学领域提供各种各样的帮助”Valaee说，“但要做到这一点，我们需要大量的数据——我们需要数千个标签的图像让这些系统发挥作用，但一些罕见疾病的数据太少了。”

为了制造这些人造X射线，研究小组使用一种被称为深度卷积生成对抗网络（DCGAN）的技术来生成并持续改进模拟图像。

GANs是由两个网络组成的一种算法：一个是生成网络，一个是判别器网络，生成网络负责生成图像，判别器则负责从真实图像中区分出合成的图像，直到这两个网络被训练成一个点，判鉴别器不能区分真实的图像和合成的图像，就可以输出了。

一旦有足够数量的人造X射线被创造出来，它们就会与真实的X射线相结合，来训练一个深度卷积神经网络，这个网络负责将需要鉴别的图像分类为正常或其他情况。

Valaee说：“我们已经能够证明，由深度卷积的GANs生成的人工数据可以用来增强真实的数据集，这为培训提供了更多的数据，并提高了这些系统在识别罕见疾病方面的性能。”

在通过人工智能系统输入数据时，MIMLab将其增强数据集的准确性与原始数据集进行了比较，发现在一般情况下，增强数据集的分类精度提高了20%，在一些罕见的情况下，准确率提高到40%左右。

由于合成的X光并不是来自真实的个体，所以数据集容易获得，同时也不会存在侵犯隐私方面的担忧。Valaee说：“这很令人兴奋，我们已经能够克服将人工智能应用于医学的障碍。”

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，应及时向本网站提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后，将会依法尽快联系相关文章源头核实，沟通删除相关内容或断开相关链接。

为了数据也是拼了！多伦多大学用人造X射线训练人工智能

下一篇