高层速读
关键信息:生物学研究人员正在使用深度学习算法对细胞图像进行分类、建立基因组联系、推进药物发现…从基因组学、成像到电子病历均有深度学习的应用。
人工智能作为一种流行的科技,为生物数据的测量和分类提供了强有力的帮助,但是对于那些对人工智能不熟悉的人来说,这项技术是困难的。
谷歌团队与神经学家的合作
四年前,谷歌的科学家们出现在了神经学家 Steve Finkbeiner的家门口,这些科学家是位于加州山景城的谷歌加速科学研究部门的人员,该部门的目标是利用谷歌人工智能技术来加速科学发展,他们有兴趣将深度学习技术应用于神经疾病研究,比如与拥有大量神经成像数据的Finkbeiner团队合作。
在神经成像数据中,深度学习算法从一个非常大的、带注释的数据集(如图像或基因组集合)中获取数据的原始特征,并利用它们创建一个数据预测模型,一旦经过训练,这些算法就可以应用这种训练来分析其他数据。
Finkbeiner说,这项技术可以用来解决“真正困难、棘手、复杂的问题,并能看到数据中的结构的不足:数据量太大、太复杂、人脑无法理解等。”
Finkbeiner和他的团队使用一种高通量成像策略来获取数据,这种策略是他们为研究脑细胞而开发的。但团队的数据分析速度却远不如获取速度那样快,因此Finkbeiner同意了与谷歌团队的合作。
在达成合作之后,Finkbeiner坦然地说道:“我当时可不能实话实说,虽然我知道深度学习可以解决哪些问题,但我也清楚,我们数据分析能力只有数据获取能力的一半左右,我们团队的数据分析能力还是比较弱。”
二者深度学习算法初见成效
现在,二者的合作和努力开始收到成效。Finkbeiner的团队和谷歌的科学家一起,训练了一套由两组细胞组成的深度学习算法。其中一组是未标记的,另一组是人工标记的,用来表示科学家通常观察不到的数据特征。
Finkbeiner说,当他们后来将该算法运用在未贴标签的细胞图像上时,团队惊讶地发现,“该算法在预测图像该贴什么标签方面非常出色”,并且有一份详细说明这一工作的刊物即将出版。
Finkbeiner的成功凸显了人工智能最有希望的分支之一--深度学习--正在生物学领域取得进展,这些算法已经渗透到智能手机、智能音箱和自动驾驶汽车等领域中。在生物学中,深度学习算法以人类无法理解的方式深入数据,检测到人类可能无法捕捉到的生物特征。
研究人员正在使用这些算法对细胞图像进行分类,建立基因组联系,推进药物发现,甚至发现不同数据类型之间的联系,从基因组学、成像到电子病历领域均有应用。
训练智能算法做出预测
深度学习算法是20世纪40年代首次提出的一种计算模型,它依赖于神经网络。在该模型中,类似神经元的节点层模仿人类大脑分析信息的方式。宾夕法尼亚大学费城分校的计算生物学家Casey Greene说,直到五年前,基于神经网络的机器学习算法还依赖于研究人员将原始信息处理成一种更有意义的形式,然后将其输入计算模型。
但是,数据集规模的爆炸式增长--比如智能手机快照或大规模基因组测序--以及算法创新等,已经使人类的数据处理能力后退一步成为可能。机器学习的“深度学习”这一进步,迫使计算机找到嵌入像素中有意义的关系。作为神经网络过滤和信息排序的层,它们还相互通信,允许每一层优化前一层的输出。
最终,这个过程允许一个经过训练的算法来分析一幅新的图像,并能正确地识别它,例如某一个病患的细胞。但是,算法无法再控制分类过程,甚至无法精确解释软件正在做什么。尽管这些深度学习网络在做出预测方面可以惊人地准确,但finkbeiner说,“有时候要弄清楚网络看是因为到了什么才能做出如此准确的预测仍然是一项挑战”。
生物学的其他分支也获得回报
然而,生物学的许多分支学科如成像等,正在从这些预测中获得回报。例如,2005年,麻省理工学院和哈佛大学的计算生物学家Anne Carpenter发布了一个名为Cell Profiler的开源软件包,以帮助生物学家定量测量个体特征。例如:显微镜领域中荧光细胞的数量或斑马鱼的长度。
但是深度学习可以让Carpenter的团队走得更远。她说:“我们已经转向测量生物学家们没有意识到的可以用图像来测量的东西。”记录并结合像DNA染色、细胞器纹理和细胞中空空间的质量等视觉特征,可以产生数千个数据特征,其中任何一个特征都有可能揭示新发现。目前版本的Cell Profiler包含了一些深度学习的元素,她的团队希望在明年增加更复杂的深度学习工具。
Carpenter说:“大多数人都很难做到,但事实上,在一张细胞图像中存在很多信息,就像对细胞群进行转录分析时的信息一样多。”
这种处理方式使Carpenter的团队能够采取一种监管较少的方法,将细胞图像转换为与疾病相关的表型。Carpenter还是Recursion制药公司的科学顾问,该公司正利用其深度学习工具,针对罕见的单基因疾病进行药物开发。
微信搜索【AI商业报道】,获取最新行业资讯!
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。