高层速读
关键信息:通过将两种神经网络进行相互对立,Ian Goodfellow(伊恩·古德费罗)创造了一个强大的人工智能工具——生成式对抗网络(GAN)。GAN在生成模型和判别模型的互相博弈学习产生好的输出,能够给予机器想象、创造的东西,具有一定的自主意识。
关键意义:GAN是人工智能中所谓“无监督学习”的一大步,更能够使机器更少地依赖人类来帮助它们了解这个世界。
| 关于生成式对抗网络(Generative Adversarial Net)
近年来,深度学习技术被广泛应用于各类数据处理任务中,比如图像、语音和文本。而生成式对抗网络(GAN)是一种深度学习模型,也是无监督学习最具前景的方法之一。GAN通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生好的输出。
GAN深度学习模型:让机器学会创造
2014的一天晚上, Goodfellow和他刚毕业的博士同学们一起喝酒庆祝,在蒙特利尔最受欢迎的酒吧Les 3 Brasseur,当时一些朋友想让他帮忙做一个非常棘手的项目:一个可以自己制作照片的电脑程序。
当时研究人员已经在使用神经网络作为对策,这种算法以人脑中的神经元网络作为生成模型,用以创造合理的新数据。但结果往往不是很好:计算机生成的脸往往很模糊,或者有错误,如缺少耳朵等。 Goodfellow的朋友们提出的改进是对构成照片的元素进行复杂的统计分析,以帮助机器自行生成图像。然而这将需要大量的数据和运算, Goodfellow告诉他们这根本行不通。
但是,当他在喝着啤酒思考这个问题时,他想到了一个主意:如果让两个神经网络互相对抗呢?他的朋友们对此持怀疑态度,但他决定试一试。Goodfellow在家中写代码一直到凌晨,然后测试了他做写的软件,第一次成功了。
▲Goodfellow
Goodfellow那晚发明的东西现在被称为“GAN”,也叫“生成式对抗网络”,可应用在NPL(自然语言处理)等技术领域。这项技术在机器学习领域引发了巨大影响,其创作者也变成了人工智能领域的重要人物。
在过去的几年里,人工智能研究人员利用一种叫做深度学习的技术取得了令人兴奋的进展。例如提供一个有足够图像数据的深度学习系统,它可以识别出即将过马路的行人。深度学习技术使得自动驾驶汽车和为Alexa、Siri等虚拟助手提供动力的人机对话成为可能。
但是,尽管深度学习的人工智能可以学会识别事物,但他们并不擅长创造事物。而GAN的目标是给机器一些类似于想象、创造的东西。
让机器进行创造不仅能使他们进行绘画或作曲,更重要的是,这能使它们更少地依赖人类来帮助它们了解这个世界和其运作方式。今天,人工智能程序员经常需要告诉机器所提供的训练数据是什么,比如在一百万张图片中,哪一张包含行人横过马路,哪些没有。这不仅数据和人力成本高,而且限制了机器系统处理的能力,即使是轻微的偏离数据的训练。在未来,计算机将在不被告知的情况下更好地利用原始数据并计算出他们需要从中学习的东西。
▲微软推出的“看图作画”机器人
这是人工智能中所谓“无监督学习”的一大步。譬如,一辆自动驾驶汽车可以在不离开车库的情况下自学到许多不同的道路条件;机器人可以预见它在繁忙的仓库中可能遇到的障碍,而不需要带着它去仓库中体验。
我们拥有想象和思考许多不同情景的能力是我们成为人类的原因之一。当未来的技术历史学家回顾过去时,他们可能会认为GAN是朝着创造具有人类意识的机器迈出的一大步。Facebook首席人工智能科学家Yann LeCun称GANs是“过去20年来深度学习中最酷的想法”。另一位人工智能名人、中国百度前首席科学家吴恩达(AndrewNg)也表示,GAN代表着“一项重大而根本性的进步”,这激发了越来越多的全球研究人员投入到深度学习研发之中。
生成式对抗网络要“对抗”多种因素
Goodfellow现在是谷歌大脑团队的一名科学家,该公司位于加州山景城的总部。当记者在那里遇见他时,他仍然对人工智能名人身份感到惊讶,称这是“有点超现实”。同样令人惊讶的是,他已经发现了有人正在利用GAN达到不法目的,现在他的大部分时间都花在这方面。
GAN的特点在于两个神经网络之间的对抗。第一个被称为生成器,负责输出尽可能逼真的素材,如照片或手写稿。第二个被称为鉴别器,它将这些图像与原始数据集中的真实图像进行比较,并试图确定哪些是真实的,哪些是假的。在这些结果的基础上,生成器再调整其参数以创建新的图像。如此循环,直到鉴别器不能再分辨出真假。
在去年一个公开的例子中,芯片公司英伟达的研究人员对GAN进行了培训,通过研究真实的照片来生成虚拟名人的照片。虽然并不是所有的「假明星」都是完美的,但与其他需要数万张训练图像的机器学习方法相比,GAN可以精通几百张图像。
原始训练数据的质量对训练效果也有很大的影响。在一个例子中,GAN开始制作带有随机字母的猫图片。因为训练数据中包含了来自互联网的猫模因(模因即在生物进化中与基因作用类似的事物),所以机器已经告诉自己,字母是它作为一只猫的含义的一部分。
华盛顿大学的机器学习研究人员Pedro Domingos说道,GAN是个性情暴躁的AI。如果鉴别器太容易欺骗,生成器输出将看上去不真实。而校准两个对抗的神经网络可能很困难,这就解释了为什么GAN有时会输出奇怪的东西,比如有两个头的动物。
▲GAN输出的假照片
然而,这些挑战并没有阻止研究人员。自从 Goodfellow和其他几个人在2014发表了关于他发现的第一份研究报告以来,已经有了数百篇与GAN有关的论文。这项技术的一位粉丝甚至创建了一个名为“GAN Zoo”的网页,致力于跟踪已经开发出来的各种技术版本。
GAN深度学习模型最明显的即时应用是在涉及大量图像的领域,如电子游戏和时尚领域。但展望未来, Goodfellow认为GAN将推动更大的进步。他说:“科学和工程领域有很多方面需要优化,”他举例说,比如需要更有效的药物或必须提高电池的效率。“这将是下一波巨浪。”
在高能物理中,科学家们使用强大的计算机来模拟数百个微粒像瑞士核研究中心大型粒子对撞机这样的机器中可能发生的相互作用。这些模拟速度慢,需要大量的计算力。耶鲁大学和劳伦斯伯克利国家实验室的研究人员开发了一种GAN,在对现有的模拟数据进行训练之后,GAN学会了准确地预测某一粒子的行为,并使其运行得更快。
医学研究是深度学习另一个有前途的领域,隐私问题的存在意味着研究人员有时无法获得足够的真实病人数据,比如分析药物无效的数据。宾夕法尼亚大学的CaseyGreene说,GAN可以通过生成几乎和真实记录一样好的假记录来帮助解决这个问题。这些数据可以更广泛地共享和研究,而真正的记录则受到严格保护。
GAN之父:技术进步不能缺少负面因素
然而,技术有黑暗的一面。一台用来制造「真实假货」的机器,对于那些想要影响股票价格、选举等假新闻的提供者来说,是一个完美的武器。况且,人工智能已经被用来在色情片的身体上放别人脸的照片,以及在政客的嘴上放上文字。GAN虽没有制造这个问题,但GAN的存在确实会让问题更糟。
哈尼·法里德(Hany Farid)是达特茅斯学院(DartmouthCollege)的数字取证专业毕业生,目前他正在研究更有效的识别假视频的方法,比如检测吸入和呼气引起的面部颜色的细微变化,这种方法是有效的,因为GAN发现这些变化很难精确模仿。但Hany Farid警告说,GAN会反过来适应,“我们从根本上说处于弱势。”
这种「猫捉老鼠」的游戏也将在网络安全中发挥作用。研究人员已经强调了“黑匣子”攻击的风险,在这种攻击中,GAN被用来找出机器学习模型,因为许多安全程序都用这些模型来发现恶意软件。但是,在预测了防御算法的工作原理之后,攻击者可以避开它并插入流氓代码。
现在, Goodfellow领导着谷歌的一个团队,专注于让机器学习更加安全。他警告说,人工智能社区必须吸取以往创新浪潮的教训,在创新浪潮中,技术人员将安全和隐私视为事后考虑。当他们意识到风险的时候,坏人已经有了明显的领先优势。“很明显,我们已经开始了,”他说,“但希望我们能在安全方面取得重大进展,否则我们就会离我们的出发点越走越远。”
尽管如此, Goodfellow认为将不存在一个纯粹没有任何欺骗的技术解决方案。相反,他认为,技术依赖于各种社会因素而进步。比如教孩子们批判性思维,让他们参加演讲和辩论课。他说:“在演讲和辩论中,你会和另一个学生竞争,你在考虑如何编造有利于自己甚至是误导的说法,或者如何编造出非常有说服力的正确说法。”
Goodfellow很可能是对的,但他的结论是,科技不能解决假新闻问题,虽然这不是人们想听到的。
微信搜索【AI商业报道】,获取最新行业资讯!
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 美媒聚焦比亚迪“副业”:电子代工助力苹果,下个大计划瞄准AI机器人
- 微信零钱通新政策:银行卡转入资金提现免手续费引热议
- 消息称塔塔集团将收购和硕印度iPhone代工厂60%股份 并接管日常运营
- 苹果揭秘自研芯片成功之道:领先技术与深度整合是关键
- 英伟达新一代Blackwell GPU面临过热挑战,交付延期引发市场关注
- 马斯克能否成为 AI 部部长?硅谷与白宫的联系日益紧密
- 余承东:Mate70将在26号发布,意外泄露引发关注
- 无人机“黑科技”亮相航展:全球首台低空重力测量系统引关注
- 赛力斯发布声明:未与任何伙伴联合开展人形机器人合作
- 赛力斯触及涨停,汽车整车股盘初强势拉升
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。