原标题:这一天,我们读了千页往事,和一页叫做“百度大脑”的未来
刚刚过去的世界读书日,大体与所有节日一样,都是媒体和各企业必要参与的节庆。
相信大家都已经看到,社交媒体上大家都在推出各种和读书、书籍有关的东西。有人笑言,这一天把一年也看不完的书都推出来了。
所有企业和媒体,无论推什么书籍、书人和书事,必然都是关于历史和往事的内容。但今年却有了一个例外。百度大脑在这天推出了一个同样切题世界读书日的玩法,实际上为读者奉上的却是一碟未来。
4月23日,百度大脑携手Kindle,发布了一个名为“遇见著名的你”的创意H5。这个H5的玩法不同之处在于,用户只需上传自己的正面照,百度大脑就会自动进行分析,把对用户的识别和理解,匹配到名著中某一段关于人物的描写或者故事情节。
从而告诉用户,此刻的你最像哪本名著中的哪段故事。这种感觉很是奇妙,在一个不期然的瞬间,突然知道此刻自己的衣着穿戴和表情,竟然与多少年前秉烛夜读时遇到的文字如出一辙。
唤醒对阅读的追忆和神往,“身临其境”显然是一种不错的选择。
但是这场优雅而隽永的“遇见”,回归到技术层面却并不容易。对AI有了解的朋友,显然会发现这个H5在识别和判断中所展现的“智慧“,已经远远超出大家对类似玩法的常识认知。
遇见名著中的自己之后,我们也许有必要细数这背后究竟隐藏着哪些技术因素。借此,或许可以精准读取出关于AI的未来能力。
“穿越回名著“是一个入口,曲径通幽连着不同远近的未来图景。而这条“径”,被称作百度大脑。
此刻的未来:AI能做的,远比想象中更多
对于AI带来的识别能力,相信大家已经并不陌生。今天机场车站都已经运用了人脸识别功能,解锁手机也有3D人脸识别这一选项。
但是如果大家觉得AI只能识别人脸,那可能就大错特错了。
从“遇见著名的你”H5中,百度大脑最直接展现出的能力,是其所提供的AI能力种类,已经远远超过了大众想象。
换句话说,在大家刚刚开始习惯简单人脸识别的时候,百度大脑已经小试牛刀展示出了AI技术在识别和理解层面可以达到的高度——对于大众行业来说这是未来,对于百度大脑来说,这就是现在。
比如说,在这个H5中,百度大脑不只是能够识别出人脸,还会更加复杂地进行“人脸属性识别”。具体来说,就是百度大脑能通过照片上的面部信息,识别出照片中人的性别、年龄、表情等信息。我在几个同事身上做了测试,年龄识别这个很困难的技术,百度大脑的判断都相当准确。
而在人脸属性识别之外,百度大脑这次还展现了另一个AI技术:人体分析。顾名思义,这一技术的识别对象不是人脸,而是人的体态。在H5中,百度大脑通过对全身照用人体分析能力,可以识别出照片中用户的性别、年龄、服饰类别及颜色、佩戴物、行为动作等信息。最终通过把理解后的信息抽象出来,与AI所理解的名著段落进行匹配,完成“穿越”。
同时,H5中还融入了百度大脑的车辆识别能力,能够识别图片中的交通工具。
能够看懂用户的容貌体态,才仅仅是个开始。要想准确匹配到名著的段落,还需要对大量名著文本信息进行理解,这就涉及语义理解这个AI能力。通过对Kindle提供的超过百万册书籍进行学习,百度大脑将各部名著中的人物描写和情节段落进行了准确抽离。让AI把读书学来的知识,和看人识物的本事放在一起,多种能力融合,这才带给用户一场“名著穿越”。
作为测试,我拍了一张同事的照片交给百度大脑来匹配。通过识别出年龄29岁、表情是高兴,然后搭配黑色长裤,这张照片被匹配到了《钢铁是怎样炼成的》中保尔回到冬妮娅身边那一幕。
同事问我这代表了什么,我说这是AI觉得你像刚从战场回来的。
以上多维度的AI能力综合,才最终做到了这件很是神奇的“小事”。而其背后,则意味着我们期待的大量AI能力为人类服务,这一非常“未来”的景象,其实已经被百度大脑带入了我们身边。
即将发生的未来:当我们习惯用百度大脑来“智慧结绳”
更深一层的未来,在于这一H5背后展现的,并不是一个个单体的AI技术,而是将大量技术融合到浑然天成。用户在毫无知觉的情况下,就得到了经过复杂识别与匹配的结果。
让我们一同思考这样一个问题:人的智慧和单一的机器,二者到底有什么区别?
最大的区别可能在于,无论多复杂的“机器”,都只能用单一能力完成单一目标。无论是生产线还是电脑,莫不如是。而人的能力在于,我们可以利用手耳眼脚心,集成所有的感官和思考,在同一点上迸发出来,解决同一个问题。我们可以听到命令,经过思考,马上实践。这样的综合和转化,是传统意义上“机器”不具备的能力。
然而规则正在发生改变。
运用之妙存乎一心,在这次“穿越名著”背后,百度大脑展示出了对多跟AI技术丝线的“结绳”。即通过整合调用,把大量技术融合解决同一个问题。这个思路的背后,事实上是百度大脑3.0的核心技术突破“多模态深度语义理解”。多模态融合与多信道统一,不仅让AI能听和看,还可以理解实物背后的含义。比如说理解一张照片如何匹配名著中的一段情节,既要能够看清看懂照片上有哪些因素,又要读懂名著的大段内容中,哪些是关于人物表情、服装、配饰和交通工具的描写。二者结合,才有智慧。
而现实世界中,也在经历必须让AI从单独的听和看,走向多看多听之后的自我理解这样一个趋势。这是一个极其广泛的技术需求,甚至大量产业应用AI能力都必须以其为基础。而这样的需求,就要求技术综合体必须具备三个能力:平台化、实用导向和多模态融合。
经历百度多年AI技术积累的百度大脑,恰好就处在这样一个位置。它包括视觉、语音、自然语言处理、知识图谱、深度学习等 AI 核心技术和 AI 开放平台,对内支持百度所有业务,对外全方位开放,赋能各行各业转型升级。
从有技术到能够用技术,从单体智能走向泛智能,百度大脑已经打开了开关,这个即将发生的未来,意味着社会化生产的全新AI可能性。
未来的未来:或许,我们终将靠AI之舟跨过“庄子悖论”
为了凝视更远的未来,让我们回到世界读书日的意义。
哪怕每一天都是世界读书日,必须承认的是人类已经彻底陷入了“庄子悖论”,即生有涯而知也无涯。在信息爆炸、知识碎片化、体系学习成本越来越重的未来,人类究竟如何与“知识”这个怪兽相处呢?
日本著名漫画家、《圣斗士星矢》的作者浜津守,还有一部知名的作品,翻译为《铁甲神兵》。那部漫画里有一个令我印象深刻的角色,他是一位哲学家,但面对浩如烟海的知识,他感到生命如此短暂。最终他选择把身体化为分子态以求永生,就是为了读完所有的人类知识。
虽然是一个漫画人物,但这却是一个鲜明的隐喻。知识体系越来越细分,好内容不计其数,但适合自己的书籍又隐藏在我们难以意料的角落里,这样一个时代,人类究竟该如何妥善地阅读?
百度大脑在这一天,展示了这样一个未来的一角:不仅仅是人去阅读知识,而是让AI来阅读人类,通过识别和理解,把最适合你的那一页放在你的面前。
对抗人类与知识的鸿沟,或许会在未来成为人类主要难题之一。虽然那还是非常遥远的未来,但百度大脑无疑掀起了帘幕一角,让我们看到不用追求永生,人类同样可以更高效率地追逐知识。
当然,这里不是教导大家放弃阅读,一味等候智能。但不可否认的是,人类与信息的交互方式正在快速迭代,从固定时空阅读,到随时阅读,再到未来的AI来为你阅读。世界读书日这天,百度大脑带来的终极人文关怀,是关于知识与生命交互的一次勇敢思考。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 消息称塔塔集团将收购和硕印度iPhone代工厂60%股份 并接管日常运营
- 苹果揭秘自研芯片成功之道:领先技术与深度整合是关键
- 英伟达新一代Blackwell GPU面临过热挑战,交付延期引发市场关注
- 马斯克能否成为 AI 部部长?硅谷与白宫的联系日益紧密
- 余承东:Mate70将在26号发布,意外泄露引发关注
- 无人机“黑科技”亮相航展:全球首台低空重力测量系统引关注
- 赛力斯发布声明:未与任何伙伴联合开展人形机器人合作
- 赛力斯触及涨停,汽车整车股盘初强势拉升
- 特斯拉首次聘请品牌大使:韩国奥运射击选手金艺智
- 华为研发中心入驻上海青浦致小镇房租大涨,带动周边租房市场热潮
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。