局部战争还是全面入侵?如何看待搜狗录音翻译笔?

原标题:局部战争还是全面入侵?如何看待搜狗录音翻译笔?

科技产品的更新换代频率之快,差不多是每个人都能感受到的。但在极速迭代的硬件大潮中,有没有产品技术陷入停滞,仅仅依靠市场刚需维持增长速度的电子产品呢?其实仔细找找就会发现,这样的产品还非常多。比如说我们的媒体同行、商务人士和学生党的标配,走到哪都要带着的录音笔,就是这样一个例子。

我们能看到的是,中国市场的录音笔每年保持着百万台级别的销售量,但录音笔本身的功能更新却近乎空白,新产品仅仅依靠价格、待机时间、收音效果来保持增长。这种不用快跑也能生存的硬件市场之所以存在,是因为刚需直接催生了市场份额。录音笔产品虽然看似不大,但却是很多生活、工作、学习场景所中不可替代的工具。无论是记者采访、秘书整理会议纪要,还是学生完成学业工作,都无法用其他工具来代替录音笔。久而久之,就把这个重要但不起眼的市场变成了真空地带,以至于大家似乎都忘记了录音笔这东西也是能进行科技创新的——但AI并没有忘记它。

刚刚,搜狗推出了录音翻译笔,这款产品刚一面世就引来了巨大关注。其原因很容易理解,因为搜狗的录音翻译笔,在价格与其他录音笔持平甚至更低价的前提下,居然增加了速记、翻译、同传这些原本非常昂贵的新功能。知乎上有用户说,这简直直接推翻了购买传统录音笔的必要性,就连马化腾都在第一时间下单抢购了一台。

但在一个产品之外,我们似乎可以看到更多。录音笔仅仅是个小的硬件场景,或者说只是个开始。AI带来的机器翻译、语音识别等功能,会不会将在完成AI+录音笔后,进行模式复制,一个又一个地去推翻我们熟悉的场景,走入更智能的时代?

这么看来,搜狗录音翻译笔的背后,或许不仅是一场单一科技硬件的局部战争,更隐藏着一场山雨欲来的AI全面入侵。这就很有可以开脑洞的地方了…

推翻已有产品的全部价值,才能创建新入口:录音笔的闪点狙击

在进行录音笔的推理前,我们不妨思考这样一个问题:今天大家还能看到带按键、连蓝牙的“智能音箱”吗?好像不太现实,即使路边摊扫码就送的音箱,如今也基本是语音交互的AI音箱了。从亚马逊推出Echo,到国内BAT、京东等公司争相进入音箱市场,再到华强北数千家工厂开工做AI音箱,短时间对话式交互、能够指挥智能家居、连接电商的音箱产品笼罩了整个中国。之所以会出现这种现象,是因为在AI带来的交互改变面前,传统蓝牙音箱已经失去了所有价值:价格不便宜、音质都一样、功能不及新音箱的十分之一。这种情况下,谁还会留恋此前的音箱产品呢?整个产业也瞬间抛弃了过去。

同样的颠覆故事,今天似乎开始在录音笔身上上演。我们知道,大多数录音笔的功能仅仅是录音和播放,稍微智能点的也就是加上上传到云端。这功能确实寡淡,但也无法被手机等硬件取代。不能取代,却不代表无法颠覆。假如新的硬件形态保留了原有硬件的价格和功能,又加入了全新的功能,岂不是马上“改朝换代”?尤其是在新功能足够重要的情况下。

比如说,同时具有速记、翻译和同传能力的录音笔。搜狗的录音翻译笔的价值就在于此。基于搜狗AI带来的语音识别、NLP和机器翻译能力,这款产品集成了速记、同传等十分重要,但录音笔无法实现的功能。

比如说,搜狗录音翻译笔支持同声传译 3 秒上屏显示。将录音翻译笔与手机连接,即可在手机端 APP 查看实时的语音识别结果与翻译结果,并可直接保存和分享录音及同传文件。

换句话说,在用录音笔收到一段英文之后,用户可以马上就得到三件东西:录音、这段录音的文字整理、这段录音的翻译结果。

如果时间倒回到不久之前,一名记者采访了位外国人。整个从整理文档到翻译内容需要多久呢?大约是一个通宵,而在搜狗录音翻译笔出现后,大约不需要时间。据了解,目前搜狗录音翻译笔支持中英与英中同传,语音识别准确率中文 97%,英文 95%。基于搜狗的神经网络机器翻译技术,同传翻译准确率达 90%,基本可以支持跨语种实时对话的需要。而其将录音转化成文字,最快可以支持400 字每分钟,也可以说是非常高效。人工同传和同传设备的价格之昂贵,是大家都知道的。商用的机器同传也只是企业们能用得起。而搜狗这次竟然推出了价格398元的完全面向普通消费者的录音笔。毫无疑问,用户在新购买一只录音笔的时候,已经不需要做什么选择了。要知道,录音笔从前仅仅提供的是一种工具,而在可以完成速记识别、录音翻译和同声传译功能之后,录音笔更多是在为用户提供此前必须依靠人力才能获得的服务。AI的奇妙之处或许正在于此。通过将经验和识别能力压缩成硬件能力,一场录音笔市场的闪点狙击就此完成。

但在录音笔战役之外,或许我们能看到这场战争还远远没有结束。

翻译是硬件的命门所在:搜狗的区域战争

通过搜狗翻译录音笔的产品功能,我们会发现这样一个现象:可搭载在硬件上,快速准确的翻译能力成为了产品的一个价值驱动点。在全球化的今天,人们对跨语言表达和获取信息的需求也越来越高,产品的翻译能力会成为影响用户消费的重要因素。

而且,翻译能力是一个办公、社交、商务、旅行场景中会反复用到的能力,用户对翻译的需求往往是随时随地产生的。而传统的硬件系统中,因为受限于语音识别和机器翻译技术的准确率,加上硬件研发的不配套,我们很少能够在硬件上看到翻译、甚至同传这类的能力方案。但从搜狗此前推出的旅行翻译宝,再到如今的搜狗翻译录音笔,我们可以看到搜狗的“翻译+硬件”正在形成一个赋能公式,一个个打开垂直硬件生态的新商业空间。在世界化飞快演进的今天,对泛在化翻译的渴求很快会变成科技产品的命门。从搜狗的硬件思路中,我们可以看到翻译能力成为了其硬件的枢纽和市场通行证,把底层的AI技术和尖部的硬件场景联系到一起,组成了完整可复制的硬件解决方案。再观察搜狗从文字翻译、对话翻译、图像翻译到首家实现同传在消费级产品上的落地,搜狗的翻译之路正越走越快。

或许有理由相信,接下来占据“翻译+”这个优势的搜狗,会进驻和颠覆更多硬件独立场景。完成从软件到硬件的区域战争,将AI技术落地带到更多战场上。而隐藏在“机器翻译方案+硬件生态”背后的,是搜狗AI技术壁垒的不断加固与转化。

作为能源的AI,可能准备好了打一场世界大战

抽离到更高层级,我们可以看到硬件和软件的产品之上,是搜狗正在基于机器翻译、语音识别、NLP、知识图谱等世界领先的技术积累,源源不断构建垂直解决方案,将能力输送到一个又一个硬件和软件场景中。在这背后,是技术壁垒的红利持续发酵。

举例来说,搜狗语音输入日频次高达3.6亿次,其基于T级海量输入法文本数据使用神经网络进行建模,语音识别率高达97%,保持着目前的世界记录。而在机器翻译领域,搜狗在去年的AI顶级赛事WMT2017中获得了中英机器翻译冠军,并获得主要机器指标BLEU第一名。

对AI技术的持续探索和积累,尤其是基于语音与语言的AI技术体系,比如NLP、语音识别、机器翻译、词意分割等等,正在构成相互间紧密联系的AI技术引擎。更重要的是,在AI渗透到各垂直市场的档口,由于搜狗掌握了整个技术到产品的IP流程,不需要支付高昂的使用费用,这也让搜狗可以快速以消费级姿态切入各细分场景。以AI作为能源,调用多种能力组合创造新物种,可以看做这个时代的一场无限迭代。而搜狗已经开始了这场面向未来的探索。整个社会都在讲AI作为能源,而从录音笔从工具到服务的个案上可以看出,搜狗已经启动了AI作为能源的垂直场景进驻之旅。

下一个被颠覆的硬件是什么,或许才是我们今天应该感兴趣的话题。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2018-05-18
局部战争还是全面入侵?如何看待搜狗录音翻译笔?
原标题:局部战争还是全面入侵?如何看待搜狗录音翻译笔?科技产品的更新换代频率之快,差不多是每个人都能感受到的。

长按扫码 阅读全文