亲爱的读者朋友们,3月,百度智能云的AI技术又有上新和优化啦。在新增AI技术方面,我们在语音技术、人脸与人体识别、语言处理基础技术、文字识别等方面都有上新。在AI技术模型优化方面,我们提升了文字识别和图像审核的准确率和易用性,让企业以最简单、最便利的方式享受到AI。
让我们详细看一下吧。
新开放AI技术能力
我们按照技术分类来梳理。
语音技术:又快又准
这一次重点推出了语音识别极速版,速度更快,适用范围更广。
语音识别极速版,支持60秒内音频使用REST API方式进行调用,简单易用。采用国际领先的注意力(Attention)模型,实时率小于0.1,5s音频不到500ms即可完成识别过程,极大提升语音交互体验。近距离安静环境下,识别准确率可达98%,为手机、小程序、智能交互设备的语音搜索、语音输入提供更高效的识别能力。
语音识别极速版上线即带来“限时领取最高80W免费调用量”的福利活动,机不可失!
另外,呼叫中心实时语音新增REST API调用方式,大幅降低接入难度,可截取通话中有效音频进行识别,减少呼叫中心语音识别成本。
人脸识别:新增人脸融合
人脸融合可以将两张人脸进行融合处理,生成的人脸同时具备两张人脸的外貌特征,意味着你可以将两个心爱的偶像的脸放在一起生成“400年”才见的脸。此服务也支持对图片进行涉黄涉暴及政治人物过滤,让人脸识别服务业务更安全。
人体分析:免费调用额度升级,在线购买QPS每月200元起
人体关键点识别、人体检测与属性识别、人流量统计、人像分割、手势识别等5个接口免费调用额度升级。个人用户每日免费调用额度提升至50000次,并发量为2QPS;完成企业认证后,立享无限制调用,并发量提升至5QPS。如需更高并发量,可以在控制台自助购买QPS,可按月、按天两种模式灵活搭配购买。
智能写作平台重磅上线
众多粉丝期待的智能写作平台终于上线了,这是基于百度深耕多年的自然语言处理技术(NLP)和知识图谱技术(KG)打造的应用平台,可提供自动写作和辅助写作技术,内置丰富的数据和素材,配置简单、生成快速,零代码基础也可以轻松使用。可应用于:智能春联、智能写诗、结构化数据写作、热点事件脉络梳理、热点发现等场景中。
语言处理基础技术
► 情感倾向分析定制版重磅上线。使用情感倾向分析定制版功能,你可以上传适合自身应用场景的情感极性标注语料,在通用模型基础上进行优化训练,满足在专属场景下的更高准确率要求。
► 15个接口提供低价购买QPS服务。为了提供更稳定可靠的技术服务,满足有更高并发需求的用户,NLP在提供5QPS免费并发量基础上,向有更高并发要求的用户提供低价QPS购买服务。支持自助购买QPS的15个NLP技术接口为:文本审核、词法分析、词法分析(定制版)、情感倾向分析、短文本相似度、评论观点抽取、评论观点抽取(定制版)、依存句法分析、词向量表示、词义相似度、对话情绪识别、文本纠错、文章分类、文章标签、DNN语言模型。
文字识别OCR:两款新品正式发布
► VIN码识别。可对车辆车架上、挡风玻璃上的VIN码进行识别,识别准确率为90%,用户可通过文档自行调用测试,提供200次/天的免费使用次数。
► 护照识别。支持对中国大陆护照个人资料页所有10个字段进行结构化识别,识别准确率为90%,用户可通过文档自行调用测试,提供200次/天的免费使用次数。可应用于境外旅游产品预订、酒店入住登记等场景。
图像处理四款新品上线
本次四款新品注重在不同场景下的图像处理技术,重建高清图像。
► 图像去雾上线。对浓雾天气下拍摄,导致细节无法辨认的图像进行去雾处理,还原更清晰真实的图像,适用在安防监控、车载系统场景下,对受浓雾天气影响拍摄的视频、图像进行优化处理,重建更可辨析的监控材料。
► 图像对比度增强上线。调整过暗或者过亮图像的对比度,使图像更加鲜明。适用于海量图片优化、监控视频优化、彩印照片美化等场景。
► 图像无损放大上线。可将图像在长宽方向各放大两倍,保持图像质量无损。多用于安防监控、车载系统场景中视频或图像无损放大优化,重建更可辨析的监控材料,以及彩印照片美化等场景。
► 黑白图像上色邀测中。智能识别黑白图像内容并填充色彩,使黑白图像变得鲜活。可应用于主题活动小程序或网页等。
图像识别两款新品,适用于更多菜品
► 果蔬识别。可精确识别近千种水果和蔬菜的名称,适用于识别只含有一种果蔬的图片,可自定义返回识别结果数,可应用于零售结算和果蔬介绍等业务场景中。
► 自定义菜品识别。识别超过5万种菜品,支持创建属于自己的菜品图库,可准确识别图片中的菜品名称、位置,并获取百科信息,适用于多种客户识别菜品的业务场景中。
车辆分析:车辆属性识别邀测中
检测图像中的各类车辆,并针对小汽车识别11种外观属性,包括:是否有车窗雨眉、是否有车顶架、副驾驶是否有人等,可用于交通安防场景的特定车辆检测追踪。
AI技术模型优化
在技术模型方面,主要提升了相关技术的易用性和准确率。这样,企业应用AI技术的门槛更低,应用效果也将更好。
OCR增值税发票识别重磅升级
全新的模型和算法在响应时间和识别准确率上有了大幅提升,耗时骤降66%,从3秒缩短为1秒。准确率方面在单位、数量、税率三个字段有30%以上的提升,价税合计(小写)、规格型号、销售方地址电话、购买方地址电话等均有10%左右的提升。
OCR行驶证识别
新增对行驶证副页所有字段的识别能力,识别准确率高达99%,应用的范围和领域更多了。
图像审核
色情识别模型优化升级。此次主要针对欧/美/非的人物特征进行了专项优化升级,在欧/美/非的人物直播、社交场景下,色情违规图片识别的准确率提升20%,快速精准,解放审核人力。如果你的应用要走向海外,这次升级不容错过。
定制化平台与工具增加新功能
通过定制化平台与工具,可以零算法零门槛实现业务定制,满足不同类别的业务需求,本次升级如下:
► 升级EasyDL定制化训练及服务平台
新增高精度算法,离线识别更准确;对IOS、Android系统新增按产品线授权,方便多台终端设备同步激活服务;EasyDL图像识别现已支持生成Linux、Windows操作系统的离线SDK。
► 在理解与交互技术UNIT中,新增两个功能
一个功能是在UNIT的预置技能中,增加了成语解答。
另一个功能是对已有的预置技能进行干预的能力上线。用户可以根据自己的业务需求添加词槽的词典值,干预平台上已有的预置技能,提升预置技能的对话效果。首批开发的可干预的预置技能为:订机票、打电话、订咖啡、音乐、故事、闹钟、通讯录等,后续将为大家开放更多可干预的预置技能,敬请期待。
来体验百度AI体验中心小程序
最后,我们也同步更新了百度AI体验中心微信小程序,你可以在这个小程序中,体验百度AI的诸多能力。本次,我们新上线的能力有:地标识别、定额发票文字识别、机动车销售发票文字识别、机打发票文字识别等4项能力体验。
听说体验过的小伙伴们都忍不住分享到朋友圈!目前“百度AI体验中心”共有38项AI能力可体验。关注百度智能云微信公众号,即可体验
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与极客网无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。