撰文 | 田小梦
编辑 | 李信马
题图 | IC Photo
“去年12月份,我第一次看到ChatGPT的时候,是我创业十年中最灰暗、最沮丧的时候。ChatGPT所表现出的几乎百分之百准确的理解能力,以及前所未见的‘生存’能力,这让我们这些理工男能够安身立命的技能,好像瞬间没有了价值。”黄伟惆怅道。
面对ChatGPT的横空出世,发布仅5天注册用户就超100万的冲击,黄伟有差不多一周的时间里处于焦虑的状态。但这种焦虑,也让他有了解和钻研ChatGPT的冲动。通过网上的文章、论文等,以及与技术负责人交流后,在他看来,ChatGPT好像也没什么,它就像是一个做的更大的transform。
从挫折、沮丧,再到发现——“好像我们也可以”。正是抱着这样的期待,云知声在去年12月中下旬快速组建了团队,投身于大模型的研发过程中。今年2月底就研发出第一版“山海”大模型。黄伟感慨称:“看到一版的时候,我整个的感觉和我在十年前创业的第一刻是一样的。”
但伴随互联网巨头的加入,虽然为科技公司指出了发展的新路径、新机遇,但对于创业公司来说,这条路并不轻松。
在黄伟看来,人工智能正从1.0进入到2.0时代,但目前只是在2.0的起点位置。1.0时代,人工智能更多的是一种鉴别能力,即利用已有的数据来训练模型,让模型做出Yes or No的判断,但无法告知原因。而2.0时代,在大模型引领的AI 2.0时代,为人工智能带来了新的能力,可以打造更多新的产品,满足客户更多的需求,例如医疗、营销、沟通等,能够创造更多的商业机会。
同时,从数据来看,今天的数据还没充分发挥它应有的价值,而通过大模型的深度学习可以充分利用和使用数据价值。黄伟认为,大模型会成为人工智能2.0时代的“发电厂”。“谁拥有发电厂,谁就具有最大的商业价值。”
在业界都将目光锁定在大模型身上,并认为大模型是未来十年20年最大的机会之一时,云知声自然也不会放弃。再者,云知声在过去十年里,积累了大量算法、数据、工程落地经验,仿佛都是为“山海”而生。
天时地利加人和,这不正是云知声在去年12月份毅然决然投身大模型的底气。
图片来源:云知声
如今,“山海”大模型完成多轮优化升级,拥有超过十项技术能力。在通用能力上,包含语言生成、语言理解、知识问答、推理能力、数学能力、代码能力,以及与人类对齐的安全合规能力;在落地能力上,提供插件扩展、领域增强,以及企业定制能力。
01.
年内通用能力比肩ChatGPT
“目标年内通用能力比肩ChatGPT,并在医疗、物联、教育等多个垂直领域能力超越GPT4。”黄伟在发布会线上扬言称。这也透露出,云知声不是简单的将目光锁定在通用能力上,更看侧重TO B的落地场景中。
当然这步棋子的布局,离不开黄伟的经验。他从学术界到工业界,再到创业,完整的做过产品,深知人工智能只是一种能力,不能仅做酷炫的外表,而是要做完整的闭环。
其实,从云知声的发展也可以窥见一二。
2012年成立时,云知声就开始做自然语言理解,投入在整个对话AI的全栈能力研究中,形成数据、算力和算法完整的能力链条。2016年,当DeepMind AIphaGo 4:1 击败李世石时,云知声敏锐的意识到,人工智能的本质是认知智能,自然语言理解才是人工智能皇冠上的明珠,并在2016年年初开始布局超算——Atlas,并躬身入局物联网、医疗等领域,收获了真实的行业场景和数据。基于此,2022年云知声紧抓机遇,开启“山海”大模型研发,实现云知声的AI三级跳。
图片来源:云知声
在这新一轮的人工智能比拼中,为了提高大模型在具体场景的应用落地水平,云知声沿袭了一以贯之的U+X战略,即以 U(AI技术和产品能力),深度结合 X(行业应用场景),解决行业深层问题。
黄伟介绍称,山海大模型技术架构就是通用大模型,并针对知识密度高的领域,通过数据训练、训练数据、微调等方式,做一些专业的加强,这样模型既具备了通用应用水平,也针对特殊场景与领域进行了能力的加强。
如在医疗领域,以前医疗行业利用AI的方式去录入病例,但是医生依然需要逐字录入信息,如今借助山海大模型,只需要随着医患问答的过程中,就能够提取关键信息生成病例,提高了医疗的效率,同时,云知声在为医疗服务中积累的千万级的标准的医疗数据,并背靠国内最大的医疗知识数据图谱,使得山海大模型在MedQA评测能力中可超越GPT-4。
云知声科技董事长兼CTO梁家恩表示,就目前而言,大模型仍然是有限的东西,对于没有见过的东西,大模型会生成“似是而非”的回答,随着AI生成能力的不断增强,校验会更加困难,这也让AI行业需要不断去探索新的解决方法。
随着AGI时代的到来,云知声也迎来了自己的GPT时刻。“如果把通用大模型看作每科都能考到80分的学生,我们要做就是在某一两门学科上,考到95分甚至更高。”黄伟如是说。
02.
突围行业大模型
在这场声势浩大的 AGI 浪潮中,大模型与具体应用场景的深度融合已成必然。
近日,互联网大佬纷纷表态,百度创始人、董事长兼首席执行官李彦宏表示:“以后的应用、软件,基本都会基于大模型来进行开发。而产业界的变化,意味着很多新机会,其中一个方向就是AI for Science。”网易CEO丁磊认为:“AI的发展可以用百花齐放、百家争鸣来形容,但其中落地场景最关键。”
经过近几个月国内大模型的混战,除通用能力外,在B端已经开始拼场景、抢客户。
例如,第一个吃螃蟹的文心一言,其定位是一个通用的赋能平台,金融、能源、媒体、政务等千行百业。据了解,百度智能云大模型目前已经与不同领域客户联合研发,在智能办公、旅行服务、电商直播、政务服务、金融服务五大领域打造行业样板间。
阿里继发布大模型产品“通义千问”之后,阿里云先接入阿里“通义千问“大模型,又推出钉钉魔法棒功能。目前阿里云敲定了一系列生态伙伴——昆仑数智、中金财富、用友网络、亚信科技等七家数字化服务商成为首批伙伴,覆盖油气、电力、交通、金融、酒旅、企服、通信行业。
除“文心一言”“通义千问”为代表的互联网企业外,科大讯飞的“星火” 认知大模型也实现了应用落地,围绕“星火”认知大模型“1+N”架构中“N”个领域的内容,科大讯飞发布了大模型在教育、办公、汽车、数字员工等多个方向的行业应用成果。
图片来源:云知声
而同样在AI语音领域有一席之地的云知声,其市场策略上坚持“U+X”战略,在发布会线上除演示上述的医疗领域外,还在销售、知识管理、教育、智慧物联等方向有所落地。
不难看出,在这场AI对决中,无论是大厂还是创新企业的制胜点,不仅包括自身大模型的技术实力,还有大模型所赋能的场景,以及为合作伙伴带来的价值。
如今,企业发布大模型等同于拿到了进入AGI的门票,但场景的交叉、商业模式的落地,却打响了大模型落地的“发令枪”。谁能在这场博弈中突出重围,还有待考验。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 苹果Q4营收949亿美元同比增6%,在华营收微降
- 三星电子Q3营收79万亿韩元,营业利润受一次性成本影响下滑
- 赛力斯已向华为支付23亿,购买引望10%股权
- 格力电器三季度营收同比降超15%,净利润逆势增长
- 合合信息2024年前三季度业绩稳健:营收增长超21%,净利润增长超11%
- 台积电四季度营收有望再攀高峰,预计超260亿美元刷新纪录
- 韩国三星电子决定退出LED业务,市值蒸发超4600亿元
- 鸿蒙概念龙头大涨超9倍,北交所与新能源板块引领A股强势行情
- 京东金融回应“挤兑”传闻:称相关言论完全失实,资金安全受监管保护
- 光刻机巨头阿斯麦业绩爆雷,股价遭重创拖累全球股市
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。