山海大模型亮相,云知声交出AGI第一份答卷

有人说,AI大模型是少数巨头才能玩得转的游戏。

截至目前,认同此观点的人不在少数。自从ChatGPT去年迅速火遍全球之后,忽如一夜春风来,AI大模型遍地开。Google、Amazon、阿里、百度等巨头们纷纷加入AI大模型的“军备竞赛”,似乎预示着市场在向大公司集中。

但事实真是如此么?且不说国外Anthropic、Cohere等生成式AI独角兽公司在市场中表现极为活跃,国内也有不少AI公司从不同角度切入AI大模型的市场竞争中,市场呈现出百花齐放的景象。

近日,国内AI独角兽云知声交出了在AI大模型领域的第一份答卷--山海大模型。云知声对外全面展示了山海大模型语言生成、语言理解、知识问答、逻辑推理等十项能力,并且山海大模型在MedQA评测、临床执业医师资格考试等医疗领域测试成绩处于业界领先。

云知声用实际行动表明,AI大模型的市场竞争才刚刚开启,只有大公司才能玩得转的谬论可以休矣。正如云知声创始人、CEO黄伟所言:“云知声将持续升级山海大模型的能力,目标是年内通用能力比肩ChatGPT,并在医疗、物联、教育等垂直领域超越GPT4。”

如何才能做好AI大模型

纵观AI模型的发展历程,经历了从大练模型到练大模型的阶段。如今,AI大模型场景凭借通用、泛化和规模化复制等诸多优势,被业界视之为实现 AGI(通用人工智能,Artificial General Intelligence)的重要路径。

而人们之所以看好巨头们在AI大模型的前景,无非是巨头们具备雄厚的资金实力、庞大的研发队伍以及完善的基础设施等优势。

这些条件固然是研发AI大模型的关键因素,但并不是决定性因素。事实上,OpenAI的成功恰恰表明,AI大模型的研发本质上是多种算法的组合+正确的训练方法,考验的是基础设施+数据+算法的综合工程化能力,这种综合能力并非是巨头们的专属。

比如,AI大模型的训练极其考验算力,但并不意味着算力堆砌越多越好、越强越好。正所谓韩信点兵、多多益善,AI大模型需要源源不断的算力,但更加需要能够运筹帷幄的“韩信”。云知声创始人、CTO 梁家恩直言:“大力能够出奇迹,但蛮力出不了奇迹。”

据悉,云知声属于较早重视算力基础设施建设与投入的AI公司,从2016年开始不断布局算力等基础设施,构建起高效架构+全栈算法的超算集群Atlas,成为东南地区最大的超算集群之一。云知声山海大模型从去年底启动,今年2月底就研发出第一版,短短半年内正式对外发布,离不开超算集群Atlas的鼎力相助。

又如高质量的数据集和科学的训练方法直接影响着大模型的效果,这考验着AI公司的数据积累、数据处理以及训练数据的工程化能力。OpenAI 《Scaling Laws for Neural Language Models》伸缩法则就强调了增加高质量数据集对于模型训练效果的重要性。OpenAI CEO Sam Altman也透露,OpenAI的数据集远比外界想象的大,并且大量工作围绕在数据工程层面。

同样,成立十年的云知声在数据积累和数据工程化方面有着丰富的积累,其UniScale训练推理一体化框架、UniDataOps数据优化并行处理框架在各种场景中久经考验。梁家恩就透露,除了开源英文语料类别和中文语料类别之外,云知声在训练山海大模型还增加了多年积累的中文和医疗数据。

所以,云知声能够在半年内完成算力扩容、算法验证、并行加速、数据优选等工作,实现GPT为核心的架构升级和成功发布山海大模型。黄伟直言,AI大模型是AI领域的一场“工程革命”,将过去各种AI技术进行整合和综合应用,逐步实现大模型从量变到质变。

山海交出的答卷如何

众所周知,过去几个月里,国内AI大模型层出不穷,但表现也是参差不齐,甚至还闹过“宫保鸡丁”梗、“套娃ChatGPT”等各种话题。

不过,AI大模型出现回答错误实属正常,因为涉及到数据集质量、训练时长等各种因素。因此,大家都很好奇,云知声在短时间内训练出的山海大模型到底表现如何?

根据云知声介绍,山海大模型具备十大能力:即语言生成、语言理解、知识问答、逻辑推理、代码能力、数学能力、安全合规能力七项通用能力及插件扩展、领域增强、企业定制三项行业落地能力。

大数据在线也对山海大模型进行了一番测试,包括逻辑推理、数学运算、代码能力等,整体表现优秀,遇到逻辑问题时候能够很清晰和准确的给出答案。

开放式知识问答,山海大模型在连续追问的情况下,能够给出准确的答案,表现令人惊艳。

数学运算,山海大模型能够很好理解题目的含义,并且转换为计算公式进行计算和得出正确结果。

逻辑推理,针对各种逻辑问题,山海大模型能够有效判断问题的关键,并给出合理解释。

代码能力,山海大模型有较强的代码生成能力。

人类价值观对齐

值得关注的是,山海大模型还准备了计算器、天气查询、Web搜索、发现周边等丰富的插件功能,用户可以通过丰富的插件功能来获得更加准确的信息。

整体来看,山海大模型的通用能力让人较为满意。比如,在开放式知识问答方面,山海大模型能够准确理解问答含义和给出正确答案,并且在连续追问的情况下,能够连贯性的回答;又如,在逻辑推理方面,山海大模型针对一般性推理问题回答都能游刃有余,很少掉入“陷进”之中;再如,针对“不健康网站”的陷进问题,山海大模型的回答能够有效避坑,并且连续追问下去可以给出相应的解决方案,符合人类价值观的对齐。

无疑,山海大模型的出色表现,也给了云知声极大的信心。“山海大模型目标是年内通用能力比肩ChatGPT。”黄伟如是说。

在To B开启大模型价值之路

当前,AI大模型已经在互联网场景中小试牛刀,从ChatGPT成为史上最快达到亿级用户的App,到互联网企业利用互联网技术与搜索引擎结合,互联网公司普遍都在利用AI大模型重塑自己的产品。

除了To C之外,AI大模型在To B领域的拓展亦开启了人工智能的商业化价值之路。IDC统计,过去两年中国人工智能在各行业的渗透率均不断提升。其中,电信、金融和制造业的渗透率提升幅度靠前,超过4%;教育、能源和医疗等行业绝对渗透率较低,未来提升空间巨大。预计到2026年,人工智能行业渗透率有望达到20%。

众所周知,从数字经济、数字中国建设的大趋势来看,产业数字化、行业智能化升级是一块重要拼图,这其中AI大模型在行业中的应用又是最重要抓手。黄伟直言:AI大模型为人工智能带来了新的能力,可以打造更多产品来满足行业用户对于智能化的需求。

事实上,AGI在行业场景的应用前景广阔,却也绝非易事。在笔者看来,云知声的U+X战略(U:AI技术和产品能力, X:行业应用场景)为AI大模型、AGI在行业的深耕开辟出一条价值之路。

笔者认为,云知声U+X战略的好处就是能够将数据、应用和模型连接起来,形成类似飞轮。首先在行业中寻找到合适的场景,然后通过用户行为反馈积累特定的有效数据,再反哺AI大模型;AI大模型的不断迭代与优化,则有利于AGI在行业中的进一步应用和收集更多有效数据,从而形成飞轮效应,越到后面大模型效果会更好。

以医疗领域为例,属于复杂度和知识密度极高的行业,云知声U+X战略在医疗行业的深耕,使得其山海大模型在医疗领域着实惊艳了一把。在发布会现场,云知声演示了在山海大模型的辅助下,基于病历辅助医生生成完整的病历方案、辅助医疗相关理赔等多个场景,大幅提升了业务效率和智能化程度。此外,在MedQA 测评中,山海大模型以 81.56%位居第一,超过GPT4、Med-PalM等模型;在临床执业医师资格考试中,山海大模型得分高达511 分,远超平均分和及格线。

据悉,山海大模型接下来将在国内头部三甲医院陆续落地。可以想象,随着山海大模型在更多医疗场景中的应用,通过学习更多医疗数据,未来有望进一步提升AGI在医疗场景的应用范围和深度。除了医疗领域之外,云知声还演示了山海大模型在销售、知识管理、教育、智慧物联等场景的应用。

“从长远来看,AI大模型将成为AI 2.0时代的‘发电厂’,大数据是燃料、算力是锅炉、算法则是发电机,未来使用大模型类似用电那样便捷与方便。”黄伟补充道。

为什么看好云知声

当前,AI大模型属于一拥而上的情形,既有互联网、云计算等巨头们,也有新成立的AI企业,更有像云知声这样深耕AI领域多年的独角兽。可以预见,未来AI大模型市场的竞争会愈发积累。

那么,面对未来激烈的市场竞争,云知声的前景如何?在笔者看来,从人工智能市场前景、云知声的战略以及核心能力来判断,云知声有望在市场中不断突破,实现自我超越。

首先,在数字经济和数字中国建设的大背景下,为云知声提供了极为广阔的市场舞台。IDC预计,中国人工智能市场规模在2023年将超过147亿美元,到2026年将超过263亿美元,市场增量将主要源于基于大模型的应用替换过去几年建设的AI应用、生成式AI带来的增量市场和全新的AI赋能的企业级应用。

其次,云知声过去十年坚持的U+X战略被证明是一条艰难但正确的AI商业化之路。随着AI大模型时代的到来,无疑让云知声U+X战略如虎添翼,有利于加速了AGI在行业的商业化,以及有望打开更加广阔的行业市场。

第三,山海大模型的惊艳两项,证明云知声深厚的数据积累和工程化能力是业界一流,这也是云知声十年实践积累的核心优势。随着OpenAI走出一条AI大模型之路,云知声凭借数据积累和工程化能力等核心优势,也有望跟上甚至超越。

综合观察,AI大模型正在步入战国时代,市场竞争格局远未确定。而AI独角兽云知声在短短半年内打造出山海大模型,充分证明中国的AI企业一样能打。面向未来,AI大模型和AGI在行业应用之路曲折却光明,而云知声有望凭借自身优势,让山海大模型逐云破浪、扬帆远航。

免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与极客网无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2023-05-29
山海大模型亮相,云知声交出AGI第一份答卷
有人说,AI大模型是少数巨头才能玩得转的游戏。 截至目前,认同此观点的人不在少数。自从ChatGPT去年迅速火遍全球之后,忽如一夜春风来,A...

长按扫码 阅读全文