人工智能大模型如火如荼,行业基本已经到了言必称ChatGPT的地步了。同时,国内已经上线了多家大模型,似乎进入到了一个百舸争流的新时代。不过要真问这些国产大模型技术哪家强?反而是一家名不见经传的公司更具领先优势,那就是智谱AI。
智谱AI是亚洲唯一入选斯坦福大学大模型中心评测的大模型,拥有国内少有的千亿级大模型,被称为国内“最具OpenAI气质和水准”的AI公司。这家公司5月16日宣布联手360共同打造大模型,这一研发型公司与产业公司的双向奔赴,颠覆了国产大模型各自为战的固有模式,给正处于混战状态的大模型产业注入了新思路。据说目前双方共同研发的千亿级大模型“360GLM”已具备新一代认知智能通用模型水准。
产研协同打开了新思路
区别于以往的区块链、元宇宙等概念,由GPT引发的人工智能革命将深刻的改变这个世界。我估计以后企业可能就不再进行2B、2C、电商、安全、娱乐这样的划分了,而是都成为“大模型+”的企业,相较于上一代的“互联网+”的颠覆,这次的颠覆可能会更加彻底。
业内普遍认为,算力、算法和数据是一款大模型研发的三大核心要素,而对国内AI发展的不看好往往也是基于这三点。一个是算力会受到美国限制,无法买到更高算力的显卡。一个是算法比较落后,毕竟ChatGPT只开源到了3.0,大家后续算法的进步能否超过ChatGPT,很多人既没有信心,也不愿意相信。数据标注可能是我们唯一可能有优势的地方,毕竟我们高学历的标注人才价格更低,不过这个优势在ChatGPT可以联网学习后不好说还在不在,而且网络上外文资料的丰富程度要远胜于中文资料。
对于这些观点,我也不否认有其正确之处,但我之前也并不担心,实际上去看,中国目前的云服务厂商已经可以提供足够的算力支持,算力并不是问题。算法问题其实一直有差距,但也并非能决定胜负的因素。而数据的差距是一个有限的差距,人类数据总有学完的一天,所以想要决定胜负恐怕还要增加其他因素。
“360+智谱AI”的组合则给了我另一个启发,那就是与其在别人的赛道上进行追赶,其实不妨跳出来自己重新做一个赛道来奔跑。而这个全新赛道本身也是有学习积累的,一旦跑远了,别人可能也很难追赶。
而这个全新的赛道,自然就是场景化的落地训练。这一点对于国内市场来说,反而是一个更大的优势,这个优势也一直是我们在AI领域领先的关键原因。那就是我们还是最大的单一大市场,也是数字化程度最高的国家甚至没有之一,我们在每个实用场景比如电子支付、比如电商交易,比如社交平台,比如信息安全等等都有远超全球各个国家的数据信息积累,这些都将成为大模型场景化落地的重要支撑,这也确实会是未来中国大模型能够超车的关键。
OpenAI为什么能成功
大模型的诞生缘于OpenAI敢为人先,走出了一条坚持发展通用人工智能的正确的道路,被称之为“四大一强”,也就是大算力里灌入大数据,加大量人工标注的能力训练,再加上大型的算法,才诞生了强大的ChatGPT,那么另一个问题则是,为什么其他更大的公司没有做出来?原因也比较简单,大公司更加追求商业化结果,对于看不到商业前景的事情兴趣寥寥。OpenAI一开始就是一家研发型公司,去年的亏损就高达5.4亿美金,在微软的大力扶持下,才闯出了一条自己的路。
除了长期主义的理想情怀外,由于训练大模型成本巨大,在大公司内部训练大模型如果几次出不了效果,项目负责人大概率就被Fire了,这也是产业公司没有研发出大模型的另一个重要原因。然而,单纯的研发型公司却又缺乏场景优势,一些学OpenAI的公司反而在不断发论文是没有意义的。实际上,在几年前中国AI与美国相比并没有太大差距,而差距的拉开正是因为过于重视商业化而导致放弃了正确的技术路线,这一点恐怕是“360+智谱AI”组合最希望避免的。
再看两家公司的合作,智谱AI源自清华系,是由清华大学计算机系知识工程实验室的技术成果转化而来。因为提前进行了AI布局,其研发的双语千亿级超大规模预训练模型GLM-130B其准确性等关键指标与OpenAI、谷歌大脑、微软和英伟达等公司的大模型接近或持平,全球已有70个国家1000余家机构申请使用。360不仅是国内的第二大搜索引擎公司,还有多款主流终端产品,在全球200多个国家分布了15亿终端,之前也发布了自己的大模型产品,在智能水平上有着亮眼的表现。
离开场景的大模型是“无本之木”
对于此次合作,智谱AI CEO张鹏也表示,智谱AI一直坚持着自己的愿景:让机器像人一样思考,实现Model as a Service(MaaS)的理念。360拥有国内先进的多模态研发团队,在AI技术上有长期积累,叠加搜索、浏览器等场景优势,将成为智谱AI强有力的研发合作伙伴,同时在训练数据、强化学习、工程调优、用户场景和商业化等方面带来有益补充。
可见,张鹏的思路很清晰,大模型的发展离不开场景,只有通过用户的使用和反馈,才能调校出更为智能的模型,而坐拥场景优势的360是最合适的选择。周鸿祎为360制定了名为“两翼齐飞”的人工智能战略,一方面在多年AI技术积累基础上,发展核心技术。另一方面则是利用自身场景优势,去一个个的落地大模型,形成技术+数据的双轮驱动。对比国内多家大模型厂商的闭门研发,我认为周鸿祎提出战略更加务实,也更落地。现在,有了智谱AI的助力,360的大模型水平将更上一层楼,也多了一重产业竞争的砝码。
笔者认为,大模型其实就和员工一样,是不是一定要追求完美的或者最厉害的员工企业才能成功?恐怕找到最合适的员工才是关键。哪个大模型最聪明,最厉害也同样不是我所关注的焦点,对我来说,更有价值的是我能够用到的,更能够解决我问题的大模型。从这个角度去思考,可以说大模型的竞争才刚刚开始,而最终能取得胜负的人,我相信也一定是能把落地场景和用户体验做到最好的人,因为只有完成了数据反馈闭环的公司才有可能真正胜出。
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与极客网无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。