零一万物新旗舰模型 Yi-Lightning超越 GPT-4o,李开复详解背后原因

10月16日消息,在辟谣“不做大模型预训练”后,今天零一万物CEO李开复正式发布最新旗舰模型 Yi-Lightning。

在国际权威盲测榜单LMSYS 上,Yi-Lightning 超越硅谷知名大模型 OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet,排名世界第六,中国第一。

这也意味着零一万物紧随 OpenAI、Google 之后,与xAI 打平,进击全球前三大模型企业。

目前 Yi-Lightning 已上线 Yi 大模型开放平台(https://platform.lingyiwanwu.com/),每百万 token 仅需 0.99 元。

李开复再次强调:“零一万物绝不放弃大模型预训练,而且我们的预训练做得又快又好。”

和 Yi-Lightning大模型同时发布的,还有零一万物的To B行业解决方案——行业应用产品 AI 2.0 数字人,聚焦零售和电商等场景,将最新版旗舰模型实践到行业解决方案,在弹幕互动、商品信息提取、实时话术生成等环节,AI 2.0 数字人已接入 Yi-Lightning。

至此,零一万物大模型在To C和To B端均有推出产品进行布局。李开复对To C和To B的布局的不同侧重也进行了深入解读。

李开复观点:

1、绝不放弃大模型预训练,不要认为落后美国六个月是一个很羞耻的事情

在发布会上,李开复再次提到:“有自媒体声称国内六家大模型公司里有几家放弃了大模型预训练,网上也有很多观点认为,中国预训练赶不上美国。”

李开复再次正式辟谣:零一万物绝不放弃预训练,而且我们的预训练做得又快又好。

李开复称,在大模型预训练上,中国是落后美国,有人说落后十年、二十年。今天我们可以用非常精确的数字来算,因为GPT4o是在5月13日做出来的模型,零一万物在10月16日Yi-Lightning大模型已经把它打败了,所以就是五个月之后超过五个月前最强的模型。算中国赶超美国有多远的距离,至少零一万物只差五个月。

李开复强调,我们千万不要认为落后美国六个月是一个很羞耻的事情,因为我很多美国朋友都认为中国会远远落后,也有美国朋友包括一些中国朋友认为,按照这个打法,人家十万张GPU,我们要被甩掉三年、五年甚至十年都有可能。现在零一万物证明了不会落后这么多,而且这次LMSYS的榜单上也有两家其他中国公司表现也不错,也不是只有我们一家在做。

在李开复看来,做好预训练模型是一个技术活,需要有懂芯片的人,懂推理的人,懂基础架构的人,懂模型的人,有很好的算法同学,一起做出来。不是每家公司都可以做这件事情,做这件事情的成本也比较高,以后有可能会越来越少的大模型公司训练做预训练。

另外,李开复透露,这次 Yi-Lightning 的预训练只用了2000张GPU、训练了一个半月,花了300多万美金,做出来的预训练模型能力跟xAI的Grok打平,但是只花了它的1%或2%的成本。

2、不打价格战、不做亏本生意,API“白菜价”也有小利润

此次,零一万物最强大模型Yi-Lightning的API定价为每百万 token 仅需 0.99 元。

对于这个价格,李开复表示:“我们不会赔钱卖模型,但也不会赚很多钱,而是在成本线上加一点点小小的利润,就得到了今天0.99元/百万token的价格。欢迎大家使用,不用担心我们被你用垮了。”

同时,李开复也再次强调:“之前回应行业价格战时,我的回答就是零一万物不参与价格战。另外,我当时也提到,不能只看模型价格,还要看模型性能是否足够好。”

新旗舰模型 Yi-Lightning强在哪儿?

继上半年千亿参数模型 Yi-Large 之后,这次零一万物发布的最新旗舰模型 Yi-Lightning在国际权威盲测榜单 LMSYS 上超越 GPT-4o-2024-05-13、Claude 3.5 Sonnet,排名世界第六,中国第一。

除了在 LMSYS 这一全球大模型必争的公开擂台上,中国大模型首度实现“超越 OpenAI GPT-4o ”的最佳成绩。

在众多分榜上,Yi-Lightning 的成绩同样出众。

在中文分榜上,Yi-Lightning 超越了 xAI 发布的 Grok-2-08-13、智谱发布的 GLM-4-Plus 等国内外优质模型,与 o1-mini 等模型并列排名世界第二。

在多轮对话分榜上,Yi-Lightning 则是超越了 Google 所发布的 Gemini-1.5-Pro 、Anthropic 发布的 Claude 3.5 Sonnet 等知名旗舰模型,排名第三。

数学能力,代码能力方面,Yi-Lightning 同样处于全球第一梯队。在数学、代码分榜上,Yi-Lightning分别取得第三、第四名。

以专业性与高难度著称的艰难提问、长提问榜单上,Yi-Lightning 的表现依旧出众,均取得世界第四的优异成绩。

LMSYS Chatbot Arena 的用户体验评估不仅证明了 Yi-Lightning 的出色性能,也更为直观地验证了大模型解决真实世界问题的能力。这不仅证明了 Yi-Lightning 优异的模型性能,更重要的是,这也意味着 Yi-Lightning 能够丝滑地由实验室场景过渡到模拟真实用户场景,能够更快、更高质量地实现模型能力落地。

另外,与 Yi-Large 相比,Yi-Lightning 在模型性能更进一步的前提下,推理速度方面有着极大提升。

内部评测数据显示,在 8xH100 算力基础下,以同样的任务规模进行测试,Yi-Lightning 的首包时间(从接收到任务请求到系统开始输出响应结果之间的时间)仅为 Yi-Large 的一半,最高生成速度也提升了近四成。

大模型To B、To C应用两手抓

国内大模型赛道狂奔进入第二年,商业化造血能力已经成为多方关注的焦点。

今天,零一万物也首度公布了全新 To B战略下的首发行业应用产品 AI 2.0 数字人,聚焦零售和电商等场景,将最新版旗舰模型实践到行业解决方案,在弹幕互动、商品信息提取、实时话术生成等环节,AI 2.0 数字人已接入 Yi-Lightning。

据介绍,接入 Yi-Lightning 后,数字人的实时互动效果更好,话术更丝滑,回复也更准确;业务数据方面,在接入 Yi-Lightning 全新加持的数字人直播后,某酒旅企业的 GMV 较此前上升 170%。

李开复表示,一个大模型公司同时做To B和To C是很辛苦的,也需要多元化的管理方式,因为两个团队的基因不一样,做事的方法和衡量KPI的方法都不太一样。我自己在这两个领域有经验,也在试着做,但是也绝对不能什么都做。

To B选择做国内,李开复表示,我们找到了一些破局的空间,比如用数字人来做零售,做餐饮等等,这能做一个完整的解决方案,另外还有两三个领域开始在做,现在还不方便披露。To B工作只能在中国做,因为要触达美国的用户或国外的用户不太可能,所以To B的国外就放弃了。在国内做To B就做有利润的解决方案,而不只是卖模型,不只是做项目制,这是零一万物To B的做法。

To C零一万物主要布局海外。李开复认为,To C的产品在国内走流量有一个很大的问题,流量的成本越来越高,有些友商的用户从十几块人民币加到三十多块人民币,近来还有相当的流失。在这样一个挑战环境里我们会非常谨慎,先不推出中国本土新的To C的应用,已有的产品还会继续维护,但更多的精力会在国外的土壤用更低廉的钱买到非常高质量的用户,或者能直接把App卖出去,让用户来订阅收费,订阅的习惯在国外比较良好。国外做To C的产品,目前零一万物变现能力和消耗用户增长的成本算账可以算得过来,以后再关注国内有什么机会可以推出To C产品。

李开复强调,而无论是 ToC 还是 ToB,如何提前预判 TC-PMF 是绕不开的核心命题。模型性能与推理成本,两项关键因素直接影响着大模型落地的成败。作为兼具性能与性价比的新旗舰模型,Yi-Lightning 也将成为零一万物探索“模应一体”的重要基石。零一万物会坚持“模型+AI Infra+应用”三位一体的全栈式布局,积极在 ToB 企业级解决方案上探索 TC-PMF,以更从容的姿态迎接即将到来的 AI 普惠时代。(果青)

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2024-10-16
零一万物新旗舰模型 Yi-Lightning超越 GPT-4o,李开复详解背后原因
10月16日消息,在辟谣“不做大模型预训练”后,今天零一万物CEO李开复正式发布最新旗舰模型 Yi-Lightning。

长按扫码 阅读全文