著名华裔科学家李飞飞以超低成本蒸馏出AI大模型,对标梁文锋的DeepSeek,在国内引发了网民的广泛关注与热议。那么,李飞飞何许人也?她在AI界的行业地位如何?
李飞飞有“AI教母”之称,《时代》周刊称其为AI行业的“思想者”,在2024《财富》全球最具影响力的商界女性榜单,她排名第93位。
李飞飞,1976年出生于北京,在四川成都成长。16岁那年,她跟随父母移民美国。她在新泽西州上的高中,通过奋发努力,考上美国普林斯顿大学物理学专业。1999年大学毕业后,她收到了美国多家知名公司的offer,但她放弃了,去了中国西藏,目的是研究藏药!
但是,仅呆了一年,李飞飞又重返美国,去加州理工学院读研究生。2005年,她获得加州理工学院电子工程博士学位,其后,她在美国多所大学任职,包括伊利诺伊大学、普林斯顿大学、斯坦福大学。2013年开始,她担任斯坦福大学人工智能实验室主任,在这个位置上坐了5年。学术方面,李飞飞在包括《自然》在内的等全球知名期刊发表了大量的科学论文。
不仅仅是教学和学术研究,指导斯坦福大学的博士及博士后,她还在企业担任重要职位。2017年、2018年,她担任Google副总裁,同时还是Google Cloud AI/ML首席科学家,这也可以看出,Google对李飞飞的能力还是相当信任的。2020年,她担任Twitter董事会独立董事。
2020,李飞飞一年收获两个美国院士头衔,成为美国国家工程院院士、美国国家医学院院士。2021年,她再次斩获一个院士头衔,成为美国艺术与科学院院士。至此,李飞飞成为美国“三院院士”。
回到DeepSeek身上来,在梁文锋的DeepSeek大火之前,大模型是高大上的,一般企业玩不起,只有科技巨头们才能参与,耗费巨大,动辄烧钱几十亿、上百亿元,甚至超过千亿元。
DeepSeek虽然也是站在前人肩膀上,但它对行业带来了巨大的触动。比如,过去行业训练大模型,是一场巨大的消耗,先不说其他,仅消耗的电力,就是一个天文数字,对环境与生态不友好。DeepSeek模式无疑可减少资源、能源的消耗,降低了用AI成本。
不过,蒸馏技术,也让大模型失去神秘感。因为成本降低,可能很多企业及个人,都可能会蒸馏大模型。这不,李飞飞团队,就蒸馏出来了一个媲美OpenAI O1和DeepSeek R1的AI模型。据披露,李飞飞团队花费300多元,20多分钟就训练出来推理模型S1,该模型擅长数学及编码。
李飞飞不简单,她在大型机器学习和视觉理解知识库方面,为全世界作出了重要贡献,并且是开创性的。不过,即便是李飞飞团队蒸馏出来的大模型,要想真正挑战DeepSeek R1,恐怕并不容易,需要经过用户的检验,需要经过市场的论证。
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与极客网无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。