大模型下半场战争硝烟四起,AI进化论第二季开启 | 第一季DeepSeek十日谈精彩回顾

在全球 AI 竞争白热化的今天,DeepSeek 以“国运级创新”横空出世,不仅刷新了国产大模型的技术高度,更点燃一场关于 AI 技术革命的热烈讨论。正是在这样的背景下,CSDN 策划推出了“DeepSeek 暨 AI 进化论十日谈”系列直播,旨在深入剖析 DeepSeek 所代表的技术创新如何重塑 AI 行业的未来。

这十场直播汇聚了顶级院校的 AI 学者、AI 专家、AI 领域的顶尖人士。他们以专业的视角和丰富的经验,分享了对 AI 技术和市场的深刻见解。期间,他们直击 AI 和大模型的核心技术问题,探讨了 Scaling Law 是否已经过时?如何构建可持续的开源生态?大模型的护城河究竟在哪里?强化学习是否会带来大模型的范式转换?DeepSeek 有意识了吗?哪些行业将会被颠覆……每一期都干货满满,在 CSDN 视频号矩阵吸引超 50 万人次观看,引发企业高管、学者、技术专家等行业人士的强烈共鸣。

Deepseek 暨 AI 进化论十日谈主题一览:

· DeepSeek 技术创新及对 AI 生态的影响

· 强化学习是否会带来大模型的范式转换

· 直击 Deepseek 技术真相,对我们究竟意味着什么?

· 十问解读 Deepseek 的“国运级创新”

· 聊聊关于 Deepseek 的误区与思考

· Deepseek 及大模型创业生态

· Deepseek 与软件开发智能化

· Deepseek 对 AI 技术及开发者的刷新

· 从 Deepseek 出发聊聊意识本质和人类未来

· Deepseek 开启的大模型下半场战争

第一谈:DeepSeek 技术创新及对 AI 生态的影响

1.jpg

在“DeepSeek 暨 AI 进化论十日谈”的第一场直播中,来自 CSDN 高级副总裁李建忠深入探讨了 DeepSeek 的三大核心技术创新,以及它对大模型生态的深远影响。作为国产大模型的典范,DeepSeek 不仅在技术上实现了突破,更通过其独特的架构设计、算法优化、工程创新推动了整个 AI 行业的快速发展。

DeepSeek 的创新不仅改变了技术层面,还对大模型生态产生了深远影响。首先,它将大模型的成本压缩至与搜索引擎相当,降低了 AI 应用的门槛。随着 AI 应用和智能体的快速发展,多个行业,尤其是医疗、金融、零售等,将迎来智能化升级的巨大机会。

更重要的是,DeepSeek 重塑了“AI 铁三角”——算法、算力、数据的关系,推动了 AI 产业版图的重构。最后,DeepSeek 的开源策略为 AI 创新提供了长期发展的平台,推动了全球技术共享与进步。

第二谈:强化学习是否会带来大模型的范式转换?

2.jpg

这一讲邀请到了 CSDN 高级副总裁李建忠、复旦大学教授张奇、中国人民大学高瓴人工智能学院副教授刘勇。嘉宾们首先介绍了强化学习(RL)如何在 AI 中发挥作用,特别是在大模型的训练中。李建忠通过 AlphaGo 到 AlphaZero 的经典案例,阐述了大模型如何通过推理能力的提升,从“快思考”到“慢思考”逐步推进。而刘勇和张奇则分别讲解了强化学习的核心框架和在大模型中的应用历史,深化了观众对 RL 的理解。

在讨论强化学习对大模型范式转变的影响时,嘉宾们深入剖析了大模型学习范式:模仿学习与探索学习的区别,以及如何通过强化学习实现更为高效的训练流程。特别是在 DeepSeek R1 的应用中,强化学习的引入不仅显著提升了推理能力,还可能减少对人工标注的依赖。通过 RLHF 与纯 RL 的对比,嘉宾们探讨了纯 RL 如何改变传统的监督微调方式,以及它是否意味着“人类标注师失业论”的到来。此外,嘉宾们也讨论了强化学习在加速科研工程、推动 AGI 发展的潜力,以及 DeepSeek 在这一进程中的技术贡献。

第三谈:直击 Deepseek 技术真相,对我们究竟意味着什么?

本期直播在 CSDN &《新程序员》执行总编唐小引的主持下,邀请到三位重量级嘉宾来为我们揭示 DeepSeek 的技术真相:硅谷资深 AI 技术专家吴双,北京邮电大学人机交互与认知工程实验室主任刘伟,以及《知识增强大模型》作者、前达观数据副总裁王文广

3.jpg

在本次直播中,三位专家围绕 DeepSeek 的技术实力展开了多维度的深入探讨。他们首先分享了对 DeepSeek 及其 R1 模型的初步印象与独特体验,进而聚焦于 DeepSeek 技术创新的核心本质,剖析其强大之处究竟源于算法突破还是工程优化,并深入辨析了围绕 DeepSeek 的诸多热点议题,例如“蒸馏”争议、低成本高效训练的实现路径、以及开源与闭源模式的优劣势。讨论还延伸至 DeepSeek R1 对下一代模型研究方向的潜在影响,并试图从技术、产业、生态等多个层面,解码 DeepSeek 现象背后所蕴含的更深层次的行业启示与未来趋势。

详细内容,欢迎阅读「直击 DeepSeek 技术真相,对我们究竟意味着什么?| 万有引力」一文。

第四谈:犀利十问,解读 DeepSeek 的“国运级创新”

本期 CSDN 高级副总裁李建忠对话北京大数医达创始人 & CEO、复星集团首席 AI 科学家邓侃,两位 AI “老炮儿”火力全开“硬核”对话,围绕十大犀利议题,分享最前沿的认知干货。

4.jpg

第一问:DeepSeek 之后,还要不要相信 Scaling Law,要不要囤卡“大力出奇迹”?

第二问:强化学习驱动的推理计算范式转移之后,数据还是否重要?

第三问:DeepSeek 的赶超到底是雕虫小技?还是国运级创新?

第四问:大模型如何构建开源生态?DeepSeek 会成为 Linux 还是 Android or other?

第五问:如果 DeepSeek 是 Android,谁是中国 iOS?闭源模型是否还有机会?

第六问:大模型到底有没有护城河?如果你是梁文锋,如何建立 DeepSeek 的护城河?

第七问:DeepSeek 首先会颠覆谁?谁最危险?谁最安全?

第八问:AGI 时代,互联网的哪些逻辑会变?哪些逻辑不会变?

第九问:DeepSeek 利好哪些职业,哪些职业会更危险?

第十问:推理计算范式下,代码能力越来越强,程序员是否会大规模失业?

有关这十问的详细内容,欢迎大家前往「十道灵魂之问,十日谈解读 DeepSeek 的“国运级创新”!」阅读,本文进行了详细整理与描述。

第五谈:聊聊关于 DeepSeek 的十大错误认识

CSDN 高级副总裁李建忠在第五谈中拨云见日,旨在厘清公众对 DeepSeek 的认知误区。他首先纠正了将 AI 发展视为线性“科技树”的片面观点,强调 AI 更像复杂系统,多维度协同创新才是关键,而非局限于单一技术分支或学派之争。针对 “赢家通吃,模型即产品” 的误解,李建忠强调大模型应定位为 AI 生态的基础设施,而非最终产品,开源共享方能促进行业繁荣。

5.jpg

对于“Chatbox 是唯一产品形态”的误读,他指出 Chatbox 仅是浅层应用,大模型潜力在于赋能各行业,催生多元产品形态。关于 “DeepSeek 会推翻一切” 的论断,李建忠认为技术发展是进化式迭代,DeepSeek 乃加速进化而非颠覆,其价值在于开辟新路径、树立新标杆。在此部分,李建忠也进一步阐释了 DeepSeek 的出现对“Scaling Law”的传统认知带来的挑战与反思。而将“大模型等同于操作系统”则是概念的混淆和作用的夸大,大模型是应用层技术,需与操作系统协同而非取代。

最后,针对“DeepSeek 缺乏创新”的论断,李建忠有力反驳,力证 DeepSeek 在模型效率、成本控制及强化学习探索上的显著创新。在厘清误区后,李建忠引导思考 DeepSeek 是否引领 AGI 之路,肯定其为通往 AGI 的“先行者”与“探路人”,未来可期。

第六谈:DeepSeek 及大模型创业生态

经过几期对 DeepSeek 技术和生态的剖析,我们本期将目光转向创业者,邀请到 CSDN 高级副总裁李建忠,维智科技创始人、PPTV前兼CEO陶闯围绕大模型创业十问展开讨论。

6.jpg

这十问分别是:

DeepSeek 浪潮是技术奇点还是范式转变?

基础模型之后,垂直模型是否还有生存空间?

AI 应用 Killer App 将在哪些赛道爆发?

AI 应用与模型之间,中间件将呈现何种形态?

数据资产价值何在?数据、数据资产与 AI 的关系是什么?

时空人工智能、时空智能学、空间智能三者有何关系?

DeepSeek 对具身智能行业有何影响?

AI 革命是工具革命到智能革命的范式转变吗?

智能眼镜体系与时空智能有何关系?在大模型发展中将如何演进?

中国 VC 为何难投出 DeepSeek?如何构建健康创业生态?

第七谈:DeepSeek 与软件开发智能化

“DeepSeek 暨 AI 进化论十日谈”第七讲中,CSDN 高级副总裁李建忠探讨了 DeepSeek 如何推动软件开发智能化。他指出,DeepSeek R1 的推理能力有望将软件开发带向 L4 高度自动编程水平(关于 L1-L5 的等级划分,详见《大模型驱动软件开发的一些误区和思考》)。

7.jpg

李建忠剖析软件开发智能化三大核心要素:复杂性、动态性、协作性。DeepSeek R1 虽擅长解决复杂性问题,但在软件开发的动态迭代与多人协作方面仍存挑战。他强调,大模型驱动软件开发并非“无代码”神话,推理能力提升使大模型从“码农”向“设计师”、“架构师”跃迁,但并非代码质量不再重要,反之,高质量代码更易于被大模型理解和优化。

针对软件开发的协作性难题,李建忠援引 Titus 论断——软件工程本质是多人多版本开发活动,Agent 智能体是破解协作难题的关键,Agent 的记忆、规划、协作三大能力将重塑软件开发模式。未来 “Agent 组织者” 将涌现,负责调度 Agent 团队,但创新性协作仍需人类主导,Agent 尚不能完全取代人类在复杂协作中的核心地位。

第八谈:DeepSeek 对 AI 技术及开发者的刷新

“DeepSeek 暨 AI 进化论十日谈”第八讲,由 CSDN&《新程序员》执行总编唐小引主持,上海人工智能实验室青年科学家崔淦渠与中国石油大学(北京)副教授吕仲琪共同聚焦 DeepSeek 对开发者的意义、技术创新及未来。

8.jpg

专家们讨论深入 DeepSeek R1 模型及 GRPO 算法的创新性,GRPO 算法在提升训练效率和降低算力成本上展现优势,验证了纯强化学习路线,尽管价值函数设计引发学术界的技术性探讨。

针对 DeepSeek 未获苹果的“青睐”这一热点事件,专家解读为 DeepSeek 侧重技术研究,商业应用非首要目标,与商业化企业定位不同。

在讨论人类在 AI 时代的核心竞争力时,吕仲琪将程序员分为三类:设计 AI 程序的程序员、创造型高级程序员以及传统码农。他认为,设计 AI 程序的程序员和创造型程序员在 AI 时代不会被取代,而传统码农则面临被 AI 替代的风险,需要积极提升自身技能。两位嘉宾建议积极探索 AI 在工作和生活中的应用,不断学习和适应 AI 驱动的变革。

第九谈:DeepSeek 有意识吗?

“DeepSeek 暨 AI 进化论十日谈”第九讲由 CSDN 创始人蒋涛主持,与复旦大学教授、高分子科学智能研究中心副主任李剑锋、科幻作家、《云球》作者白丁一同探讨“DeepSeek 是否会有意识”这一前沿且深刻的议题。

9.jpg

讨论伊始,众嘉宾从生物学角度引入意识的起源,引发对意识与智能关系的思考:李剑锋认为,即使 AI 在决策、情感模拟甚至完成人类任务方面表现卓越,也并不等同于具备意识;白丁借《云球》中“意识场”的概念,呼应意识不可分割的整体性,探讨精神与意识的可分性;李建忠强调意识与死亡这一核心哲学命题紧密相连,他认为意识的核心在于主观体验,而 AI 虽可模仿情绪,却缺乏生命体验,尤其对死亡的感知。

在观众问答环节,嘉宾们对“AI 可能加剧的贫富差距”、“产生意识的 AI 将优先与谁竞争”、“AI 生成内容的真伪辨别与知识准确性”等十几道提问作出回答,直播间气氛活跃。尾声,嘉宾们金句频出,从“未来的小孩应该选什么专业”这一提问,引发对 AI 未来及人类自身价值的更深层次思考。

第十谈:DeepSeek 开启的大模型下半场战争

10.jpg

“DeepSeek 暨 AI 进化论十日谈”终结篇,CSDN 高级副总裁李建忠深度剖析 DeepSeek 的出现标志着大模型竞争进入下半场,重心从预训练转向推理及应用爆发。技术成本的降低和开源生态的构建将推动 AI 应用迎来寒武纪般的爆发。DeepSeek 目前专注于模型层,但其影响力将深入计算范式、开发范式和交互范式,尤其是在生产力工具和信息搜索领域,有望颠覆旧的互联网格局,降低创作门槛,重塑内容生产与消费的比例。

在生态层面,DeepSeek 的开源技术将对云产业产生深远影响,并催生基于 DeepSeek 的 Agent 平台和云产业联盟。微信接入 DeepSeek 主要增强了其搜索能力,但社交领域仍然是 AI 最难啃的骨头。对话类 AI 产品的终局是 Agent 平台,这将重塑应用生态,独立的 App 或将消失,人机交互将更加自然。苹果与阿里的合作,以及操作系统厂商对 Agent 分发入口的争夺,都体现了 AI 时代新的竞争格局,而 DeepSeek 的未来,或将通过收购手机厂商改造操作系统,构建新一代 AI Agent 商店,并在国际竞争中,通过开源生态构建起强大的三层生态链。

关于 AI 进化论

AI 进化论系列直播秉持开放、思辨、前沿的理念,邀请众多 AI 领域专家,带来深度、尖锐、前瞻的思想碰撞,直面 AI 技术挑战与机遇,一同探寻 AI 的无限可能,共同见证 AI 的蓬勃发展。

“如果说「AI 进化论第一季 DeepSeek 十日谈」是对技术原理的深入探索,那么现在,我们将把目光投向实践与落地!「AI 进化论第二季:智能应用崛起」将聚焦 DeepSeek 如何赋能千行百业?智能应用如何解决实际问题,创造商业价值?等业界关注的核心话题,邀请行业先锋分享他们的经验和洞见。

11.jpg

进化永不终止,追问永不停歇。关注「CSDN 视频号」让我们在下一次的「AI 进化论」中相遇。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2025-02-24
大模型下半场战争硝烟四起,AI进化论第二季开启 | 第一季DeepSeek十日谈精彩回顾
在全球 AI 竞争白热化的今天,DeepSeek 以“国运级创新”横空出世,不仅刷新了国产大模型的技术高度,更点燃一场关于 AI 技术革命的热烈讨论。

长按扫码 阅读全文