文 | 硅基研究室,作者 | Judy 一家来自中国杭州、成立不到两年的初创企业 DeepSeek,以前所未有的速度触及了全球大模型界敏锐的神经。 风险投资机构 a16z 创始人安德森将 DeepSeek 最新的推理模型 R1 描述为「人工智能的斯普特尼克时刻」,斯普特尼克是苏联在 1957 年先于美国发射的人造卫星,英伟达高级研究科学家 Jim Fan 则认为" Deepseek 作为一家非美国公司真正践行着 OpenAI 最初的使命"。 DeepSeek 还引发了华尔街的震动,从股市到科技巨头的财报电话会上,分析师迫切想知道 DeepSeek 所带来的影响。据「硅基研究室」不完全统计,DeepSeek 在本周至少九次在财报电话会议上被提及,微软首席执行官萨蒂亚 · 纳德拉 ( Satya Nadella ) 承认 DeepSeek「确实有一些创新」,Meta 创始人扎克伯格则在电话会上将这家中国公司视为新的竞争对手。 事实上,作为中国大模型玩家,DeepSeek 的出圈并非是孤例。2024 年至今,「神秘的东方力量」已经在硅谷 AI 圈多次受到关注。正如 AI 领域泰斗吴恩达所言: " DeepSeek 的创新表明,中美在生成式 AI 领域的差距正在迅速缩小,在某些领域中国已现领先迹象。" 本文主要论述三个核心趋势: 1、反击 OpenAI,「中国 AI 复仇者联盟」已经崛起 2、AI 领域的「中国式创新」有三大核心关键词 3、2025,中美 AI 竞逐或迎来新叙事 一、反击 OpenAI,「中国 AI 复仇者联盟」正在崛起 在全球目光聚焦 DeepSeek 的出圈背后,事实上,过去一段时间内,在追赶和反击 OpenAI 这件事上,从大厂到创业公司,在多个技术领域里,「中国 AI 复仇者联盟」已经在崛起。 比如在多模态领域的文生视频上,去年 2 月,OpenAI 发布 Sora,但推动 AI 视频真正落地的却来自中国科技大厂——快手的可灵,可灵甚至在内测期就引发海外用户集体跪求「中国账号」;语音方面,字节跳动豆包的实时语音功能就曾以惊人的拟人效果,实现了 GPT-4o 想要追求语音助手「Her」的效果。 在更关键的大模型「幻觉」问题上,以百度为主的中国公司更是贡献出明显优于 OpenAI 的更优解决方案,以 RAG(Retrieval-Augmented Generation 检索增强生成)技术为例,如今已成为主流大模型提升性能的共识。但实际上,早在 2023 年 3 月,百度发布文心一言时,就已提到了 RAG 是百度大模型的特色,而两年过去,百度特色已成为行业追逐更优模型效果的共识。 实测文心一言和 OpenAI 也可能清晰地看到中国 AI 的能力跃升。我们以热门春节档电影为话题,分别问了文心一言和 chatGPT 两个问题:在"做藕粉的过程中,出现了哪些让哪吒感觉不适的操作?"和"在徐克的射雕电影中,黄蓉给欧阳锋的九阴真经,是用什么语言写的?"实测结果可以发现,文心一言都给出了详细正确的解答,但 chatGPT 即便在联网下也并未给出正确或详细的解答。 
图说:相同问题下,chatGPT(右)回答错误或不详细 ,文心一言(左)给出正确和详细解答 这背后其实是百度针对 RAG 构建了一整套「理解-检索-生成」的协同优化技术,百度 CTO 王海峰曾拆解过这一技术实现过程。所谓的「理解」就是拆解知识点,充分理解用户的需求;「检索」则是先找到最合适的信息,然后进行搜索排序优化,并将搜索返回的异构信息统一表示,再送给大模型;而「生成」则是会综合不同来源的信息做出判断,并基于大模型逻辑推理能力,解决信息冲突等问题,最终生成准确率高、时效性好且高质量的答案。 从构建更低成本的模型,到 RAG、多模态、语音交互等多个技术领域的追赶超越,无论是 DeepSeek 此类创企,还是百度等科技大厂,可以肯定的是,在全球大模型竞逐中,「中国 AI 复仇者联盟」已经上桌了。 
二、AI 领域的「中国式创新」 墙内开花墙外也香,一系列中国 AI 玩家出圈背后,其实是 AI 领域「中国式创新」的复现。 我们可以将「中国式创新」总结为三个关键词:应用优先、形态丰富、务实优先。 一是应用优先。百度创始人李彦宏曾说:"模型本身不产生直接价值,只有在模型之上开发各种各样应用,在各种场景找到所谓的‘ PMF ’,才能真正产生价值。 "这种「应用优先」的认知也随着中国大模型玩家的洗牌和分化逐步成为关键共识。在广阔的应用土壤中,中国 AI 更容易发现用户实际需求、迅速迭代,找到 OpenAI 们不容易看到的创新落脚点。 二是形态丰富。对比海外大模型应用层的表现,随着中国 AI 的应用形态的不断丰富和能力迭代,跨越从「能用到好用」的鸿沟。 「AI 产品榜」此前曾发布一份关于《2024 全球 AI 产品付费用户规模》的榜单,其中微软 Copilot 以 5574 万付费用户规模位列全球第一,而中国 AI 产品百度文库以 4000 万规模位列全球第二,第三、第四为 Canva 和 ChatGPT,而百度文库的付费用户规模是它们的 2-4 倍。 
图源:AI 产品榜 与免费用户不同,付费用户是愿意为企业成本买单的真用户,而以百度文库为代表的中国 AI 的上榜也印证了在中国 AI 的真价值。 三是务实优先。以 OpenAI 为代表的海外大模型企业擅长用「暴力美学」追求 AGI,但中国 AI 企业在「有限资源」下,追求的是一条务实主义的路。 中国创企中 DeepSeek 就是务实的典型代表,R1 它通过混合专家模型(MoE)、多头潜在注意力极致(MLA)、多令牌预测(MTP)、长链式推理 ( CoT ) 等多种技术组合,且只进行了 RL 训练,在数据精度、底层通信上做优化,最终实现了模型训练高效率和低 API 成本。 李彦宏也曾对比国内和海外生态,他提到,"很多美国同行,他们做法是当做一个 science,有一个 AGI 终极目标,就想尽各种办法解决它",但中国公司也有 AGI 梦想,但不同的是,中国 AI 是边做边解决问题,"我更多希望尽早接触场景及接触应用,在这个过程当中大家遇到的最多的问题,就是我们优先解决的问题。" 更多的投入并不代表就有更多的创新,百度和 DeepSeek 的诸多实践成果其实都是中国技术公司工程能力优势的体现。 三、2025,中美 AI 竞逐或迎来新叙事 2023 年,当 OpenAI 携 chatGPT 横空出世时,一位谷歌研究员曾发布一句流传网络的预测:"谷歌没有护城河,OpenAI 也没有。" 如今随着中国 AI 的崛起,这句话的含金量仍在上升。梁文锋也曾说过:"技术没有什么秘密,但重置需要时间和成本。" 而在今天,随着大模型竞逐正式进入第三年,中国 AI 一面专注模型迭代,一面聚焦成本效率优化,亲手打破了「中国 AI 只跟随、无创新」的质疑。 创新的落脚点可以是多方面的,中国的科技公司们已经在走这条路:一方面我们可以利用有限资源的极致高效利用,绕开「算力暴力美学」,实现弯道超车;另一面,丰富的实体产业应用场景和高质量的数据,都利于中国 AI 公司更务实的探索,通过让 AI 落地千行百业,实现真正的「平权」,这将是中国公司的机会。 一位大模型产业人士认为,DeepSeek 的出圈的最大意义在于,让外界看到了中国 AI 的爆发能力,以及中国正在加速缩短与美国 AI 的差距,速度比人们想象中要更快。 新的中美大模型竞逐还在继续,OpenAI 深夜推出 o3-mini 新模型已印证了这一点,但「DeepSeek 风暴」也只是中国 AI 崛起的开始,CNBC 的 Jim Cramer 就猜测百度是否会成为下一个吸引市场关注的中国科技巨头。他在 X 上提出了这个问题,"首先是 DeepSeek,然后是 BABA,接下来可能是百度?"据「硅基研究室」了解,春节过后,百度或将推出文心模型的新版本。 
图源:X 一切迹象都在表明,2025 年,AI 领域的「中国式创新」也将会发挥更大的作用,中国的 AI 的创新价值,也在加速被世界重估。 伟大无法被计划,真正的创新也不会因「出口管制」而停止,2025,不妨给中国 AI 多一点信心。
|