从DeepSeek 2000万DAU说起

人阅读 2025-02-03 09:39:30快讯

怎么理解模型热点的不断切换？没有一家模型厂商可以在所有维度维持领先优势，各家模型大概率各有千秋。模型层将在未来的切换成本将接近于零。闭源的压力必然非常大，要努力证明自己的价值，就要画出一条远超开源的curve。

相信大家都看到那张图了，DeepSeek已经成为全球DAU增速最快的AI 应用，用20天实现DAU 2000万。要知道豆包是23年8月上线，DAU直到24年底才到了2000万（春节放假DAU略有盘整）。过年期间的最大赢家毫无疑问是DeepSeek

而这引申出来几个问题

1. 显然推理需求远远超过了DS自己的预期。深度思考和联网模式不是所谓技术问题，就是算力不够用。这把算是让中国人民也能亲身体会什么叫test-time compute scaling law。时间越长，推理效果越高，相应的就是算力的无底洞。

供给如何？我们之前写过，国内算力资源结构性供需不平衡。

官方版本要DS自己拿算力承接，但内部即便是训练算力分配都不够。海外如微软、国内腾阿里云用自身算力去承接。而硅基流动这次找华为云，也是考虑到升腾是国内三方可买到的扩展能力最强的国产卡（毕竟南方产能拿最多）。但另一边，过去几年大干快上的地方智算中心利用率可能不足50%（但其实很多资源储备相当不错，比如一半的N卡...）

过去几天几乎所有加速卡厂商用最快速度“适配”了DS v3和r1，充分证明DS这次开源的穿透力。因此这波暴增的推理需求，当潮水退去（2000万肯定有尝鲜需求），真实需求沉淀下来，希望能看到r1自身的深度推理多模态、外部开源带来的各类垂直蒸馏微调、进一步衍生出的应用产品，整体上拉动需求，对“前置投资”的国内算力供给侧来一波填充。

2. 如何看待模型热点的不断轮动。我们12月初开始写豆包，市场的焦点刚挪到字节体系不到2个月，DS又横空出世。怎么理解模型热点的不断切换？我们嘉宾“全速前进”今天有一个非常好的总结：

判断1：没有一家模型厂商可以在所有维度维持领先优势，各家模型大概率各有千秋。

判断2：模型层将在未来的切换成本将接近于零。DS的发布和开源，证明模型层内卷更加激烈（或如微软CEO说的模型同质化）。一种流行的说法：模型公司终将吞噬各种AI应用公司（Wrapper），其实要具体问题具体分析，因为应用层/Wrapper一直在演化，没有创造价值的GPT套壳已经倒闭干净了，但找到PMF深度定制化的产品活得都不错。今天Cursor（26亿刀估值）、Perplexity（90亿刀估值）、Glean（46亿刀估值）某种意义上都是wrapper，能做深做好一样有很大市场。

个人理解，DS这次算是过去2年LLM浪潮开启以来的重要拐点，以开源追赶闭源为信号，验证了Satya的判断，在AGI之前，模型会持续处于商品化（commoditized）。这里面有技术早期的必然性，比如算法的非线性进步和优化空间超过了头部玩家的预测；也有偶然因素，比如DS这次没有任何经济意义的开源（AGI之前甚至继续开源？）

因此闭源的压力必然非常大，要努力证明自己的价值，就要画出一条远超开源的curve。而如果上述假设成立，如我们之前阐述过的，就好比开源的安卓滋养出的手机应用生态，同样，AI更大商业价值从模型层让渡到上层，应用会繁荣。

3. 豆包是竞争关系吗？不，是生态共荣。

从本质上战略聚焦略有不同。DS的资源投入重心应该还是围绕AGI，2000万DAU的背后，也要看到DS在主动支持CSP和硅基等等上线部署r1。因此DS要的不是流量，而是生态。

豆包目前的定位依然偏重于super APP，或至少是应用与模型双轮驱动。与Meta等其他厂商一样，字节也会受益于DS r1的开源。而豆包在情感语音、多模态、视频生成等应用向的模型能力上，也超过DS和其他。最重要的是，字节算力储备、资本优势决定了，对任何模型和research上的进展进步，都有比较强的虹吸力。聚焦不同，完全可以后发，但却可持续享受这个过程中向上层释放的商业价值。字节是商业上的正向循环。两条路不矛盾，或许最终也殊途同归。