> 资讯 > 产业政策

从DeepSeek 2000万DAU说起

人阅读 2025-02-03 09:39:30快讯

怎么理解模型热点的不断切换?没有一家模型厂商可以在所有维度维持领先优势,各家模型大概率各有千秋。模型层将在未来的切换成本将接近于零。闭源的压力必然非常大,要努力证明自己的价值,就要画出一条远超开源的curve。

相信大家都看到那张图了,DeepSeek已经成为全球DAU增速最快的AI应用,用20天实现DAU 2000万。要知道豆包是23年8月上线,DAU直到24年底才到了2000万(春节放假DAU略有盘整)。过年期间的最大赢家毫无疑问是DeepSeek

而这引申出来几个问题

1. 显然推理需求远远超过了DS自己的预期。深度思考和联网模式不是所谓技术问题,就是算力不够用。这把算是让中国人民也能亲身体会什么叫test-time compute scaling law。时间越长,推理效果越高,相应的就是算力的无底洞。

供给如何?我们之前写过,国内算力资源结构性供需不平衡。

官方版本要DS自己拿算力承接,但内部即便是训练算力分配都不够。海外如微软、国内腾阿里云用自身算力去承接。而硅基流动这次找华为云,也是考虑到升腾是国内三方可买到的扩展能力最强的国产卡(毕竟南方产能拿最多)。但另一边,过去几年大干快上的地方智算中心利用率可能不足50%(但其实很多资源储备相当不错,比如一半的N卡...)

过去几天几乎所有加速卡厂商用最快速度“适配”了DS v3和r1,充分证明DS这次开源的穿透力。因此这波暴增的推理需求,当潮水退去(2000万肯定有尝鲜需求),真实需求沉淀下来,希望能看到r1自身的深度推理 多模态、外部开源带来的各类垂直蒸馏微调、进一步衍生出的应用产品,整体上拉动需求,对“前置投资”的国内算力供给侧来一波填充。

2. 如何看待模型热点的不断轮动。我们12月初开始写豆包,市场的焦点刚挪到字节体系不到2个月,DS又横空出世。怎么理解模型热点的不断切换?我们嘉宾“全速前进”今天有一个非常好的总结:

判断1:没有一家模型厂商可以在所有维度维持领先优势,各家模型大概率各有千秋。

判断2:模型层将在未来的切换成本将接近于零。DS的发布和开源,证明模型层内卷更加激烈(或如微软CEO说的模型同质化)。一种流行的说法:模型公司终将吞噬各种AI应用公司(Wrapper),其实要具体问题具体分析,因为应用层/Wrapper一直在演化,没有创造价值的GPT套壳已经倒闭干净了,但找到PMF深度定制化的产品活得都不错。今天Cursor(26亿刀 估值)、Perplexity(90亿刀 估值)、Glean(46亿刀 估值)某种意义上都是wrapper,能做深做好一样有很大市场。

个人理解,DS这次算是过去2年LLM浪潮开启以来的重要拐点,以开源追赶闭源为信号,验证了Satya的判断,在AGI之前,模型会持续处于商品化(commoditized)。这里面有技术早期的必然性,比如算法的非线性进步和优化空间超过了头部玩家的预测;也有偶然因素,比如DS这次没有任何经济意义的开源(AGI之前甚至继续开源?)

因此闭源的压力必然非常大,要努力证明自己的价值,就要画出一条远超开源的curve。而如果上述假设成立,如我们之前阐述过的,就好比开源的安卓滋养出的手机应用生态,同样,AI更大商业价值从模型层让渡到上层,应用会繁荣。

3. 豆包是竞争关系吗?不,是生态共荣。

从本质上战略聚焦略有不同。DS的资源投入重心应该还是围绕AGI,2000万DAU的背后,也要看到DS在主动支持CSP和硅基等等上线部署r1。因此DS要的不是流量,而是生态。

豆包目前的定位依然偏重于super APP,或至少是应用与模型双轮驱动。与Meta等其他厂商一样,字节也会受益于DS r1的开源。而豆包在情感语音、多模态、视频生成等应用向的模型能力上,也超过DS和其他。最重要的是,字节算力储备、资本优势决定了,对任何模型和research上的进展进步,都有比较强的虹吸力。聚焦不同,完全可以后发,但却可持续享受这个过程中向上层释放的商业价值。字节是商业上的正向循环。两条路不矛盾,或许最终也殊途同归。

LOT物联网

iot产品 iot技术 iot应用 iot工程

Powered By LOT物联网  闽ICP备2024036174号-1

联系邮箱:support1012@126.com