天下苦黄仁勋久矣

日期:2026-05-29 20:44:47 / 人气:3


2006年的那个冬天,黄仁勋做了一个华尔街认为极其愚蠢的决定。

他要求英伟达全线产品必须支持一种叫CUDA的技术。

为了这个毫无盈利希望的项目,这家卖显卡的公司每年的研发开支飙升到5亿美元,利润常年在地板上摩擦。

股东们在痛骂,媒体嘲笑他这是对一个不存在的市场的盲目投资。

老黄没有停。他骨子里是个赌徒。

后来的故事,大家都知道了。

今天硅谷的巨头们为了抢夺英伟达的显卡,几乎要把头挤破。

马斯克把十万张卡塞进得州的机房,然后转手以12.5亿美元一个月的价格租给了Anthropic。

扎克伯格甚至会在Meta的财报里炫耀自己囤了三十万张H100。

大模型行业诞生了一条极其粗暴的铁律:Scaling Law(规模法则)。

模型越大越好,算力越多越好。

英伟达吃掉了行业里绝大部分的利润,云厂商买下昂贵的显卡,再把算力切碎,按Token向创业者和普通用户收租。

每一次AI的思考,都在燃烧英伟达的算力,都在向硅谷的铁王座上贡。

天下苦黄仁勋久矣。

历史的剧本写到这里,通常是一个死局。

但有些人决定要反抗。

PART.01

算力

THUMB

STOPPING

反抗的第一枪,只能打在最硬的硅片上。

昨天,很多人都在转发华为那篇关于芯片的论文。

最近的国产芯片也取得非常多的突破,至少股市是这样的。

但如果去问真正跑在大模型前线的开发者,他们会告诉你一个残酷的真相:老黄脚下,还有一条深不见底的护城河。

这条河叫CUDA。

英伟达花了15年,让全世界几百万程序员在这个生态里试错、填坑,砸出了一条极其丝滑的高速公路。

平心而论,华为的昇腾亦或是其他的国产显卡依然很难用。

算力参数上去了,但因为缺乏软件生态,模型跑在上面动不动就断点、崩溃。

很多拿着热钱的大厂,捏着鼻子转身又去特殊渠道上高价买英伟达了。

但硬骨头总得有人啃。

在这场算力大逃亡里,有极少数几家中国公司,选择了最难走的那条泥泞小路。

比如名震硅谷的DeepSeek。

为了死磕国产算力,把模型硬生生跑通在华为等国产卡上,他们不惜抽调了最核心的工程团队,去一行一行地重新手写底层算子。

这种在泥泞里打滚的代价,

是整个模型发布节奏的严重延迟。

这是一个令人敬佩的孤勇者故事。

但这也暴露了一个残酷的现实:

如果中国大模型只能靠顶尖工程师拿命、拿时间去填英伟达15年的生态坑,那我们什么时候才能真正翻盘?

也许有别的路子。

PART.02

模型

THUMB

STOPPING

后端的算力护城河正在被瓦解,但这还不够。

如果你翻翻几家科技巨头的财报,你就会发现一个极其荒诞的现象。

无数的高管和产品经理天天掉头发,思考怎么让用户多对话、多生图,怎么多卖API、多卖会员。

为了抢地盘,大厂之间甚至打起了残酷的、近乎白给的API价格战。

但背后大部分利润都付给了英伟达或者云厂商。

说白了,整个AI行业都在给黄仁勋一个人打工。

黄仁勋和云厂商们的最终幻想,是把所有的高级智能都锁在云端数据中心里,让你永远交网费、交Token费。

只要模型还在云端一天,推理的计费表就永远在转。

哪怕这个行业的API价格战打得再凶,只要英伟达的显卡还要通电,边际成本就永远降不到零。

天下苦黄仁勋久矣。但怎么反抗?

要彻底终结这种垄断,就必须把战场转移。

转移到黄仁勋的显卡永远触达不到的地方——端侧模型。

所谓端侧模型,其实就是在你自己的设备里运行模型。

把那个绝顶聪明的大脑,直接摁进你口袋里的手机、桌上的旧笔记本,甚至手腕上的一块智能手表里。

这会带来两个好处:

第一是成本。

一旦模型在本地跑起来,云端的Token计费器就彻底哑火了。

你不需要再为每一次提问心惊肉跳地算钱,你让它去读几十万字的研报、帮你写一整夜的代码,边际成本统统是零。

没有中间商赚算力差价,更不需要向任何二道贩子交过路费。

第二是隐私。

巨头们再也无法通过云端偷窥你的数据,公司的机密财务表、个人的私密日记,都被死死锁在了物理隔绝的设备里。

即便你坐在毫无网络信号的高铁钻山洞,它依然能为你全速运转。

但这条路,太难走了。

其实在过去两年,行业里也曾涌现过一大批喊着要做端侧、要把大模型装进手机的团队。

但资本是极其现实的。

当大家在泥潭里滚了一圈后发现,做端侧不仅要跟物理硬件的极限死磕,而且利润薄得像刀片。

更要命的是,它完全破坏了那种躺在云端按API收租的完美商业模式。

于是,人群很快就散了。

大家一窝蜂地调转车头,回去继续卷千亿万亿参数的云端巨兽。

潮水褪去后,这个赛道显得无比空旷和寂寥。

放眼全球,如今还愿意在这个边缘战场上逆行的人,寥寥无几。

比如美国巨头谷歌的Gemma团队、微软的Phi团队、阿里的Qwen团队等等。

有趣的是,就连卖铲子的英伟达,他们自己的研究院也发过一篇论文,直言不讳地说‘小语言模型才是未来’。

巨头们虽然下了场,但端侧对他们来说,更像是为了补全模型版图的防御性任务。

毕竟,让他们彻底砸碎自己躺着赚钱的云端收租盘,太难了。

但与这些巨头的防御性任务不同。

很多人对桌宠的记忆,还停留在二十年前只会吃饭睡觉的QQ宠物、电子鸡,或者是那个偶尔在屏幕上翻跟头、打呼噜的瑞星小狮子。

PART.03

明天

THUMB

STOPPING

昨天,很多人都在为华为的一篇论文激动。

大家似乎看到了掀翻英伟达帝国的曙光。

但今天老黄依然穿着他那件标志性的黑皮衣,他依然是硅谷的唯一神明。

很多人问,中国的大模型什么时候能真正超越美国?

答案或许根本不在于谁能买到更多的显卡,或者谁能用更多的钱堆出一个更大的参数怪物。

真正的超越,往往发生在游戏规则被颠覆的那一刻。

大模型的上半场,是人肉写代码的手工作坊,是买卡囤卡的冷兵器时代。

大家比的是谁的钱包厚,谁能从那个穿皮衣的男人手里买到更多的硅片。

但下半场,规矩变了。

在这场天下苦老黄久矣的突围战中,华为在最底层的硅片上凿冰,DeepSeek在算法的极限上压榨算力。

不盲从巨头的暴力美学,不在旧规则里内卷,而是直接掀翻牌桌。

很多年后,当我们回头看当下发生的这些事,可能会发现这是一个静水流深的分水岭。

现在的硅谷依然热闹,纳斯达克的数字依然在跳动,老黄的饭局上依然坐满了求购芯片的大佬。

那个穿着皮衣的男人依然站在顶端,受万人膜拜。

巨头们也依然在为了云端的算力焦虑地厮杀。

但在他们看不见的地方,旧秩序的基石,已经被悄然抽走了几块。

在那条极其拥挤、昂贵、还随时可能被封锁的英伟达高速公路旁边,有一群中国造反者不再按喇叭催促了。

他们转过身,开始自己修路。"

作者:新航娱乐




现在致电 xylmwohu OR 查看更多联系方式 →

COPYRIGHT 新航娱乐 版权所有