天下苦黄仁勋久矣
日期:2026-05-29 20:44:47 / 人气:3

2006年的那个冬天,黄仁勋做了一个华尔街认为极其愚蠢的决定。
他要求英伟达全线产品必须支持一种叫CUDA的技术。
为了这个毫无盈利希望的项目,这家卖显卡的公司每年的研发开支飙升到5亿美元,利润常年在地板上摩擦。
股东们在痛骂,媒体嘲笑他这是对一个不存在的市场的盲目投资。
老黄没有停。他骨子里是个赌徒。
后来的故事,大家都知道了。
今天硅谷的巨头们为了抢夺英伟达的显卡,几乎要把头挤破。
马斯克把十万张卡塞进得州的机房,然后转手以12.5亿美元一个月的价格租给了Anthropic。
扎克伯格甚至会在Meta的财报里炫耀自己囤了三十万张H100。
大模型行业诞生了一条极其粗暴的铁律:Scaling Law(规模法则)。
模型越大越好,算力越多越好。
英伟达吃掉了行业里绝大部分的利润,云厂商买下昂贵的显卡,再把算力切碎,按Token向创业者和普通用户收租。
每一次AI的思考,都在燃烧英伟达的算力,都在向硅谷的铁王座上贡。
天下苦黄仁勋久矣。
历史的剧本写到这里,通常是一个死局。
但有些人决定要反抗。
PART.01
算力
THUMB
STOPPING
反抗的第一枪,只能打在最硬的硅片上。
昨天,很多人都在转发华为那篇关于芯片的论文。
最近的国产芯片也取得非常多的突破,至少股市是这样的。
但如果去问真正跑在大模型前线的开发者,他们会告诉你一个残酷的真相:老黄脚下,还有一条深不见底的护城河。
这条河叫CUDA。
英伟达花了15年,让全世界几百万程序员在这个生态里试错、填坑,砸出了一条极其丝滑的高速公路。
平心而论,华为的昇腾亦或是其他的国产显卡依然很难用。
算力参数上去了,但因为缺乏软件生态,模型跑在上面动不动就断点、崩溃。
很多拿着热钱的大厂,捏着鼻子转身又去特殊渠道上高价买英伟达了。
但硬骨头总得有人啃。
在这场算力大逃亡里,有极少数几家中国公司,选择了最难走的那条泥泞小路。
比如名震硅谷的DeepSeek。
为了死磕国产算力,把模型硬生生跑通在华为等国产卡上,他们不惜抽调了最核心的工程团队,去一行一行地重新手写底层算子。
这种在泥泞里打滚的代价,
是整个模型发布节奏的严重延迟。
这是一个令人敬佩的孤勇者故事。
但这也暴露了一个残酷的现实:
如果中国大模型只能靠顶尖工程师拿命、拿时间去填英伟达15年的生态坑,那我们什么时候才能真正翻盘?
也许有别的路子。
PART.02
模型
THUMB
STOPPING
后端的算力护城河正在被瓦解,但这还不够。
如果你翻翻几家科技巨头的财报,你就会发现一个极其荒诞的现象。
无数的高管和产品经理天天掉头发,思考怎么让用户多对话、多生图,怎么多卖API、多卖会员。
为了抢地盘,大厂之间甚至打起了残酷的、近乎白给的API价格战。
但背后大部分利润都付给了英伟达或者云厂商。
说白了,整个AI行业都在给黄仁勋一个人打工。
黄仁勋和云厂商们的最终幻想,是把所有的高级智能都锁在云端数据中心里,让你永远交网费、交Token费。
只要模型还在云端一天,推理的计费表就永远在转。
哪怕这个行业的API价格战打得再凶,只要英伟达的显卡还要通电,边际成本就永远降不到零。
天下苦黄仁勋久矣。但怎么反抗?
要彻底终结这种垄断,就必须把战场转移。
转移到黄仁勋的显卡永远触达不到的地方——端侧模型。
所谓端侧模型,其实就是在你自己的设备里运行模型。
把那个绝顶聪明的大脑,直接摁进你口袋里的手机、桌上的旧笔记本,甚至手腕上的一块智能手表里。
这会带来两个好处:
第一是成本。
一旦模型在本地跑起来,云端的Token计费器就彻底哑火了。
你不需要再为每一次提问心惊肉跳地算钱,你让它去读几十万字的研报、帮你写一整夜的代码,边际成本统统是零。
没有中间商赚算力差价,更不需要向任何二道贩子交过路费。
第二是隐私。
巨头们再也无法通过云端偷窥你的数据,公司的机密财务表、个人的私密日记,都被死死锁在了物理隔绝的设备里。
即便你坐在毫无网络信号的高铁钻山洞,它依然能为你全速运转。
但这条路,太难走了。
其实在过去两年,行业里也曾涌现过一大批喊着要做端侧、要把大模型装进手机的团队。
但资本是极其现实的。
当大家在泥潭里滚了一圈后发现,做端侧不仅要跟物理硬件的极限死磕,而且利润薄得像刀片。
更要命的是,它完全破坏了那种躺在云端按API收租的完美商业模式。
于是,人群很快就散了。
大家一窝蜂地调转车头,回去继续卷千亿万亿参数的云端巨兽。
潮水褪去后,这个赛道显得无比空旷和寂寥。
放眼全球,如今还愿意在这个边缘战场上逆行的人,寥寥无几。
比如美国巨头谷歌的Gemma团队、微软的Phi团队、阿里的Qwen团队等等。
有趣的是,就连卖铲子的英伟达,他们自己的研究院也发过一篇论文,直言不讳地说‘小语言模型才是未来’。
巨头们虽然下了场,但端侧对他们来说,更像是为了补全模型版图的防御性任务。
毕竟,让他们彻底砸碎自己躺着赚钱的云端收租盘,太难了。
但与这些巨头的防御性任务不同。
很多人对桌宠的记忆,还停留在二十年前只会吃饭睡觉的QQ宠物、电子鸡,或者是那个偶尔在屏幕上翻跟头、打呼噜的瑞星小狮子。
PART.03
明天
THUMB
STOPPING
昨天,很多人都在为华为的一篇论文激动。
大家似乎看到了掀翻英伟达帝国的曙光。
但今天老黄依然穿着他那件标志性的黑皮衣,他依然是硅谷的唯一神明。
很多人问,中国的大模型什么时候能真正超越美国?
答案或许根本不在于谁能买到更多的显卡,或者谁能用更多的钱堆出一个更大的参数怪物。
真正的超越,往往发生在游戏规则被颠覆的那一刻。
大模型的上半场,是人肉写代码的手工作坊,是买卡囤卡的冷兵器时代。
大家比的是谁的钱包厚,谁能从那个穿皮衣的男人手里买到更多的硅片。
但下半场,规矩变了。
在这场天下苦老黄久矣的突围战中,华为在最底层的硅片上凿冰,DeepSeek在算法的极限上压榨算力。
不盲从巨头的暴力美学,不在旧规则里内卷,而是直接掀翻牌桌。
很多年后,当我们回头看当下发生的这些事,可能会发现这是一个静水流深的分水岭。
现在的硅谷依然热闹,纳斯达克的数字依然在跳动,老黄的饭局上依然坐满了求购芯片的大佬。
那个穿着皮衣的男人依然站在顶端,受万人膜拜。
巨头们也依然在为了云端的算力焦虑地厮杀。
但在他们看不见的地方,旧秩序的基石,已经被悄然抽走了几块。
在那条极其拥挤、昂贵、还随时可能被封锁的英伟达高速公路旁边,有一群中国造反者不再按喇叭催促了。
他们转过身,开始自己修路。"
作者:新航娱乐
新闻资讯 News
- 揭阳卖翡翠的老板不相信AI:热闹...05-29
- 揭阳卖翡翠的老板不相信AI:热闹...05-29
- 产业政策全面解禁,本土产能爆发...05-29
- 阿里再不入手朴朴,就晚了!50亿...05-29

