转自:格隆汇
马斯克夸口,从来齐是先打草稿。
2月18日,xAI重磅发布堪称“地表最强”的Grok 3 系列模子。
从官方丢出的数据来看,Grok 3基础模子向上DeepSeek V3、GPT-4o等SOTA模子;Grok 3推理模子一样向上o3-mini high、DeepSeek R1、Gemini 2 Flash Thinking等模子。
除此以外,在东说念主工盲评的Chatbot Arena上,Grok 3全类型齐排名第一。
虽然评分只比第二高十几分……但高等于高。
“地表最强”,如实没什么争议。
牛皮再一次成真,马斯克壕气地文书:怒放Grok 3供用户免费使用,直至办事器崩溃。
最强、不要钱,这两个标签摆在沿路,放纵不言而喻。
2月20日,Grok应用越过ChatGPT APP,速即升知音意思国区App Store免费APP榜首。
不外有一说一,这个“地表最强”,其实并莫得给东说念主几许激荡。
最近的公论,也赫然反馈了这极少,远莫得联想中的爆炸性效用。
毕竟,这关联词拿20万张GPU,历时214天硬生生堆出来的首个Elo评分破1400的模子,消耗的动力足以防守一个中型城市开动。
放纵是,除了基座测试分数亮眼外,比如推理效用之类,并莫得骨子性的突破。
一定流程上,只是个单纯的数值怪。正确的叫法,是“全球最大的H100连集群”。
换句话说,只须肯烧钱,这个“地表最强”的名称,敌手随时不错拿走。
名义上看,这性价比,的确是有点低。
尤其是最近被DeepSeek顶点的低资本胆怯后,吃瓜众人难免发出疑问:Gork 3破钞了这样多资源,性能仅比面前的SOTA提高了极少汉典,真理真理很大吗?
值不值得,取决于你何如看待这个事。
至少马斯克本东说念主,并不认为不值。
甚而,后续筹商还要扩大畛域,功率至少是面前的5倍,一心在堆卡这条说念上走到黑……
险些等于无脑烧钱的举动,依然不成完全用营业逻辑来解释了。
到底值不值?
马斯克至少向宇宙讲解了一件事:更刚劲的算力,如实能提醒出更刚劲的模子。
问题在于,面前众人能猜想的测试模式,基本齐是对标东说念主类的各式检修之类的,最前沿的几个大模子齐依然取得很高分了。
换句话说,最优秀的几个大模子,其材干齐依然接近东说念主类能剖析的上限。
Grok 3的窘态之处在于,在面前的领路框架中,它没看法讲解我方的上风究竟在哪。
这就好比,一门检修,学霸们齐能考90分以上。
学渣不以为有什么,唯独他们我方知说念,90分和95分分袂有多大。
60分到90分,你要付出1的力图;90到95分,虽然看起来分袂不大,但所需付出的元气心灵却是成倍的提高。
对绝大多量东说念主而言,两者其实没什么分袂,唯独头部几个争排名的东说念主会为了1分的差距而力图。
这种桥段,也不错套入咱们看的修真演义情节当中。
东说念主间界的天花板之是以是化神期,一方面是寰宇限定的压制,另一方面,是这个宇宙的资源等第只够修士练到这个田地。
想要延续升级,最胜仗的看法等于飞升灵界取得高档资源;但平素的化神期修士根本抗不外天劫,根蒂去不了灵界。
想升级就要飞升,但不升级又没材干飞升……这等于矛盾的,是以亘古以来,登顶者如过江之鲫,飞升者却三三两两。
再回到现实。
面前系数的AI,包括Gork 3,不管看起来多强,其实仍然处于最低级的阶段。
为什么低级?因为莫得东说念主知说念下一步究竟该何如去突破,突破后究竟是什么?是不是等于AGI?
大模子的根本是谀媚主义,效法的是东说念主脑。
东说念主为什么领有灵敏?并不是因为脑子“大”。
论大脑分量,东说念主类不如大象;论脑重占比,不如黑猩猩;论神经元畛域,不如蓝鲸;论视觉信息畛域,不如大部分鸟类……
在算力这方面,东说念主脑并不比其他动物更有上风。真让让东说念主脱颖而出的,可能是“算法”。
效法东说念主脑的大模子,往上堆算力不错提高开动效用,但并不一定能量变产生质变。
前者还能靠钱堆,后者就很难说了。
所谓的技艺奇点大要等于这样,你不仅不知说念它什么时候来,更不知说念它究竟是什么。
如果以这种角度看,Gork 3与DeepSeek V3和GPT-4o的分袂,可能并不是95分和90分,而是0.95和0.9分,推行上齐莫得完成1的突破。
满分100分。
不是说这没迥殊念念真理,越接近1突破的概率天然越大。
但在推行的使用场景中,对大多量东说念主而言,不管你是0.95照旧0.9,甚而更弱极少的0.8,其实分袂齐不大。
更关节的是,0.95所需的资本更高,收费理所天然更贵,大多量用户用不起、也根蒂用不到。
是以从营业化的角度来看,马斯克烧了这样多钱提醒出暂时率先的大模子,虽然如实是地表最强,但边际收益属实是有点低。
马斯克是个商东说念主,作念任何边幅齐要接洽答复率。
但此次,可能不太一样。
就算短期亏钱,也一定要作念;因为恒久的答复,可能远远超出联想。
这份答复,甚而不成只是用财富去忖度。
权利的游戏
对马斯克本东说念主而言,急需一个掌控在我方手中的、饱和强力的AI大模子。
岂论花几许钱,岂论它是不是划期间的,总之是必须要有一个。
不然他面前要作念的事,没看法伸开。
他面前的第一看法是什么?
最近,乃至畴昔4年,全球公论的中枢,毫无疑问是马斯克主导的“政府效用部”,简称DOGE。
DOGE部门满打满算不外20余东说念主,中枢成员更是仅有6东说念主,绝对是真实的天才,年事最大的25岁,最小的才19岁。
有一说一,这6东说念主虽然是天才,但除了最年长辈,其余有3东说念主照旧学生、1东说念主辍学,甚而还有黑历史。
这种配景别说参预玄妙机构,岂论在哪个国度,齐是过不了政审的。
但他们如实成了宇宙上权利最大的几个后生之一,领有好意思国最高档别的安全许可,不受任何东说念主监督:
Gavin Kliger,25岁,加州伯克利策画机专科,前推特数据工程师,清扫对象是好意思国开辟署,并向五角大楼植入去中心化审计要领。
Gautier Cole Killian,24岁,来自加拿大麦吉尔大学,是6东说念主中最玄机的一位,认真通过AI分析、确保政府资金被最高效使用。
Luke Farritor,23岁,里面拉斯加大学辍学,任务是监督医保系统和动力部,后者包括监督核火器的使用。
Ethan Shaotran,22岁,办事黑客,哈佛大学在读生,xAI黑马马拉松比赛亚军,致力于于用算法取代政府的传统东说念主力模式。
绵薄来说,预算评估、行政审批乃至国会证据,全部交给AI去作念。
bobba,21岁,印度裔,加州伯克利大学在读生,主导财政支拨实事监管系统,有权胜仗冻结联邦支拨。
Edward Coristine,19岁,办事黑客,好意思国东北大学在读生,曾为俄罗斯提供AI办事,现为好意思国国土安全部高档照料人,认真国度边境安全。
6位年青东说念主,每一位齐有后劲成为畴昔科技行业的引颈者,面前却答应不拿工资,每周使命时候长达120个小时,不顾抚慰卷进政事接触中。
马斯克称他们是地球上最优秀的6位软件工程师,外界东说念主称“DOGE六正人”。(示意他们的下场可能如戊戌六正人,不太好。)
按照筹商,他们将在好意思国开国250周年、即2026年7月4日前,透顶推翻好意思国开动了两个多世纪的体制。
第一个挨刀的,是领有1.2万名职工的好意思国国外开辟署,被裁得只剩294东说念主。
面前为止,这个小团队日均砍掉好意思国政府1.26亿好意思元的预算。
看起来夸张,但按这个速率,瞻望到来岁7月,只可砍掉670亿好意思元,远远低于特朗普最终削减2万亿好意思元预算的看法。
是以还得加大马力,真实的大算作,未必还莫得来。
后续,甚而还要动奥巴马医改下的Medicaid和Medicare等边幅。
这个不错说是众望所谓,奥巴马医改的年度预算高达26%,甚而媲好意思国国防开支的13.3%还要高一倍……
毛糙策画,至少200万好意思国公事员将被条款主动离职。你若是不我方走,到时候一毛钱赔偿齐不给。
再加上那两千多万还在领社保的“鬼魂”,影响的东说念主难以测算。
一言以蔽之,裁东说念主这块,面前的DOGE完全不错作念到。
但有一件事更危急的事,仅凭几个东说念主和现存的AI技艺可能无法作念到:查账。
好意思国政府往日这样多年的账,绝对涉及到全宇宙。就这样几个东说念主,岂论何如天才,就算各部门把账本送到案前让你查……
查到特朗普下台,这账齐不可能理得清。
别说6个东说念主,等于6万东说念主,三五年之内也很难查阅完。
就算真请这样多管帐来查,东说念主多鱼龙搀和,根本就没看法保证公说念性。
东说念主不可能办到,唯独更刚劲AI不错。它将光速整合系数单元的所罕有据,钱去哪了、经谁的手、效用怎么,绝对给你安排得清澄澈爽。
具体何如作念?至少有4个所在。
第一,锁定资金流向。
AI通过分析资金的运动旅途,追想到资金末段,判断这笔钱的合感性。
第二,扫描财务数据。
通过天然话语处理,对比数据和计谋,快速发现资金是否存在运用法律疏忽套利的可能性。
第三,自动处理。
AI不辩别分析海量的政府文献,自动筛选可疑的数据,极大攻讦效用部发现问题的时候资本。
第四,自我升级。
AI也会犯错,但“扞拒提醒”机制不错将AI错判的数据重新编码为新的提醒数据,束缚提高准确率。
……
Gork 3之前的AI,也不错作念到这些事。
尤其是凭借第四点,自我升级的材干,效用会越来越高。
但是,能不成在2026年7月4日前完成看法?
Gork 3之前,毫无疑问不成,不然马斯克没必要烧钱作念枉费有害的事。
Gork 3不错吗?毫无疑问也不成,不然一样没必要以公认收益低的步伐,延续烧钱。
马斯克面前最缺的,不是钱,是时候。
天然,若能完毕突破、简直轻松出名胜了,那更好。
但这不是第一优先级。
岂论能不成完毕技艺上的突破,只须能攻讦达成看法的时候,至少对马斯克本东说念主和效用部的几东说念主而言,等于赚的。
期间漩涡
很赫然不错看到,马斯克的阅兵并不是依次渐进的。
而是胜仗运用科技,试图用一年时候就完成对沿用两百年的体系进行降维打击。
这与历史上任何国度的阅兵,底层逻辑和外皮推崇是雷同的。
总体上齐是胜仗用暴力技能,冲破旧的体制。
不一样的地方在于四个新的变量。
第一个是体量。
抽象系数层面,好意思国事东说念主类历史上体量最大的国度。
船浩劫掉头,往日体量不偏握百分之一的国度想要变革齐无比劳苦,并且是这尊巨无霸。
第二个是时候节点。
当下毫无疑问正处于新一轮科技翻新的前夜。同前三次科技翻新一样,分娩力的飞跃将带来弘远的财富增量,这些新的财富不错一定流程上弥补利益受损的群体。
打不外你,但只须还有公正,也不是不成跟你混。
这推行上减少了好多矛盾,照旧那句经典台词:谁赢,他们跟谁。
第三个变量,是马斯克本东说念主。
马斯克被称为好意思国版张居正,和DOGE六正人一样,这个称呼一样示意了不好的结局。
他动的不单是是好意思国官僚体系的蛋糕,届时这场阅兵很可能将扩散至全球每一个旯旮,东说念主类社会系数的政事游戏限定齐将被改写。
这不是遴选题,AI技艺对措置逻辑的重构,正如工业期间的到来推翻了君王制,莫得任何东说念主不错抵触大趋势。(比如最近深圳引入AI公事员,未必等于一次很好的尝试。)
如斯大的漩涡中,阅兵能得胜就终结,马斯克的地位莫得东说念主不错动摇;若中途折戟,旧体系的反扑也不是他不错承受的。
唯独前一种情况,第四个变量才迥殊念念真理。
临了一个变量是速率。
此次虽然算得上是不流血的翻新,但只是想用一年多就完成变革,这是前无仅有的放荡,也有可能对社会酿成难以预见的蹂躏。
数以亿计的等闲东说念主,能否跟得上?有莫得必要这样急?
乐不雅点看,马斯克不是政客,他的DOGE并不是正规部门、权利的保质期唯独4年。
他阅兵的看法并不是成为新的掌权者,而是为我方外侨火星的终极联想办事。
是以这种急迫,一样表面前天际职业上。
大多量东说念主齐很朦拢,为啥马斯克那么每每放射火箭,好像非得赶着这几年上天际。
营业成分天然有,更多则是东说念主生苦短的无奈。
马斯克1971年生,本年依然54岁。而好意思国的平均寿命是76.6岁,就算他能蹦跶到100岁,也还就剩40多年。
即便飞船没问题了,还得考据宇航员培训、前列基地修复和补给等一系列问题。
按平素发展速率,他到死齐不可能看到登陆火星。
他莫得时候等技艺渐渐完善,必须尽快鼓舞技艺迭代。达成这一看法的独一看法,唯独让全宇宙、至少是好意思国快速完成升级,为我方的终极联想办事。
全东说念主类齐还没反应过来,就依然被请上了通往星辰大海的方舟,简直太仓促了。
而咱们除了点赞转发,又能作念些什么?
背负剪辑:张恒星 开云体育(中国)官方网站