节目分æˆäº†ä¸¤æ¬¡å½•制。第一次是在 7 月 18 æ—¥ï¼ŒçœŸæ ¼åŸºé‡‘ç®¡ç†åˆä¼™äººæˆ´é›¨æ£®ä¸Žæ™šç‚¹ç§‘技报é“负责人程曼祺,围绕月之暗é¢åˆšå‘布的 Kimi K2ã€AI 应用普åŠçš„æ–°åЍå‘,以åŠè¿‘å‡ ä¸ªæœˆæŒç»å‡æ¸©çš„æŠ¢äººå¤§æˆ˜ï¼Œåšäº†ä¸€æ¬¡ä¸åœºå›žé¡¾ã€‚ 第二次是在 7 月 21 日,我们补充èŠäº†åˆšåˆšå‘生的新进展:7 月 18 日,OpenAI å‘布了 ChatGPT Agentï¼›7 月 19 日,OpenAI åˆå®£å¸ƒï¼Œä¸€ä¸ªå°šæœªå…¬å¼€çš„通用大è¯è¨€æ¨¡åž‹ï¼Œé¦–次达到了 IMO 国际数å¦å¥¥æž—匹克金牌水准;7 月 22 日,Google DeepMind 也宣布,他们的 Gemini DeepThink 模型å–å¾—äº†åŒæ ·æˆç»©ã€‚这之å‰ï¼Œåªæœ‰ Google DeepMind 曾用为数å¦è°ƒä¼˜çš„æ¨¡åž‹è¾¾åˆ°é“¶ç‰Œã€‚ å…¨çƒçš„ AI 社区ä»å¤„于 Early Adopter(早期采用者)阶段。他们愿æ„è¯•é”™ã€æ„¿æ„åé¦ˆã€‚å½“ä½ æ‹¿å‡ºä¸€ä¸ªå¥½äº§å“,并以开放的æ€åº¦å¯¹å¾…ç”¨æˆ·æ—¶ï¼Œæ— è®ºæ˜¯ DeepSeekã€Kimiã€Manus 还是 Genspark,都已ç»è¯æ˜Žï¼šæ¥è‡ªå„地的用户ä¸ä»…会欣èµã€æ”¯æŒä½ ï¼Œç”šè‡³ä¼šä¸»åŠ¨å¸®ä½ æ”¹è¿›äº§å“。 回看 Kimi K2 的故事,也能看到「投人ã€è¿™ä»¶äº‹åœ¨ AI æ—¶ä»£è¢«é‡æ–°è®¤è¯†çš„过程。Kimi 从一开始就是一个以技术视野和技术能力为底的团队。2023 年,AI 风å‘å‡ ä¹Žæœˆæœˆåœ¨å˜ï¼Œä½†æ¨æ¤éºŸçš„团队押ä¸äº†é•¿æ–‡æœ¬è¿™ä¸ªæ–¹å‘,并基于æ¤åšå‡ºäº†ç¬¬ä¸€ä¸ªå…·å¤‡æœç´¢èƒ½åŠ›çš„ç‰ˆæœ¬ã€‚è¿™æ˜¯ä¸€åœºé¢å‘未æ¥çš„下注。 AI æ£åœ¨è®©äººä»¬åŽ»å°è¯•那些原本ä¸ä¼šåšçš„事。这次 IMO 金牌事件更让我们看清 AGI å³å°†åˆ°æ¥çš„ä¿¡å·ã€‚å¦‚æžœè¯´è¿‡åŽ»æˆ‘ä»¬åªæ˜¯è¿œè¿œæœ›è§ä¸€è¾†å†’烟的ç«è½¦ï¼Œå¦‚今,已ç»èƒ½æ¸…楚地å¬è§å®ƒçš„轰鸣声了。 戴雨森:确实过去这个周末å‘生了很多事情。我觉得最é‡è¦çš„一件是 OpenAI 的一个新模型,在 IMO(国际数å¦å¥¥æž—匹克)2025 年的题目上获得了金牌级别的æˆç»©ã€‚具体æ¥è¯´æ˜¯å…é“题åšå¯¹äº†äº”é“。 这个为什么é‡è¦å‘¢ï¼Ÿå› 为按照 OpenAI çš„æè¿°ï¼Œè¿™æ˜¯ä¸€ä¸ªæ²¡æœ‰è”网的通用大è¯è¨€æ¨¡åž‹ï¼Œå¹¶ä¸”没有针对数å¦åšç‰¹åˆ«ä¼˜åŒ–,也没有用任何 Code Interpreter 一类的工具。它完æˆçš„æ˜¯ IMO çš„è¯æ˜Žé¢˜ï¼Œè€Œä¸” OpenAI æ‰¾äº†ä¸‰ä½ IMO 的金牌得主æ¥äº¤å‰éªŒè¯ï¼Œç¡®è®¤è¿™äº›è§£ç”是对的。 当然,这个结果也引å‘了一些争议。比如有些人指出它还没有ç»è¿‡å®˜æ–¹è®¤è¯ï¼Œå› æ¤ä¸ä¸€å®šæœ‰æ•ˆã€‚陶哲轩也说,IMO 题目的解法路径会有很多ä¸åŒï¼Œæœ€ç»ˆå¾—分也会ä¸ä¸€æ ·ã€‚ 但ä¸ç®¡æ€Žæ ·ï¼Œè¿™ä¸ªç»“果是一个划时代的进展。è¯è¨€æ¨¡åž‹æ²¡æœ‰ç»è¿‡ç‰¹åˆ«çš„æ•°å¦ä¼˜åŒ–,åªåœ¨ç¦»çº¿çŽ¯å¢ƒä¸å°±èƒ½è§£å‡º IMO çº§åˆ«çš„è¯æ˜Žé¢˜ã€‚åƒä¹‹å‰ Google 用 AlphaGeometry 是为数å¦ä¸“门设计的模型,还借助了形å¼åŒ–éªŒè¯æ–¹æ³•,并ä¸å…·å¤‡æ³›åŒ–能力。 晚点:这刚好是一年å‰çš„事,2024 å¹´ 7 月 Google çš„ AlphaGeometry 达到了 IMO é“¶ç‰Œçš„æ°´å‡†ï¼Œå½“æ—¶å·®ä¸€ç‚¹åˆ°é‡‘ç‰Œã€‚ä½†é‚£ä¸æ˜¯é€šç”¨å¤§è¯è¨€æ¨¡åž‹ï¼Œè€Œè¿™æ¬¡ OpenAI 说是通用大模型。 戴雨森:对,而且今年这个时间点æ£å¥½æ˜¯ IMO 出题的时间,OpenAI 是题目一出就åšäº†ï¼Œæ‰€ä»¥ä¹Ÿä¸å˜åœ¨æ¨¡åž‹è®ç»ƒæ—¶æå‰è§è¿‡è¿™äº›é¢˜çš„æƒ…况。 虽然过去一年è¯è¨€æ¨¡åž‹å·²ç»æœ‰å¾ˆå¤šè¿›å±•ï¼Œä½†åƒæ•°å¦è¯æ˜Žè¿™æ ·çš„任务,尤其是 IMO 这类题,属于 hard to verify 的问题类型。验è¯ä¸€ä¸ªç”æ¡ˆæ˜¯å¦æ£ç¡®æœ¬èº«å°±éžå¸¸éš¾ã€‚ 这类问题一直以æ¥éƒ½è¢«è®¤ä¸ºæ˜¯å½“å‰è¯è¨€æ¨¡åž‹éš¾ä»¥èƒœä»»çš„任务。并且现实ä¸ä¸–界上大部分真æ£çš„é—®é¢˜ï¼Œäº‹å…ˆéƒ½æ˜¯æ²¡æœ‰æ ‡å‡†ç”æ¡ˆå’Œè§£æ³•的。所以当一个è¯è¨€æ¨¡åž‹å¯ä»¥åœ¨æ²¡æœ‰ä»»ä½•ç‰¹åˆ«è°ƒæ•™çš„å‰æä¸‹ï¼Œè§£å‡ºè¿™ç±»é«˜éš¾åº¦çš„é¢˜ï¼Œè¾¾åˆ°äººç±»é¡¶å°–æ°´å¹³æ—¶ï¼Œè¿™æ„味ç€å®ƒçš„æ€è€ƒèƒ½åŠ›ç¡®å®žä¸Šäº†ä¸€ä¸ªå°é˜¶ã€‚ IMO çš„è¯æ˜Žé¢˜å’ŒçŽ°å®žä¸çš„æŸäº›ç†ç§‘的问题在形å¼é€»è¾‘ä¸Šå¾ˆç›¸ä¼¼ï¼Œéƒ½æ˜¯è¯æ˜Žé¢˜ã€‚LLM 既然能åšå‰è€…,也许说明它离å‘现新知识的能力也ä¸è¿œäº†ã€‚ 还有一个八å¦ï¼šæ®è¯´è¿™æ¬¡ OpenAI 使用的模型和 GPT-4o 是åŒä¸€ä¸ªåº•层模型。也就是说,å–得这个æˆç»©å¹¶ä¸æ˜¯å› 为底层模型有很大æå‡ï¼Œè€Œæ˜¯åœ¨ post-training å’Œ inference 阶段åšå‡ºäº†ä¼˜åŒ–。åŽç»çš„优化空间给整个 AI å‘展带æ¥äº†å¾ˆå¤šæƒ³è±¡ã€‚ 这让我想到 2023 å¹´ 3 月微软那篇论文《Sparks of AGI》,当时他们测试 GPT-4 的预å‘布版本,感å¹ä»Žä¸çœ‹åˆ°äº† AGI çš„ç«èŠ±ã€‚é‚£ç¯‡æ–‡ç« ä¹Ÿå°±ä¸¤å¹´åŠå‰ï¼Œè€ŒçŽ°åœ¨æˆ‘ä»¬å·²ç»èµ°åˆ°äº†èƒ½è§£ IMO 的地æ¥ã€‚两年åŠåœ¨ç§‘技进æ¥å²ä¸æ˜¯å¾ˆçŸçš„æ—¶é—´ï¼Œç”šè‡³æ¯”很多创业公å¸ä»Žç§å轮到产å“å‘布还çŸã€‚ ä¸€ä¸ªã€Œåªæ˜¯é¢„测下一个è¯ã€çš„è¯è¨€æ¨¡åž‹ï¼Œåœ¨æ²¡æœ‰ä»»ä½•工具辅助的情况下,能够完æˆä¸€ä¸ªåªæœ‰æžå°‘数天æ‰äººç±»æ‰èƒ½åšå‡ºçš„æœ‰åˆ›é€ 性的数å¦è¯æ˜Žã€‚这确实说明 AI 的能力已ç»åˆ°äº†ä¸€ä¸ªæ–°çš„高度。 我们年åˆå½•èŠ‚ç›®ã€Šå’Œæˆ´é›¨æ£®é•¿èŠ AI Agent》时也说过:2024 年会是很多行业迎æ¥ã€ŒæŽä¸–石时刻ã€çš„一年。所谓「æŽä¸–石时刻ã€ï¼Œå°±æ˜¯ AI 在æŸä¸ªé¢†åŸŸè¶…越了人类最强水平。 我们已ç»åœ¨å›´æ£‹ã€ç¼–ç¨‹ã€æ•°å¦æŽ¨ç†ç‰é¢†åŸŸçœ‹åˆ°è¿™ç§æƒ…况䏿–出现。接下æ¥è¿˜ä¼šæœ‰æ›´å¤šè¿™æ ·çš„æ—¶åˆ»ç‰å¾…ç€æˆ‘们,解决我们原本以为还很难ã€å¾ˆè¿œçš„问题。 戴雨森:我们也在æ‹ç›®ä»¥å¾…ã€‚å¥½åƒ Google DeepMind 也åšåˆ°äº†é‡‘牌,但我们ä¸çŸ¥é“æ˜¯ä¸æ˜¯ç”¨é€šç”¨æ¨¡åž‹å®žçŽ°çš„ã€‚å¦‚æžœçœŸæ˜¯é€šç”¨æ¨¡åž‹ï¼Œé‚£å°±è¯´æ˜Žè¿™ä¸ªèƒ½åŠ›å·²ç»ä¸åªæ˜¯ä¸€å®¶æŽŒæ¡çš„ã€‚è¿™ç§æŠ€æœ¯ä¸€æ—¦æ‰©æ•£å¼€æ¥ï¼Œä¼šå¸¦æ¥æŽ¨ç†èƒ½åŠ›çš„å¤§å¹…æå‡ï¼Œä¸ç®¡æ˜¯å“ªä¸ªæ¨¡åž‹åŽ‚å•†éƒ½ä¼šä»Žä¸å—益。 戴雨森:我觉得方å‘大家早就知é“,是æœç€æ›´å¼º reasoning 能力去的。è°éƒ½çŸ¥é“ reasoning 能力æå‡äº†ï¼Œæ¨¡åž‹å°±èƒ½è§£æ›´éš¾çš„题。但现在就能åšåˆ°ç¡®å®žè¿˜æ˜¯è®©äººå¾ˆéœ‡æƒŠã€‚我èŠåˆ°ä¸€äº›ä¸å›½æœ€é¡¶å°–çš„ç ”ç©¶è€…ï¼Œä»–ä»¬ä¹Ÿè¡¨ç¤ºéžå¸¸æƒŠè®¶ã€‚但就åƒåŽŸåå¼¹ä¸€æ ·ï¼šçˆ†ç‚¸é‚£ä¸€åˆ»èµ·ï¼Œå¤§å®¶çŸ¥é“这件事情å¯ä»¥åšåˆ°ï¼Œå°±å·²ç»ç¦»åšå‡ºæ¥ä¸è¿œäº†ã€‚ å›´æ£‹æ˜¯ä¸€ä¸ªåŒæ–¹ä¿¡æ¯å…¬å¼€ä¸”完备ã€èƒœè´Ÿæ˜Žç¡®çš„任务,éžå¸¸é€‚åˆå¼ºåŒ–å¦ä¹ ï¼›ç¼–ç¨‹ä¹Ÿæ˜¯ç»“æž„åŒ–ä»»åŠ¡ï¼Œè€Œä¸”å¾ˆå¤šä»£ç æ˜¯å·²æœ‰äººå†™è¿‡çš„ï¼Œæ‹¼è£…æ¯”å…¨æ–°åˆ›é€ å¤šã€‚ ä½†æ•°å¦æ˜¯ç†å·¥ç§‘çš„åŸºç¡€ï¼Œå®ƒçš„æŽ¨ç†æ˜¯å¾ˆå¤šå¦ç§‘çš„æ ¹åŸºã€‚è€Œä¸”ä¸ä¾èµ–自然世界实验,åªé 逻辑æ€ç»´ã€‚所以 AI 能解 IMO çº§åˆ«çš„è¯æ˜Žé¢˜ï¼Œæ„味ç€ç†å·¥ç§‘å¾ˆå¤šçŸ¥è¯†ç”Ÿæˆæ–¹å¼å¯èƒ½éƒ½è¦æ”¹å˜ï¼Œå¸¦æ¥çš„ç§‘å¦è¿›æ¥å¯èƒ½æ¯”编程还大。 戴雨森:有å¯èƒ½æ›´å¤§ã€‚å› ä¸ºç¼–ç¨‹çŽ°åœ¨æ›¿ä»£çš„æ˜¯ä¸€äº›é‡å¤æ€§è¾ƒé«˜çš„åˆçº§å·¥ä½œï¼Œæ¯”如 Vibe Coding 大部分还是å¤åˆ¶ç²˜è´´ä¸€äº›å‰ç«¯ä»£ç ã€‚ä½†æ•°å¦æŽ¨ç†å¸¦æ¥çš„æ˜¯éžå¸¸å¼ºçš„æ€è€ƒå’Œæ½œåœ¨çš„æ–°çŸ¥è¯†å‘现能力。显然,这是更值钱的部分。 这就是为什么我说这次 IMO 金牌事件让我更清晰地看到了 AGI å³å°†åˆ°æ¥çš„ä¿¡å·ã€‚å¦‚æžœä»¥å‰æ˜¯è¿œå¤„看到一辆冒烟的ç«è½¦ï¼ŒçŽ°åœ¨å·²ç»èƒ½å¬åˆ°å®ƒçš„轰鸣声了。 晚点:有人在 X(原 Twitter)上说强化å¦ä¹ 现在也能处ç†é‚£äº›å¥–励åé¦ˆä¸æ˜¯å¾ˆç›´æŽ¥çš„领域。这å¯èƒ½æ˜¯è¿™æ¬¡è¿›å±•èƒŒåŽæ›´å¤§çš„çªç ´ä¹‹ä¸€ã€‚还有人æåˆ°ã€ŒéªŒè¯çš„éžå¯¹ç§°æ€§ã€ï¼Œè¯´æœ‰äº›ä»»åŠ¡ä½ åšå‡ºæ¥çš„æ—¶é—´å¯èƒ½æ¯”éªŒè¯æ—¶é—´è¿˜çŸã€‚IMO æ•°å¦é¢˜å°±å±žäºŽè¿™ç§ç±»åž‹ã€‚ 戴雨森:有å¯èƒ½ã€‚ä½†å…‰æ˜¯ç»™å‡ºè¯æ˜Žè¿™ä¸€ç‚¹ï¼Œå…¶å®žå°±å·²ç»æ˜¯è´¨çš„飞跃。现在我们还ä¸çŸ¥é“所有细节,但我们期待更多公开信æ¯ï¼Œæˆ–其他模型公å¸å¤åˆ»ç±»ä¼¼æˆæžœã€‚æŒ‰ç…§ç›®å‰ AI çš„å‘展速度,åªè¦ä¸€ä»¶äº‹è¢«åšåˆ°ï¼Œé‚£å®ƒå°±å·²ç»ä¸æ˜¯é¥ä¸å¯åŠçš„难题了。 æˆ´é›¨æ£®ï¼šæˆ‘è§‰å¾—è¿™åæ˜ 了 OpenAI 作为 AI çš„é¢†å¤´ç¾Šã€æœ€å¤§çš„ AI 应用公å¸ï¼Œä»–们也把 Agent 作为é‡è¦çš„æ–¹å‘ã€‚å°±åƒæˆ‘们年åˆå°±å¼€å§‹è®¨è®ºçš„:ç†è§£ç›®æ ‡ã€æ‹†è§£è§„划ã€ç¼–程使用工具ã€å¯¹ç»“果进行å¤ç›˜å’Œåæ€ã€‚从一开始的构想,到 Devinã€Manus ç‰ç¬¬ä¸€æ³¢äº§å“的出现,å†åˆ° ChatGPT Agent çš„å‘布,Agent ç¡®å®žé€æ¸æˆä¸ºäº† AI åº”ç”¨çš„å…±è¯†ï¼Œå˜æˆäº†å¤§å®¶èšç„¦çš„æ–¹å‘。 戴雨森:我们ä¸ä¼šè¿™ä¹ˆæƒ³ã€‚我觉得ä¸èƒ½ä½Žä¼° OpenAIã€‚ä»–ä»¬æœ‰æœ€å¤šçš„äººã€æœ€å¤šçš„å¡ã€æœ€å¤šçš„用户,在安全性上也åšäº†å¾ˆå¤šè€ƒé‡ï¼ŒåŠ äº†å¾ˆå¤šé¢å¤–约æŸã€‚其实 ChatGPT Agent 的能力是被é™åˆ¶å¾—很æ»çš„,这是负责任的表现。 这个产å“也是他们第一个在 AI 安全性评估ä¸è¢«åˆ—为「高å±é™©çº§åˆ«ã€çš„,说明他们确实担心这类 Agent 会é‡åˆ°æ¯”å¦‚é’“é±¼ç½‘ç«™ã€æˆ–者生物æ¦å™¨ä¿¡æ¯ç‰é£Žé™©ï¼ˆè¯¦è§ OpenAI å‘布的 ChatGPT agent System Card)。当公å¸å˜å¤§ï¼Œå°±ä¼šå˜å¾—更谨慎;这也å过æ¥è¯´æ˜Žäº†åˆ›ä¸šå…¬å¸çš„è¡ŒåŠ¨åŠ›å¿«ã€æ•¢äºŽçªç ´çš„æœºä¼šæ‰€åœ¨ã€‚ 戴雨森:是的,Manus 确实探索出了一个方å‘:让 AI 在åšä»€ä¹ˆå¯ä»¥è¢«ç›´è§‚看到,让人ç†è§£èƒŒæ™¯ï¼Œå¦åˆ™å¦‚æžœåªçœ‹åˆ°æœ€åŽçš„结果,会很困扰。所以我们看到 Manusã€Gensparkã€Kimi,还有 MiniMax ç‰ä¸å›½å›¢é˜Ÿä¹Ÿåœ¨é’ˆå¯¹ OpenAI çš„ Task,用自己已ç»å‘布的线上 Agent åšå¯¹æ¯”。ä¸å¾—ä¸è¯´ï¼Œè¿™äº›å…¬å¸çš„产å“åœ¨å¾ˆå¤šç»´åº¦ä¸Šçš„è¡¨çŽ°ï¼Œæ¯”å¦‚åš PPT 的任务,确实比 ChatGPT Agent è¦å¥½ã€‚ 第二,所谓的「套壳ã€äº§å“,也就是调用 API 的应用,并ä¸ä¼šå°±ä¸€å®šè¢« model native 产å“åŠæ‰“。之å‰å¤§å®¶ä»¥ä¸º OpenAI 下场,è®ç»ƒçš„æ¨¡åž‹èƒ½ç«¯åˆ°ç«¯å¤„ç†ï¼Œå°±èƒ½å®Œå…¨æ›¿ä»£ç¬¬ä¸‰æ–¹ã€‚但其实ä¸ç„¶ï¼Œå°¤å…¶ Agent éœ€è¦æ›´å¤š context 和工具,很多都ä¾èµ–壳和应用本身æä¾›çš„环境。 Manus 分享的那篇关于 Context Engineering çš„æ–‡ç« ã€Šå¦‚ä½•ç³»ç»Ÿæ€§æ‰“é€ AI Agent çš„ä¸Šä¸‹æ–‡å·¥ç¨‹ï¼Ÿã€‹å°±æ”¶åˆ°å¾ˆå¤šå¥½è¯„ã€‚å› ä¸ºè¿™å°±æ˜¯ä¸€ä¸ªå¤§å®¶çŽ°åœ¨éƒ½åœ¨è§£å†³çš„é—®é¢˜ï¼Œé‡Œé¢æœ‰å¾ˆå¤šå®žè·µæ˜¯éœ€è¦æ—¶é—´å’Œç»éªŒçš„。 我ç†è§£ï¼ŒContext Engineering 最早是æ¥è‡ªäºŽ Prompt Engineering。Prompt Engineering 就是给 AI 一个命令ã€ä¸€ä¸ªä»»åŠ¡ï¼Œç„¶åŽ AI 自己去åšäº‹ã€‚这很åƒä¼ ç»Ÿç®¡ç†æ–¹å¼ï¼šè€æ¿å¸ƒç½®ä»»åŠ¡ï¼Œå‘˜å·¥åŽ»æ‰§è¡Œã€‚è€Œåƒ Netflixã€å—节ç‰å…ˆè¿›å…¬å¸å¼ºè°ƒçš„「Context, not controlã€ï¼Œæ„味ç€è¦ç»™å‘˜å·¥æ›´å¤šä¸Šä¸‹æ–‡å’ŒæŽˆæƒï¼Œæ‰èƒ½æ›´å¥½å®Œæˆä»»åŠ¡ã€‚Context Engineering 也是类似的é“ç†ï¼šæˆ‘们è¦ç»™æ¨¡åž‹æä¾›çš„æ˜¯èƒ½å¤Ÿå¸®åŠ©å®ƒæ›´å¥½å®Œæˆä»»åŠ¡çš„ä¸Šä¸‹æ–‡ã€‚ 第二个层é¢ï¼Œæ˜¯å¤š session 或跨 session 的个性化记忆:比如说今天åšäº†ä»€ä¹ˆï¼Œæ˜Žå¤©å†åšå¯¹åº”的事,用户的å好ã€ä¹ 惯ã€å·¥ä½œç»éªŒï¼Œèƒ½ä¸èƒ½ç´¯ç§¯ï¼Ÿè¿™ä¸ªé•¿æœŸå¯èƒ½æˆä¸ºæŠ¤åŸŽæ²³ã€‚å› ä¸ºåŒæ ·çš„æ¨¡åž‹ï¼Œè°æœ‰æ›´å¥½çš„上下文,它就更懂我。 第三个层é¢ï¼Œæ˜¯äº§å“设计本身å¯ä»¥æä¾›æ¨¡åž‹åŽŸæœ¬èŽ·å–ä¸åˆ°çš„上下文。比如大家设想的一个还没åšå‡ºæ¥çš„产å“:戴个眼镜å¯ä»¥å®žæ—¶çœ‹åˆ°å‘¨å›´ä¸–ç•Œã€‚è¿™æ ·çš„ context æ˜¯æ¨¡åž‹è‡ªå·±æ— æ³•äº§ç”Ÿçš„ï¼Œå¿…é¡»é€šè¿‡å¥½çš„ç¡¬ä»¶ä¸Žè½¯ä»¶è®¾è®¡æ¥å®žçŽ°ï¼Œä¹Ÿè¯´æ˜Žäº†äº§å“层的价值。 模型这æ¡çº¿ï¼ŒOpenAI 这周刚拿下了 IMO 金牌,说明它的进æ¥é€Ÿåº¦è¿˜æ˜¯å¾ˆå¿«ã€‚而 OpenAI 自己åšçš„ ChatGPT Agent 还有很大æå‡ç©ºé—´ï¼Œè¯´æ˜Žã€Œå£³ã€çš„价值也éžå¸¸é‡è¦ã€‚所以我觉得模型和应用都被低估了。 æ™šç‚¹ï¼šä½ åˆšè¯´çš„ context 的价值特别好。它其实和管ç†å¦ä¹Ÿæ‰“通了,比如 Netflix 的那本书《No Rules Rules》最开始就讲了这个逻辑。AI 确实很åƒä¸€ä¸ªäººï¼Œä½ è¦æ•™å®ƒã€è¦ç»™ä¸Šä¸‹æ–‡ï¼Œæ¯”起给它具体指令,这å¯èƒ½æ˜¯æ›´å¥½çš„æ–¹å¼ã€‚ 戴雨森:第一阶段大家都在写更好的 prompt,就åƒè€æ¿å†™ briefã€‚åŽæ¥å‘现è¦åŠ æ›´å¤šç¤ºä¾‹ã€æ›´å¥½çš„ä¸Šä¸‹æ–‡ã€æ›´é€‚åˆæ¨¡åž‹å·¥ä½œçš„çŽ¯å¢ƒã€‚è¿™å…¶ä¸æœ‰å¾ˆå¤šå…·ä½“技巧。Manus çš„æ–‡ç« å°±åˆ†äº«äº†å¾ˆå¤šã€‚æˆ‘æƒ³è¯´çš„æ˜¯ï¼Œæ›´å¤šçš„ Context å¸¦æ¥æ¨¡åž‹èƒ½åŠ›çš„æå‡ï¼Œä¹Ÿåæ˜ å‡ºæˆ‘ä»¬å¯¹ AI 的使用越æ¥è¶Šæ·±å…¥ï¼Œäº§å“本身也越æ¥è¶Šå®Œå–„。以å‰ä¸€å¥ prompt å°±èƒ½è·‘ï¼ŒçŽ°åœ¨äº§å“æœ¬èº«è¦æ‰¿æ‹…更多事情,产å“å…¬å¸çš„价值也在这里体现。 æ™šç‚¹ï¼šä½ è§‰å¾—è¿™ä¸€å±‚çš„åº”ç”¨ä»·å€¼ï¼Œä»€ä¹ˆæ—¶å€™ä¼šè¢«æ¨¡åž‹æœ¬èº«åšæŽ‰ï¼Ÿæ˜¯ä¸æ˜¯ç‰åˆ°æ¨¡åž‹å…·å¤‡åœ¨çº¿å¦ä¹ 能力ã€èƒ½ä¸æ–叿”¶æ–°çš„上下文的时候? æ™šç‚¹ï¼šæ‰€ä»¥æ˜¯ä¸æ˜¯åˆå›žåˆ°ä¸€ä¸ªæ›¾ç»è¢«å¦è®¤çš„逻辑?以å‰ç§»åŠ¨äº’è”网时代,用户越多,数æ®å馈越多,推è越准,有一个数æ®é£žè½®ã€‚ä½†åŽæ¥å¤§å®¶è§‰å¾—大模型里用户输入对模型智能æå‡æ²¡å•¥å¸®åŠ©ã€‚ä½†ä½ åˆšåˆšçš„æ„æ€æ˜¯ï¼šç”¨æˆ·è¾“入对上下文是有帮助的。 戴雨森:这是两个ä¸åŒçš„问题。大家说的数æ®é£žè½®å¤±æ•ˆï¼ŒæŒ‡çš„æ˜¯ç”¨æˆ·çš„èŠå¤©è®°å½•ä¸èƒ½æå‡æ¨¡åž‹æ™ºèƒ½ã€‚è¿™æˆ‘åŒæ„ã€‚å› ä¸ºçŽ°åœ¨æ¨¡åž‹çš„æ™ºèƒ½å·²ç»è¶…è¿‡æ™®é€šäººã€‚ä½ è·Ÿå®ƒèŠäº›æ—¥å¸¸è¯é¢˜ï¼Œæ²¡æ³•æå‡å®ƒçš„能力。 最开始模型通过 RLHF(人类å馈强化å¦ä¹ ) æ¥å¦ä¹ 人类å好,现在æ¥çœ‹æ™®é€šäººå馈æ„义ä¸å¤§ã€‚比如 AI 都能解 IMO 的题了,为什么还è¦åœ¨æ„æ™®é€šäººè§‰å¾—å“ªä¸ªç”æ¡ˆæ›´å¥½ï¼Ÿæ‰€ä»¥å¯¹äºŽæœ‰æ ‡å‡†ç”案的任务,用户输入越æ¥è¶Šæ²¡ä»€ä¹ˆä»·å€¼ã€‚ æˆ´é›¨æ£®ï¼šæ˜¯çš„ï¼Œå°¤å…¶æ˜¯åœ¨æ™ºèƒ½èƒ½åŠ›æˆ–è€…é‚£ç§æœ‰æ ‡å‡†ç”案的任务上。最开始大模型å¯ä»¥çœ‹ä½œæ˜¯å¯¹å¤§é‡äººç±»å¹³å‡æ™ºèƒ½çš„一ç§åŽ‹ç¼©ã€‚å½“æ—¶ç‰¹å¾·Â·å§œï¼ˆTed Chiangï¼‰ä¸æ˜¯å°±è¯´è¿‡ï¼Œè¯è¨€æ¨¡åž‹æœ¬è´¨ä¸Šæ˜¯å¯¹äº’è”网的模糊压缩å—?但现在,它显然已ç»è¶…越了普通人的水平,达到了æŸç§è¶…人水平。在这个阶段,简å•的数æ®å¯èƒ½å°±æ²¡é‚£ä¹ˆæœ‰ç”¨äº†ã€‚ æ™šç‚¹ï¼šçŽ°åœ¨è¿™ä¸ªæ—¶é—´ç‚¹ï¼Œæ˜¯è¶Šæ—©åš Agent 越好å—ï¼Ÿå› ä¸ºä½ ç§¯ç´¯çš„ç”¨æˆ·ä¸Šä¸‹æ–‡è¶Šå¤šï¼Œä»·å€¼ä¹Ÿè¶Šå¤§ã€‚ä¹‹å‰å¤§å®¶å¯èƒ½æ‹…å¿ƒæ–°çš„å¼ºæ¨¡åž‹ä¼šæŠŠå·²æœ‰äº§å“æ·¹æ²¡æŽ‰ã€‚ æ™šç‚¹ï¼šä¸Šæ¬¡æˆ‘ä»¬èŠæ˜¯äºŒæœˆä»½ï¼Œè½¬çœ¼åˆ°çŽ°åœ¨å·®ä¸å¤šäº”个月了。今年已ç»è¿‡å޻䏀åŠï¼Œå›žå¤´çœ‹ï¼Œä½ 觉得 2025 年上åŠå¹´ AI 领域å‘ç”Ÿçš„å‡ ä»¶æœ€é‡è¦çš„事是什么? 戴雨森:整体æ¥è¯´ï¼ŒAI å·²ç»ä»Žä¸€ä¸ªåç ”ç©¶æ€§è´¨ã€çœ‹èµ·æ¥å¾ˆæ–°é¢–但实用性有é™çš„æŠ€æœ¯ï¼Œè¿›å…¥åˆ°äº†ä¸»æµå¸‚场。上åŠå¹´æˆ‘è®¤ä¸ºæœ‰å‡ ä¸ªé‡å¤§è¿›å±•。 第一,是 AI 在编程领域的çªç ´ã€‚Coding å·²ç»æˆä¸º AI 应用的é‡ä¸ä¹‹é‡ã€‚我今天还å¬è¯´ OpenAI çŽ°åœ¨å·²ç»æœ‰ä¸‰ä¸ªä¸šåŠ¡çº¿ï¼šGPTã€API å’Œ Coding。用户也å‘现 AI coding 产å“éžå¸¸æœ‰ç”¨ï¼Œä¹Ÿæ„¿æ„为æ¤ä»˜è´¹ã€‚Cursor ç‰ AI 编程工具的æˆé•¿é€Ÿåº¦å°±æ˜¯ä¸€ä¸ªä»£è¡¨ã€‚Claude Code 也有人称是 L3 或 Agent 级别的产å“ï¼Œèƒ½æ¯”äººç±»å†™å¾—æ›´å¿«æ›´å¥½ï¼Œä»£ç æ›´ä¼˜é›…ï¼Œè¿˜èƒ½å¤„ç†æ›´å¤§çš„代ç 库。所以 AI åœ¨ç¼–ç¨‹é¢†åŸŸå·²ç»æ£å¼è·¨è¶Šé¸¿æ²Ÿï¼Œè¿›å…¥äº†ä¸»æµå¸‚场。 第二,是 o3 在四月的æ£å¼å‘布,伴éšç€ ChatGPT ç”¨æˆ·çš„é«˜é€Ÿå¢žé•¿ï¼Œè¿™æ˜¯æŽ¨ç†æ¨¡åž‹çš„æŒç»æ¼”进。从去年下åŠå¹´å¼€å§‹æˆ‘们就看到 OpenAI 推出 o1ã€R1,到今年的 o3ï¼Œå®ƒæ ‡å¿—ç€æŽ¨ç†é—®ç”ã€é¢˜è§£è¿™äº›èƒ½åŠ›ä»Žç§‘ç ”å±‚é¢è¿›å…¥åˆ°äº†æ™®é€šç”¨æˆ·å¯ä»¥ä½¿ç”¨çš„产å“,是真æ£çš„è½åœ°äº†ã€‚ ChatGPT 的用户增长还在æŒç»ï¼Œè¿™ä¸€æ³¢ä¹Ÿå—益于 o3 推ç†èƒ½åŠ›çš„æå‡ã€‚我们也看到年åˆä¸å›½è¿™è¾¹çš„çªç ´ï¼Œæ¯”如 R1 是国内在 reasoning 上迈出的é‡è¦ä¸€æ¥ï¼ŒKimi Researcher 也是第一个广泛å¯ç”¨çš„ deep research 类产å“,用户å馈很好。AI åœ¨è¿™ä¸ªé¢†åŸŸå·²ç»æ¯”ç»å¤§å¤šæ•°äººåšå¾—更好了,也是跨越鸿沟。 第三,是 Agent 应用开始普åŠã€‚比如 Devin 是第一个让人看到 L3 Agent prototype 的产å“。Manus å’Œ Genspark 都是在三月å‘布,Claude Code ä¹Ÿåœ¨ä¸æ–完善。我们看到éšç€æ¨¡åž‹åœ¨æŽ¨ç†ã€ç¼–程ã€å·¥å…·ä½¿ç”¨è¿™ä¸‰å¤§èƒ½åŠ›çš„å¢žå¼ºï¼Œå‡ºçŽ°äº†ç¬¬ä¸€æ‰¹å…·å¤‡å®Œæ•´ Agent å½¢æ€çš„产å“ï¼šå®ƒä»¬èƒ½æŽ¥æ”¶æ¨¡ç³Šç›®æ ‡ï¼Œè‡ªä¸»è°ƒç”¨å·¥å…·ï¼Œå¯»æ‰¾è§£å†³æ–¹æ¡ˆï¼Œè¯„ä¼°ä»»åŠ¡è¿›åº¦ï¼Œå¹¶æœ€ç»ˆå®Œæˆä»»åŠ¡ã€‚è™½ç„¶å®ƒä»¬è¿˜ä¸ç®—主æµï¼Œä½†å·²ç»è¿›å…¥ Early Adopter 阶段,部分场景下用户éžå¸¸æ„¿æ„用。尽管还有ä¸å°‘问题,但 Agent å·²ç»å˜å¾—有用了,这是上åŠå¹´ AI 应用领域最é‡è¦çš„进展之一。 第四,是多模æ€èƒ½åŠ›çš„å¿«é€Ÿè¿›æ¥ï¼Œå°¤å…¶æ˜¯å›¾åƒç”Ÿæˆã€‚从早期åƒçŽ©å…·ä¸€æ ·çš„å·¥å…·ï¼Œå˜æˆäº†å®žå®žåœ¨åœ¨çš„生产力工具。比如 ChatGPT 的图åƒç”Ÿæˆå¯¹è¯ä¹‰çš„è·Ÿéšéžå¸¸å¥½ï¼Œèƒ½å‡†ç¡®ç†è§£ç”¨æˆ·æ„图。现在很多人用 AI æ¥ç”»æ¼«ç”»ã€ç”»æµç¨‹å›¾ã€åšè§†è§‰å†…容。这ç§ç”Ÿæˆèƒ½åŠ›çš„æå‡å·²ç»å˜å¾—éžå¸¸å®žç”¨ã€‚ æˆ´é›¨æ£®ï¼šå¯¹ï¼Œå› ä¸ºå®ƒçš„æŒ‡ä»¤è·Ÿéšèƒ½åŠ›è¶Šæ¥è¶Šå¼ºï¼Œèƒ½æ›´å¥½æ»¡è¶³ç”¨æˆ·éœ€æ±‚ã€‚åŽŸæ¥æ˜¯åƒæŠ½å¡é‚£æ ·çš„ä¸ç¡®å®šæ€§ï¼ŒçŽ°åœ¨å·²ç»è¶Šæ¥è¶Šå¥½äº†ã€‚ç›´æ’头åƒå¥½å¤šéƒ½å˜æˆäº† AI 生æˆçš„。 Veo3 ä¹Ÿæ˜¯ä¸€ä¸ªå¾ˆåŽ‰å®³çš„æ¨¡åž‹ã€‚å®ƒåŠ å…¥è¯éŸ³é…音åŽï¼Œæˆ‘å‘了个朋å‹åœˆæ„Ÿå¹ï¼Œå®ƒç”Ÿæˆçš„ä¸–ç•Œå·²ç»æŽ¥è¿‘çœŸç›¸éš¾è¾¨çš„è™šæ‹Ÿä¸–ç•Œäº†ã€‚Veo3 第一次让我有一ç§è·¨è¶Šææ€–谷的感觉,真å‡éš¾è¾¨ã€‚ ç¬¬äº”ï¼Œæ˜¯æŠ¢äººå¤§æˆ˜ã€‚æ— è®ºæ˜¯ Meta 的大规模挖人,还是创业公å¸ç–¯ç‹‚èžèµ„,å†åˆ° Windsurf 最近收è´çš„ drama,都说明硅谷对人æ‰çš„争夺和资本竞争进入了一个新的阶段。我们在国内也感å—到类似çƒåº¦ï¼šèžèµ„é¢ä¸Šå‡ã€é¡¹ç›®æŠ¢æ‰‹ã€ä¸€ä¸ªæœˆèžèµ„å‡ è½®çš„æƒ…å†µåˆå‡ºçŽ°äº†ã€‚è¿™èƒŒåŽæ˜¯å› 为大家真的看到了 AI æ£åœ¨è½åœ°ï¼Œä¸å†åªæ˜¯æ¦‚念,很多已ç»å®žå®žåœ¨åœ¨åœ°äº§ç”Ÿæ”¶å…¥äº†ã€‚ 戴雨森:我们认为模型基础能力的æå‡æ˜¯è§£é”应用场景的关键。模型能力é…åˆå¥½çš„产å“设计,æ‰èƒ½çœŸæ£é‡Šæ”¾ä»·å€¼ã€‚ä¸€ä¸ªçœŸæ£æœ‰ä»·å€¼çš„ AI 应用,一定能通过æŸç§æ–¹å¼è®©ç”¨æˆ·ä»˜è´¹ï¼Œæ¯”如订阅或按工作交付。所以我们特别关注 AI 在æå‡ç”Ÿäº§åŠ›æ–¹é¢çš„价值,尤其是在数å—世界里的应用。å¯ä»¥çœ‹åˆ°æˆ‘们投的很多是 AI Agent 或者 AI 生产力方å‘çš„é¡¹ç›®ï¼Œå› ä¸ºè¿™æ˜¯å½“ä¸‹æœ€èƒ½çœŸæ£å¸®ç”¨æˆ·è§£å†³é—®é¢˜çš„场景。 戴雨森:是的,但我认为上åŠå¹´æœ‰ä¸€ä¸ªè¢«é«˜ä¼°çš„æ–¹å‘,就是人形机器人。特斯拉最近下调了对 Optimus 的生产预期,我觉得很有代表性。 去年我就说过,大家对 Optimus 进工厂打螺ä¸çš„æœŸå¾…值太高了。当时有人说 2025 年特斯拉就能有一万个机器人进厂干活,这完全低估了 manipulation(æ“作控制)的难度。现在我们看到的一些 demo 确实越æ¥è¶Šå¥½ï¼Œæ¯”如å è¡£æœï¼Œä½†çœŸçš„è¦æœºå™¨äººåšå‡ºä¸€æ¯å’–啡,还是éžå¸¸éš¾çš„。 当然,我认为这个领域还在快速å‘展,在未æ¥å‡ å¹´å¯èƒ½ä¼šçœ‹åˆ° manipulation 的「ChatGPT 时刻ã€çªç ´ï¼Œä½†å¦‚果期待 2025 年就能大规模è½åœ°ï¼Œæˆ‘觉得是大大高估了。 技术的å‘展ä¸èƒ½æ‹”苗助长,必须ç»åŽ†ï¼šæ–¹å‘确定ã€é€æ¸æ”¾å¤§ã€å½¢æˆäº§å“ã€å†åˆ°å¤§è§„模è½åœ°ï¼Œè¿™å‡ ä¸ªé˜¶æ®µï¼Œæ²¡æ³•è·³è¿‡ã€‚æœºå™¨äººç›®å‰æ˜¾ç„¶è¿˜å¤„在早期探索阶段。 戴雨森:我觉得首先,应用的价值还是在被低估的。一年å‰ï¼Œå¤§å®¶è¿˜åœ¨è®²æ¨¡åž‹å…¬å¸ä¼šé¢ 覆应用公å¸ï¼Œè¯´ã€Œåº”ç”¨åªæ˜¯å¥—壳ã€ï¼Œè¿™ä¸ªä¸šåŠ¡æ¨¡å¼ä¸æˆç«‹ã€‚当时ä¸ç®¡æ˜¯ Manusã€Genspark,还是很多其他公å¸ï¼Œéƒ½ç»åŽ†äº†ä¸å°‘è´¨ç–‘ï¼Œè¯´ï¼šã€Œä½ æ˜¯ä¸€ä¸ªå£³å…¬å¸ï¼Œæœ‰æ²¡æœ‰é•¿æœŸä»·å€¼ï¼Ÿæ˜¯ä¸æ˜¯æ¨¡åž‹ä¸€å‡çº§ä½ 就完了?〠现在这个争论虽然还在继ç»ï¼Œä½†æ˜¾ç„¶ä¸æ˜¯æ¨¡åž‹å‡çº§äº†åº”用公å¸å°±ä¼šå®Œè›‹ã€‚相åï¼Œå¥½çš„åº”ç”¨å…¬å¸æ˜¯æœŸå¾…模型å‡çº§çš„ï¼Œè¿™æ ·å¯ä»¥è®©ç”¨æˆ·äº«å—更强大的体验。「壳ã€çš„价值ä»è¢«ä½Žä¼°äº†ã€‚ 大家之å‰å¯èƒ½ä¸ä¼šæ–™åˆ°ï¼Œè‚–弘能åšå‡ºä¸€ä¸ªä¸–界级的 AI åº”ç”¨ã€‚è€Œå‡ å¤©å‰å‘布的 Kimi K2,在 7 月 15 日这个时间点,å¯ä»¥è¯´æ˜¯å…¨çƒæœ€å¼ºçš„å¼€æºå¤§æ¨¡åž‹ï¼Œæ²¡æœ‰ä¹‹ä¸€ã€‚它在 codingã€Agent 工作æµå’Œä¸æ–‡å†™ä½œç‰æ–¹é¢çš„表现,确实优于 Claude。当然,Claude 是在年åˆå‘布的,但在 AI 这个领域,å…个月就相当于很久了。 OpenRouter ä¸Šçš„è°ƒç”¨æ•°æ®æ˜¾ç¤ºï¼ŒK2 åˆšä¸Šçº¿æ²¡å‡ å¤©ï¼Œæ˜¨å¤©è¿˜åœ¨ç¼–ç¨‹ç±»ç›®é‡ŒæŽ’ç¬¬ 13,今天就å‡åˆ°äº†ç¬¬ 10,å‰é¢æ˜¯ Claudeã€Geminiã€GPT。这ç§ä¸Šå‡é€Ÿåº¦æ˜¯éžå¸¸å¿«çš„,说明用户å馈éžå¸¸å¥½ã€‚但现在大家其实已ç»å¯¹ benchmark 麻木了,对å§ï¼Ÿæˆ‘们更看é‡å®žé™…用户的使用å馈。 Kimi 是最典型的例åï¼Œä½†ä¸æ˜¯å”¯ä¸€çš„。我们也讨论过 DeepSeek åŽä»–们团队的转型问题,Kimi 背åŽçš„ Moonshot 也ç»åŽ†äº†å¾ˆå¤šå¤ç›˜ï¼Œå¹¶é›†ä¸ç²¾åŠ›æ”»åšä¸‹ä¸€ä»£æ¨¡åž‹ã€‚我觉得外界太容易在很早期就下结论,比如说 DeepSeek 出æ¥çš„å…å°é¾™å…¬å¸æ˜¯ä¸æ˜¯éƒ½ä¸è¡Œäº†ã€‚但实际上,如果一个团队足够稳定,有优秀人æ‰ã€æœ‰èµ„æºã€æœ‰æ„志,那他们的主观能动性和çªç ´ç©ºé—´è¿œè¿œè¢«ä½Žä¼°äº†ã€‚ ç¬¬ä¸‰ï¼Œæˆ‘è§‰å¾—æ¨¡åž‹èƒ½åŠ›è¿›åŒ–çš„é€Ÿåº¦ä¹Ÿè¢«ä½Žä¼°äº†ã€‚æ¯”å¦‚çŽ°åœ¨å·²ç»æœ‰ä¼ 言说 GPT-5 很快就è¦å‘,它å¯èƒ½æ˜¯ä¸€ä¸ªåŽŸç”Ÿå¤šæ¨¡æ€ã€æŽ¨ç†èƒ½åŠ›éžå¸¸å¼ºã€å…·å¤‡é«˜çº§ Agent 能力的模型。 现在新产å“å‘布的时候往往会被喷,说画了大饼但实际上产å“体验没有那么好。但好的应用公å¸éœ€è¦ä¸º 6 到 12 个月åŽçš„æ¨¡åž‹è®¾è®¡ã€‚比如 Cursor 一开始å‘å¸ƒçš„æ—¶å€™ï¼Œå½“æ—¶çš„æ¨¡åž‹è¿˜æ— æ³•å®žçŽ°å®ƒçš„å®Œæ•´æ„¿æ™¯ï¼Œç›´åˆ° Claude 3.5 Sonnet 出æ¥ï¼ŒCursor æ‰çœŸæ£æˆä¸ºä¸€ä¸ªå¥½ç”¨çš„产å“。 Manus 在设计时能用的最好模型是 Sonnet 3.5,å‘布时 Sonnet 3.7 刚上线,Manus å› æ¤èƒ½å¤Ÿå®Œæˆä¸€äº›æ›´å¤æ‚çš„ä»»åŠ¡ï¼Œä¹‹åŽ Claude 4,Gemini 2.5 Pro ç‰æ–°æ¨¡åž‹çš„å‘å¸ƒä¹Ÿè¿›ä¸€æ¥æå‡äº† Manus 的表现。也许å†éœ€è¦ 1-2 个模型的大版本è¿ä»£ï¼Œæ‰èƒ½å¤Ÿå……分让主æµç”¨æˆ·æ„Ÿå—到 Agent 带æ¥çš„生产力æå‡ã€‚ æ‰€ä»¥æˆ‘ä»¬è®¤ä¸ºï¼Œæœªæ¥æ¨¡åž‹çš„能力æå‡ä»ç„¶éžå¸¸å¿«ï¼Œä¹Ÿè®¸å¾ˆå¿«å°±ä¼šæœ‰è®©å¤§å®¶éœ‡æƒŠçš„å‘布出现。那时,模型增长和应用价值å¯èƒ½éƒ½å°†è¶…出市场预期,整个 AI å‘展节å¥ä¹Ÿä¼šå†åº¦åŠ å¿«ã€‚ 晚点:这åŠå¹´è¿˜æœ‰ä¸€ä¸ªæˆ‘之剿²¡æœ‰æƒ³åˆ°çš„æ–°å˜åŒ–,就是最近éžå¸¸æ¿€çƒˆçš„外å–å¤§æˆ˜ã€‚å› ä¸ºå¤–å–å¤§æˆ˜è¿™ä»¶äº‹æƒ…ç‰µæ‰¯äº†å¥½å‡ ä¸ªå·¨å¤´çš„ç²¾åŠ›å’Œèµ„æºï¼ŒåŒ…括阿里ã€ç¾Žå›¢å’Œäº¬ä¸œã€‚ä½ è§‰å¾—è¿™ä¸ªä¼šæ€Žä¹ˆå½±å“ä¸å›½çš„ AI çš„æ ¼å±€ï¼Œæˆ–è€…è¯´å¯¹åˆ›ä¸šå…¬å¸æ¥è¯´ï¼Œå®ƒå¯èƒ½ä¼šæœ‰ä»€ä¹ˆå½±å“? 但我看阿里云的增速预期还是挺高的。今天 Jensen 还宣布å¯ä»¥é‡æ–°å‘ä¸å›½é”€å”® H100。我们看到,今年美国这边的 IDC 和云æœåŠ¡å¢žé•¿å¾—éžå¸¸å¿«ï¼Œå› 为应用è½åœ°ä¹‹å޿ލç†çš„用é‡ä¼šå¤§å¹…增长。 我认为ä¸å›½å¸‚场的å‘展路径也会是类似的。当 Kimiã€å—节ã€DeepSeek ç‰å…¬å¸æŽ¨å‡ºæ›´å¥½çš„æ¨¡åž‹åŽï¼Œæ›´å¤šåœºæ™¯è¢«è§£é”,推ç†çš„算力需求也会很快爆å‘。知识工作者在ä¸ç¾Žå…¶å®žéƒ½å¾ˆåƒï¼Œå¤§å®¶éƒ½ç”¨ Officeã€éƒ½è¦æœç´¢ã€éƒ½ç”¨ deep research 工具,在美国市场已ç»éªŒè¯çš„这些需求场景在ä¸å›½è¿Ÿæ—©ä¹Ÿä¼šçˆ†å‘。 当然这跟外å–大战没什么直接关系。但比如说阿里云ã€ç«å±±äº‘这些ä¸å›½äº‘æœåŠ¡å•†ï¼Œå¯èƒ½ä¹Ÿä¼šç»åŽ†ä¸€æ¬¡ç¾Žå›½é‚£æ ·çš„å¢žé•¿è¿‡ç¨‹ã€‚ 戴雨森:哈哈,这个现在还是挺神秘的,我们也åªèƒ½é€šè¿‡ä¸€äº›å¤–å›´ä¿¡æ¯åŽ»äº†è§£ã€‚æˆ‘å¬è¯´çŽ°åœ¨ V4 还在è®ç»ƒé˜¶æ®µã€‚å› ä¸ºä»–ä»¬å½“æ—¶æ˜¯å…ˆå‘了一个 V3,然åŽå†å‘ R1,那现在 V4 都还没补å‘,å¬è¯´è¿˜åœ¨è®ç»ƒä¸ï¼Œé‚£ R2 çš„å‘布时间å¯èƒ½å°±è¦ç‰åˆ° V4 之åŽäº†ã€‚但我相信 DeepSeek 肯定在åšå¾ˆå¤šæœ‰æ„æ€çš„创新。我们也和里é¢çš„一些åŒå¦èŠè¿‡ï¼ŒçŸ¥é“他们的创新能力是éžå¸¸å¼ºçš„。ä¸è¿‡æˆ‘觉得他们也确实会å—到算力资æºçš„é™åˆ¶ã€‚毕竟å¡çš„æ€»é‡æ˜¯æœ‰é™çš„,而且他们å‘布模型之åŽï¼Œè¿˜æœ‰å¤§é‡çš„算力è¦ç”¨æ¥åšæŽ¨ç†ï¼ˆinference)。 æˆ´é›¨æ£®ï¼šå¯¹ï¼Œè¿™å…¶å®žåæ˜ 了一个很现实的情况:DeepSeek çš„èµ„æºæ²¡æœ‰å¤šåˆ°å¯ä»¥åœ¨æ‰€æœ‰é¢†åŸŸå¯¹æ ‡ SOTAã€‚æ‰€ä»¥å°±åƒ Claude 背åŽçš„ Anthropic ä¸€æ ·ï¼Œä»–ä»¬è¦åšä¸€äº›åˆ¤æ–:哪些方å‘在当å‰é˜¶æ®µæœ€é‡è¦ã€æœ€èƒ½å‡ºç»“果,然åŽé›†ä¸èµ„æºçªç ´ï¼›è€Œå¯¹äºŽä¸€äº›å°šä¸æ˜Žæœ—的方å‘,他们å¯ä»¥ç‰ç‰ï¼Œç‰åˆ°æ€è·¯æ›´æ¸…晰之åŽï¼Œå†åˆ©ç”¨è‡ªå·±çš„工程能力和团队的努力赶上。 而å—节 Seed 现在å¯èƒ½æ˜¯åœ¨è¯•图åšåˆ°å…¨é¢é¢†å…ˆï¼šä»–们有 Edge ç»„åŽ»åšæœ€å‰æ²¿çš„ç ”ç©¶ï¼Œæœ‰ Focus 组去冲击 SOTA,还有 Base ç»„åŽ»åšæœåŠ¡äº§å“åº”ç”¨ã€‚è¿™ç§æ˜¯å…¨æ ˆåž‹çš„布局。 相比之下,DeepSeek 更有选择性,比如é‡ç‚¹çªç ´æ¨¡åž‹æ™ºèƒ½ã€‚当资æºä¸é‚£ä¹ˆå……足时,确实需è¦åšä¸€äº›å–èˆã€‚åƒ Seed è¿™æ ·çš„ç»„ç»‡ç»“æž„ï¼ŒæŠŠ Edgeã€Focusã€Base ä¸‰ä¸ªæ–¹å‘æ˜Žç¡®åˆ†å¼€ï¼Œæˆ‘觉得是更明确的。 æ™šç‚¹ï¼šå¯¹ï¼Œä»–ä»¬çŽ°åœ¨å°±æ˜¯è¿™ç§æ¯”较明确的分工结构。Edge 一开始列了五个方å‘,现在å¯èƒ½å·²ç»æ‰©å±•到了åå‡ ä¸ªé¡¹ç›®ï¼Œç¡®å®žæŒºåŽ‰å®³çš„ã€‚ æˆ´é›¨æ£®ï¼šæˆ‘è§‰å¾—æŠŠåº”ç”¨å’Œç ”ç©¶åˆ†å¼€ï¼Œå†æŠŠç ”ç©¶ä¸çš„ SOTA å’Œ Frontier 部分继ç»ç»†åˆ†ï¼Œæ˜¯æ¯”è¾ƒå¯¹çš„åšæ³•。之å‰å¤§å®¶å¯èƒ½å°±æ˜¯åˆ†æˆ Frontier å’Œ Applied Research,但那时候资æºä¸å¤Ÿï¼Œç»„织的èŒè´£ä¹Ÿä¸å¤Ÿæ˜Žç¡®ã€‚æ™®éçš„é—®é¢˜æ˜¯ï¼šå¦‚æžœä½ è®©ä¸€ä¸ªæ¨¡åž‹å›¢é˜Ÿæ—¢è¦åšå‰æ²¿ç ”ç©¶ã€è¿½èµ¶ SOTA,甚至超越 SOTAï¼ŒåŒæ—¶åˆè¦æ»¡è¶³ App çš„è½åœ°éœ€æ±‚ï¼Œè¿™ä¸¤ä¸ªç›®æ ‡æ˜¯å¾ˆå®¹æ˜“å†²çªçš„。 Kimi 在过去åŠå¹´å…¶å®žä¹Ÿæ€»ç»“了很多这方é¢çš„ç»éªŒã€‚如果有个大用户é‡çš„应用在线上,需è¦èб大é‡ç²¾åŠ›åŽ»ç»´æŠ¤ï¼Œå¤„ç†å„ç§ corner case,修 bugã€‚ä½†è¿™äº›å·¥ä½œå…¶å®žå¯¹æŽ¨åŠ¨ä¸‹ä¸€ä»£æ¨¡åž‹ã€æŒ‘战 SOTA 的帮助是有é™çš„。今年就没有投入太多精力在 K1 çš„è¿ä»£å’Œåº”用功能上,而是专注于åšä¸‹ä¸€ä»£æ¨¡åž‹ï¼Œæ¥æ‹“展模型智能的边界。 æˆ´é›¨æ£®ï¼šç›®å‰æ¥çœ‹ï¼Œæˆ‘觉得还是è¦å…ˆæŠŠä¸€ä¸ªæ–¹å‘åšåˆ°æžè‡´ã€‚æ¯”å¦‚ä½ å¦‚æžœæ˜¯åšåº”用的,那就å‡è®¾è‡ªå·±èƒ½ç”¨ä¸Šæœ€å¥½çš„æ¨¡åž‹ï¼Œè°æœ€å¼ºã€æœ€åˆé€‚就用è°ã€‚ä½†å¦‚æžœä½ æ˜¯åšæ¨¡åž‹çš„ï¼Œé‚£ç›®æ ‡å°±æ˜¯è®©è‡ªå·±çš„æ¨¡åž‹ä¿æŒåœ¨ SOTA 水准,在æŸä¸ªå…·ä½“领域åšåˆ°æœ€å¼ºã€‚ 晚点:我想èŠä¸€ä¸‹ Kimi K2ã€‚ä»Šå¹´å¹´åˆ DeepSeek 引å‘çƒæ½®åŽï¼ŒKimi å†…éƒ¨ä¹Ÿæœ‰äº†ä¸€ä¸ªæ¯”è¾ƒæ˜Žç¡®çš„ç›®æ ‡ï¼Œå°±æ˜¯è¦è¿½æ±‚ SOTAã€‚åœ¨è¿™ä¸ªç›®æ ‡ä¸‹ï¼ŒK2 应该是他们åšå‡ºæ–¹å‘调整åŽç¬¬ä¸€ä¸ªæ¯”较é‡ç£…çš„æˆæžœã€‚ä½ å¯¹è¿™ä¸ªè¿‡ç¨‹æ˜¯æ€Žä¹ˆç†è§£çš„? æˆ´é›¨æ£®ï¼šæˆ‘æƒ³å…ˆè®²ä¸ªå°æ•…事。å‰å‡ 天,暗涌在良渚组织了一个圆桌,把投资了 Kimi å’Œ MiniMax 的投资人都请到一å—ã€‚æˆ‘è¿˜å¼€çŽ©ç¬‘è¯´ï¼Œè¿™åƒæ˜¯ä¸€ä¸ªã€ŒåŒæƒ…å±€ã€ï¼Œä»¿ä½›æˆ‘们投了大模型公å¸ï¼Œå¾ˆæƒ¨è¯¥è¢«åŒæƒ…。但我觉得,其实真æ£ä½“现一个团队能力的,是他们é¢å¯¹æŒ‘战时的应对方å¼ï¼Œä»¥åŠæ˜¯å¦åšæŒè‡ªå·±çš„è·¯çº¿åŽ»åšæœ‰ä»·å€¼çš„创新。 é¡ºé£Žçš„æ—¶å€™æœ‰é¡ºé£Žçš„æ‰“æ³•ï¼Œé€†é£Žçš„æ—¶å€™ä¹Ÿæœ‰é€†é£Žçš„æ‰“æ³•ã€‚åƒ MiniMax,他们专注自己的方å‘,现在也在推进上市æµç¨‹ã€‚这就是他们é¢å¯¹æŒ‘战的方å¼ã€‚当然,也有一些公å¸åœ¨é€†é£Žä¸å†…部团队å‘生较大å˜åŒ–,甚至业务方å‘都有调整。但我觉得 Kimi 特别的一点,是他们的团队éžå¸¸ç¨³å®šã€‚å¦‚æžœä½ çœ‹ä»–ä»¬çš„åˆ›å§‹å›¢é˜Ÿæˆ–æ ¸å¿ƒæˆå‘˜ï¼Œå‡ 乎没有大的å˜åŠ¨ã€‚ 晚点:这其实就是我第一个好奇的点。现在很多公å¸åˆ°äº†è”åˆåˆ›å§‹äººæˆ–æ ¸å¿ƒä¸šåŠ¡è´Ÿè´£äººå±‚é¢ï¼Œéƒ½ä¼šæœ‰ä¸€äº›å˜åŒ–,但 Kimi 基本没怎么å˜ã€‚ 戴雨森:这å¯èƒ½è·Ÿä»–ä»¬çš„å›¢é˜Ÿç»„æˆæœ‰å…³ã€‚Kimi 的创始团队一直是以æ¤éºŸä¸ºæ ¸å¿ƒï¼Œè€Œä¸”æˆå‘˜æ˜¯æ¸…åŽçš„è€åŒå¦ï¼Œä¹‹é—´åˆä½œå¾ˆå¤šï¼Œç”šè‡³æ˜¯å®¤å‹è¿˜ä¸€èµ·çŽ©è¿‡ä¹é˜Ÿã€‚并䏿˜¯å› 为è¦åšå¤§æ¨¡åž‹å…¬å¸æ‰ä¸´æ—¶ç»„èµ·æ¥çš„。 晚点:我查阅资料时å‘çŽ°ï¼Œå½“å¹´æ¨æ¤éºŸåŽ»è¯„ç‰¹å¥–çš„æ—¶å€™ï¼Œæœ‰ä¸€å¼ ç…§ç‰‡æ˜¯ä»–ä»¬ç³»çš„ä¸€äº›åŒå¦ä¸¾ç€æ¨ªå¹…去支æŒä»–ã€‚å‡ ä½ä»–ä»¬ç³»çš„å¸ˆå¼Ÿå¸ˆå¦¹éƒ½ä¼šè¯´æ¨æ¤éºŸåœ¨å½“时就是一个让大家觉得ã€éžå¸¸æœ‰å·å¬åŠ›çš„äººã€‚ 戴雨森:没错,这也是我们从一开始就决定投资他们的é‡è¦åŽŸå› ä¹‹ä¸€ã€‚è¿™ä¸ªå›¢é˜Ÿä¸ä»…有技术,而是有很长的共åŒä¿¡ä»»ã€‚创业会ç»åŽ†å¾ˆå¤šæŒ‘æˆ˜ï¼Œå¦‚åŒåŽ‹åŠ›æµ‹è¯•ï¼Œåœ¨é¢å¯¹æŒ‘战的时候,团队稳定和方å‘èšç„¦ä¼šå¾ˆé‡è¦ã€‚ Kimi è¿™ä¸ªå›¢é˜Ÿä»Žä¸€å¼€å§‹å°±æ˜¯ä»¥æŠ€æœ¯åŸºå› å’ŒæŠ€æœ¯è§†é‡Žä½œä¸ºæ ¸å¿ƒèƒ½åŠ›çš„ã€‚å¾ˆå¤šäººå¯èƒ½å·²ç»å¿˜äº†ï¼Œåœ¨ 2023 年的时候,AI çš„å˜åŒ–å¤ªå¿«ï¼Œå‡ ä¹Žæ¯ä¸ªæœˆéƒ½æœ‰æ–°é£Žå‘。当时,Kimi 就对长文本这个方å‘åšå‡ºäº†å¾ˆé‡è¦çš„判æ–,选择åšäº†ä¸€ä¸ªå…·å¤‡é•¿æ–‡æœ¬èƒ½åŠ›çš„æ¨¡åž‹ï¼Œå¹¶åŸºäºŽè¿™ä¸ªæŽ¨å‡ºäº†å¸¦æœç´¢èƒ½åŠ›çš„ Kimi 第一个版本。 那时大é‡çš„ AI chatbot 其实是没有æœç´¢åŠŸèƒ½çš„ã€‚æ²¡æœ‰æœç´¢ï¼Œæ¨¡åž‹çš„用途就会å—到很大é™åˆ¶ï¼Œæ¯”å¦‚ä½ éšä¾¿é—®ä¸€ä¸ªã€ŒçŽ°åœ¨çš„ç¾Žå›½æ€»ç»Ÿæ˜¯è°ã€ï¼Œå®ƒéƒ½å¯èƒ½ç”ä¸ä¸Šæ¥ã€‚ Kimi 团队当时对长文本技术方å‘的判æ–就展现了他们éžå¸¸å¼ºçš„æŠ€æœ¯ vision。到了 2025 年,AI 更强调 Agent 能力ã€å¤æ‚任务执行ã€ä»¥åŠå¤„ç†æ›´å¤§çš„代ç 库,大家æ‰çœŸæ£æ„识到长文本的é‡è¦æ€§ã€‚å¦‚æžœä½ çœŸçš„è¦è®© AI åšä¸€ä¸ª Agent,完æˆä¸€ä¸ªå¤æ‚任务,它ä¸èƒ½åªæ˜¯æ‰§è¡Œ 100 æ¥å°±æ‡äº†ã€‚回头看,其实这也验è¯äº†æ¤éºŸåˆ¤æ–上的准确。 第二是对技术方å‘çš„åšæŒã€‚他们䏿˜¯çœ‹åˆ°å“ªä¸ªç«å°±å¾€å“ªå„¿è·Ÿé£Žï¼Œæ¯”如陪伴ç«äº†åŽ»åšé™ªä¼´ï¼Œå¤šæ¨¡æ€ç«äº†åˆåŽ»åšå¤šæ¨¡æ€ã€‚很多方å‘都å¯ä»¥åšï¼Œä½†çœŸæ£æœ‰ç§¯ç´¯çš„æ˜¯é‚£äº›æŒç»åšä¸€ä»¶äº‹çš„团队。 当然 R1 çš„æˆåŠŸä¹Ÿç¡®å®žç»™äº†è¡Œä¸šå¾ˆå¤šå¯å‘ï¼Œè¿™ä¸€ç‚¹æ¯«æ— ç–‘é—®ã€‚å½“æ—¶å¾ˆå¤šäººçœ‹åˆ° R1,有个æµè¡Œè¯´æ³•是:「pre-training ä¸é‡è¦ï¼Œpost-training æ‰é‡è¦ã€‚ã€ä½†æˆ‘认为 R1 的基础是 V3,这æ°å¥½è¯´æ˜Žå¥½çš„基础模型很é‡è¦ï¼Œ pre-training 和整体架构优化å¯ä»¥å¸¦æ¥æ¨¡åž‹èƒ½åŠ›çš„æå‡ã€‚K2 现在还是个 non-reasoning 的模型,已ç»å‘ˆçŽ°å‡ºå¾ˆå¥½çš„èƒ½åŠ›ï¼Œè¿™ä¹Ÿè¯´æ˜Ž pre-training ä¾ç„¶å¾ˆé‡è¦ã€‚ å¼€æºä¹Ÿå¾ˆé‡è¦ã€‚çŽ°åœ¨å…¨çƒ AI 社区æ£å¤„于 Early Adopter(早期采用者)阶段,通过开æºä¼˜ç§€çš„æ¨¡åž‹å’Œäº§å“给社区æä¾›ä»·å€¼çš„团队,很容易得到çƒå¿ƒçš„回应。我们在 DeepSeekã€K2ï¼Œä»¥åŠæˆ‘们 sponsor çš„ vLLMã€ControlNET ç‰å¼€æºé¡¹ç›®ä¸çœ‹åˆ°ï¼Œåªè¦ä¸æ–拿出好的产å“ï¼Œä¿æŒå¯¹ç”¨æˆ·å¼€æ”¾äº¤æµçš„æ€åº¦ï¼Œä¸–ç•Œå„地的用户都会欣èµã€æ”¯æŒä½ ï¼Œç”šè‡³ä¸»åŠ¨å¸®ä½ æ”¹è¿›é—®é¢˜ã€‚ä½†åªæ˜¯å¼€æºä¸æœ¬è´¨ï¼Œæœ¬è´¨æ˜¯å¼€æºå¥½çš„ä¸œè¥¿ï¼Œä¸æ˜¯å¼€æºå°±ä¸€å®šå¥½ï¼Œç¤¾åŒºè§‰å¾—å¥½æ‰æ˜¯æ ¸å¿ƒã€‚ 戴雨森:K2 主è¦çš„åœºæ™¯ä¸æ˜¯åœ¨æœ¬åœ°æœºå™¨éƒ¨ç½²ï¼Œäº‹å®žä¸Šè¦åœ¨æœ¬åœ°æ»¡è¡€è·‘ Deepseek R1 也ä¸ç®€å•。开æºçš„æ ¸å¿ƒä¸åœ¨äºŽæœ¬åœ°éƒ¨ç½²ï¼Œè€Œæ˜¯è®©å¤§å®¶å¯¹æ¨¡åž‹æœ‰æ›´å¤šè‡ªä¸»æŠŠæŽ§ã€‚ æ™šç‚¹ï¼šä½ èƒ½æ€»ç»“ä¸‹ä»–ä»¬ä¸ºä»€ä¹ˆèƒ½åšå‡º K2 è¿™ç§çº§åˆ«æ¨¡åž‹ï¼ŸçŽ°å®žè¿‡ç¨‹ä¸é‡åˆ°äº†å“ªäº›æŒ‘战?外部舆论把他们放在低谷,是å¦å¸¦æ¥å¾ˆå¤§åŽ‹åŠ›ï¼Œæ¯”å¦‚äººæ‰æµå¤±ï¼Ÿæˆ‘指的ä¸å…‰æ˜¯æ ¸å¿ƒå±‚,还有一线工程师。 之å‰åšæŠ•æ”¾æ—¶è®¨è®ºè¿‡ï¼Œä»–ä»¬åšæŠ•æ”¾ä¸æ˜¯å¼ºé¡¹ï¼Œä½†çŽ°åœ¨æ˜¯å›žå½’äº†åˆå¿ƒï¼Œåšå›¢é˜Ÿèƒ½åŠ›æœ€å¼ºçš„æ–¹å‘。我觉得这很é‡è¦ã€‚é¢å¯¹å¤–部市场压力,首先ä¸è¦ä¹±ï¼Œè¦èšç„¦è‡ªå·±æœ€æ“…é•¿ã€æœ€èƒ½åšå¥½ã€æœ€æœ‰æ„ä¹‰çš„äº‹æƒ…ã€‚çŸ¥ä¹Žä¸Šä¹Ÿæœ‰å¥½å‡ ä½ Kimi çš„ç ”ç©¶å‘˜å†™äº†å‚与 K2 的很多感想。 在 reasoning æ–¹é¢ï¼Œæˆ‘们看到了 o3ã€o4 mini çš„å‘å¸ƒï¼Œè¿˜æœ‰åŽæ¥çš„ o3 pro。虽然这些模型在一些榜å•上表现进展ä¸å¤§ï¼Œä½†æˆ‘们自己的使用体验是,o3 相比 o1 是一个明显的大å°é˜¶ï¼Œo3 pro 在推ç†é•¿åº¦å’Œé€»è¾‘连贯性上也越æ¥è¶Šå¥½ã€‚现在很多模型在 reasoning 的细节上都有进æ¥ï¼Œæ¯”如细节的幻觉å‡å°‘,推ç†ç»“果更严谨。 åŒæ—¶æˆ‘们还看到,一些å°ä¸€ç‚¹çš„æ¨¡åž‹ä¹Ÿå¼€å§‹å…·å¤‡å¾ˆå¼ºçš„ reasoning èƒ½åŠ›ã€‚åƒ GPQA 或 AIME 这些å应模型 reasoning èƒ½åŠ›çš„æŒ‡æ ‡éƒ½éžå¸¸é«˜ã€‚K2 在这方é¢ä¹Ÿè¡¨çްä¸é”™ã€‚ 晚点:我们之å‰å’Œä¸€äº›äººäº¤æµï¼Œæ¯”如阿里云 CTO 周é–人,他并ä¸è§‰å¾—åƒ o 系列的更新是特别大的范å¼å˜åŒ–。他认为这还是在大模型原有方法框架内的自然延展。 ä¸è¿‡æœ‰æ—¶å€™ï¼Œä¸€ä¸ªæŠ€æœ¯èŒƒå¼å°±å¯ä»¥èµ°å¾—很远。就åƒé«˜é€Ÿå…¬è·¯å¯ä»¥ç”¨å‡ å年,ä¸ä¸€å®šéžè¦æ¯å¹´éƒ½æœ‰é¢ 覆å¼çš„æž¶æž„å˜åŒ–æ‰å«åˆ›æ–°ï¼Œå®žé™…上,如果æ¯å¹´éƒ½æœ‰é¢ 覆å¼çš„æŠ€æœ¯å‘生,那说明这个行业还很ä¸ç¨³å®šï¼Œå而ä¸ä¸€å®šé€‚åˆäº§ä¸šè½åœ°ã€‚今年我们在产业上真æ£èƒ½ç”¨åˆ°çš„æŠ€æœ¯ï¼Œå¹¶ä¸æ˜¯ä»Ž 0 到 1 çš„å˜åŒ–ï¼Œæ›´åƒæ˜¯ä»Ž 1 到 10,甚至从 5 到 8 çš„è¿›åŒ–ã€‚åƒ reasoning 的进æ¥ï¼Œå°±æ˜¯ä»Žå¾ˆå¥½å˜æˆéžå¸¸å¥½ã€‚ 在 coding 上,Sonnet 3.5 å·²ç»å¾ˆä¸é”™äº†ï¼Œä½† context 长度还ä¸å¤Ÿï¼Œè‡ªæˆ‘çº é”™èƒ½åŠ›ä¹Ÿä¸€èˆ¬ã€‚Sonnet 3.7 å’Œ 4 跑在 Claude Code 上效果éžå¸¸å¥½ã€‚坹夿‚代ç ã€é•¿ä»£ç 段,它们常常一æ¥å°±èƒ½åšå¯¹ã€‚è¿™ä¸æ˜¯ä»Ž 0 到 1,而是从 7 到 10 çš„è´¨é‡æå‡ã€‚ 晚点:在基础模型的竞争上,Google 最近的势头也很强。过去两年 OpenAI 横空出世时,Google 给人感觉有点被打懵。但现在 Gemini 2.5 çš„å£ç¢‘和实际使用å馈都很好。 模型层é¢ï¼ŒGoogle çš„ Gemini 2.5 表现éžå¸¸å¥½ã€‚云æœåС层é¢ï¼Œ æä¾›åŒæ ·çš„ Claude API æŽ¨ç†æœåŠ¡ä¸Šï¼ŒGCP 的表现其实更好,这背åŽä¹Ÿç¦»ä¸å¼€ TPU 的支æŒã€‚Google 的实力很强,是现在模型领域å‰ä¸‰åä¸éžå¸¸æœ‰ç«žäº‰åŠ›çš„ä¸€å®¶ã€‚ 但他们现在也有一个现实问题,就是 Google çš„æœç´¢ä¸»ä¸šæ£åœ¨æ‰¿åŽ‹ã€‚å› ä¸ºæ‹…å¿ƒ AI 对æœç´¢å¹¿å‘Šå¸¦æ¥å†²å‡»ï¼Œæ‰€ä»¥å®ƒçš„股价一直在震è¡ã€‚我觉得这就是一个典型例å:è€ä¸šåŠ¡åœ¨å—æŸï¼Œè€Œæ–°ä¸šåŠ¡å¢žé•¿åˆå¾ˆå¿«ã€‚这最终会怎么演化,我觉得å¯èƒ½è¿˜éœ€è¦ä¸€ä¸¤å¹´æ‰èƒ½çœ‹æ¸…。 戴雨森:应用的价值首先å–决于模型本身,也就是模型厂商固化在æƒé‡é‡Œçš„那些基础能力。模型的推ç†èƒ½åŠ›ã€ç¼–程能力越强,应用所能释放的价值就越大。但æƒé‡ä¸€æ—¦å›ºå®šï¼Œå†…容就是æ»çš„,而问题是动æ€çš„,所以需è¦å¼•å…¥ context,现在æµè¡Œçš„ context engineering vs prompt engineering 也说明了 prompt 模型并ä¸å¤Ÿï¼Œè¿˜éœ€è¦æ›´å¤šæ›´å¥½çš„ context。 第一层是通用信æ¯ï¼Œæ¯”å¦‚ã€Œä»Šå¤©çš„å¤©æ°”æ€Žä¹ˆæ ·ï¼Ÿã€è¿™ç±»æ¨¡åž‹æœ¬èº«æ˜¯æ²¡æœ‰çš„,需è¦é€šè¿‡æœç´¢ç‰æ–¹å¼åЍæ€èŽ·å–。虽然现在也有模型能åšç®€å•çš„æœç´¢å·¥ä½œï¼Œä½†è¿™éœ€è¦ç»™æ¨¡åž‹é…备åˆé€‚的工具。 第二层是组织层é¢ï¼Œæ¯”如公å¸å†…部有哪些æµç¨‹ã€æ–‡æ¡£ã€å·²æœ‰çš„çŸ¥è¯†ç§¯ç´¯ã€‚è¿™äº›ä¿¡æ¯æ¨¡åž‹æœ¬èº«ä¹Ÿä¸çŸ¥é“,需è¦é€šè¿‡åº”用层与模型å作,让模型指导人去调用这些信æ¯ã€‚比如一个人和 AI 的对è¯åކå²ã€ä¸ªäººå好ã€èƒŒæ™¯ä¿¡æ¯ç‰ï¼Œè¿™äº›æ¨¡åž‹ä¹Ÿä¸å…·å¤‡ï¼Œå¿…é¡»ç”±åº”ç”¨å±‚æ¥æä¾›ã€‚ AI çš„ç›®æ ‡ä¸åªæ˜¯æˆä¸ºä¸€ä¸ªé—®ç”机器,最终它是è¦çœŸæ£å¸®ç”¨æˆ·å®Œæˆäº‹æƒ…。那在åšäº‹æƒ…的时候,它能调用哪些工具ã€å½±å“ä»€ä¹ˆç»“æžœï¼Œè¿™äº›ä¹Ÿæ˜¯ç”±åº”ç”¨å±‚å…¬å¸æä¾›çš„ã€‚æ¯”å¦‚äº§å“æä¾›äº†å“ªäº›å…¬æœ‰æˆ–ç§æœ‰çš„ MCP 工具,或者最终 AI 能把它的输出结果部署在什么环境上。 æ‰€ä»¥æˆ‘è§‰å¾—æ¨¡åž‹å…¶å®žåªæ˜¯æœ€åº•层的那一å—ã€‚åªæ˜¯å› 为在 ChatGPT 刚出æ¥çš„æ—¶å€™ï¼Œæˆ‘ä»¬å¤§å¤šæ•°ä½¿ç”¨åœºæ™¯éƒ½æ˜¯åœ¨ã€Œé—®ã€æ¨¡åž‹ï¼Œä¹Ÿå°±æ˜¯æå–它通过压缩已有知识获得的回ç”ã€‚æ¯”å¦‚é—®ä¸€ä¸ªäº‹å®žç±»çš„é—®é¢˜ï¼Œè¿™ç§æƒ…况下确实主è¦é æ¨¡åž‹æœ¬èº«ã€‚ä½†å½“ä»»åŠ¡æ›´å¤æ‚ã€æ¨¡åž‹çš„æ™ºåŠ›éœ€è¦ä¸Ž contextã€ç”šè‡³ environment é…åˆæ‰èƒ½å‘挥作用时,那就是「壳ã€çš„价值了。 戴雨森:大家那时候肯定觉得 Google 有点è½åŽï¼Œè¢« OpenAI 抢了风头,很多人æ‰ä¹Ÿé€‰æ‹©å‡ºèµ°ã€‚ä½†åŽæ¥ Google çš„è”åˆåˆ›å§‹äºº Sergey Brin 回归公å¸ä¹‹åŽï¼Œå¾ˆå¤šäº‹æƒ…å‘生了å˜åŒ–ã€‚æ¯”å¦‚æœ‰ä¼ é—»è¯´ Google æ”¶è´çš„ Character.ai 创始人 Noam Shazeer 回去åŽäº²è‡ªæ”¹äº†ä¸€ä¸ª bug,直接让模型性能大幅æå‡ã€‚真å‡ä¸ç¡®å®šï¼Œä½†å…³é”®äººæ‰ç¡®å®žèƒ½è§£å†³é—®é¢˜ã€‚ 最近 Y Combinator 的创业è¥ä¹Ÿæåˆ°ï¼ŒçŽ°åœ¨åšä»»ä½•å…¬å¸ï¼Œéƒ½åº”该以「AGI 两年内实现ã€ä¸ºå‰æå‡è®¾ã€‚ä½ è¦æ€è€ƒï¼šå‡è®¾ AGI ä¸¤å¹´å†…å®žçŽ°ï¼Œé‚£ä½ çš„å…¬å¸è¯¥æ€Žä¹ˆåšï¼Ÿ 当然 AGI åˆ°åº•æ˜¯ä»€ä¹ˆè¿˜æœ‰å¾ˆå¤šäº‰è®®ï¼Œä½†æ¯«æ— ç–‘é—®å·¨å¤§çš„å˜åŒ–æ£åœ¨å‘生,而且是快速å‘生。现在硅谷å¦è®¡ç®—机的å¦ç”Ÿæ‰¾å·¥ä½œéƒ½å˜éš¾äº†ï¼Œå› 为åˆçº§ç¨‹åºå‘˜çš„工作已ç»è¢« AI 替代了很多,很多å˜åŒ–是实实在在å‘生的。 æ™šç‚¹ï¼šæˆ‘ä»¬å›žåˆ°ä½ è¯´çš„ä¸‰æ¡ä¸»çº¿ã€‚我们讲了推ç†å’Œç¼–ç¨‹ï¼ŒçŽ°åœ¨è®²å·¥å…·ä½¿ç”¨ã€‚æœ€è¿‘åƒ Kimi K2 å’Œ Grok 都在è®ç»ƒé˜¶æ®µå°±åŠ å…¥äº†ä½¿ç”¨å·¥å…·çš„èƒ½åŠ›ã€‚è¿™æ˜¯æ–°è¶‹åŠ¿å—? è¿™ä¸¤ç§æ–¹å¼éƒ½æœ‰äººåœ¨åšï¼ŒçŽ°åœ¨åƒ MCP è¿™æ ·çš„ç”Ÿæ€å·²ç»å»ºç«‹èµ·æ¥äº†ï¼Œè¶Šæ¥è¶Šå¤šä¸º AI æå»ºçš„工具å˜å¾—å¯ç”¨ã€‚åˆæ¯”如 Manus å’Œ OpenAI çš„ Operator 用的是沙盒虚拟机里é¢çš„æµè§ˆå™¨ã€é€šè¿‡è§†è§‰æ“作æµè§ˆå™¨ç‰å·²æœ‰çš„软件,模拟人类的使用过程,目的是让 AI 更好地调用已有软件的功能。 戴雨森:对,之å‰å¼ 祥雨有个æ’客讲得特别好,我很认åŒä»–的分æžã€‚第一个阶段是 chatbot,对应 ChatGPT;第二个阶段是 reasoning,对应 o 系列模型;第三阶段的 Agent 对应的是 Agent-native 模型,但目å‰å¥½åƒè¿˜æ²¡æœ‰çœŸæ£å‡ºçŽ°ã€‚ 在 Agent 的定义ä¸ï¼Œç›®æ ‡æ˜¯ AI 自己去寻找的,但目å‰ç›®æ ‡ä»ç”±äººç»™å®šã€‚Agent æ˜¯è¯´ï¼Œæˆ‘ç»™ä½ ä¸€ä¸ªç›®æ ‡åŽï¼Œå®ƒåŽ»é¢„æµ‹ä½¿ç”¨å·¥å…·çš„åºåˆ—,选择什么工具完æˆä»»åŠ¡ã€‚å®ƒå¯èƒ½è¿˜æ²¡åšåˆ°åƒç»™å‘˜å·¥å®Œæˆä»»åŠ¡é‚£æ ·ï¼Œè‡ªå·±æ‹†åˆ†ä»»åŠ¡å’Œå®šä¹‰ç›®æ ‡ã€‚ 现在 AI Agent 这一类产å“还处于éžå¸¸æ—©æœŸé˜¶æ®µã€‚比如 Manus æ‰åˆšæŽ¨å‡ºå‡ 个月,但我觉得一年甚至åŠå¹´åŽï¼Œéšç€æ¨¡åž‹èƒ½åŠ›æå‡ï¼Œè¿™ç±»äº§å“的能力会大幅增强。 我想说的是,ä¸åŒå…¬å¸å› 为资æºç¦€èµ‹ä¸åŒï¼Œè§£å†³ Agent 这个问题的方å¼ä¹Ÿä¼šæœ‰å·®å¼‚。我们尽é‡ä¸åšé¢„判,ä¸è®¤ä¸ºæˆ‘们能够预先知晓未æ¥ã€‚比如 Kimi 的看法是 Model as Agent,通过模型è®ç»ƒä¸åР入大é‡ç«¯åˆ°ç«¯çš„工具使用数æ®ï¼Œè®©æ¨¡åž‹æœ¬èº«å…·å¤‡å¼ºå¤§çš„å·¥å…·è°ƒç”¨èƒ½åŠ›ã€‚è€ŒåŒæ ·æ˜¯è°ƒç”¨é—æºæ¨¡åž‹ API 的产å“。Manus æå‡ºäº†ã€Œless structure, more intelligenceã€ï¼Œä½†æœ‰æ—¶ç»“构化也能æå‡å·¥ä½œæ•ˆçŽ‡ã€‚Genspark 就专门åšäº†é’ˆå¯¹ PPT 场景的 slide 生æˆåŠŸèƒ½ï¼Œå¼•å…¥äº†ä¸€ç³»åˆ—ä¼˜åŒ–å·¥ä½œæ•ˆæžœçš„æ–¹æ³•ã€‚ æˆ´é›¨æ£®ï¼šå› ä¸ºç”¨æˆ·è¦çš„æ˜¯æœ€åŽçš„结果,而ä¸åŒçš„公叿ƒ³å®žçŽ°è¿™ä¸ªç»“æžœï¼Œå¯èƒ½æœ‰å„ç§ä¸åŒçš„è·¯å¾„ã€‚æœ‰çš„çµæ´»ä½†æˆæœ¬é«˜ï¼Œæœ‰çš„å›ºå®šä½†æˆæœ¬ä½Žã€‚所以大家解åŒä¸€é“题,用ä¸åŒæ–¹æ³•都åˆç†ã€‚ 有人说这是类似自动驾驶 L3 级别的产å“,人ä¸åŠ¨æ–¹å‘盘,车自动驾驶。我们å‘现写代ç 的工程师一开始喜欢 Cursorï¼Œå› ä¸ºå®ƒè¿˜æ˜¯è®©ä½ åœ¨ç†Ÿæ‚‰çš„ IDE 里é¢å†™ä»£ç ,但 Manus å‘现产å“ç»ç†ç”¨ Cursor 去完æˆä»»åС䏿€Žä¹ˆçœ‹ä»£ç ï¼Œåªæ˜¯çœ‹å³è¾¹çš„å¯¹è¯æ¡†ï¼Œæ‰€ä»¥ä»–ä»¬æŠŠå¯¹è¯æ¡†æ”¾åˆ°ä¸»è¦çš„ä½ç½®ï¼Œåšå‡ºäº†ä¸€ä¸ªæ›´åР适åˆéžç¨‹åºå‘˜äººç¾¤ä½¿ç”¨çš„ Agent。 éšç€æ¨¡åž‹èƒ½åŠ›çš„è¿›æ¥ï¼ŒClaude Code æ›´æžè‡´ï¼Œç”¨æˆ·ä¸èƒ½å†™ä»£ç ,åªèƒ½å‘Šè¯‰ AI ä½ è¦åšä»€ä¹ˆï¼Œå…¶ä»–çš„ AI 去完æˆã€‚所以 L3 或 Agent æ„å‘³ç€ AI 去作为执行主角,而用户è¦å¦ä¼šå½“ AI çš„å¥½è€æ¿ã€‚ æˆ´é›¨æ£®ï¼šä»¥å‰æˆ‘创业时也这么想,所有事我都亲自åšã€‚åŽæ¥å‘çŽ°è¿™ä¸æ˜¯å¥½ç®¡ç†æ–¹å¼ï¼Œæˆ‘åº”è¯¥èµ‹èƒ½ä¸‹å±žï¼Œè®©ä»–ä»¬çŸ¥é“æˆ‘è¦ä»€ä¹ˆï¼Œè®©ä»–们有主观能动性。 以åŽäººç±»æŒ‡æŒ¥ AI å¯èƒ½ä¹Ÿæ˜¯è¿™æ ·ï¼Œè¿™å¯èƒ½æ˜¯äººç±»åކå²ä¸Šç¬¬ä¸€æ¬¡è¦åŸ¹å…»ä¸€ä¸ªå·¥å…·ã€‚以å‰åŸ¹å…»äººå¾ˆéš¾ï¼Œå¤§éƒ¨åˆ†äººæ˜¯è¢«åŸ¹å…»çš„,很少有人有能力或机会去培养一个下属。但现在æ¯ä¸ªäººå¯èƒ½éƒ½è¦å¦ä¼šå¦‚何给 AI 下命令,如何培养 AI 去更好完æˆå·¥ä½œã€‚ 我觉得一个好的产å“,最åŽè‚¯å®šè¿˜æ˜¯è¦æœ‰æ¸…晰的定ä½ï¼Œè¦åœ¨æŸäº›é¢†åŸŸåšåˆ°ç»å¯¹çš„第一å,æ‰èƒ½æ‹¥æœ‰é•¿æœŸä»·å€¼ã€‚æˆ–è€…è¯´æˆ‘ä»¬ç›®æ ‡ä¸æ˜¯è¿½æ±‚é€šç”¨ï¼Œè€Œæ˜¯ä»Žé€šç”¨å¼€å§‹ï¼Œé€æ¸å‘å±•æ”¶æ•›åˆ°ä¸€äº›æ ¸å¿ƒåœºæ™¯ã€‚ 技术é©å‘½çš„æ—©æœŸå‘展阶段,往往大家都在å°è¯•,也ä¸çŸ¥é“新技术适åˆåšä»€ä¹ˆï¼Œæœ€åŽçœ‹ä»€ä¹ˆæ•ˆæžœæœ€å¥½ã€‚ä¾‹å¦‚è’¸æ±½æœºåˆšè¢«å‘æ˜Žæ—¶ï¼Œæœ€å¼€å§‹æ˜¯ç”¨äºŽæŠ½ç…¤çŸ¿çš„æ°´ï¼ŒåŽæ¥å‘现用æ¥é©±åЍç«è½¦å’Œçººç»‡æœºæ›´å¥½ã€‚蒸汽机也是一个「通用技术ã€ï¼Œä½†æœ€åŽæœ€å¤§çš„价值å¯èƒ½æ¥è‡ªå‡ 个具体场景。 晚点:有个è¯é¢˜æŒºæœ‰æ„æ€ã€‚国内大家讨论通用产å“,觉得这是大公å¸çš„必争之地。但跟国外投资人èŠï¼Œä»–们å而对 Super App çš„å¯èƒ½æ€§æ›´æ„Ÿå…´è¶£ï¼Œå…³å¿ƒæ€Žä¹ˆæ‰“è´¥ OpenAI å’Œ Google。 å¾ˆæœ‰æ„æ€çš„一件事是,Manus 出现åŽï¼Œæœ‰å¾ˆå¤šäººè¯´å®ƒæ²¡å£åž’ï¼Œç”¨å¼€æºæ¡†æž¶ä¸€ä¸ªå‘¨æœ«å°±èƒ½æžå‡ºæ¥ã€‚但现在过了这么多个周末,还没看到任何一个类似的应用能真æ£åšå¥½çš„。 我觉得在全çƒå¸‚场,大家对真æ£çš„创新还是尊é‡çš„,ä¸ä¼šç›´æŽ¥å¤åˆ¶å®Œå…¨ä¸€æ¨¡ä¸€æ ·çš„产å“。å¯èƒ½ä¼šå€Ÿé‰´äº¤äº’或呈现æ€è·¯ï¼Œæ¯”如 AI 在干活的表现形å¼ï¼Œä½†ä¸ä¼šç›´æŽ¥åƒç´ 级å¤åˆ¶ã€‚在全çƒåŒ–竞争里,先å‘优势会带æ¥å¾ˆå¤šå£ç¢‘å’Œä¼ æ’优势,这也是对创新者的建奖励。 我一直有个ç†å¿µï¼Œæ–°äº§å“å°±è¦å¤šè¯•试,很多时候花点钱试一试并ä¸è¿‡åˆ†ã€‚很多 AI 产å“çš„é©å‘½ä¹‹å¤„ä¸èƒ½åªçœ‹æŠ¥é“ï¼Œå¾—äº²èº«åŽ»ç”¨ã€‚å½“ä½ èƒ½çœ‹åˆ°ä¸€ä¸ªæœªæ¥çš„æ—¶å€™ï¼Œä½ ä¼šäº§ç”Ÿå¾ˆå¤šçš„çµæ„Ÿã€‚ 我们三月份就观察到,Manus ä¸Šçº¿åŽæŽ¨ç†ç”¨é‡æš´æ¶¨ï¼ŒAgent 产å“çš„ token 用é‡ç›¸æ¯” Chatbot 是显著增长。当时二级市场很多人还在质疑英伟达,觉得哪怕全世界所有人都用 chatbot,推ç†éœ€æ±‚ä¹Ÿæ ¹æœ¬æ²¡é‚£ä¹ˆå¤§ï¼Œç”¨ä¸äº†é‚£ä¹ˆå¤šç®—力。 ä½†å…¶å®žè¿™å°±åƒæ‹¨å·ä¸Šç½‘æ—¶ä»£ï¼Œä¸€å¼€å§‹æ‰€æœ‰äººéƒ½åœ¨èŠ QQ,ä¸éœ€è¦é‚£ä¹ˆå¤šå¸¦å®½ã€‚但有了宽带网之åŽï¼Œå¤§å®¶å°±è¦åœ¨çº¿ä¸Šçœ‹ 4K 视频了。模型能力越强,å¯ä»¥è§£é”的场景越多,token 使用就越多。 晚点:2023 年,黄ä»å‹‹åœ¨è‹±ä¼Ÿè¾¾å†…部讲è¯ä¸è¯´ï¼Œä»–ä»¬çš„å¸‚å€¼ç›®æ ‡æ˜¯ 2 万亿美元。当时英伟达刚刚çªç ´ 1 ä¸‡äº¿ã€‚æˆ‘ä»¬è¿˜åœ¨è®¨è®ºä»–è¿™å£æ°”æ˜¯ä¸æ˜¯å¤ªå¤§ã€‚结果今年已ç»çªç ´ 4 万亿了。 这就åƒç«è½¦å¼€åŠ¨äº†ï¼Œå°±ä¸ä¼šçªç„¶åˆåœä¸‹æ¥äº†ã€‚æˆ‘ä»¬çŽ°åœ¨è¿˜åœ¨ä¸æ–å‘现 AI 新的使用场景。比如说一个工程师原æ¥ä¸€å¤©å¯ä»¥å†™ 100 行代ç ,现在有了 Cursorã€Claude Code,å¯èƒ½å†™çš„ä»£ç æ˜¯åŽŸæ¥çš„ 10xï¼Œèƒ½è§£å†³æ›´å¤šä»¥å‰æ²¡æƒ³è¿‡è¦è§£å†³çš„é—®é¢˜ã€‚åˆæ¯”如有了 ChatGPT å’Œ Manusï¼Œä½ ä¼šé—®çš„é—®é¢˜ä¹Ÿä¼šå˜å¤šã€‚ 戴雨森:生产力å¯ä»¥ä»¥ 10 å€ï¼Œ100 å€çš„速度增长。和 AI é—²èŠå†æ€Žä¹ˆèŠï¼Œä¸€å¤©å°±é‚£ä¹ˆå¤šæ—¶é—´ï¼Œè¿™æ˜¯æˆ‘们以å‰è®²çš„ attention is all you needã€‚å¦‚æžœä½ è¦çš„æ˜¯ç”¨æˆ·æ³¨æ„力,它是有é™çš„,并且是和抖音,Tiktokã€å°çº¢ä¹¦ä¸€èµ·åŽ»äº‰å¤ºçš„æ³¨æ„力。 戴雨森:在未æ¥ä½ å¯ä»¥é—® AI 之剿²¡æƒ³åˆ°çš„éžå¸¸å¤æ‚çš„é—®é¢˜ï¼Œæˆ‘ç»™ä½ ä¸¾ä¸ªå¾ˆç®€å•的例å。比如美股二级市场的朋å‹ï¼Œåœ¨è´¢æŠ¥å£æ—¶ä¸€å¤©å¯èƒ½è¦å…³æ³¨äº”å…å®¶å…¬å¸å‘业绩。凌晨四点起床看财报数æ®ã€ä»£å…¥æ¨¡åž‹åšå¯¹æ¯”ã€å¬ç”µè¯ä¼šè®®ã€åˆ†æž CEO 的展望,都是他们的日常。 原æ¥ä»–们ä¸å¯èƒ½åŒæ—¶å¬å¤šä¸ªè´¢æŠ¥ä¼šï¼Œåªèƒ½é 招更多人或挑é‡ç‚¹åŽ»é€‰æ‹©ã€‚ä½†çŽ°åœ¨æœ‰äº† AI,虽然目å‰è¿˜ä¸èƒ½å®Œå…¨è·‘通全æµç¨‹ï¼Œä½† 6-12 个月内就有å¯èƒ½è®©ä¸€ä¸ªåˆ†æžå¸ˆåŒæ—¶è¦†ç›– 50 家股票的财报。 AI å¯ä»¥å¸®ä»–们看财报ã€å¬ç”µè¯ä¼šè®®è®°ç¬”è®°ã€å›žç”事å‰å‡†å¤‡å¥½çš„é—®é¢˜ã€æ€»ç»“ CEO 回ç”ã€å†™æŠ¥å‘Šã€‚这些原æ¥å› 为「åšä¸åˆ°ã€æ‰æ²¡æ”¾åˆ°ä½ 的工作时间表里的事情现在 AI 能完æˆäº†ï¼Œéœ€æ±‚就自然增长了。 å°±åƒé£žæœºå‡ºçް之å‰ï¼Œæ²¡æœ‰äººä¼šè¯´ã€Œæˆ‘今天è¦é£žç¾Žå›½å‡ºå·®ã€ã€‚但飞机一旦å˜åœ¨ï¼Œæ–°çš„需求就出现了。AI ä¹Ÿä¸€æ ·ï¼Œå®ƒè®©ä½ å¼€å§‹åšé‚£äº›ä½ 原本ä¸ä¼šæƒ³åšçš„事。 è€Œä¸”æˆ‘ä»¬è§‚å¯Ÿåˆ°ä¸€ä¸ªå¾ˆæœ‰æ„æ€çš„现象:当 AI 按 token 用é‡è®¡è´¹åŽï¼Œå¾ˆå¤šäººæ˜¯å¸Œæœ›ç”¨å¾—æ›´å¤šçš„ã€‚å› ä¸ºå®ƒç¡®å®žåœ¨å¸®ä½ å®Œæˆå·¥ä½œï¼Œæ¯”å¦‚å¸®ä½ å†™äº†æ›´å¤šä»£ç 。 è¿™ç§æŒ–è§’ä¸ç®¡æ˜¯å¯¹è¢«æŒ–团队,还是 Meta 自己原有的团队,都是éžå¸¸å¤§çš„å†²å‡»ã€‚åœ¨ç¡…è°·å‡ ä¹Žæ‰€æœ‰é¡¶å°–å…¬å¸éƒ½åœ¨å‘生类似动è¡ã€‚被挖的人所在团队军心难å…åŠ¨æ‘‡ï¼Œç•™ä¸‹çš„äººä¹Ÿå¼€å§‹è´¨ç–‘ï¼šæ˜¯ä¸æ˜¯è‡ªå·±ä¹Ÿè¯¥æ¶¨è–ªï¼Ÿ è¿™ç§é«˜è–ªæŒ–人当然是人æ‰ä»·å€¼çš„体现,但越是顶级人æ‰ï¼Œä¹Ÿè¶Šéœ€è¦æ—¶é—´å’ŒçŽ¯å¢ƒæ¥ç£¨åˆï¼Œæ‰èƒ½çœŸæ£å½¢æˆåˆåŠ›ã€‚åŽ†å²ä¸Šå¤±è´¥çš„例å也很多,所以对于这些组织æ¥è¯´ï¼Œè¿™æ—¢æ˜¯æœºä¼šï¼Œä¹Ÿæ˜¯ä¸€åœºæŒ‘战。 戴雨森:我觉得这也是体现了创始人的精神,就是他愿æ„䏿ƒœä»£ä»·åŽ»äº‰å–人æ‰ã€‚å¦‚æžœèŠ±é’±èƒ½è§£å†³çš„äº‹ï¼Œæˆ‘å°±èŠ±é’±åŠžã€‚æˆ‘è§‰å¾—è¿™ä¹Ÿåæ˜ 了人æ‰ç¡®å®žå¾ˆé‡è¦ã€‚ 戴雨森:但是这ç§é€¶Ä出å¯èƒ½ä¸å¤Ÿå¤§ã€‚有的人觉得公å¸å–ä¸ªå‡ äº¿ç¾Žå…ƒå°±æŒºå¥½ï¼Œæœ‰äººåˆ™æƒ³åšåƒäº¿ç¾Žå…ƒå…¬å¸ã€‚创业公å¸ä¹Ÿéœ€è¦æ›´å¤šå¼¹è¯åŽ»å’Œ Meta è¿™æ ·çš„å¤§åŽ‚ç«žäº‰ã€‚æ¯”å¦‚è¯´ Cursor 之å‰èžäº†å¾ˆå¤šé’±ï¼Œæˆ‘们一度还觉得èžè¿™ä¹ˆå¤šé’±åšä»€ä¹ˆï¼ŒçŽ°åœ¨çœ‹åˆ°ä»–ä»¬è¦é¢å¯¹çš„æ˜¯æ›´å¤šé’±è¡¥è´´ç”¨æˆ·ç”¨ tokenï¼Œæ‹›äººä¹Ÿè¦æ›´é«˜æˆæœ¬ï¼Œæ‰€ä»¥èžèµ„更多很åˆç†ã€‚çŽ°åœ¨ç«žäº‰æ— è®ºæ˜¯è¡¥è´´è¿˜æ˜¯äººæ‰éƒ½å‡çº§äº†ã€‚顶级人æ‰ä¹Ÿæœ‰å¾ˆå¤šé€‰æ‹©ï¼Œå¯¹å¾ˆå¤šåˆ›ä¸šå…¬å¸æ¥è¯´ï¼ŒåŠ å…¥æˆ˜å±€çš„é—¨æ§›å’Œæ°´ä½éƒ½åœ¨æå‡ã€‚ æˆ´é›¨æ£®ï¼šå¤§å®¶éƒ½æƒ³åŠ å¿«èŠ‚å¥ï¼Œå› ä¸ºé’±å¤ªå¤šäº†ã€‚å‡ å®¶å·¨å¤´è´¦ä¸Šéƒ½æœ‰å¤§é‡çŽ°é‡‘ï¼Œè¿™äº›é’±æŠ•ä¸‹åŽ»ï¼Œå¦‚æžœèƒ½ç”¨é’±æ¢æ—¶é—´å’Œç«žäº‰ä¼˜åŠ¿ï¼Œå¯¹ä»–ä»¬æ¥è¯´å°±æ˜¯ç®€å•的事情。 ä½ æƒ³ï¼ŒChatGPT 刚出æ¥çš„æ—¶å€™ï¼Œäººç±»è¿˜èƒ½æŒ‡å‡ºå®ƒçš„回ç”é—®é¢˜æ‰€åœ¨ã€‚ä½†çŽ°åœ¨æ— è®ºæ˜¯å®ƒç ”ç©¶çš„å†…å®¹æœ¬èº«è¿˜æ˜¯æ–‡ç¬”ï¼Œæ™®é€šäººç±»è¶Šæ¥è¶Šéš¾å‘çŽ°å®ƒçš„ç¼ºé™·äº†ã€‚å½“äººç±»æ™ºèƒ½è¢«é€æ¸æŽ¥è¿‘çš„æ—¶å€™ï¼Œä½ æ€Žä¹ˆè¡¡é‡ä¸€ä¸ªæˆ–è®¸æ¯”ä½ æ›´èªæ˜Žã€æ›´æ·±åº¦æ€è€ƒã€è®°å¿†åŠ›æ›´å¼ºçš„å˜åœ¨ï¼Ÿ å…³äºŽå¦‚ä½•è¡¡é‡æ™ºèƒ½ï¼Œæˆ‘的好朋å‹å§šé¡ºé›¨ä»–å†™äº†ç¯‡æ–‡ç« ã€Šä¸‹åŠåœºã€‹æåˆ°ï¼Œæœªæ¥ AI çš„ benchmark 会越æ¥è¶Šé‡è¦ï¼ŒçŽ°åœ¨çš„ benchmark å·²ç»é’化,ä¸èƒ½å‡†ç¡®åŒºåˆ†æ¨¡åž‹å·®å¼‚。比如说 一个 benchmark å¾— 85 分和 90 åˆ†ï¼ŒçœŸçš„èƒ½åæ˜ 模型的区别å—?Kimi çš„ç»éªŒä¹Ÿè¯´æ˜Žï¼Œå†…部制定好的 benchmark 也很é‡è¦ï¼Œæ¨¡åž‹è®ç»ƒï¼Œå…³é”®æ˜¯å¦‚何衡é‡ç»“果。内部 benchmark 的水平质é‡å¾€å¾€å†³å®šäº†æ¨¡åž‹çš„è´¨é‡ã€‚ æ‰€ä»¥æˆ‘è§‰å¾—å¦‚ä½•è¡¡é‡æ™ºèƒ½ã€å¦‚何探索智能边界ä¾ç„¶éžå¸¸é‡è¦ã€‚现在我们还能勉强说用一用模型,「Vibe Testingã€ï¼Œèƒ½æ„Ÿå—到模型的能力好å,但å†è¿‡å‡ 年,å‰äº”å的模型å¯èƒ½éƒ½æ¯”ä½ èªæ˜Žçš„æ—¶å€™ï¼Œä½ æ€Žä¹ˆåŽ»è¯„ä¼°è°æ›´å¥½ï¼Ÿ 戴雨森:第二个我想说的是,我一直å夿€è€ƒç”Ÿäº§åŠ›è¿™ä¸ªé€»è¾‘ã€‚æ¯ä¸ªäººæ‹¥æœ‰å¤§é‡ç”Ÿäº§åЛ之åŽï¼Œå¯¹äºŽä¸ªäººã€ç»„织ã€ä¹ƒè‡³ä¸–ç•Œçš„å½±å“æ˜¯ä»€ä¹ˆï¼Ÿ 对个人æ¥è¯´ï¼Œè¶…级个人。一个人能åšçš„事情越æ¥è¶Šå¤šï¼šä»Žåšå°çŒ«è¡¥å…‰ç¯è¿™æ ·çš„å° appï¼Œåˆ°å¼€å‘æ¸¸æˆï¼Œç”šè‡³åˆ° Sam Altman 预言的「一个人的独角兽公å¸ã€å®Œå…¨å¯èƒ½å®žçŽ°ã€‚å½“å¹´ Instagram è¢«æ”¶è´æ—¶åªæœ‰ 13 个人,在 AI 时代,13 个人到 3 个人是完全有å¯èƒ½çš„。 è¿™æ„味ç€äººå’Œäººä¹‹é—´å·®è·ä¼šå˜å¾—很大。当æ¯ä¸ªäººéƒ½æ‹¥æœ‰æ— é™èªæ˜Žçš„助手,以åŠåƒ Manus è¿™ç§å¯ä»¥æ—¥å¤œæ— ä¼‘å¸®ä½ æ‰“å·¥çš„ã€Œèµ›åšç‰›é©¬ã€æ—¶ï¼Œæœ‰äººèƒ½å¾ˆå¥½åœ°åˆ©ç”¨å®ƒåˆ›é€ 巨大价值,有人å¯èƒ½æ²¡æœ‰äº§ç”Ÿé‚£ä¹ˆå¤§ä»·å€¼ï¼Œæ‰€ä»¥æˆé•¿é€Ÿåº¦å·®å¼‚ä¼šè¿›ä¸€æ¥æ‹‰å¤§ã€‚ 对组织æ¥è¯´ï¼Œä¸€æ˜¯å°ç»„织å¯ä»¥å˜å¾—å¾ˆå¼ºå¤§ï¼ŒäºŒæ˜¯å¤§ç»„ç»‡èƒ½é€šè¿‡å…ˆè¿›æŠ€æœ¯ç®¡ç†æ›´å¤§ã€æ›´å¤æ‚的业务。比如美团管ç†å‡ 百万骑手,业务éžå¸¸å¤æ‚,如果没有先进互è”ç½‘é€šä¿¡å’Œç®¡ç†æŠ€æœ¯ï¼Œæ ¹æœ¬æ— æ³•å®žçŽ°ã€‚åŠ å…¥ AI åŽï¼Œå¤§å…¬å¸çš„管ç†äººæ•°ã€ä¸šåС夿‚度和深度都会å†å‡ä¸€ä¸ªå°é˜¶ã€‚ 世界是由å„ç§ç»„织驱动的,组织能力边界的æå‡å¯¹ä¸–界影å“å·¨å¤§ã€‚è¿›ä¸€æ¥æ¥è¯´ï¼Œå½“整体生产力大幅æå‡ï¼Œè€Œäººä¸Žäººã€ç»„织与组织之间差è·å˜å¤§æ—¶ï¼Œå¦‚何在效率和公平间寻求平衡?AI æœ€åˆæ˜¯æœ€èªæ˜Žçš„人制作工具给头部用户用,但这些精英产生的价值如何å哺普通大众?å³ä¾¿ä¸€ä¸ªæ™®é€šäººä¸æ˜¯ç‰¹åˆ«åŠªåŠ›å¦ AI,我们如何让 AI 产å“è¶Šæ¥è¶Šæ˜“用,让普通人也能从ä¸èŽ·ç›Šï¼Ÿ æˆ´é›¨æ£®ï¼šå¯¹ï¼ŒçŽ°åœ¨ä½ å¾ˆéš¾åŒºåˆ†ä»€ä¹ˆæ˜¯çœŸå®žçš„æ–‡ç« ã€‚æˆ‘çŽ°åœ¨è¿˜èƒ½è¯»å‡º DeepSeek 的味é“,但一年åŽå¯èƒ½åˆ†è¾¨ä¸å‡ºï¼Œæˆ–者说,å¯èƒ½å·²ç»æœ‰å¾ˆå¤š AI å†™çš„æ–‡ç« æˆ‘å·²ç»åˆ†è¾¨ä¸å‡ºæ¥äº†ï¼Œæˆ‘能分辨出æ¥çš„åªæ˜¯é‚£äº›è¿˜ä¼ªè£…å¾—ä¸å¤Ÿå¥½çš„ã€‚å¤§å®¶éƒ½çŸ¥é“ AI 会引用虚å‡å†…容,但关键什么是虚å‡å‘¢ï¼ŸçœŸå‡çš„界é™ä¹Ÿè¶Šæ¥è¶Šæ¨¡ç³Šäº†ã€‚ 我一直在想,人类最大的é™åˆ¶æ˜¯ä»€ä¹ˆï¼Ÿæˆ‘这边觉得是大脑的功率,大脑功率大约 20 瓦,人类智能的上é™å°±æ˜¯è¿™ä¹ˆå¤šã€‚而 AI å¯ä»¥å¾ˆå¿«æŽ¥è¿‘甚至çªç ´è¿™ä¸ªä¸Šé™ã€‚智能越多,我们用它åšä»€ä¹ˆï¼Œäººä¸Ž AI 的角色分工如何,这些都是我们很快è¦é¢å¯¹å’Œè°ƒæ•´çš„问题。 æœ‰æ—¶å€™æˆ‘è§‰å¾—æœ‰ç‚¹å¯æ€•ï¼Œå› ä¸ºå¤§çš„å˜åŒ–å·²ç»åˆ°æ¥ï¼Œåªæ˜¯å¤§å®¶è¿˜åœ¨é€æ¸æ„Ÿå—到它。比如对程åºå‘˜å½±å“特别直接,普通åˆçº§ç¨‹åºå‘˜å¦‚æžœä¸ç”¨ AI,未æ¥ä¸¤å¹´åŽæ‰¾åˆ°å·¥ä½œä¼šéžå¸¸å›°éš¾ã€‚但一年的时间人是很难åšå‡ºæ”¹å˜çš„。而更多的èŒä¸šå¯èƒ½ä¹Ÿä¼šåœ¨å¾ˆçŸçš„æ—¶é—´å†…å—到æžå¤§çš„冲击。 戴雨森:我觉得第一个疲倦的是过度è¥é”€ã€‚è¿‡åŽ»å‡ å¹´æœ‰ä¸€ä¸ªè¶‹åŠ¿ï¼Œå°±æ˜¯å¾ˆå¤šäº§å“在过度è¥é”€ï¼Œå„ç§ã€Œéœ‡æƒŠä½“ã€ï¼Œä½†å¥½çš„äº§å“æ¯”如说 Manusï¼Œå‡ ä¹Žæ²¡èŠ±é’±è¥é”€ï¼Œä½†å¤§å®¶è¯¯ä»¥ä¸ºå®ƒèŠ±äº†å¾ˆå¤šé’±ã€‚ ä¹‹å‰ AI 的进æ¥ä¸»è¦æ˜¯æ¨¡åž‹çš„è¿›æ¥ï¼Œæ™®é€šç”¨æˆ·è¿˜æ— 法在产å“ä¸ä½“éªŒï¼Œå› æ¤ç ”究员和媒体拥有很大的解释æƒã€‚但现在模型已ç»å¼€å§‹è½¬åŒ–æˆåº”用了。那时候我在å³åˆ»å‘了一æ¡è¯´ï¼šã€ŒTalk is cheap, show me your product.〠现在很多 AI æ¨¡åž‹çš„æ ¸å¿ƒèƒ½åŠ›æœ€ç»ˆéƒ½è¦è½¬åŒ–æˆäº§å“,用户èƒ