91ºÚÁÏÍø

EN
www.world-show.cn

400多个成品视频IMO金牌ã€Kimiç¿»ç›˜ã€æŠ¢äººå¤§æˆ˜ï¼Œä¸ŽçœŸæ ¼æˆ´é›¨æ£®å¤ç›˜2025AI 中场战事

节目分æˆäº†ä¸¤æ¬¡å½•制。第一次是在 7 月 18 日,真格基金管ç†åˆä¼™äººæˆ´é›¨æ£®ä¸Žæ™šç‚¹ç§‘技报é“负责人程曼祺,围绕月之暗é¢åˆšå‘布的 Kimi K2ã€AI 应用普åŠçš„æ–°åЍå‘,以åŠè¿‘几个月æŒç»­å‡æ¸©çš„æŠ¢äººå¤§æˆ˜ï¼Œåšäº†ä¸€æ¬¡ä¸­åœºå›žé¡¾ã€‚ 第二次是在 7 月 21 日,我们补充èŠäº†åˆšåˆšå‘生的新进展:7 月 18 日,OpenAI å‘布了 ChatGPT Agentï¼›7 月 19 日,OpenAI åˆå®£å¸ƒï¼Œä¸€ä¸ªå°šæœªå…¬å¼€çš„通用大语言模型,首次达到了 IMO 国际数学奥林匹克金牌水准;7 月 22 日,Google DeepMind 也宣布,他们的 Gemini DeepThink 模型å–å¾—äº†åŒæ ·æˆç»©ã€‚这之å‰ï¼Œåªæœ‰ Google DeepMind 曾用为数学调优的模型达到银牌。 å…¨çƒçš„ AI 社区ä»å¤„于 Early Adopter(早期采用者)阶段。他们愿æ„è¯•é”™ã€æ„¿æ„å馈。当你拿出一个好产å“,并以开放的æ€åº¦å¯¹å¾…用户时,无论是 DeepSeekã€Kimiã€Manus 还是 Genspark,都已ç»è¯æ˜Žï¼šæ¥è‡ªå„地的用户ä¸ä»…会欣èµã€æ”¯æŒä½ ï¼Œç”šè‡³ä¼šä¸»åŠ¨å¸®ä½ æ”¹è¿›äº§å“。 回看 Kimi K2 的故事,也能看到「投人ã€è¿™ä»¶äº‹åœ¨ AI æ—¶ä»£è¢«é‡æ–°è®¤è¯†çš„过程。Kimi 从一开始就是一个以技术视野和技术能力为底的团队。2023 年,AI 风å‘几乎月月在å˜ï¼Œä½†æ¨æ¤éºŸçš„团队押中了长文本这个方å‘,并基于此åšå‡ºäº†ç¬¬ä¸€ä¸ªå…·å¤‡æœç´¢èƒ½åŠ›çš„ç‰ˆæœ¬ã€‚è¿™æ˜¯ä¸€åœºé¢å‘未æ¥çš„下注。 AI 正在让人们去å°è¯•那些原本ä¸ä¼šåšçš„事。这次 IMO 金牌事件更让我们看清 AGI å³å°†åˆ°æ¥çš„ä¿¡å·ã€‚å¦‚æžœè¯´è¿‡åŽ»æˆ‘ä»¬åªæ˜¯è¿œè¿œæœ›è§ä¸€è¾†å†’烟的ç«è½¦ï¼Œå¦‚今,已ç»èƒ½æ¸…楚地å¬è§å®ƒçš„轰鸣声了。 戴雨森:确实过去这个周末å‘生了很多事情。我觉得最é‡è¦çš„一件是 OpenAI 的一个新模型,在 IMO(国际数学奥林匹克)2025 年的题目上获得了金牌级别的æˆç»©ã€‚具体æ¥è¯´æ˜¯å…­é“题åšå¯¹äº†äº”é“。 这个为什么é‡è¦å‘¢ï¼Ÿå› ä¸ºæŒ‰ç…§ OpenAI çš„æè¿°ï¼Œè¿™æ˜¯ä¸€ä¸ªæ²¡æœ‰è”网的通用大语言模型,并且没有针对数学åšç‰¹åˆ«ä¼˜åŒ–,也没有用任何 Code Interpreter 一类的工具。它完æˆçš„æ˜¯ IMO çš„è¯æ˜Žé¢˜ï¼Œè€Œä¸” OpenAI æ‰¾äº†ä¸‰ä½ IMO 的金牌得主æ¥äº¤å‰éªŒè¯ï¼Œç¡®è®¤è¿™äº›è§£ç­”是对的。 当然,这个结果也引å‘了一些争议。比如有些人指出它还没有ç»è¿‡å®˜æ–¹è®¤è¯ï¼Œå› æ­¤ä¸ä¸€å®šæœ‰æ•ˆã€‚陶哲轩也说,IMO 题目的解法路径会有很多ä¸åŒï¼Œæœ€ç»ˆå¾—分也会ä¸ä¸€æ ·ã€‚ 但ä¸ç®¡æ€Žæ ·ï¼Œè¿™ä¸ªç»“果是一个划时代的进展。语言模型没有ç»è¿‡ç‰¹åˆ«çš„æ•°å­¦ä¼˜åŒ–,åªåœ¨ç¦»çº¿çŽ¯å¢ƒä¸­å°±èƒ½è§£å‡º IMO çº§åˆ«çš„è¯æ˜Žé¢˜ã€‚åƒä¹‹å‰ Google 用 AlphaGeometry 是为数学专门设计的模型,还借助了形å¼åŒ–éªŒè¯æ–¹æ³•,并ä¸å…·å¤‡æ³›åŒ–能力。 晚点:这刚好是一年å‰çš„事,2024 å¹´ 7 月 Google çš„ AlphaGeometry 达到了 IMO é“¶ç‰Œçš„æ°´å‡†ï¼Œå½“æ—¶å·®ä¸€ç‚¹åˆ°é‡‘ç‰Œã€‚ä½†é‚£ä¸æ˜¯é€šç”¨å¤§è¯­è¨€æ¨¡åž‹ï¼Œè€Œè¿™æ¬¡ OpenAI 说是通用大模型。 戴雨森:对,而且今年这个时间点正好是 IMO 出题的时间,OpenAI 是题目一出就åšäº†ï¼Œæ‰€ä»¥ä¹Ÿä¸å­˜åœ¨æ¨¡åž‹è®­ç»ƒæ—¶æå‰è§è¿‡è¿™äº›é¢˜çš„æƒ…况。 è™½ç„¶è¿‡åŽ»ä¸€å¹´è¯­è¨€æ¨¡åž‹å·²ç»æœ‰å¾ˆå¤šè¿›å±•ï¼Œä½†åƒæ•°å­¦è¯æ˜Žè¿™æ ·çš„任务,尤其是 IMO 这类题,属于 hard to verify 的问题类型。验è¯ä¸€ä¸ªç­”æ¡ˆæ˜¯å¦æ­£ç¡®æœ¬èº«å°±éžå¸¸éš¾ã€‚ 这类问题一直以æ¥éƒ½è¢«è®¤ä¸ºæ˜¯å½“å‰è¯­è¨€æ¨¡åž‹éš¾ä»¥èƒœä»»çš„任务。并且现实中世界上大部分真正的问题,事先都是没有标准答案和解法的。所以当一个语言模型å¯ä»¥åœ¨æ²¡æœ‰ä»»ä½•ç‰¹åˆ«è°ƒæ•™çš„å‰æä¸‹ï¼Œè§£å‡ºè¿™ç±»é«˜éš¾åº¦çš„é¢˜ï¼Œè¾¾åˆ°äººç±»é¡¶å°–æ°´å¹³æ—¶ï¼Œè¿™æ„味ç€å®ƒçš„æ€è€ƒèƒ½åŠ›ç¡®å®žä¸Šäº†ä¸€ä¸ªå°é˜¶ã€‚ IMO çš„è¯æ˜Žé¢˜å’ŒçŽ°å®žä¸­çš„æŸäº›ç†ç§‘的问题在形å¼é€»è¾‘ä¸Šå¾ˆç›¸ä¼¼ï¼Œéƒ½æ˜¯è¯æ˜Žé¢˜ã€‚LLM 既然能åšå‰è€…,也许说明它离å‘现新知识的能力也ä¸è¿œäº†ã€‚ 还有一个八å¦ï¼šæ®è¯´è¿™æ¬¡ OpenAI 使用的模型和 GPT-4o 是åŒä¸€ä¸ªåº•层模型。也就是说,å–得这个æˆç»©å¹¶ä¸æ˜¯å› ä¸ºåº•层模型有很大æå‡ï¼Œè€Œæ˜¯åœ¨ post-training å’Œ inference 阶段åšå‡ºäº†ä¼˜åŒ–。åŽç»­çš„优化空间给整个 AI å‘展带æ¥äº†å¾ˆå¤šæƒ³è±¡ã€‚ 这让我想到 2023 å¹´ 3 月微软那篇论文《Sparks of AGI》,当时他们测试 GPT-4 的预å‘布版本,感å¹ä»Žä¸­çœ‹åˆ°äº† AGI çš„ç«èŠ±ã€‚é‚£ç¯‡æ–‡ç« ä¹Ÿå°±ä¸¤å¹´åŠå‰ï¼Œè€ŒçŽ°åœ¨æˆ‘ä»¬å·²ç»èµ°åˆ°äº†èƒ½è§£ IMO 的地步。两年åŠåœ¨ç§‘技进步å²ä¸­æ˜¯å¾ˆçŸ­çš„æ—¶é—´ï¼Œç”šè‡³æ¯”很多创业公å¸ä»Žç§å­è½®åˆ°äº§å“å‘布还短。 ä¸€ä¸ªã€Œåªæ˜¯é¢„测下一个è¯ã€çš„语言模型,在没有任何工具辅助的情况下,能够完æˆä¸€ä¸ªåªæœ‰æžå°‘数天æ‰äººç±»æ‰èƒ½åšå‡ºçš„æœ‰åˆ›é€ æ€§çš„æ•°å­¦è¯æ˜Žã€‚这确实说明 AI 的能力已ç»åˆ°äº†ä¸€ä¸ªæ–°çš„高度。 我们年åˆå½•èŠ‚ç›®ã€Šå’Œæˆ´é›¨æ£®é•¿èŠ AI Agent》时也说过:2024 年会是很多行业迎æ¥ã€ŒæŽä¸–石时刻ã€çš„一年。所谓「æŽä¸–石时刻ã€ï¼Œå°±æ˜¯ AI 在æŸä¸ªé¢†åŸŸè¶…越了人类最强水平。 我们已ç»åœ¨å›´æ£‹ã€ç¼–ç¨‹ã€æ•°å­¦æŽ¨ç†ç­‰é¢†åŸŸçœ‹åˆ°è¿™ç§æƒ…况䏿–­å‡ºçŽ°ã€‚æŽ¥ä¸‹æ¥è¿˜ä¼šæœ‰æ›´å¤šè¿™æ ·çš„æ—¶åˆ»ç­‰å¾…ç€æˆ‘们,解决我们原本以为还很难ã€å¾ˆè¿œçš„问题。 æˆ´é›¨æ£®ï¼šæˆ‘ä»¬ä¹Ÿåœ¨æ‹­ç›®ä»¥å¾…ã€‚å¥½åƒ Google DeepMind 也åšåˆ°äº†é‡‘牌,但我们ä¸çŸ¥é“æ˜¯ä¸æ˜¯ç”¨é€šç”¨æ¨¡åž‹å®žçŽ°çš„ã€‚å¦‚æžœçœŸæ˜¯é€šç”¨æ¨¡åž‹ï¼Œé‚£å°±è¯´æ˜Žè¿™ä¸ªèƒ½åŠ›å·²ç»ä¸åªæ˜¯ä¸€å®¶æŽŒæ¡çš„ã€‚è¿™ç§æŠ€æœ¯ä¸€æ—¦æ‰©æ•£å¼€æ¥ï¼Œä¼šå¸¦æ¥æŽ¨ç†èƒ½åŠ›çš„å¤§å¹…æå‡ï¼Œä¸ç®¡æ˜¯å“ªä¸ªæ¨¡åž‹åŽ‚å•†éƒ½ä¼šä»Žä¸­å—益。 戴雨森:我觉得方å‘大家早就知é“,是æœç€æ›´å¼º reasoning 能力去的。è°éƒ½çŸ¥é“ reasoning 能力æå‡äº†ï¼Œæ¨¡åž‹å°±èƒ½è§£æ›´éš¾çš„题。但现在就能åšåˆ°ç¡®å®žè¿˜æ˜¯è®©äººå¾ˆéœ‡æƒŠã€‚我èŠåˆ°ä¸€äº›ä¸­å›½æœ€é¡¶å°–的研究者,他们也表示éžå¸¸æƒŠè®¶ã€‚但就åƒåŽŸå­å¼¹ä¸€æ ·ï¼šçˆ†ç‚¸é‚£ä¸€åˆ»èµ·ï¼Œå¤§å®¶çŸ¥é“这件事情å¯ä»¥åšåˆ°ï¼Œå°±å·²ç»ç¦»åšå‡ºæ¥ä¸è¿œäº†ã€‚ å›´æ£‹æ˜¯ä¸€ä¸ªåŒæ–¹ä¿¡æ¯å…¬å¼€ä¸”完备ã€èƒœè´Ÿæ˜Žç¡®çš„任务,éžå¸¸é€‚åˆå¼ºåŒ–å­¦ä¹ ï¼›ç¼–ç¨‹ä¹Ÿæ˜¯ç»“æž„åŒ–ä»»åŠ¡ï¼Œè€Œä¸”å¾ˆå¤šä»£ç æ˜¯å·²æœ‰äººå†™è¿‡çš„,拼装比全新创造多。 但数学是ç†å·¥ç§‘çš„åŸºç¡€ï¼Œå®ƒçš„æŽ¨ç†æ˜¯å¾ˆå¤šå­¦ç§‘的根基。而且ä¸ä¾èµ–自然世界实验,åªé é€»è¾‘æ€ç»´ã€‚所以 AI 能解 IMO çº§åˆ«çš„è¯æ˜Žé¢˜ï¼Œæ„味ç€ç†å·¥ç§‘å¾ˆå¤šçŸ¥è¯†ç”Ÿæˆæ–¹å¼å¯èƒ½éƒ½è¦æ”¹å˜ï¼Œå¸¦æ¥çš„科学进步å¯èƒ½æ¯”编程还大。 戴雨森:有å¯èƒ½æ›´å¤§ã€‚因为编程现在替代的是一些é‡å¤æ€§è¾ƒé«˜çš„åˆçº§å·¥ä½œï¼Œæ¯”如 Vibe Coding 大部分还是å¤åˆ¶ç²˜è´´ä¸€äº›å‰ç«¯ä»£ç ã€‚但数学推ç†å¸¦æ¥çš„æ˜¯éžå¸¸å¼ºçš„æ€è€ƒå’Œæ½œåœ¨çš„æ–°çŸ¥è¯†å‘现能力。显然,这是更值钱的部分。 这就是为什么我说这次 IMO 金牌事件让我更清晰地看到了 AGI å³å°†åˆ°æ¥çš„ä¿¡å·ã€‚å¦‚æžœä»¥å‰æ˜¯è¿œå¤„看到一辆冒烟的ç«è½¦ï¼ŒçŽ°åœ¨å·²ç»èƒ½å¬åˆ°å®ƒçš„轰鸣声了。 晚点:有人在 X(原 Twitter)上说强化学习现在也能处ç†é‚£äº›å¥–励åé¦ˆä¸æ˜¯å¾ˆç›´æŽ¥çš„领域。这å¯èƒ½æ˜¯è¿™æ¬¡è¿›å±•èƒŒåŽæ›´å¤§çš„çªç ´ä¹‹ä¸€ã€‚还有人æåˆ°ã€ŒéªŒè¯çš„éžå¯¹ç§°æ€§ã€ï¼Œè¯´æœ‰äº›ä»»åС你åšå‡ºæ¥çš„æ—¶é—´å¯èƒ½æ¯”éªŒè¯æ—¶é—´è¿˜çŸ­ã€‚IMO 数学题就属于这ç§ç±»åž‹ã€‚ 戴雨森:有å¯èƒ½ã€‚ä½†å…‰æ˜¯ç»™å‡ºè¯æ˜Žè¿™ä¸€ç‚¹ï¼Œå…¶å®žå°±å·²ç»æ˜¯è´¨çš„飞跃。现在我们还ä¸çŸ¥é“所有细节,但我们期待更多公开信æ¯ï¼Œæˆ–其他模型公å¸å¤åˆ»ç±»ä¼¼æˆæžœã€‚æŒ‰ç…§ç›®å‰ AI çš„å‘展速度,åªè¦ä¸€ä»¶äº‹è¢«åšåˆ°ï¼Œé‚£å®ƒå°±å·²ç»ä¸æ˜¯é¥ä¸å¯åŠçš„难题了。 æˆ´é›¨æ£®ï¼šæˆ‘è§‰å¾—è¿™åæ˜ äº† OpenAI 作为 AI çš„é¢†å¤´ç¾Šã€æœ€å¤§çš„ AI 应用公å¸ï¼Œä»–们也把 Agent 作为é‡è¦çš„æ–¹å‘ã€‚å°±åƒæˆ‘们年åˆå°±å¼€å§‹è®¨è®ºçš„:ç†è§£ç›®æ ‡ã€æ‹†è§£è§„划ã€ç¼–程使用工具ã€å¯¹ç»“果进行å¤ç›˜å’Œåæ€ã€‚从一开始的构想,到 Devinã€Manus 等第一波产å“的出现,å†åˆ° ChatGPT Agent çš„å‘布,Agent ç¡®å®žé€æ¸æˆä¸ºäº† AI åº”ç”¨çš„å…±è¯†ï¼Œå˜æˆäº†å¤§å®¶èšç„¦çš„æ–¹å‘。 戴雨森:我们ä¸ä¼šè¿™ä¹ˆæƒ³ã€‚我觉得ä¸èƒ½ä½Žä¼° OpenAIã€‚ä»–ä»¬æœ‰æœ€å¤šçš„äººã€æœ€å¤šçš„å¡ã€æœ€å¤šçš„用户,在安全性上也åšäº†å¾ˆå¤šè€ƒé‡ï¼ŒåŠ äº†å¾ˆå¤šé¢å¤–约æŸã€‚其实 ChatGPT Agent 的能力是被é™åˆ¶å¾—很死的,这是负责任的表现。 这个产å“也是他们第一个在 AI 安全性评估中被列为「高å±é™©çº§åˆ«ã€çš„,说明他们确实担心这类 Agent 会é‡åˆ°æ¯”å¦‚é’“é±¼ç½‘ç«™ã€æˆ–者生物武器信æ¯ç­‰é£Žé™©ï¼ˆè¯¦è§ OpenAI å‘布的 ChatGPT agent System Card)。当公å¸å˜å¤§ï¼Œå°±ä¼šå˜å¾—更谨慎;这也å过æ¥è¯´æ˜Žäº†åˆ›ä¸šå…¬å¸çš„è¡ŒåŠ¨åŠ›å¿«ã€æ•¢äºŽçªç ´çš„æœºä¼šæ‰€åœ¨ã€‚ 戴雨森:是的,Manus 确实探索出了一个方å‘:让 AI 在åšä»€ä¹ˆå¯ä»¥è¢«ç›´è§‚看到,让人ç†è§£èƒŒæ™¯ï¼Œå¦åˆ™å¦‚æžœåªçœ‹åˆ°æœ€åŽçš„结果,会很困扰。所以我们看到 Manusã€Gensparkã€Kimi,还有 MiniMax 等中国团队也在针对 OpenAI çš„ Task,用自己已ç»å‘布的线上 Agent åšå¯¹æ¯”。ä¸å¾—ä¸è¯´ï¼Œè¿™äº›å…¬å¸çš„产å“åœ¨å¾ˆå¤šç»´åº¦ä¸Šçš„è¡¨çŽ°ï¼Œæ¯”å¦‚åš PPT 的任务,确实比 ChatGPT Agent è¦å¥½ã€‚ 第二,所谓的「套壳ã€äº§å“,也就是调用 API 的应用,并ä¸ä¼šå°±ä¸€å®šè¢« model native 产å“åŠæ‰“。之å‰å¤§å®¶ä»¥ä¸º OpenAI 下场,训练的模型能端到端处ç†ï¼Œå°±èƒ½å®Œå…¨æ›¿ä»£ç¬¬ä¸‰æ–¹ã€‚但其实ä¸ç„¶ï¼Œå°¤å…¶ Agent éœ€è¦æ›´å¤š context 和工具,很多都ä¾èµ–壳和应用本身æä¾›çš„环境。 Manus 分享的那篇关于 Context Engineering 的文章《如何系统性打造 AI Agent çš„ä¸Šä¸‹æ–‡å·¥ç¨‹ï¼Ÿã€‹å°±æ”¶åˆ°å¾ˆå¤šå¥½è¯„ã€‚å› ä¸ºè¿™å°±æ˜¯ä¸€ä¸ªå¤§å®¶çŽ°åœ¨éƒ½åœ¨è§£å†³çš„é—®é¢˜ï¼Œé‡Œé¢æœ‰å¾ˆå¤šå®žè·µæ˜¯éœ€è¦æ—¶é—´å’Œç»éªŒçš„。 我ç†è§£ï¼ŒContext Engineering 最早是æ¥è‡ªäºŽ Prompt Engineering。Prompt Engineering 就是给 AI 一个命令ã€ä¸€ä¸ªä»»åŠ¡ï¼Œç„¶åŽ AI 自己去åšäº‹ã€‚这很åƒä¼ ç»Ÿç®¡ç†æ–¹å¼ï¼šè€æ¿å¸ƒç½®ä»»åŠ¡ï¼Œå‘˜å·¥åŽ»æ‰§è¡Œã€‚è€Œåƒ Netflixã€å­—节等先进公å¸å¼ºè°ƒçš„「Context, not controlã€ï¼Œæ„味ç€è¦ç»™å‘˜å·¥æ›´å¤šä¸Šä¸‹æ–‡å’ŒæŽˆæƒï¼Œæ‰èƒ½æ›´å¥½å®Œæˆä»»åŠ¡ã€‚Context Engineering 也是类似的é“ç†ï¼šæˆ‘们è¦ç»™æ¨¡åž‹æä¾›çš„æ˜¯èƒ½å¤Ÿå¸®åŠ©å®ƒæ›´å¥½å®Œæˆä»»åŠ¡çš„ä¸Šä¸‹æ–‡ã€‚ 第二个层é¢ï¼Œæ˜¯å¤š session 或跨 session 的个性化记忆:比如说今天åšäº†ä»€ä¹ˆï¼Œæ˜Žå¤©å†åšå¯¹åº”的事,用户的å好ã€ä¹ æƒ¯ã€å·¥ä½œç»éªŒï¼Œèƒ½ä¸èƒ½ç´¯ç§¯ï¼Ÿè¿™ä¸ªé•¿æœŸå¯èƒ½æˆä¸ºæŠ¤åŸŽæ²³ã€‚å› ä¸ºåŒæ ·çš„æ¨¡åž‹ï¼Œè°æœ‰æ›´å¥½çš„上下文,它就更懂我。 第三个层é¢ï¼Œæ˜¯äº§å“设计本身å¯ä»¥æä¾›æ¨¡åž‹åŽŸæœ¬èŽ·å–ä¸åˆ°çš„上下文。比如大家设想的一个还没åšå‡ºæ¥çš„产å“:戴个眼镜å¯ä»¥å®žæ—¶çœ‹åˆ°å‘¨å›´ä¸–界。这样的 context 是模型自己无法产生的,必须通过好的硬件与软件设计æ¥å®žçŽ°ï¼Œä¹Ÿè¯´æ˜Žäº†äº§å“层的价值。 模型这æ¡çº¿ï¼ŒOpenAI 这周刚拿下了 IMO 金牌,说明它的进步速度还是很快。而 OpenAI 自己åšçš„ ChatGPT Agent 还有很大æå‡ç©ºé—´ï¼Œè¯´æ˜Žã€Œå£³ã€çš„价值也éžå¸¸é‡è¦ã€‚所以我觉得模型和应用都被低估了。 晚点:你刚说的 context 的价值特别好。它其实和管ç†å­¦ä¹Ÿæ‰“通了,比如 Netflix 的那本书《No Rules Rules》最开始就讲了这个逻辑。AI 确实很åƒä¸€ä¸ªäººï¼Œä½ è¦æ•™å®ƒã€è¦ç»™ä¸Šä¸‹æ–‡ï¼Œæ¯”起给它具体指令,这å¯èƒ½æ˜¯æ›´å¥½çš„æ–¹å¼ã€‚ 戴雨森:第一阶段大家都在写更好的 prompt,就åƒè€æ¿å†™ briefã€‚åŽæ¥å‘现è¦åŠ æ›´å¤šç¤ºä¾‹ã€æ›´å¥½çš„ä¸Šä¸‹æ–‡ã€æ›´é€‚åˆæ¨¡åž‹å·¥ä½œçš„环境。这其中有很多具体技巧。Manus 的文章就分享了很多。我想说的是,更多的 Context å¸¦æ¥æ¨¡åž‹èƒ½åŠ›çš„æå‡ï¼Œä¹Ÿå映出我们对 AI 的使用越æ¥è¶Šæ·±å…¥ï¼Œäº§å“本身也越æ¥è¶Šå®Œå–„。以å‰ä¸€å¥ prompt å°±èƒ½è·‘ï¼ŒçŽ°åœ¨äº§å“æœ¬èº«è¦æ‰¿æ‹…更多事情,产å“å…¬å¸çš„价值也在这里体现。 æ™šç‚¹ï¼šä½ è§‰å¾—è¿™ä¸€å±‚çš„åº”ç”¨ä»·å€¼ï¼Œä»€ä¹ˆæ—¶å€™ä¼šè¢«æ¨¡åž‹æœ¬èº«åšæŽ‰ï¼Ÿæ˜¯ä¸æ˜¯ç­‰åˆ°æ¨¡åž‹å…·å¤‡åœ¨çº¿å­¦ä¹ èƒ½åŠ›ã€èƒ½ä¸æ–­å¸æ”¶æ–°çš„上下文的时候? æ™šç‚¹ï¼šæ‰€ä»¥æ˜¯ä¸æ˜¯åˆå›žåˆ°ä¸€ä¸ªæ›¾ç»è¢«å¦è®¤çš„逻辑?以å‰ç§»åŠ¨äº’è”网时代,用户越多,数æ®å馈越多,推è越准,有一个数æ®é£žè½®ã€‚ä½†åŽæ¥å¤§å®¶è§‰å¾—大模型里用户输入对模型智能æå‡æ²¡å•¥å¸®åŠ©ã€‚ä½†ä½ åˆšåˆšçš„æ„æ€æ˜¯ï¼šç”¨æˆ·è¾“入对上下文是有帮助的。 戴雨森:这是两个ä¸åŒçš„问题。大家说的数æ®é£žè½®å¤±æ•ˆï¼ŒæŒ‡çš„æ˜¯ç”¨æˆ·çš„èŠå¤©è®°å½•ä¸èƒ½æå‡æ¨¡åž‹æ™ºèƒ½ã€‚è¿™æˆ‘åŒæ„。因为现在模型的智能已ç»è¶…过普通人。你跟它èŠäº›æ—¥å¸¸è¯é¢˜ï¼Œæ²¡æ³•æå‡å®ƒçš„能力。 最开始模型通过 RLHF(人类å馈强化学习) æ¥å­¦ä¹ äººç±»å好,现在æ¥çœ‹æ™®é€šäººå馈æ„义ä¸å¤§ã€‚比如 AI 都能解 IMO 的题了,为什么还è¦åœ¨æ„普通人觉得哪个答案更好?所以对于有标准答案的任务,用户输入越æ¥è¶Šæ²¡ä»€ä¹ˆä»·å€¼ã€‚ æˆ´é›¨æ£®ï¼šæ˜¯çš„ï¼Œå°¤å…¶æ˜¯åœ¨æ™ºèƒ½èƒ½åŠ›æˆ–è€…é‚£ç§æœ‰æ ‡å‡†ç­”案的任务上。最开始大模型å¯ä»¥çœ‹ä½œæ˜¯å¯¹å¤§é‡äººç±»å¹³å‡æ™ºèƒ½çš„一ç§åŽ‹ç¼©ã€‚å½“æ—¶ç‰¹å¾·Â·å§œï¼ˆTed Chiangï¼‰ä¸æ˜¯å°±è¯´è¿‡ï¼Œè¯­è¨€æ¨¡åž‹æœ¬è´¨ä¸Šæ˜¯å¯¹äº’è”网的模糊压缩å—?但现在,它显然已ç»è¶…越了普通人的水平,达到了æŸç§è¶…人水平。在这个阶段,简å•的数æ®å¯èƒ½å°±æ²¡é‚£ä¹ˆæœ‰ç”¨äº†ã€‚ æ™šç‚¹ï¼šçŽ°åœ¨è¿™ä¸ªæ—¶é—´ç‚¹ï¼Œæ˜¯è¶Šæ—©åš Agent 越好å—?因为你积累的用户上下文越多,价值也越大。之å‰å¤§å®¶å¯èƒ½æ‹…å¿ƒæ–°çš„å¼ºæ¨¡åž‹ä¼šæŠŠå·²æœ‰äº§å“æ·¹æ²¡æŽ‰ã€‚ æ™šç‚¹ï¼šä¸Šæ¬¡æˆ‘ä»¬èŠæ˜¯äºŒæœˆä»½ï¼Œè½¬çœ¼åˆ°çŽ°åœ¨å·®ä¸å¤šäº”个月了。今年已ç»è¿‡å޻䏀åŠï¼Œå›žå¤´çœ‹ï¼Œä½ è§‰å¾— 2025 年上åŠå¹´ AI 领域å‘生的几件最é‡è¦çš„事是什么? 戴雨森:整体æ¥è¯´ï¼ŒAI å·²ç»ä»Žä¸€ä¸ªå研究性质ã€çœ‹èµ·æ¥å¾ˆæ–°é¢–但实用性有é™çš„æŠ€æœ¯ï¼Œè¿›å…¥åˆ°äº†ä¸»æµå¸‚场。上åŠå¹´æˆ‘认为有几个é‡å¤§è¿›å±•。 第一,是 AI 在编程领域的çªç ´ã€‚Coding å·²ç»æˆä¸º AI 应用的é‡ä¸­ä¹‹é‡ã€‚我今天还å¬è¯´ OpenAI çŽ°åœ¨å·²ç»æœ‰ä¸‰ä¸ªä¸šåŠ¡çº¿ï¼šGPTã€API å’Œ Coding。用户也å‘现 AI coding 产å“éžå¸¸æœ‰ç”¨ï¼Œä¹Ÿæ„¿æ„为此付费。Cursor ç­‰ AI 编程工具的æˆé•¿é€Ÿåº¦å°±æ˜¯ä¸€ä¸ªä»£è¡¨ã€‚Claude Code 也有人称是 L3 或 Agent 级别的产å“ï¼Œèƒ½æ¯”äººç±»å†™å¾—æ›´å¿«æ›´å¥½ï¼Œä»£ç æ›´ä¼˜é›…ï¼Œè¿˜èƒ½å¤„ç†æ›´å¤§çš„代ç åº“。所以 AI åœ¨ç¼–ç¨‹é¢†åŸŸå·²ç»æ­£å¼è·¨è¶Šé¸¿æ²Ÿï¼Œè¿›å…¥äº†ä¸»æµå¸‚场。 第二,是 o3 在四月的正å¼å‘布,伴éšç€ ChatGPT ç”¨æˆ·çš„é«˜é€Ÿå¢žé•¿ï¼Œè¿™æ˜¯æŽ¨ç†æ¨¡åž‹çš„æŒç»­æ¼”è¿›ã€‚ä»ŽåŽ»å¹´ä¸‹åŠå¹´å¼€å§‹æˆ‘们就看到 OpenAI 推出 o1ã€R1,到今年的 o3ï¼Œå®ƒæ ‡å¿—ç€æŽ¨ç†é—®ç­”ã€é¢˜è§£è¿™äº›èƒ½åŠ›ä»Žç§‘ç ”å±‚é¢è¿›å…¥åˆ°äº†æ™®é€šç”¨æˆ·å¯ä»¥ä½¿ç”¨çš„产å“,是真正的è½åœ°äº†ã€‚ ChatGPT 的用户增长还在æŒç»­ï¼Œè¿™ä¸€æ³¢ä¹Ÿå—益于 o3 推ç†èƒ½åŠ›çš„æå‡ã€‚我们也看到年åˆä¸­å›½è¿™è¾¹çš„çªç ´ï¼Œæ¯”如 R1 是国内在 reasoning 上迈出的é‡è¦ä¸€æ­¥ï¼ŒKimi Researcher 也是第一个广泛å¯ç”¨çš„ deep research 类产å“,用户å馈很好。AI åœ¨è¿™ä¸ªé¢†åŸŸå·²ç»æ¯”ç»å¤§å¤šæ•°äººåšå¾—更好了,也是跨越鸿沟。 第三,是 Agent 应用开始普åŠã€‚比如 Devin 是第一个让人看到 L3 Agent prototype 的产å“。Manus å’Œ Genspark 都是在三月å‘布,Claude Code ä¹Ÿåœ¨ä¸æ–­å®Œå–„。我们看到éšç€æ¨¡åž‹åœ¨æŽ¨ç†ã€ç¼–程ã€å·¥å…·ä½¿ç”¨è¿™ä¸‰å¤§èƒ½åŠ›çš„å¢žå¼ºï¼Œå‡ºçŽ°äº†ç¬¬ä¸€æ‰¹å…·å¤‡å®Œæ•´ Agent å½¢æ€çš„产å“:它们能接收模糊目标,自主调用工具,寻找解决方案,评估任务进度,并最终完æˆä»»åŠ¡ã€‚è™½ç„¶å®ƒä»¬è¿˜ä¸ç®—主æµï¼Œä½†å·²ç»è¿›å…¥ Early Adopter 阶段,部分场景下用户éžå¸¸æ„¿æ„用。尽管还有ä¸å°‘问题,但 Agent å·²ç»å˜å¾—有用了,这是上åŠå¹´ AI 应用领域最é‡è¦çš„进展之一。 第四,是多模æ€èƒ½åŠ›çš„å¿«é€Ÿè¿›æ­¥ï¼Œå°¤å…¶æ˜¯å›¾åƒç”Ÿæˆã€‚从早期åƒçŽ©å…·ä¸€æ ·çš„å·¥å…·ï¼Œå˜æˆäº†å®žå®žåœ¨åœ¨çš„生产力工具。比如 ChatGPT 的图åƒç”Ÿæˆå¯¹è¯­ä¹‰çš„è·Ÿéšéžå¸¸å¥½ï¼Œèƒ½å‡†ç¡®ç†è§£ç”¨æˆ·æ„图。现在很多人用 AI æ¥ç”»æ¼«ç”»ã€ç”»æµç¨‹å›¾ã€åšè§†è§‰å†…容。这ç§ç”Ÿæˆèƒ½åŠ›çš„æå‡å·²ç»å˜å¾—éžå¸¸å®žç”¨ã€‚ 戴雨森:对,因为它的指令跟éšèƒ½åŠ›è¶Šæ¥è¶Šå¼ºï¼Œèƒ½æ›´å¥½æ»¡è¶³ç”¨æˆ·éœ€æ±‚ã€‚åŽŸæ¥æ˜¯åƒæŠ½å¡é‚£æ ·çš„ä¸ç¡®å®šæ€§ï¼ŒçŽ°åœ¨å·²ç»è¶Šæ¥è¶Šå¥½äº†ã€‚直播头åƒå¥½å¤šéƒ½å˜æˆäº† AI 生æˆçš„。 Veo3 也是一个很厉害的模型。它加入语音é…音åŽï¼Œæˆ‘å‘了个朋å‹åœˆæ„Ÿå¹ï¼Œå®ƒç”Ÿæˆçš„ä¸–ç•Œå·²ç»æŽ¥è¿‘çœŸç›¸éš¾è¾¨çš„è™šæ‹Ÿä¸–ç•Œäº†ã€‚Veo3 第一次让我有一ç§è·¨è¶Šææ€–谷的感觉,真å‡éš¾è¾¨ã€‚ 第五,是抢人大战。无论是 Meta 的大规模挖人,还是创业公å¸ç–¯ç‹‚èžèµ„,å†åˆ° Windsurf 最近收购的 drama,都说明硅谷对人æ‰çš„争夺和资本竞争进入了一个新的阶段。我们在国内也感å—到类似热度:èžèµ„é¢ä¸Šå‡ã€é¡¹ç›®æŠ¢æ‰‹ã€ä¸€ä¸ªæœˆèžèµ„几轮的情况åˆå‡ºçŽ°äº†ã€‚è¿™èƒŒåŽæ˜¯å› ä¸ºå¤§å®¶çœŸçš„看到了 AI 正在è½åœ°ï¼Œä¸å†åªæ˜¯æ¦‚念,很多已ç»å®žå®žåœ¨åœ¨åœ°äº§ç”Ÿæ”¶å…¥äº†ã€‚ 戴雨森:我们认为模型基础能力的æå‡æ˜¯è§£é”应用场景的关键。模型能力é…åˆå¥½çš„产å“设计,æ‰èƒ½çœŸæ­£é‡Šæ”¾ä»·å€¼ã€‚一个真正有价值的 AI 应用,一定能通过æŸç§æ–¹å¼è®©ç”¨æˆ·ä»˜è´¹ï¼Œæ¯”如订阅或按工作交付。所以我们特别关注 AI 在æå‡ç”Ÿäº§åŠ›æ–¹é¢çš„价值,尤其是在数字世界里的应用。å¯ä»¥çœ‹åˆ°æˆ‘们投的很多是 AI Agent 或者 AI 生产力方å‘的项目,因为这是当下最能真正帮用户解决问题的场景。 戴雨森:是的,但我认为上åŠå¹´æœ‰ä¸€ä¸ªè¢«é«˜ä¼°çš„æ–¹å‘,就是人形机器人。特斯拉最近下调了对 Optimus 的生产预期,我觉得很有代表性。 去年我就说过,大家对 Optimus 进工厂打螺ä¸çš„æœŸå¾…值太高了。当时有人说 2025 年特斯拉就能有一万个机器人进厂干活,这完全低估了 manipulation(æ“作控制)的难度。现在我们看到的一些 demo 确实越æ¥è¶Šå¥½ï¼Œæ¯”如å è¡£æœï¼Œä½†çœŸçš„è¦æœºå™¨äººåšå‡ºä¸€æ¯å’–啡,还是éžå¸¸éš¾çš„。 当然,我认为这个领域还在快速å‘展,在未æ¥å‡ å¹´å¯èƒ½ä¼šçœ‹åˆ° manipulation 的「ChatGPT 时刻ã€çªç ´ï¼Œä½†å¦‚果期待 2025 年就能大规模è½åœ°ï¼Œæˆ‘觉得是大大高估了。 技术的å‘展ä¸èƒ½æ‹”苗助长,必须ç»åŽ†ï¼šæ–¹å‘确定ã€é€æ¸æ”¾å¤§ã€å½¢æˆäº§å“ã€å†åˆ°å¤§è§„模è½åœ°ï¼Œè¿™å‡ ä¸ªé˜¶æ®µï¼Œæ²¡æ³•è·³è¿‡ã€‚æœºå™¨äººç›®å‰æ˜¾ç„¶è¿˜å¤„在早期探索阶段。 戴雨森:我觉得首先,应用的价值还是在被低估的。一年å‰ï¼Œå¤§å®¶è¿˜åœ¨è®²æ¨¡åž‹å…¬å¸ä¼šé¢ è¦†åº”用公å¸ï¼Œè¯´ã€Œåº”ç”¨åªæ˜¯å¥—壳ã€ï¼Œè¿™ä¸ªä¸šåŠ¡æ¨¡å¼ä¸æˆç«‹ã€‚当时ä¸ç®¡æ˜¯ Manusã€Genspark,还是很多其他公å¸ï¼Œéƒ½ç»åŽ†äº†ä¸å°‘质疑,说:「你是一个壳公å¸ï¼Œæœ‰æ²¡æœ‰é•¿æœŸä»·å€¼ï¼Ÿæ˜¯ä¸æ˜¯æ¨¡åž‹ä¸€å‡çº§ä½ å°±å®Œäº†ï¼Ÿã€ çŽ°åœ¨è¿™ä¸ªäº‰è®ºè™½ç„¶è¿˜åœ¨ç»§ç»­ï¼Œä½†æ˜¾ç„¶ä¸æ˜¯æ¨¡åž‹å‡çº§äº†åº”用公å¸å°±ä¼šå®Œè›‹ã€‚相åï¼Œå¥½çš„åº”ç”¨å…¬å¸æ˜¯æœŸå¾…模型å‡çº§çš„,这样å¯ä»¥è®©ç”¨æˆ·äº«å—更强大的体验。「壳ã€çš„价值ä»è¢«ä½Žä¼°äº†ã€‚ 大家之å‰å¯èƒ½ä¸ä¼šæ–™åˆ°ï¼Œè‚–弘能åšå‡ºä¸€ä¸ªä¸–界级的 AI 应用。而几天å‰å‘布的 Kimi K2,在 7 月 15 日这个时间点,å¯ä»¥è¯´æ˜¯å…¨çƒæœ€å¼ºçš„å¼€æºå¤§æ¨¡åž‹ï¼Œæ²¡æœ‰ä¹‹ä¸€ã€‚它在 codingã€Agent 工作æµå’Œä¸­æ–‡å†™ä½œç­‰æ–¹é¢çš„表现,确实优于 Claude。当然,Claude 是在年åˆå‘布的,但在 AI 这个领域,六个月就相当于很久了。 OpenRouter ä¸Šçš„è°ƒç”¨æ•°æ®æ˜¾ç¤ºï¼ŒK2 刚上线没几天,昨天还在编程类目里排第 13,今天就å‡åˆ°äº†ç¬¬ 10,å‰é¢æ˜¯ Claudeã€Geminiã€GPT。这ç§ä¸Šå‡é€Ÿåº¦æ˜¯éžå¸¸å¿«çš„,说明用户å馈éžå¸¸å¥½ã€‚但现在大家其实已ç»å¯¹ benchmark 麻木了,对å§ï¼Ÿæˆ‘们更看é‡å®žé™…用户的使用å馈。 Kimi 是最典型的例å­ï¼Œä½†ä¸æ˜¯å”¯ä¸€çš„。我们也讨论过 DeepSeek åŽä»–们团队的转型问题,Kimi 背åŽçš„ Moonshot 也ç»åŽ†äº†å¾ˆå¤šå¤ç›˜ï¼Œå¹¶é›†ä¸­ç²¾åŠ›æ”»åšä¸‹ä¸€ä»£æ¨¡åž‹ã€‚我觉得外界太容易在很早期就下结论,比如说 DeepSeek 出æ¥çš„å…­å°é¾™å…¬å¸æ˜¯ä¸æ˜¯éƒ½ä¸è¡Œäº†ã€‚但实际上,如果一个团队足够稳定,有优秀人æ‰ã€æœ‰èµ„æºã€æœ‰æ„志,那他们的主观能动性和çªç ´ç©ºé—´è¿œè¿œè¢«ä½Žä¼°äº†ã€‚ ç¬¬ä¸‰ï¼Œæˆ‘è§‰å¾—æ¨¡åž‹èƒ½åŠ›è¿›åŒ–çš„é€Ÿåº¦ä¹Ÿè¢«ä½Žä¼°äº†ã€‚æ¯”å¦‚çŽ°åœ¨å·²ç»æœ‰ä¼ è¨€è¯´ GPT-5 很快就è¦å‘,它å¯èƒ½æ˜¯ä¸€ä¸ªåŽŸç”Ÿå¤šæ¨¡æ€ã€æŽ¨ç†èƒ½åŠ›éžå¸¸å¼ºã€å…·å¤‡é«˜çº§ Agent 能力的模型。 现在新产å“å‘布的时候往往会被喷,说画了大饼但实际上产å“体验没有那么好。但好的应用公å¸éœ€è¦ä¸º 6 到 12 个月åŽçš„æ¨¡åž‹è®¾è®¡ã€‚比如 Cursor 一开始å‘布的时候,当时的模型还无法实现它的完整愿景,直到 Claude 3.5 Sonnet 出æ¥ï¼ŒCursor æ‰çœŸæ­£æˆä¸ºä¸€ä¸ªå¥½ç”¨çš„产å“。 Manus 在设计时能用的最好模型是 Sonnet 3.5,å‘布时 Sonnet 3.7 刚上线,Manus 因此能够完æˆä¸€äº›æ›´å¤æ‚çš„ä»»åŠ¡ï¼Œä¹‹åŽ Claude 4,Gemini 2.5 Pro 等新模型的å‘布也进一步æå‡äº† Manus 的表现。也许å†éœ€è¦ 1-2 个模型的大版本迭代,æ‰èƒ½å¤Ÿå……分让主æµç”¨æˆ·æ„Ÿå—到 Agent 带æ¥çš„生产力æå‡ã€‚ æ‰€ä»¥æˆ‘ä»¬è®¤ä¸ºï¼Œæœªæ¥æ¨¡åž‹çš„能力æå‡ä»ç„¶éžå¸¸å¿«ï¼Œä¹Ÿè®¸å¾ˆå¿«å°±ä¼šæœ‰è®©å¤§å®¶éœ‡æƒŠçš„å‘布出现。那时,模型增长和应用价值å¯èƒ½éƒ½å°†è¶…出市场预期,整个 AI å‘展节å¥ä¹Ÿä¼šå†åº¦åŠ å¿«ã€‚ 晚点:这åŠå¹´è¿˜æœ‰ä¸€ä¸ªæˆ‘之剿²¡æœ‰æƒ³åˆ°çš„æ–°å˜åŒ–,就是最近éžå¸¸æ¿€çƒˆçš„外å–大战。因为外å–大战这件事情牵扯了好几个巨头的精力和资æºï¼ŒåŒ…括阿里ã€ç¾Žå›¢å’Œäº¬ä¸œã€‚你觉得这个会怎么影å“中国的 AI çš„æ ¼å±€ï¼Œæˆ–è€…è¯´å¯¹åˆ›ä¸šå…¬å¸æ¥è¯´ï¼Œå®ƒå¯èƒ½ä¼šæœ‰ä»€ä¹ˆå½±å“? 但我看阿里云的增速预期还是挺高的。今天 Jensen 还宣布å¯ä»¥é‡æ–°å‘中国销售 H100。我们看到,今年美国这边的 IDC 和云æœåŠ¡å¢žé•¿å¾—éžå¸¸å¿«ï¼Œå› ä¸ºåº”用è½åœ°ä¹‹å޿ލç†çš„用é‡ä¼šå¤§å¹…增长。 我认为中国市场的å‘展路径也会是类似的。当 Kimiã€å­—节ã€DeepSeek ç­‰å…¬å¸æŽ¨å‡ºæ›´å¥½çš„æ¨¡åž‹åŽï¼Œæ›´å¤šåœºæ™¯è¢«è§£é”,推ç†çš„算力需求也会很快爆å‘。知识工作者在中美其实都很åƒï¼Œå¤§å®¶éƒ½ç”¨ Officeã€éƒ½è¦æœç´¢ã€éƒ½ç”¨ deep research 工具,在美国市场已ç»éªŒè¯çš„这些需求场景在中国迟早也会爆å‘。 当然这跟外å–大战没什么直接关系。但比如说阿里云ã€ç«å±±äº‘这些中国云æœåŠ¡å•†ï¼Œå¯èƒ½ä¹Ÿä¼šç»åŽ†ä¸€æ¬¡ç¾Žå›½é‚£æ ·çš„å¢žé•¿è¿‡ç¨‹ã€‚ 戴雨森:哈哈,这个现在还是挺神秘的,我们也åªèƒ½é€šè¿‡ä¸€äº›å¤–å›´ä¿¡æ¯åŽ»äº†è§£ã€‚æˆ‘å¬è¯´çŽ°åœ¨ V4 还在训练阶段。因为他们当时是先å‘了一个 V3,然åŽå†å‘ R1,那现在 V4 都还没补å‘,å¬è¯´è¿˜åœ¨è®­ç»ƒä¸­ï¼Œé‚£ R2 çš„å‘布时间å¯èƒ½å°±è¦ç­‰åˆ° V4 之åŽäº†ã€‚但我相信 DeepSeek 肯定在åšå¾ˆå¤šæœ‰æ„æ€çš„创新。我们也和里é¢çš„一些åŒå­¦èŠè¿‡ï¼ŒçŸ¥é“他们的创新能力是éžå¸¸å¼ºçš„。ä¸è¿‡æˆ‘觉得他们也确实会å—到算力资æºçš„é™åˆ¶ã€‚毕竟å¡çš„æ€»é‡æ˜¯æœ‰é™çš„,而且他们å‘布模型之åŽï¼Œè¿˜æœ‰å¤§é‡çš„算力è¦ç”¨æ¥åšæŽ¨ç†ï¼ˆinference)。 æˆ´é›¨æ£®ï¼šå¯¹ï¼Œè¿™å…¶å®žåæ˜ äº†ä¸€ä¸ªå¾ˆçŽ°å®žçš„æƒ…å†µï¼šDeepSeek çš„èµ„æºæ²¡æœ‰å¤šåˆ°å¯ä»¥åœ¨æ‰€æœ‰é¢†åŸŸå¯¹æ ‡ SOTAã€‚æ‰€ä»¥å°±åƒ Claude 背åŽçš„ Anthropic 一样,他们è¦åšä¸€äº›åˆ¤æ–­ï¼šå“ªäº›æ–¹å‘在当å‰é˜¶æ®µæœ€é‡è¦ã€æœ€èƒ½å‡ºç»“果,然åŽé›†ä¸­èµ„æºçªç ´ï¼›è€Œå¯¹äºŽä¸€äº›å°šä¸æ˜Žæœ—的方å‘,他们å¯ä»¥ç­‰ç­‰ï¼Œç­‰åˆ°æ€è·¯æ›´æ¸…晰之åŽï¼Œå†åˆ©ç”¨è‡ªå·±çš„工程能力和团队的努力赶上。 而字节 Seed 现在å¯èƒ½æ˜¯åœ¨è¯•图åšåˆ°å…¨é¢é¢†å…ˆï¼šä»–们有 Edge ç»„åŽ»åšæœ€å‰æ²¿çš„研究,有 Focus 组去冲击 SOTA,还有 Base ç»„åŽ»åšæœåŠ¡äº§å“åº”ç”¨ã€‚è¿™ç§æ˜¯å…¨æ ˆåž‹çš„布局。 相比之下,DeepSeek 更有选择性,比如é‡ç‚¹çªç ´æ¨¡åž‹æ™ºèƒ½ã€‚当资æºä¸é‚£ä¹ˆå……足时,确实需è¦åšä¸€äº›å–èˆã€‚åƒ Seed 这样的组织结构,把 Edgeã€Focusã€Base ä¸‰ä¸ªæ–¹å‘æ˜Žç¡®åˆ†å¼€ï¼Œæˆ‘觉得是更明确的。 æ™šç‚¹ï¼šå¯¹ï¼Œä»–ä»¬çŽ°åœ¨å°±æ˜¯è¿™ç§æ¯”较明确的分工结构。Edge 一开始列了五个方å‘,现在å¯èƒ½å·²ç»æ‰©å±•到了å几个项目,确实挺厉害的。 æˆ´é›¨æ£®ï¼šæˆ‘è§‰å¾—æŠŠåº”ç”¨å’Œç ”ç©¶åˆ†å¼€ï¼Œå†æŠŠç ”ç©¶ä¸­çš„ SOTA å’Œ Frontier éƒ¨åˆ†ç»§ç»­ç»†åˆ†ï¼Œæ˜¯æ¯”è¾ƒå¯¹çš„åšæ³•。之å‰å¤§å®¶å¯èƒ½å°±æ˜¯åˆ†æˆ Frontier å’Œ Applied Research,但那时候资æºä¸å¤Ÿï¼Œç»„织的èŒè´£ä¹Ÿä¸å¤Ÿæ˜Žç¡®ã€‚æ™®é的问题是:如果你让一个模型团队既è¦åšå‰æ²¿ç ”ç©¶ã€è¿½èµ¶ SOTA,甚至超越 SOTAï¼ŒåŒæ—¶åˆè¦æ»¡è¶³ App çš„è½åœ°éœ€æ±‚,这两个目标是很容易冲çªçš„。 Kimi 在过去åŠå¹´å…¶å®žä¹Ÿæ€»ç»“了很多这方é¢çš„ç»éªŒã€‚如果有个大用户é‡çš„应用在线上,需è¦èб大é‡ç²¾åŠ›åŽ»ç»´æŠ¤ï¼Œå¤„ç†å„ç§ corner case,修 bugã€‚ä½†è¿™äº›å·¥ä½œå…¶å®žå¯¹æŽ¨åŠ¨ä¸‹ä¸€ä»£æ¨¡åž‹ã€æŒ‘战 SOTA 的帮助是有é™çš„。今年就没有投入太多精力在 K1 的迭代和应用功能上,而是专注于åšä¸‹ä¸€ä»£æ¨¡åž‹ï¼Œæ¥æ‹“展模型智能的边界。 æˆ´é›¨æ£®ï¼šç›®å‰æ¥çœ‹ï¼Œæˆ‘觉得还是è¦å…ˆæŠŠä¸€ä¸ªæ–¹å‘åšåˆ°æžè‡´ã€‚比如你如果是åšåº”用的,那就å‡è®¾è‡ªå·±èƒ½ç”¨ä¸Šæœ€å¥½çš„æ¨¡åž‹ï¼Œè°æœ€å¼ºã€æœ€åˆé€‚就用è°ã€‚ä½†å¦‚æžœä½ æ˜¯åšæ¨¡åž‹çš„ï¼Œé‚£ç›®æ ‡å°±æ˜¯è®©è‡ªå·±çš„æ¨¡åž‹ä¿æŒåœ¨ SOTA 水准,在æŸä¸ªå…·ä½“领域åšåˆ°æœ€å¼ºã€‚ 晚点:我想èŠä¸€ä¸‹ Kimi K2ã€‚ä»Šå¹´å¹´åˆ DeepSeek 引å‘热潮åŽï¼ŒKimi 内部也有了一个比较明确的目标,就是è¦è¿½æ±‚ SOTA。在这个目标下,K2 应该是他们åšå‡ºæ–¹å‘调整åŽç¬¬ä¸€ä¸ªæ¯”较é‡ç£…çš„æˆæžœã€‚你对这个过程是怎么ç†è§£çš„? æˆ´é›¨æ£®ï¼šæˆ‘æƒ³å…ˆè®²ä¸ªå°æ•…事。å‰å‡ å¤©ï¼Œæš—涌在良渚组织了一个圆桌,把投资了 Kimi å’Œ MiniMax 的投资人都请到一å—ã€‚æˆ‘è¿˜å¼€çŽ©ç¬‘è¯´ï¼Œè¿™åƒæ˜¯ä¸€ä¸ªã€ŒåŒæƒ…å±€ã€ï¼Œä»¿ä½›æˆ‘们投了大模型公å¸ï¼Œå¾ˆæƒ¨è¯¥è¢«åŒæƒ…。但我觉得,其实真正体现一个团队能力的,是他们é¢å¯¹æŒ‘战时的应对方å¼ï¼Œä»¥åŠæ˜¯å¦åšæŒè‡ªå·±çš„è·¯çº¿åŽ»åšæœ‰ä»·å€¼çš„创新。 é¡ºé£Žçš„æ—¶å€™æœ‰é¡ºé£Žçš„æ‰“æ³•ï¼Œé€†é£Žçš„æ—¶å€™ä¹Ÿæœ‰é€†é£Žçš„æ‰“æ³•ã€‚åƒ MiniMax,他们专注自己的方å‘,现在也在推进上市æµç¨‹ã€‚这就是他们é¢å¯¹æŒ‘战的方å¼ã€‚当然,也有一些公å¸åœ¨é€†é£Žä¸­å†…部团队å‘生较大å˜åŒ–,甚至业务方å‘都有调整。但我觉得 Kimi 特别的一点,是他们的团队éžå¸¸ç¨³å®šã€‚如果你看他们的创始团队或核心æˆå‘˜ï¼Œå‡ ä¹Žæ²¡æœ‰å¤§çš„å˜åŠ¨ã€‚ 晚点:这其实就是我第一个好奇的点。现在很多公å¸åˆ°äº†è”åˆåˆ›å§‹äººæˆ–核心业务负责人层é¢ï¼Œéƒ½ä¼šæœ‰ä¸€äº›å˜åŒ–,但 Kimi 基本没怎么å˜ã€‚ 戴雨森:这å¯èƒ½è·Ÿä»–ä»¬çš„å›¢é˜Ÿç»„æˆæœ‰å…³ã€‚Kimi 的创始团队一直是以æ¤éºŸä¸ºæ ¸å¿ƒï¼Œè€Œä¸”æˆå‘˜æ˜¯æ¸…åŽçš„è€åŒå­¦ï¼Œä¹‹é—´åˆä½œå¾ˆå¤šï¼Œç”šè‡³æ˜¯å®¤å‹è¿˜ä¸€èµ·çŽ©è¿‡ä¹é˜Ÿã€‚并䏿˜¯å› ä¸ºè¦åšå¤§æ¨¡åž‹å…¬å¸æ‰ä¸´æ—¶ç»„èµ·æ¥çš„。 晚点:我查阅资料时å‘çŽ°ï¼Œå½“å¹´æ¨æ¤éºŸåŽ»è¯„ç‰¹å¥–çš„æ—¶å€™ï¼Œæœ‰ä¸€å¼ ç…§ç‰‡æ˜¯ä»–ä»¬ç³»çš„ä¸€äº›åŒå­¦ä¸¾ç€æ¨ªå¹…去支æŒä»–。几ä½ä»–ä»¬ç³»çš„å¸ˆå¼Ÿå¸ˆå¦¹éƒ½ä¼šè¯´æ¨æ¤éºŸåœ¨å½“时就是一个让大家觉得ã€éžå¸¸æœ‰å·å¬åŠ›çš„äººã€‚ 戴雨森:没错,这也是我们从一开始就决定投资他们的é‡è¦åŽŸå› ä¹‹ä¸€ã€‚è¿™ä¸ªå›¢é˜Ÿä¸ä»…有技术,而是有很长的共åŒä¿¡ä»»ã€‚创业会ç»åŽ†å¾ˆå¤šæŒ‘æˆ˜ï¼Œå¦‚åŒåŽ‹åŠ›æµ‹è¯•ï¼Œåœ¨é¢å¯¹æŒ‘战的时候,团队稳定和方å‘èšç„¦ä¼šå¾ˆé‡è¦ã€‚ Kimi 这个团队从一开始就是以技术基因和技术视野作为核心能力的。很多人å¯èƒ½å·²ç»å¿˜äº†ï¼Œåœ¨ 2023 年的时候,AI çš„å˜åŒ–太快,几乎æ¯ä¸ªæœˆéƒ½æœ‰æ–°é£Žå‘。当时,Kimi 就对长文本这个方å‘åšå‡ºäº†å¾ˆé‡è¦çš„判断,选择åšäº†ä¸€ä¸ªå…·å¤‡é•¿æ–‡æœ¬èƒ½åŠ›çš„æ¨¡åž‹ï¼Œå¹¶åŸºäºŽè¿™ä¸ªæŽ¨å‡ºäº†å¸¦æœç´¢èƒ½åŠ›çš„ Kimi 第一个版本。 那时大é‡çš„ AI chatbot 其实是没有æœç´¢åŠŸèƒ½çš„ã€‚æ²¡æœ‰æœç´¢ï¼Œæ¨¡åž‹çš„用途就会å—到很大é™åˆ¶ï¼Œæ¯”如你éšä¾¿é—®ä¸€ä¸ªã€ŒçŽ°åœ¨çš„ç¾Žå›½æ€»ç»Ÿæ˜¯è°ã€ï¼Œå®ƒéƒ½å¯èƒ½ç­”ä¸ä¸Šæ¥ã€‚ Kimi 团队当时对长文本技术方å‘的判断就展现了他们éžå¸¸å¼ºçš„æŠ€æœ¯ vision。到了 2025 年,AI 更强调 Agent 能力ã€å¤æ‚任务执行ã€ä»¥åŠå¤„ç†æ›´å¤§çš„代ç åº“,大家æ‰çœŸæ­£æ„识到长文本的é‡è¦æ€§ã€‚如果你真的è¦è®© AI åšä¸€ä¸ª Agent,完æˆä¸€ä¸ªå¤æ‚任务,它ä¸èƒ½åªæ˜¯æ‰§è¡Œ 100 步就歇了。回头看,其实这也验è¯äº†æ¤éºŸåˆ¤æ–­ä¸Šçš„准确。 第二是对技术方å‘çš„åšæŒã€‚他们䏿˜¯çœ‹åˆ°å“ªä¸ªç«å°±å¾€å“ªå„¿è·Ÿé£Žï¼Œæ¯”如陪伴ç«äº†åŽ»åšé™ªä¼´ï¼Œå¤šæ¨¡æ€ç«äº†åˆåŽ»åšå¤šæ¨¡æ€ã€‚很多方å‘都å¯ä»¥åšï¼Œä½†çœŸæ­£æœ‰ç§¯ç´¯çš„æ˜¯é‚£äº›æŒç»­åšä¸€ä»¶äº‹çš„团队。 当然 R1 çš„æˆåŠŸä¹Ÿç¡®å®žç»™äº†è¡Œä¸šå¾ˆå¤šå¯å‘,这一点毫无疑问。当时很多人看到 R1,有个æµè¡Œè¯´æ³•是:「pre-training ä¸é‡è¦ï¼Œpost-training æ‰é‡è¦ã€‚ã€ä½†æˆ‘认为 R1 的基础是 V3,这æ°å¥½è¯´æ˜Žå¥½çš„基础模型很é‡è¦ï¼Œ pre-training 和整体架构优化å¯ä»¥å¸¦æ¥æ¨¡åž‹èƒ½åŠ›çš„æå‡ã€‚K2 现在还是个 non-reasoning 的模型,已ç»å‘ˆçŽ°å‡ºå¾ˆå¥½çš„èƒ½åŠ›ï¼Œè¿™ä¹Ÿè¯´æ˜Ž pre-training ä¾ç„¶å¾ˆé‡è¦ã€‚ å¼€æºä¹Ÿå¾ˆé‡è¦ã€‚çŽ°åœ¨å…¨çƒ AI 社区正处于 Early Adopter(早期采用者)阶段,通过开æºä¼˜ç§€çš„æ¨¡åž‹å’Œäº§å“给社区æä¾›ä»·å€¼çš„团队,很容易得到热心的回应。我们在 DeepSeekã€K2ï¼Œä»¥åŠæˆ‘们 sponsor çš„ vLLMã€ControlNET 等开æºé¡¹ç›®ä¸­çœ‹åˆ°ï¼Œåªè¦ä¸æ–­æ‹¿å‡ºå¥½çš„产å“ï¼Œä¿æŒå¯¹ç”¨æˆ·å¼€æ”¾äº¤æµçš„æ€åº¦ï¼Œä¸–ç•Œå„地的用户都会欣èµã€æ”¯æŒä½ ï¼Œç”šè‡³ä¸»åŠ¨å¸®ä½ æ”¹è¿›é—®é¢˜ã€‚ä½†åªæ˜¯å¼€æºä¸æœ¬è´¨ï¼Œæœ¬è´¨æ˜¯å¼€æºå¥½çš„ä¸œè¥¿ï¼Œä¸æ˜¯å¼€æºå°±ä¸€å®šå¥½ï¼Œç¤¾åŒºè§‰å¾—å¥½æ‰æ˜¯æ ¸å¿ƒã€‚ 戴雨森:K2 主è¦çš„åœºæ™¯ä¸æ˜¯åœ¨æœ¬åœ°æœºå™¨éƒ¨ç½²ï¼Œäº‹å®žä¸Šè¦åœ¨æœ¬åœ°æ»¡è¡€è·‘ Deepseek R1 也ä¸ç®€å•。开æºçš„æ ¸å¿ƒä¸åœ¨äºŽæœ¬åœ°éƒ¨ç½²ï¼Œè€Œæ˜¯è®©å¤§å®¶å¯¹æ¨¡åž‹æœ‰æ›´å¤šè‡ªä¸»æŠŠæŽ§ã€‚ 晚点:你能总结下他们为什么能åšå‡º K2 è¿™ç§çº§åˆ«æ¨¡åž‹ï¼ŸçŽ°å®žè¿‡ç¨‹ä¸­é‡åˆ°äº†å“ªäº›æŒ‘战?外部舆论把他们放在低谷,是å¦å¸¦æ¥å¾ˆå¤§åŽ‹åŠ›ï¼Œæ¯”å¦‚äººæ‰æµå¤±ï¼Ÿæˆ‘指的ä¸å…‰æ˜¯æ ¸å¿ƒå±‚,还有一线工程师。 之å‰åšæŠ•æ”¾æ—¶è®¨è®ºè¿‡ï¼Œä»–ä»¬åšæŠ•æ”¾ä¸æ˜¯å¼ºé¡¹ï¼Œä½†çŽ°åœ¨æ˜¯å›žå½’äº†åˆå¿ƒï¼Œåšå›¢é˜Ÿèƒ½åŠ›æœ€å¼ºçš„æ–¹å‘。我觉得这很é‡è¦ã€‚é¢å¯¹å¤–部市场压力,首先ä¸è¦ä¹±ï¼Œè¦èšç„¦è‡ªå·±æœ€æ“…é•¿ã€æœ€èƒ½åšå¥½ã€æœ€æœ‰æ„ä¹‰çš„äº‹æƒ…ã€‚çŸ¥ä¹Žä¸Šä¹Ÿæœ‰å¥½å‡ ä½ Kimi 的研究员写了å‚与 K2 的很多感想。 在 reasoning æ–¹é¢ï¼Œæˆ‘们看到了 o3ã€o4 mini çš„å‘å¸ƒï¼Œè¿˜æœ‰åŽæ¥çš„ o3 pro。虽然这些模型在一些榜å•上表现进展ä¸å¤§ï¼Œä½†æˆ‘们自己的使用体验是,o3 相比 o1 是一个明显的大å°é˜¶ï¼Œo3 pro 在推ç†é•¿åº¦å’Œé€»è¾‘连贯性上也越æ¥è¶Šå¥½ã€‚现在很多模型在 reasoning 的细节上都有进步,比如细节的幻觉å‡å°‘,推ç†ç»“果更严谨。 åŒæ—¶æˆ‘们还看到,一些å°ä¸€ç‚¹çš„æ¨¡åž‹ä¹Ÿå¼€å§‹å…·å¤‡å¾ˆå¼ºçš„ reasoning èƒ½åŠ›ã€‚åƒ GPQA 或 AIME 这些å应模型 reasoning 能力的指标都éžå¸¸é«˜ã€‚K2 在这方é¢ä¹Ÿè¡¨çްä¸é”™ã€‚ 晚点:我们之å‰å’Œä¸€äº›äººäº¤æµï¼Œæ¯”如阿里云 CTO 周é–人,他并ä¸è§‰å¾—åƒ o 系列的更新是特别大的范å¼å˜åŒ–。他认为这还是在大模型原有方法框架内的自然延展。 ä¸è¿‡æœ‰æ—¶å€™ï¼Œä¸€ä¸ªæŠ€æœ¯èŒƒå¼å°±å¯ä»¥èµ°å¾—很远。就åƒé«˜é€Ÿå…¬è·¯å¯ä»¥ç”¨å‡ å年,ä¸ä¸€å®šéžè¦æ¯å¹´éƒ½æœ‰é¢ è¦†å¼çš„æž¶æž„å˜åŒ–æ‰å«åˆ›æ–°ï¼Œå®žé™…上,如果æ¯å¹´éƒ½æœ‰é¢ è¦†å¼çš„æŠ€æœ¯å‘生,那说明这个行业还很ä¸ç¨³å®šï¼Œå而ä¸ä¸€å®šé€‚åˆäº§ä¸šè½åœ°ã€‚ä»Šå¹´æˆ‘ä»¬åœ¨äº§ä¸šä¸ŠçœŸæ­£èƒ½ç”¨åˆ°çš„æŠ€æœ¯ï¼Œå¹¶ä¸æ˜¯ä»Ž 0 到 1 çš„å˜åŒ–ï¼Œæ›´åƒæ˜¯ä»Ž 1 到 10,甚至从 5 到 8 çš„è¿›åŒ–ã€‚åƒ reasoning çš„è¿›æ­¥ï¼Œå°±æ˜¯ä»Žå¾ˆå¥½å˜æˆéžå¸¸å¥½ã€‚ 在 coding 上,Sonnet 3.5 å·²ç»å¾ˆä¸é”™äº†ï¼Œä½† context 长度还ä¸å¤Ÿï¼Œè‡ªæˆ‘纠错能力也一般。Sonnet 3.7 å’Œ 4 跑在 Claude Code 上效果éžå¸¸å¥½ã€‚坹夿‚代ç ã€é•¿ä»£ç æ®µï¼Œå®ƒä»¬å¸¸å¸¸ä¸€æ­¥å°±èƒ½åšå¯¹ã€‚è¿™ä¸æ˜¯ä»Ž 0 到 1,而是从 7 到 10 çš„è´¨é‡æå‡ã€‚ 晚点:在基础模型的竞争上,Google 最近的势头也很强。过去两年 OpenAI 横空出世时,Google 给人感觉有点被打懵。但现在 Gemini 2.5 çš„å£ç¢‘和实际使用å馈都很好。 模型层é¢ï¼ŒGoogle çš„ Gemini 2.5 表现éžå¸¸å¥½ã€‚云æœåС层é¢ï¼Œ æä¾›åŒæ ·çš„ Claude API æŽ¨ç†æœåŠ¡ä¸Šï¼ŒGCP 的表现其实更好,这背åŽä¹Ÿç¦»ä¸å¼€ TPU 的支æŒã€‚Google 的实力很强,是现在模型领域å‰ä¸‰å中éžå¸¸æœ‰ç«žäº‰åŠ›çš„ä¸€å®¶ã€‚ 但他们现在也有一个现实问题,就是 Google çš„æœç´¢ä¸»ä¸šæ­£åœ¨æ‰¿åŽ‹ã€‚å› ä¸ºæ‹…å¿ƒ AI 对æœç´¢å¹¿å‘Šå¸¦æ¥å†²å‡»ï¼Œæ‰€ä»¥å®ƒçš„股价一直在震è¡ã€‚我觉得这就是一个典型例å­ï¼šè€ä¸šåŠ¡åœ¨å—æŸï¼Œè€Œæ–°ä¸šåŠ¡å¢žé•¿åˆå¾ˆå¿«ã€‚这最终会怎么演化,我觉得å¯èƒ½è¿˜éœ€è¦ä¸€ä¸¤å¹´æ‰èƒ½çœ‹æ¸…。 戴雨森:应用的价值首先å–决于模型本身,也就是模型厂商固化在æƒé‡é‡Œçš„那些基础能力。模型的推ç†èƒ½åŠ›ã€ç¼–程能力越强,应用所能释放的价值就越大。但æƒé‡ä¸€æ—¦å›ºå®šï¼Œå†…容就是死的,而问题是动æ€çš„,所以需è¦å¼•å…¥ context,现在æµè¡Œçš„ context engineering vs prompt engineering 也说明了 prompt 模型并ä¸å¤Ÿï¼Œè¿˜éœ€è¦æ›´å¤šæ›´å¥½çš„ context。 第一层是通用信æ¯ï¼Œæ¯”如「今天的天气怎么样?ã€è¿™ç±»æ¨¡åž‹æœ¬èº«æ˜¯æ²¡æœ‰çš„,需è¦é€šè¿‡æœç´¢ç­‰æ–¹å¼åЍæ€èŽ·å–。虽然现在也有模型能åšç®€å•çš„æœç´¢å·¥ä½œï¼Œä½†è¿™éœ€è¦ç»™æ¨¡åž‹é…备åˆé€‚的工具。 第二层是组织层é¢ï¼Œæ¯”如公å¸å†…部有哪些æµç¨‹ã€æ–‡æ¡£ã€å·²æœ‰çš„çŸ¥è¯†ç§¯ç´¯ã€‚è¿™äº›ä¿¡æ¯æ¨¡åž‹æœ¬èº«ä¹Ÿä¸çŸ¥é“,需è¦é€šè¿‡åº”用层与模型å作,让模型指导人去调用这些信æ¯ã€‚比如一个人和 AI 的对è¯åކå²ã€ä¸ªäººå好ã€èƒŒæ™¯ä¿¡æ¯ç­‰ï¼Œè¿™äº›æ¨¡åž‹ä¹Ÿä¸å…·å¤‡ï¼Œå¿…é¡»ç”±åº”ç”¨å±‚æ¥æä¾›ã€‚ AI 的目标ä¸åªæ˜¯æˆä¸ºä¸€ä¸ªé—®ç­”机器,最终它是è¦çœŸæ­£å¸®ç”¨æˆ·å®Œæˆäº‹æƒ…。那在åšäº‹æƒ…的时候,它能调用哪些工具ã€å½±å“ä»€ä¹ˆç»“æžœï¼Œè¿™äº›ä¹Ÿæ˜¯ç”±åº”ç”¨å±‚å…¬å¸æä¾›çš„ã€‚æ¯”å¦‚äº§å“æä¾›äº†å“ªäº›å…¬æœ‰æˆ–ç§æœ‰çš„ MCP 工具,或者最终 AI 能把它的输出结果部署在什么环境上。 æ‰€ä»¥æˆ‘è§‰å¾—æ¨¡åž‹å…¶å®žåªæ˜¯æœ€åº•层的那一å—ã€‚åªæ˜¯å› ä¸ºåœ¨ ChatGPT 刚出æ¥çš„æ—¶å€™ï¼Œæˆ‘ä»¬å¤§å¤šæ•°ä½¿ç”¨åœºæ™¯éƒ½æ˜¯åœ¨ã€Œé—®ã€æ¨¡åž‹ï¼Œä¹Ÿå°±æ˜¯æå–å®ƒé€šè¿‡åŽ‹ç¼©å·²æœ‰çŸ¥è¯†èŽ·å¾—çš„å›žç­”ã€‚æ¯”å¦‚é—®ä¸€ä¸ªäº‹å®žç±»çš„é—®é¢˜ï¼Œè¿™ç§æƒ…况下确实主è¦é æ¨¡åž‹æœ¬èº«ã€‚ä½†å½“ä»»åŠ¡æ›´å¤æ‚ã€æ¨¡åž‹çš„æ™ºåŠ›éœ€è¦ä¸Ž contextã€ç”šè‡³ environment é…åˆæ‰èƒ½å‘挥作用时,那就是「壳ã€çš„价值了。 戴雨森:大家那时候肯定觉得 Google 有点è½åŽï¼Œè¢« OpenAI 抢了风头,很多人æ‰ä¹Ÿé€‰æ‹©å‡ºèµ°ã€‚ä½†åŽæ¥ Google çš„è”åˆåˆ›å§‹äºº Sergey Brin 回归公å¸ä¹‹åŽï¼Œå¾ˆå¤šäº‹æƒ…å‘生了å˜åŒ–。比如有传闻说 Google æ”¶è´­çš„ Character.ai 创始人 Noam Shazeer 回去åŽäº²è‡ªæ”¹äº†ä¸€ä¸ª bug,直接让模型性能大幅æå‡ã€‚真å‡ä¸ç¡®å®šï¼Œä½†å…³é”®äººæ‰ç¡®å®žèƒ½è§£å†³é—®é¢˜ã€‚ 最近 Y Combinator 的创业è¥ä¹Ÿæåˆ°ï¼ŒçŽ°åœ¨åšä»»ä½•å…¬å¸ï¼Œéƒ½åº”该以「AGI 两年内实现ã€ä¸ºå‰æå‡è®¾ã€‚ä½ è¦æ€è€ƒï¼šå‡è®¾ AGI 两年内实现,那你的公å¸è¯¥æ€Žä¹ˆåšï¼Ÿ 当然 AGI 到底是什么还有很多争议,但毫无疑问巨大的å˜åŒ–正在å‘生,而且是快速å‘生。现在硅谷学计算机的学生找工作都å˜éš¾äº†ï¼Œå› ä¸ºåˆçº§ç¨‹åºå‘˜çš„工作已ç»è¢« AI 替代了很多,很多å˜åŒ–是实实在在å‘生的。 晚点:我们回到你说的三æ¡ä¸»çº¿ã€‚我们讲了推ç†å’Œç¼–ç¨‹ï¼ŒçŽ°åœ¨è®²å·¥å…·ä½¿ç”¨ã€‚æœ€è¿‘åƒ Kimi K2 å’Œ Grok 都在训练阶段就加入了使用工具的能力。这是新趋势å—? è¿™ä¸¤ç§æ–¹å¼éƒ½æœ‰äººåœ¨åšï¼ŒçŽ°åœ¨åƒ MCP 这样的生æ€å·²ç»å»ºç«‹èµ·æ¥äº†ï¼Œè¶Šæ¥è¶Šå¤šä¸º AI æ­å»ºçš„工具å˜å¾—å¯ç”¨ã€‚åˆæ¯”如 Manus å’Œ OpenAI çš„ Operator 用的是沙盒虚拟机里é¢çš„æµè§ˆå™¨ã€é€šè¿‡è§†è§‰æ“作æµè§ˆå™¨ç­‰å·²æœ‰çš„软件,模拟人类的使用过程,目的是让 AI 更好地调用已有软件的功能。 戴雨森:对,之å‰å¼ ç¥¥é›¨æœ‰ä¸ªæ’­å®¢è®²å¾—特别好,我很认åŒä»–的分æžã€‚第一个阶段是 chatbot,对应 ChatGPT;第二个阶段是 reasoning,对应 o 系列模型;第三阶段的 Agent 对应的是 Agent-native 模型,但目å‰å¥½åƒè¿˜æ²¡æœ‰çœŸæ­£å‡ºçŽ°ã€‚ 在 Agent 的定义中,目标是 AI 自己去寻找的,但目å‰ç›®æ ‡ä»ç”±äººç»™å®šã€‚Agent 是说,我给你一个目标åŽï¼Œå®ƒåŽ»é¢„æµ‹ä½¿ç”¨å·¥å…·çš„åºåˆ—,选择什么工具完æˆä»»åŠ¡ã€‚å®ƒå¯èƒ½è¿˜æ²¡åšåˆ°åƒç»™å‘˜å·¥å®Œæˆä»»åŠ¡é‚£æ ·ï¼Œè‡ªå·±æ‹†åˆ†ä»»åŠ¡å’Œå®šä¹‰ç›®æ ‡ã€‚ 现在 AI Agent 这一类产å“还处于éžå¸¸æ—©æœŸé˜¶æ®µã€‚比如 Manus æ‰åˆšæŽ¨å‡ºå‡ ä¸ªæœˆï¼Œä½†æˆ‘觉得一年甚至åŠå¹´åŽï¼Œéšç€æ¨¡åž‹èƒ½åŠ›æå‡ï¼Œè¿™ç±»äº§å“的能力会大幅增强。 我想说的是,ä¸åŒå…¬å¸å› ä¸ºèµ„æºç¦€èµ‹ä¸åŒï¼Œè§£å†³ Agent 这个问题的方å¼ä¹Ÿä¼šæœ‰å·®å¼‚。我们尽é‡ä¸åšé¢„判,ä¸è®¤ä¸ºæˆ‘们能够预先知晓未æ¥ã€‚比如 Kimi 的看法是 Model as Agent,通过模型训练中加入大é‡ç«¯åˆ°ç«¯çš„工具使用数æ®ï¼Œè®©æ¨¡åž‹æœ¬èº«å…·å¤‡å¼ºå¤§çš„å·¥å…·è°ƒç”¨èƒ½åŠ›ã€‚è€ŒåŒæ ·æ˜¯è°ƒç”¨é—­æºæ¨¡åž‹ API 的产å“。Manus æå‡ºäº†ã€Œless structure, more intelligenceã€ï¼Œä½†æœ‰æ—¶ç»“构化也能æå‡å·¥ä½œæ•ˆçŽ‡ã€‚Genspark 就专门åšäº†é’ˆå¯¹ PPT 场景的 slide 生æˆåŠŸèƒ½ï¼Œå¼•å…¥äº†ä¸€ç³»åˆ—ä¼˜åŒ–å·¥ä½œæ•ˆæžœçš„æ–¹æ³•ã€‚ 戴雨森:因为用户è¦çš„æ˜¯æœ€åŽçš„结果,而ä¸åŒçš„公叿ƒ³å®žçŽ°è¿™ä¸ªç»“æžœï¼Œå¯èƒ½æœ‰å„ç§ä¸åŒçš„è·¯å¾„ã€‚æœ‰çš„çµæ´»ä½†æˆæœ¬é«˜ï¼Œæœ‰çš„å›ºå®šä½†æˆæœ¬ä½Žã€‚所以大家解åŒä¸€é“题,用ä¸åŒæ–¹æ³•都åˆç†ã€‚ 有人说这是类似自动驾驶 L3 级别的产å“,人ä¸åŠ¨æ–¹å‘盘,车自动驾驶。我们å‘现写代ç çš„工程师一开始喜欢 Cursor,因为它还是让你在熟悉的 IDE 里é¢å†™ä»£ç ï¼Œä½† Manus å‘现产å“ç»ç†ç”¨ Cursor 去完æˆä»»åС䏿€Žä¹ˆçœ‹ä»£ç ï¼Œåªæ˜¯çœ‹å³è¾¹çš„å¯¹è¯æ¡†ï¼Œæ‰€ä»¥ä»–ä»¬æŠŠå¯¹è¯æ¡†æ”¾åˆ°ä¸»è¦çš„ä½ç½®ï¼Œåšå‡ºäº†ä¸€ä¸ªæ›´åР适åˆéžç¨‹åºå‘˜äººç¾¤ä½¿ç”¨çš„ Agent。 éšç€æ¨¡åž‹èƒ½åŠ›çš„è¿›æ­¥ï¼ŒClaude Code æ›´æžè‡´ï¼Œç”¨æˆ·ä¸èƒ½å†™ä»£ç ï¼Œåªèƒ½å‘Šè¯‰ AI ä½ è¦åšä»€ä¹ˆï¼Œå…¶ä»–çš„ AI 去完æˆã€‚所以 L3 或 Agent æ„å‘³ç€ AI 去作为执行主角,而用户è¦å­¦ä¼šå½“ AI çš„å¥½è€æ¿ã€‚ æˆ´é›¨æ£®ï¼šä»¥å‰æˆ‘创业时也这么想,所有事我都亲自åšã€‚åŽæ¥å‘çŽ°è¿™ä¸æ˜¯å¥½ç®¡ç†æ–¹å¼ï¼Œæˆ‘åº”è¯¥èµ‹èƒ½ä¸‹å±žï¼Œè®©ä»–ä»¬çŸ¥é“æˆ‘è¦ä»€ä¹ˆï¼Œè®©ä»–们有主观能动性。 以åŽäººç±»æŒ‡æŒ¥ AI å¯èƒ½ä¹Ÿæ˜¯è¿™æ ·ï¼Œè¿™å¯èƒ½æ˜¯äººç±»åކå²ä¸Šç¬¬ä¸€æ¬¡è¦åŸ¹å…»ä¸€ä¸ªå·¥å…·ã€‚以å‰åŸ¹å…»äººå¾ˆéš¾ï¼Œå¤§éƒ¨åˆ†äººæ˜¯è¢«åŸ¹å…»çš„,很少有人有能力或机会去培养一个下属。但现在æ¯ä¸ªäººå¯èƒ½éƒ½è¦å­¦ä¼šå¦‚何给 AI 下命令,如何培养 AI 去更好完æˆå·¥ä½œã€‚ 我觉得一个好的产å“,最åŽè‚¯å®šè¿˜æ˜¯è¦æœ‰æ¸…晰的定ä½ï¼Œè¦åœ¨æŸäº›é¢†åŸŸåšåˆ°ç»å¯¹çš„第一å,æ‰èƒ½æ‹¥æœ‰é•¿æœŸä»·å€¼ã€‚æˆ–è€…è¯´æˆ‘ä»¬ç›®æ ‡ä¸æ˜¯è¿½æ±‚é€šç”¨ï¼Œè€Œæ˜¯ä»Žé€šç”¨å¼€å§‹ï¼Œé€æ¸å‘展收敛到一些核心场景。 技术é©å‘½çš„æ—©æœŸå‘展阶段,往往大家都在å°è¯•,也ä¸çŸ¥é“新技术适åˆåšä»€ä¹ˆï¼Œæœ€åŽçœ‹ä»€ä¹ˆæ•ˆæžœæœ€å¥½ã€‚ä¾‹å¦‚è’¸æ±½æœºåˆšè¢«å‘æ˜Žæ—¶ï¼Œæœ€å¼€å§‹æ˜¯ç”¨äºŽæŠ½ç…¤çŸ¿çš„æ°´ï¼ŒåŽæ¥å‘现用æ¥é©±åЍç«è½¦å’Œçººç»‡æœºæ›´å¥½ã€‚蒸汽机也是一个「通用技术ã€ï¼Œä½†æœ€åŽæœ€å¤§çš„价值å¯èƒ½æ¥è‡ªå‡ ä¸ªå…·ä½“场景。 晚点:有个è¯é¢˜æŒºæœ‰æ„æ€ã€‚国内大家讨论通用产å“,觉得这是大公å¸çš„必争之地。但跟国外投资人èŠï¼Œä»–们å而对 Super App çš„å¯èƒ½æ€§æ›´æ„Ÿå…´è¶£ï¼Œå…³å¿ƒæ€Žä¹ˆæ‰“è´¥ OpenAI å’Œ Google。 å¾ˆæœ‰æ„æ€çš„一件事是,Manus 出现åŽï¼Œæœ‰å¾ˆå¤šäººè¯´å®ƒæ²¡å£åž’ï¼Œç”¨å¼€æºæ¡†æž¶ä¸€ä¸ªå‘¨æœ«å°±èƒ½æžå‡ºæ¥ã€‚但现在过了这么多个周末,还没看到任何一个类似的应用能真正åšå¥½çš„。 我觉得在全çƒå¸‚场,大家对真正的创新还是尊é‡çš„,ä¸ä¼šç›´æŽ¥å¤åˆ¶å®Œå…¨ä¸€æ¨¡ä¸€æ ·çš„产å“。å¯èƒ½ä¼šå€Ÿé‰´äº¤äº’或呈现æ€è·¯ï¼Œæ¯”如 AI 在干活的表现形å¼ï¼Œä½†ä¸ä¼šç›´æŽ¥åƒç´ çº§å¤åˆ¶ã€‚在全çƒåŒ–竞争里,先å‘优势会带æ¥å¾ˆå¤šå£ç¢‘和传播优势,这也是对创新者的建奖励。 我一直有个ç†å¿µï¼Œæ–°äº§å“å°±è¦å¤šè¯•试,很多时候花点钱试一试并ä¸è¿‡åˆ†ã€‚很多 AI 产å“çš„é©å‘½ä¹‹å¤„ä¸èƒ½åªçœ‹æŠ¥é“,得亲身去用。当你能看到一个未æ¥çš„æ—¶å€™ï¼Œä½ ä¼šäº§ç”Ÿå¾ˆå¤šçš„çµæ„Ÿã€‚ 我们三月份就观察到,Manus ä¸Šçº¿åŽæŽ¨ç†ç”¨é‡æš´æ¶¨ï¼ŒAgent 产å“çš„ token 用é‡ç›¸æ¯” Chatbot 是显著增长。当时二级市场很多人还在质疑英伟达,觉得哪怕全世界所有人都用 chatbot,推ç†éœ€æ±‚也根本没那么大,用ä¸äº†é‚£ä¹ˆå¤šç®—力。 ä½†å…¶å®žè¿™å°±åƒæ‹¨å·ä¸Šç½‘æ—¶ä»£ï¼Œä¸€å¼€å§‹æ‰€æœ‰äººéƒ½åœ¨èŠ QQ,ä¸éœ€è¦é‚£ä¹ˆå¤šå¸¦å®½ã€‚但有了宽带网之åŽï¼Œå¤§å®¶å°±è¦åœ¨çº¿ä¸Šçœ‹ 4K 视频了。模型能力越强,å¯ä»¥è§£é”的场景越多,token 使用就越多。 晚点:2023 年,黄ä»å‹‹åœ¨è‹±ä¼Ÿè¾¾å†…部讲è¯ä¸­è¯´ï¼Œä»–们的市值目标是 2 万亿美元。当时英伟达刚刚çªç ´ 1 ä¸‡äº¿ã€‚æˆ‘ä»¬è¿˜åœ¨è®¨è®ºä»–è¿™å£æ°”æ˜¯ä¸æ˜¯å¤ªå¤§ã€‚结果今年已ç»çªç ´ 4 万亿了。 这就åƒç«è½¦å¼€åŠ¨äº†ï¼Œå°±ä¸ä¼šçªç„¶åˆåœä¸‹æ¥äº†ã€‚æˆ‘ä»¬çŽ°åœ¨è¿˜åœ¨ä¸æ–­å‘现 AI 新的使用场景。比如说一个工程师原æ¥ä¸€å¤©å¯ä»¥å†™ 100 行代ç ï¼ŒçŽ°åœ¨æœ‰äº† Cursorã€Claude Code,å¯èƒ½å†™çš„ä»£ç æ˜¯åŽŸæ¥çš„ 10xï¼Œèƒ½è§£å†³æ›´å¤šä»¥å‰æ²¡æƒ³è¿‡è¦è§£å†³çš„é—®é¢˜ã€‚åˆæ¯”如有了 ChatGPT å’Œ Manus,你会问的问题也会å˜å¤šã€‚ 戴雨森:生产力å¯ä»¥ä»¥ 10 å€ï¼Œ100 å€çš„速度增长。和 AI é—²èŠå†æ€Žä¹ˆèŠï¼Œä¸€å¤©å°±é‚£ä¹ˆå¤šæ—¶é—´ï¼Œè¿™æ˜¯æˆ‘们以å‰è®²çš„ attention is all you need。如果你è¦çš„æ˜¯ç”¨æˆ·æ³¨æ„力,它是有é™çš„,并且是和抖音,Tiktokã€å°çº¢ä¹¦ä¸€èµ·åŽ»äº‰å¤ºçš„æ³¨æ„力。 戴雨森:在未æ¥ä½ å¯ä»¥é—® AI 之剿²¡æƒ³åˆ°çš„éžå¸¸å¤æ‚的问题,我给你举个很简å•的例å­ã€‚比如美股二级市场的朋å‹ï¼Œåœ¨è´¢æŠ¥å­£æ—¶ä¸€å¤©å¯èƒ½è¦å…³æ³¨äº”å…­å®¶å…¬å¸å‘业绩。凌晨四点起床看财报数æ®ã€ä»£å…¥æ¨¡åž‹åšå¯¹æ¯”ã€å¬ç”µè¯ä¼šè®®ã€åˆ†æž CEO 的展望,都是他们的日常。 原æ¥ä»–们ä¸å¯èƒ½åŒæ—¶å¬å¤šä¸ªè´¢æŠ¥ä¼šï¼Œåªèƒ½é æ‹›æ›´å¤šäººæˆ–挑é‡ç‚¹åŽ»é€‰æ‹©ã€‚ä½†çŽ°åœ¨æœ‰äº† AI,虽然目å‰è¿˜ä¸èƒ½å®Œå…¨è·‘通全æµç¨‹ï¼Œä½† 6-12 个月内就有å¯èƒ½è®©ä¸€ä¸ªåˆ†æžå¸ˆåŒæ—¶è¦†ç›– 50 家股票的财报。 AI å¯ä»¥å¸®ä»–们看财报ã€å¬ç”µè¯ä¼šè®®è®°ç¬”è®°ã€å›žç­”事å‰å‡†å¤‡å¥½çš„é—®é¢˜ã€æ€»ç»“ CEO 回答ã€å†™æŠ¥å‘Šã€‚这些原æ¥å› ä¸ºã€Œåšä¸åˆ°ã€æ‰æ²¡æ”¾åˆ°ä½ çš„工作时间表里的事情现在 AI 能完æˆäº†ï¼Œéœ€æ±‚就自然增长了。 å°±åƒé£žæœºå‡ºçް之å‰ï¼Œæ²¡æœ‰äººä¼šè¯´ã€Œæˆ‘今天è¦é£žç¾Žå›½å‡ºå·®ã€ã€‚但飞机一旦存在,新的需求就出现了。AI 也一样,它让你开始åšé‚£äº›ä½ åŽŸæœ¬ä¸ä¼šæƒ³åšçš„事。 è€Œä¸”æˆ‘ä»¬è§‚å¯Ÿåˆ°ä¸€ä¸ªå¾ˆæœ‰æ„æ€çš„现象:当 AI 按 token 用é‡è®¡è´¹åŽï¼Œå¾ˆå¤šäººæ˜¯å¸Œæœ›ç”¨å¾—更多的。因为它确实在帮你完æˆå·¥ä½œï¼Œæ¯”如帮你写了更多代ç ã€‚ è¿™ç§æŒ–è§’ä¸ç®¡æ˜¯å¯¹è¢«æŒ–团队,还是 Meta 自己原有的团队,都是éžå¸¸å¤§çš„冲击。在硅谷几乎所有顶尖公å¸éƒ½åœ¨å‘生类似动è¡ã€‚被挖的人所在团队军心难å…åŠ¨æ‘‡ï¼Œç•™ä¸‹çš„äººä¹Ÿå¼€å§‹è´¨ç–‘ï¼šæ˜¯ä¸æ˜¯è‡ªå·±ä¹Ÿè¯¥æ¶¨è–ªï¼Ÿ è¿™ç§é«˜è–ªæŒ–人当然是人æ‰ä»·å€¼çš„体现,但越是顶级人æ‰ï¼Œä¹Ÿè¶Šéœ€è¦æ—¶é—´å’ŒçŽ¯å¢ƒæ¥ç£¨åˆï¼Œæ‰èƒ½çœŸæ­£å½¢æˆåˆåŠ›ã€‚åŽ†å²ä¸Šå¤±è´¥çš„例å­ä¹Ÿå¾ˆå¤šï¼Œæ‰€ä»¥å¯¹äºŽè¿™äº›ç»„织æ¥è¯´ï¼Œè¿™æ—¢æ˜¯æœºä¼šï¼Œä¹Ÿæ˜¯ä¸€åœºæŒ‘战。 戴雨森:我觉得这也是体现了创始人的精神,就是他愿æ„䏿ƒœä»£ä»·åŽ»äº‰å–人æ‰ã€‚å¦‚æžœèŠ±é’±èƒ½è§£å†³çš„äº‹ï¼Œæˆ‘å°±èŠ±é’±åŠžã€‚æˆ‘è§‰å¾—è¿™ä¹Ÿåæ˜ äº†äººæ‰ç¡®å®žå¾ˆé‡è¦ã€‚ 戴雨森:但是这ç§é€¶Ä出å¯èƒ½ä¸å¤Ÿå¤§ã€‚有的人觉得公å¸å–个几亿美元就挺好,有人则想åšåƒäº¿ç¾Žå…ƒå…¬å¸ã€‚创业公å¸ä¹Ÿéœ€è¦æ›´å¤šå¼¹è¯åŽ»å’Œ Meta 这样的大厂竞争。比如说 Cursor 之å‰èžäº†å¾ˆå¤šé’±ï¼Œæˆ‘们一度还觉得èžè¿™ä¹ˆå¤šé’±åšä»€ä¹ˆï¼ŒçŽ°åœ¨çœ‹åˆ°ä»–ä»¬è¦é¢å¯¹çš„æ˜¯æ›´å¤šé’±è¡¥è´´ç”¨æˆ·ç”¨ tokenï¼Œæ‹›äººä¹Ÿè¦æ›´é«˜æˆæœ¬ï¼Œæ‰€ä»¥èžèµ„更多很åˆç†ã€‚现在竞争无论是补贴还是人æ‰éƒ½å‡çº§äº†ã€‚顶级人æ‰ä¹Ÿæœ‰å¾ˆå¤šé€‰æ‹©ï¼Œå¯¹å¾ˆå¤šåˆ›ä¸šå…¬å¸æ¥è¯´ï¼ŒåŠ å…¥æˆ˜å±€çš„é—¨æ§›å’Œæ°´ä½éƒ½åœ¨æå‡ã€‚ 戴雨森:大家都想加快节å¥ï¼Œå› ä¸ºé’±å¤ªå¤šäº†ã€‚几家巨头账上都有大é‡çŽ°é‡‘ï¼Œè¿™äº›é’±æŠ•ä¸‹åŽ»ï¼Œå¦‚æžœèƒ½ç”¨é’±æ¢æ—¶é—´å’Œç«žäº‰ä¼˜åŠ¿ï¼Œå¯¹ä»–ä»¬æ¥è¯´å°±æ˜¯ç®€å•的事情。 你想,ChatGPT 刚出æ¥çš„æ—¶å€™ï¼Œäººç±»è¿˜èƒ½æŒ‡å‡ºå®ƒçš„回答问题所在。但现在无论是它研究的内容本身还是文笔,普通人类越æ¥è¶Šéš¾å‘çŽ°å®ƒçš„ç¼ºé™·äº†ã€‚å½“äººç±»æ™ºèƒ½è¢«é€æ¸æŽ¥è¿‘的时候,你怎么衡é‡ä¸€ä¸ªæˆ–è®¸æ¯”ä½ æ›´èªæ˜Žã€æ›´æ·±åº¦æ€è€ƒã€è®°å¿†åŠ›æ›´å¼ºçš„å­˜åœ¨ï¼Ÿ å…³äºŽå¦‚ä½•è¡¡é‡æ™ºèƒ½ï¼Œæˆ‘的好朋å‹å§šé¡ºé›¨ä»–写了篇文章《下åŠåœºã€‹æåˆ°ï¼Œæœªæ¥ AI çš„ benchmark 会越æ¥è¶Šé‡è¦ï¼ŒçŽ°åœ¨çš„ benchmark å·²ç»é’化,ä¸èƒ½å‡†ç¡®åŒºåˆ†æ¨¡åž‹å·®å¼‚。比如说 一个 benchmark å¾— 85 分和 90 åˆ†ï¼ŒçœŸçš„èƒ½åæ˜ æ¨¡åž‹çš„区别å—?Kimi çš„ç»éªŒä¹Ÿè¯´æ˜Žï¼Œå†…部制定好的 benchmark 也很é‡è¦ï¼Œæ¨¡åž‹è®­ç»ƒï¼Œå…³é”®æ˜¯å¦‚何衡é‡ç»“果。内部 benchmark 的水平质é‡å¾€å¾€å†³å®šäº†æ¨¡åž‹çš„è´¨é‡ã€‚ æ‰€ä»¥æˆ‘è§‰å¾—å¦‚ä½•è¡¡é‡æ™ºèƒ½ã€å¦‚何探索智能边界ä¾ç„¶éžå¸¸é‡è¦ã€‚现在我们还能勉强说用一用模型,「Vibe Testingã€ï¼Œèƒ½æ„Ÿå—到模型的能力好å,但å†è¿‡å‡ å¹´ï¼Œå‰äº”å的模型å¯èƒ½éƒ½æ¯”ä½ èªæ˜Žçš„æ—¶å€™ï¼Œä½ æ€Žä¹ˆåŽ»è¯„ä¼°è°æ›´å¥½ï¼Ÿ 戴雨森:第二个我想说的是,我一直å夿€è€ƒç”Ÿäº§åŠ›è¿™ä¸ªé€»è¾‘ã€‚æ¯ä¸ªäººæ‹¥æœ‰å¤§é‡ç”Ÿäº§åЛ之åŽï¼Œå¯¹äºŽä¸ªäººã€ç»„织ã€ä¹ƒè‡³ä¸–ç•Œçš„å½±å“æ˜¯ä»€ä¹ˆï¼Ÿ 对个人æ¥è¯´ï¼Œè¶…级个人。一个人能åšçš„事情越æ¥è¶Šå¤šï¼šä»Žåšå°çŒ«è¡¥å…‰ç¯è¿™æ ·çš„å° appï¼Œåˆ°å¼€å‘æ¸¸æˆï¼Œç”šè‡³åˆ° Sam Altman 预言的「一个人的独角兽公å¸ã€å®Œå…¨å¯èƒ½å®žçŽ°ã€‚å½“å¹´ Instagram è¢«æ”¶è´­æ—¶åªæœ‰ 13 个人,在 AI 时代,13 个人到 3 个人是完全有å¯èƒ½çš„。 è¿™æ„味ç€äººå’Œäººä¹‹é—´å·®è·ä¼šå˜å¾—很大。当æ¯ä¸ªäººéƒ½æ‹¥æœ‰æ— é™èªæ˜Žçš„助手,以åŠåƒ Manus è¿™ç§å¯ä»¥æ—¥å¤œæ— ä¼‘帮你打工的「赛åšç‰›é©¬ã€æ—¶ï¼Œæœ‰äººèƒ½å¾ˆå¥½åœ°åˆ©ç”¨å®ƒåˆ›é€ å·¨å¤§ä»·å€¼ï¼Œæœ‰äººå¯èƒ½æ²¡æœ‰äº§ç”Ÿé‚£ä¹ˆå¤§ä»·å€¼ï¼Œæ‰€ä»¥æˆé•¿é€Ÿåº¦å·®å¼‚会进一步拉大。 对组织æ¥è¯´ï¼Œä¸€æ˜¯å°ç»„织å¯ä»¥å˜å¾—å¾ˆå¼ºå¤§ï¼ŒäºŒæ˜¯å¤§ç»„ç»‡èƒ½é€šè¿‡å…ˆè¿›æŠ€æœ¯ç®¡ç†æ›´å¤§ã€æ›´å¤æ‚的业务。比如美团管ç†å‡ ç™¾ä¸‡éª‘手,业务éžå¸¸å¤æ‚,如果没有先进互è”ç½‘é€šä¿¡å’Œç®¡ç†æŠ€æœ¯ï¼Œæ ¹æœ¬æ— æ³•å®žçŽ°ã€‚åŠ å…¥ AI åŽï¼Œå¤§å…¬å¸çš„管ç†äººæ•°ã€ä¸šåС夿‚度和深度都会å†å‡ä¸€ä¸ªå°é˜¶ã€‚ 世界是由å„ç§ç»„织驱动的,组织能力边界的æå‡å¯¹ä¸–界影å“巨大。进一步æ¥è¯´ï¼Œå½“整体生产力大幅æå‡ï¼Œè€Œäººä¸Žäººã€ç»„织与组织之间差è·å˜å¤§æ—¶ï¼Œå¦‚何在效率和公平间寻求平衡?AI æœ€åˆæ˜¯æœ€èªæ˜Žçš„人制作工具给头部用户用,但这些精英产生的价值如何å哺普通大众?å³ä¾¿ä¸€ä¸ªæ™®é€šäººä¸æ˜¯ç‰¹åˆ«åŠªåŠ›å­¦ AI,我们如何让 AI 产å“è¶Šæ¥è¶Šæ˜“用,让普通人也能从中获益? 戴雨森:对,现在你很难区分什么是真实的文章。我现在还能读出 DeepSeek 的味é“,但一年åŽå¯èƒ½åˆ†è¾¨ä¸å‡ºï¼Œæˆ–者说,å¯èƒ½å·²ç»æœ‰å¾ˆå¤š AI 写的文章我已ç»åˆ†è¾¨ä¸å‡ºæ¥äº†ï¼Œæˆ‘能分辨出æ¥çš„åªæ˜¯é‚£äº›è¿˜ä¼ªè£…å¾—ä¸å¤Ÿå¥½çš„ã€‚å¤§å®¶éƒ½çŸ¥é“ AI 会引用虚å‡å†…容,但关键什么是虚å‡å‘¢ï¼ŸçœŸå‡çš„界é™ä¹Ÿè¶Šæ¥è¶Šæ¨¡ç³Šäº†ã€‚ 我一直在想,人类最大的é™åˆ¶æ˜¯ä»€ä¹ˆï¼Ÿæˆ‘这边觉得是大脑的功率,大脑功率大约 20 瓦,人类智能的上é™å°±æ˜¯è¿™ä¹ˆå¤šã€‚而 AI å¯ä»¥å¾ˆå¿«æŽ¥è¿‘甚至çªç ´è¿™ä¸ªä¸Šé™ã€‚智能越多,我们用它åšä»€ä¹ˆï¼Œäººä¸Ž AI 的角色分工如何,这些都是我们很快è¦é¢å¯¹å’Œè°ƒæ•´çš„问题。 æœ‰æ—¶å€™æˆ‘è§‰å¾—æœ‰ç‚¹å¯æ€•,因为大的å˜åŒ–å·²ç»åˆ°æ¥ï¼Œåªæ˜¯å¤§å®¶è¿˜åœ¨é€æ¸æ„Ÿå—到它。比如对程åºå‘˜å½±å“特别直接,普通åˆçº§ç¨‹åºå‘˜å¦‚æžœä¸ç”¨ AI,未æ¥ä¸¤å¹´åŽæ‰¾åˆ°å·¥ä½œä¼šéžå¸¸å›°éš¾ã€‚但一年的时间人是很难åšå‡ºæ”¹å˜çš„。而更多的èŒä¸šå¯èƒ½ä¹Ÿä¼šåœ¨å¾ˆçŸ­çš„æ—¶é—´å†…å—到æžå¤§çš„冲击。 戴雨森:我觉得第一个疲倦的是过度è¥é”€ã€‚过去几年有一个趋势,就是很多产å“在过度è¥é”€ï¼Œå„ç§ã€Œéœ‡æƒŠä½“ã€ï¼Œä½†å¥½çš„äº§å“æ¯”如说 Manus,几乎没花钱è¥é”€ï¼Œä½†å¤§å®¶è¯¯ä»¥ä¸ºå®ƒèŠ±äº†å¾ˆå¤šé’±ã€‚ ä¹‹å‰ AI çš„è¿›æ­¥ä¸»è¦æ˜¯æ¨¡åž‹çš„进步,普通用户还无法在产å“中体验,因此研究员和媒体拥有很大的解释æƒã€‚但现在模型已ç»å¼€å§‹è½¬åŒ–æˆåº”用了。那时候我在å³åˆ»å‘了一æ¡è¯´ï¼šã€ŒTalk is cheap, show me your product.〠现在很多 AI 模型的核心能力最终都è¦è½¬åŒ–æˆäº§å“,用户èƒ