【新智元导读】加州大学最新推出Orca浏览器,把拥挤标签页变成可随意拖拽、并排比较的无限画布,让AI替你同时点按钮、填表单。你只需像指挥家一样扫一眼全局、下指令,就能让上百个网页和智能体自动完成搜索、整理、汇总,全程可控。 预订旅行酒店便是例子:用户需在多个选项间权衡比较、了解均价,并结合机票与活动随时调整计划,而单页式浏览器迫使用户反复切换界面,频频丢失上下文。 AI智能体的最大潜力,就是将我们从细节性的任务中解放出来(点按按钮、填写表单),从而在复杂的信息空间和工作中纵览全局,操控成百上千的智能体为我们收集、整理、汇总信息,生成报告并完成任务。 为此,加州大学圣地亚哥分校的研究者设计了Orca浏览器,把视角拉远,让用户可以在无限的画布空间中浏览、管理网页,并部署、调度自动化智能体来提取相关的信息并完成具体的操作。 Orca最核心的设计探索,就是将网页不再看作我们只能浏览、操作的固定界面,而是人人可以根据自己的任务和需求实时并行查看、灵活提取、动态重组的可塑材料(malleable materials)。 而浏览器也不再仅是渲染网页的容器,而是可以根据用户现实的需求动态变化的可塑空间(malleable space)。在这个环境中,用户和AI可以协作,将这些「网页材料」组合成一个定制化的工作区。 在这个过程中,AI扮演着促进者的角色:它加速重复性工作,成倍地拓展用户可接触的信息,并帮助他们理解;而用户可以选择性地深入研究、监控把关AI的执行。 Orca提供一个空间化的网页画布:把多个网页当成可拖拽/缩放的对象,就像在Figma里排版。用户可并排对照、按任务分簇,随探索范围扩大而能够在缩放中纵览全局。 或者,Orca可以基于当前页语境给出自动的「情境扩展」建议(如在订酒店时建议查机票、跨平台同店比较),用户可以通过拖拽灵活地控制打开多少页面。 用户可以用自然语言同时从多页抽取关键信息(如Wi-Fi、价格、营业时间),并把答案以统一小卡片显示在每页上面,便于快速扫过所有网页。 最后,用户可以便捷地在每个页面中部署调度不同的智能体以完成情境下的任务。每个智能体通过不同颜色的虚拟光标来显示,以方便用户追踪和查看。 和许多其他AI浏览器一样,用户也可以选择单个或多个网页,并对它们进行提问,如果当前页信息没有办法回答用户的问题,Orca 将会自动部署智能体进行探索并找到答案。 由于Orca显著降低了管理和导航多页面的成本,参与者表示更愿意探索更多内容。一位用户评价道,「现在的一次点击相当于过去的很多次点击」。尤其是页面提取功能,让用户「再也不怕一开始就打开一大堆页面」,因为它能帮助快速筛选信息。 所有参与者都认为空间画布易于使用,无论其经验如何。他们喜欢这种「鸟瞰图」式的体验,认为这有助于清晰地掌握自己的探索进度。 Orca 项目展示了一种与当前主流的全自动化AI智能体不同的发展方向。它没有将用户从浏览过程中「移除」,而是通过AI赋能,将用户提升为一位「指挥家」,在可塑的浏览器空间中,大规模地「编排」海量网页信息。 这项研究为未来浏览器的设计指明了一个充满希望的方向:将AI能力深度整合到个人化、用户驱动的信息任务中,在降低认知与交互成本的同时,保留并增强用户的自主权、参与感和创造力。 Orca 原型将会开源,以促进社区对大规模网页浏览和并行智能体自动化的进一步探索。想查看更多信息及加入等候名单可前往https://orca.jiang.pl。 江沛岭,目前博士就读于加州大学圣地亚哥分校。本科毕业于纽约大学。他的研究广泛地将新颖的交互设计应用于复杂多变的信息系统与任务之中。 夏海峻,目前任教于加州大学圣地亚哥分校认知科学系,领导 Foundation Interface 实验室,研究人机交互并探索以可塑的信息与界面为基础的人机协作新范式。本科毕业于清华大学。


