AI智能体2026第一枪:阿里千问明确「双重协议」路线,阿里(智能官网

  更新时间:2026-01-18 23:00   来源:牛马见闻

吉报头条
重要新闻
国内新闻
国际新闻
图片精选

千问App上线了全新AI Agent能力为AI与电商AI Agent说它看到的是这个按钮

<p class="f_center"><br><br></p> <p id="48IAR9P1"><strong>文 | 周天财经</strong></p> <p id="48IAR9P2"><strong>周天?财经 原(创出品</strong></p> <p id="48IAR9P4">2026,大概率是AI智能体的「大年」。</p> <p id="48IAR9P6">大模型经历了三年的技术发展演进,行业叙事从chatbot(聊天机器人)时代,迈入「用AI替人办事」的Agent时代。</p> <p id="48IAR9P8">就在最近,智能体全面接管我们日常生活的信号,就出现了。千问App上线了全新AI Agent能力「任务助理」,全面打通阿里生态,包括淘宝、闪购、飞猪、高德地图和支付宝。</p> <p id="48IAR9PA">通俗来说,你张张嘴就有个AI助理替你点单,替你找餐厅、订酒店。</p> <p id="48IAR9PC"><strong>在这个时间点,互联网平台都在暗暗准备各自的Agent方案和AI路线图。</strong></p> <p id="48IAR9PE">阿里是全生态一起上,能打通的尽量打通。</p> <p id="48IAR9PG">某搜索中厂,他们的发力点之一是AI医疗,正在暗中大举招人,想把竞价排名的模式在AI医疗里复现,哪家医院付费意愿强,就把哪家作为答案直接给到用户。搜索大厂缺乏自己的生态、用户粘性和优质内容,只能回过头把过去最赚钱的项目重新捡起来,用AI重做一次。</p> <p id="48IAR9PI">豆包则是推出了自己的硬件豆包手机,以「蔚来-江淮模式」开发出一个让豆包拥有系统级权限的手机,主打通过「读屏+模拟用户点击」的方式来接替用户进行操作。</p> <p id="48IAR9PK">各家都在自己的能力禀赋和野心范围内,进行着AI时代的进攻和防守。</p> <p id="48IAR9PM">AI一键生成文字图片视频,chatbot和你聊天,不管聊成啥样,对我们普通人的影响还不算很大,最多是需要提防AI换脸骗术的可能性。</p> <p id="48IAR9PO">但Agent替你下单,替你聊天,涉及到钱和隐私的事儿,普通人的顾虑应该会高一个量级,不论是行业还是用户,都需要关注背后的运行机制。</p> <p id="48IAR9PQ">因此,这次我就拿放大镜看看千问的运行逻辑,到底是怎么替你办事,替你把钱付出去的。</p> <p id="48IAR9PS">我从千问的用户说明里阅读到这么一段文字:</p> <p id="48IAR9PU">合作方调用与数据授权。AI Agent在部分功能下需要调用合作平台接口 (如淘宝、淘宝闪购),为您提供自动购物、智能比价、外卖各类生活服务。</p> <p id="48IAR9Q0">在您明确授权的前提下,我们会将您的必要个人信息共享给合作平台,用于实现您的千问账号与合作平台账号的绑定、数据互通及功能授权,具体共享的个人信息类型、使用目的见产品页面提示。未经您的许可,我们不会擅自共享您的敏感个人数据。</p> <p id="48IAR9Q2">用行业术语来说,这就明晰了合作模式是agent to agent之间的能力调用:千问和其合作平台、应用签署了调用协议——这属于一种双重授权机制,不仅千问和用户之间签署协议,千问还和不同平台签署协议,获得调用许可。</p> <p id="48IAR9Q4">整个大阿里生态的思路是一致的,就在这两天,蚂蚁支付宝还联合千问App、淘宝闪购、Rokid、大麦、阿里云百炼等,正式发布ACT协议 (智能体商业信任协议)。这是中国首个面向Agent商业需求设计的开放技术协议框架,为AI与电商、外卖等服务平台的协同打造一套「通用语言」,助力跨终端、跨系统、跨平台的AI任务执行。</p> <p id="48IAR9Q6"><strong>那么,在2026年的年初,路线区别就显现出来了。</strong></p> <p class="f_center"><br><br></p> <p id="48IAR9Q8">阿里千问所代表的「双重授权机制」,是一种基于开放协议的合作模式。在这种模式下,AI Agent通过标准化授权协议与第三方服务进行对接,所有的数据交换都在结构化的接口中完成,权限边界清晰可控,每一次操作都有完整的审计日志。这就像是外交渠道——走正门,递国书,在明面上进行。</p> <p id="48IAR9QA">也是在不久前,豆包手机问世,则代表了另一种技术路线:<strong>「读屏加模拟点击」</strong>。它通过屏幕OCR识别界面元素,然后模拟人类点击、勾选等触控操作来完成任务。这种方式绕过了应用的逻辑层,直接在表现层进行操作,绕开了第三方平台的配合或授权。形象地说,更像是翻窗入室——虽然也能进去办事。</p> <p id="48IAR9QC">读屏模拟路线最大优势在于部署速度快、覆盖范围广。由于不需要与任何平台进行商务谈判或技术对接,厂商可以单方面实现对几乎所有应用的接管能力,这种「即插即用」的特性使其在市场竞争中具有明显的先发优势。</p> <p id="48IAR9QE">但从用户侧来看,这种便利性还是会打一些折扣。读屏+模拟点击路线,需要模拟人类点击,需要跳转App,再一页一页去翻、去识别、去填写,而如果是两个Agent之间签有协议,瞬间就完成信息授权和互通。</p> <p id="48IAR9QG">业内人士认为,模拟点击的便利性是有代价的,存在安全隐患和责任真空。API授权路线虽然部署缓慢、覆盖范围受限于平台开放意愿,但它提供了精确的权限粒度控制和清晰的责任归属。</p> <p id="48IAR9QI">从资金安全和用户隐私角度考虑,让我们具体想象一个场景:用户对AI说「帮我把余额宝的钱转到银行卡」。在读屏模式下,为了完成这个任务,AI必须具备读取屏幕上所有信息的能力,这意味着它实际上能看到用户所有的账户余额、所有的交易记录、所有的联系人信息,并且可以模拟点击任何按钮——包括转账给任意账户。</p> <p id="48IAR9QK">还有一个敏感场景是好友之间的对话,特别是对方不知情的情况下,让Agent帮自己回复信息,是节省了打字的麻烦,但读屏读的是当前页面全部信息,很敏感的信息也会一览无余,这一点上读屏模式可能还是得拿出令人信服的风控方案。</p> <p id="48IAR9QM">责任归属的模糊性或许是最棘手的问题。假设AI误操作导致转错账或买错股票,或者把一张情侣之间的照片发给了恰好同名的第三方,在API模式下,有完整的调用日志、授权记录和明确的接口语义,可以清晰地追溯责任。但在读屏模式下,AI Agent说它看到的是这个按钮,App则说按钮当时不在那个位置,整个事件无法复现、无法审计、无法锁定责任。这种责任真空在金融场景中尤其不可忽视。</p> <p id="48IAR9QO">而从互联网生态健康度的角度看,读屏模式本质上是一种「寄生」关系,它鼓励的是对抗而非合作。平台一旦发现自己的应用被这种方式「入侵」,自然会采取技术反制措施,这将导致一场无休止的攻防战。相反,API模式创造的是「共生」关系——Agent厂商获得能力,平台获得流量和生态位,用户获得便利,各方都受益。</p> <p id="48IAR9QQ">站在更加宏观视角,读屏模拟点击路线,很可能使得滴滴、携程、美团这类具有线下履约网络的平台,其线上的高利润环节被绕开,商业价值被削弱,这会对产业产生巨大震荡,<strong>Agent是帮用户节省了三秒钟,地球上就此消失了若干家世界五百强</strong>,这种路线,在当前经济社会状况下,应该是不会得到各方首推的。</p> <p id="48IAR9QS">我猜想一下趋势可能的走向,在未来一到两年的短期内,读屏模式会在非敏感场景快速普及,比如查天气、内容消费这类场合。而涉及到金融、支付和聊天场景,需要更加审慎。</p> <p class="f_center"><br><br></p> <p id="48IAR9QU">站在旁观者角度来看此次千问发布会,有一个意义是很突出的,阿里生态选择双重授权路线,能率先卡住A2A路线,有机会成为行业标准制定者,建立一个生态联盟,有利于先把朋友搞得多多的。</p> <p id="48IAR9R0">合理推测,2026年,阿里必会推出自己定义的AI手机,甚至对于大多数头部互联网平台来说,尽快推出自己定义的Agent手机,都是件迫在眉睫的事。</p> <p id="48IAR9R2">在AI叙事的另一个大国,2026年1月,谷歌也在行动,它联合Shopify、沃尔玛等全球零售业巨头,发布「通用商务协议」(UCP),前沿探路者们都在试图争夺标准定义权。</p> <p id="48IAR9R4">在三到五年的中期,我预计会出现类似「Agent Protocol」的行业标准,主流应用会提供官方的Agent接入点,读屏模式将退化为<strong>「最后手段」</strong>,用于那些尚未适配的长尾应用。</p> <p id="48IAR9R6">读屏模拟是<strong>「证明Agent有用」</strong>的捷径,API授权是<strong>「让Agent可信」</strong>的必经之路。前者适合开荒探路,后者适合长久定居。站在不想被一眼看穿的普通用户,以及产业能健康发展的角度,我们还是希望双重授权的A2A模式,成为最终行业标准和共识,大家一起走得更加平稳一点。</p> <p id="48IAR9R8">*本文如有提及上市公司,仅作为研究交流用途,不构成推荐股票或相关金融产品的建议。</p>

编辑:迈克尔·巴考尔