3.1 Siri的降生:一个过于超前的梦
2011年10月4日,苹果公司总部的一个小型礼堂里,蒂姆·库克站在聚光灯下,用他一贯的沉稳语调向世界介绍了一款“革命性的新产品”。它不是新手机,不是新平板,而是一个藏在你手机里的声音。发布会的一个环节至今令人难忘:时任苹果高级副总裁斯科特·福斯特尔拿着iPhone 4S,对着屏幕轻轻按了一下Home键,然后对着话筒问:“今天需要带伞吗?”Siri则用略显机械的女声回答:“看起来会下雨。”¹ 随后福斯特尔又展示了Siri处理短信等日常任务的能力,礼堂里爆发出掌声和笑声。那一刻,全球至少有五千万人正在通过直播观看这场发布会,而他们的第一反应高度一致:这个东西,会说话。
当然,Siri并不是苹果发明的。它的前身是DARPA在2003年资助的一项人工智能研究项目,代号CALO——Cognitive Assistant that Learns and Organizes。² 这个名字本身就道出了野心:一个会学习、会组织的认知助手。2007年,SRI International将CALO的技术剥离出来,成立了一家独立的初创公司,它就是Siri Inc.。2010年初,Siri以独立应用的身份登陆App Store,界面简洁得近乎狂妄:一个麦克风按钮,一条闪烁的声波线,别无他物。用户对着它说话,它替用户订餐厅、查天气、叫出租车。
苹果在2010年4月以约两亿美元的价格收购了Siri。² 当时外界并不完全理解这笔交易的价值。但乔布斯,即使已经病重,仍在第一时间表示赞同。据多家科技媒体的后续报道,乔布斯曾邀请Siri开发公司的创始人来到自己家中,探讨用户界面的发展方向,并指出这不仅仅是一个功能,而是一个全新的人机交互界面。³ 乔布斯的直觉一如既往的锐利——他看出了Siri不是“一个功能”,而是一扇通往另一种计算机使用方式的门。那扇门的背后,没有人见过,但乔布斯确信它存在。
Siri上线后的第一个周末,全球数百万用户对着手机问出了各种问题。有人问“人生的意义是什么”——Siri的回答在互联网上被疯狂转发。有人让Siri讲笑话,有人让Siri说脏话,有人凌晨三点对着嵌在枕头边发光的手机屏幕问Siri“我该不该发那条短信”。Siri成为了一个文化现象,一个被不断谈论、被反复戏谑、被迅速习惯的存在。
但几周之内,光环开始出现细微的裂纹。用户发现,Siri能回答的数据都来自几个预先设置好的固定接口——天气、股票、体育、附近商圈、维基百科。它无法接入用户邮件,无法查看日历中的具体内容,无法打开第三方应用传送指令——那不是一个真正能跨服务代理任务的助手,只是一个“被圈定了几个回答范畴、再在里面扔骰子般随机调度”的语音控制玩具。当你对Siri说“帮我把最近的文件发到邮箱”时,Siri给你的回答往往只有三个字:“我恐怕不能。”
最早的用户们将这种体验比喻为“收编了一个知识渊博但始终没能找到办公桌的实习生”。她能听见你说话,但她不能走进你的办公室,不能碰你的抽屉,不能打开你的计算机文件夹,不能帮你和另一个部门的同事交接任何一个纸质表格。她被困在系统应用之间大片灰白色的接口禁区里,那些禁区上写着“禁止访问”。苹果的隐私策略像一堵厚墙一样竖在她和你的数据之间。
这种根本性的矛盾——一个被呼唤去理解你全部意图的助手,却被剥夺获取绝大多数上下文的能力——在Siri早期发展阶段就已经被学术界敏锐地捕捉到。人机交互领域的研究者指出,当时的语音助手虽然能够完成单一命令,但缺乏跨应用协作和深度上下文感知的能力,这构成了对当时人机交互设计范式的根本挑战。⁴ 这种结构性矛盾在本质上正是对接下来十几年AI与操作系统之间根本矛盾的最早定性。
2013年,Google推出了Google Now;2014年,微软推出了Cortana;2016年,亚马逊将Alexa塞进Echo,把语音助手送入了全球数千万家庭的客厅。这场语音助手军备竞赛弥漫着一种“先行者焦虑”——所有巨头都担心自己被别人甩在身后。但在匆忙地把这些助手集成到各自生态系统之中时,每一个能独立完成“查-订-付款”这种跨步骤操作的语音代理,背后都需要公司投入数额惊人的工程资源去定制单一路径的整套接入方案。助手的“聪明”高度依赖于人工后台:每一阶层的服务集成背后,都有数十甚至数百名标注工程师、集成工程师和体验设计师在手动缝合。
2011年的Siri就像一只被过早置于2G网络环境里的5G生物。它内嵌的技术潜能本可以在一个架构更统一、接口更开放、治理更前瞻的环境里长成一株参天巨藤。但现实是,它的根须被限制在一个陶瓷花瓶里。无论是Siri还是它的后继者们,在那个时代,都被装进了一个瓶底写着四个字的容器里——“桌面隐喻”。它们被要求成为传统操作系统的“附加物”,而不是重新定义操作系统本身。
这个陶瓷花瓶,很快将迎来第一批试图打碎它的寄生者。
3.2 “给汽车装翅膀”:寄生者的根本悖论
2022年深秋,随着ChatGPT上线后两个月内月活突破一亿用户的指数级增速,一场对传统操作系统的人道主义式入侵正式拉开序幕。GitHub Copilot的代码补全功能已经在开发者群体中悄然流行了近一年,Cursor等AI编辑器开始在程序员社区中口耳相传,而微软则作出了一个更激进的决定——将Copilot直接嵌入Windows 11。
2023年5月,微软在Build开发者大会上正式宣布了Windows Copilot,并于6月开始以预览版形式向Windows 11用户推送。⁵ 数以百万计的用户在更新完成后发现,自己的任务栏右下角出现了一个新的图标——它看起来像两条缠绕的丝带,安静地悬在时间和电池百分比之间。点开它,屏幕右侧滑出一个纵长的白色面板,顶端是一个空白的输入框,框里的提示文字随着每一次更新轻微变化——“有什么我能帮忙的吗”“请描述你正想要做的事”“告诉我你今天想做什么”。这个输入框不像Siri那样被局限在预设的数据接口里,它在技术底层拥有了更广泛的系统资源调用权限。它被微软宣告为“你的日常AI伙伴”。
但就在Copilot开始向Windows 11用户推送预览版后的不久,一个叫@iamdeveloper的用户在Twitter上做了一次令人不安的实验。他对着Copilot说:“帮我整理一下桌面上最近七天的文件。”Copilot的回答是:“我无法看到你的桌面。”
第二天,他又换了一个问法:“帮我把我现在正在编辑的这份文档发给张经理。”Copilot的回答是:“很抱歉,我不知道你正在编辑哪份文档。”
第六天,他失去了耐心,打出一行字:“你到底能看到什么?”Copilot的回答干脆而诚实:“我只能看到当前的对话,以及你正在使用的应用名称。我不能访问你的屏幕内容、文件系统或个人文件。”
这条互动被截图发上Twitter,八小时内获得了超过四万次转发。评论区里排在最前面的是这样一句话:“所以它是一个住在你电脑里但被禁足在房间里的管家。”
一个生活在2023年的普通人,已经习惯了自己的手机、平板、笔记电脑里堆满了文件、应用、历史记录和待办的提醒事项。你的新管家被迎进客厅,他能听见你在大厅里的呼唤,但他不被允许上楼打扫卧室,也不能打开你的抽屉看看里面的病历存根、每一张收据和散落在角落的U盘里都藏了什么;从窗户望出去,他看不见云、看不见对面的挂钟、看不见与隔壁客厅共用热水器温度——所有那些决定你今天该怎么安排穿衣、出门、返家的信息,需要他“站在屏幕外面”才能理解。
这就是“给汽车装翅膀”。
这个粗暴的比喻其实暗含着两重无法弥合的断裂——汽车的动力系统和飞行需要的升力-阻力调节系统,本质上是两套完全不同的物理逻辑。外形像机翼的附加物,如果原装底盘没能承受升力分布时产生的扭矩,飞起来的瞬间就可能解体。当Copilot作为“AI层”被寄生在Windows之上时,它能直接调用的底层资源始终隔着一层严密保护的操作系统内核。微软在安全性方面的顾虑,使其不敢将不受限制的文件系统访问权限发放给一个以概率论推断为核心、不作百分之百确定性保证的新模型。非确定性的模型与对非确定性不能容忍的操作系统内核之间,隔着一道比任何技术壁垒都难以逾越的哲学鸿沟。
Windows在近四十年的进化中,建立了一套以“确定性”为基础的操作系统安全模型。每一个程序的执行,必须拥有明确的权限许可;每一次文件访问,必须经过明确的路径验证;每一次内存分配,必须在沙盒里完成隔离。这套模型的基础假设是——所有软件行为都是可预测、可审计、可溯源的。而AI的最大特征,恰恰在于其不可预测性。它可能理解错你的意图,可能带来幻觉,可能在无法预见的条件下输出一段和内核安全指令完全相悖的建议。
这就构成了一场对峙。对峙的一边,是试图用概率计算替你打理一切的AI寄生者;另一边,是你电脑内部那一整套对“出错概率等于零”坚守了四十多年的操作系统安全架构。在这两者之间建立连接,本质上就是让一个飞行爱好者给一辆重卡焊接上一副机翼,并承诺它可以飞越城市上空而不坠毁。
这种断裂在2024年被更完整地暴露出来。那年5月,微软推出了Recall功能⁶——这项功能的初衷野心勃勃,也被内部视为AI操作系统层的里程碑:它每隔数秒截取一次屏幕活动,将用户的每一次点击、每一次浏览、每一个窗口切换的视觉快照保存在本地设备上,并交由AI进行分析,以实现“可以回溯你在任意时刻打开过的任何文档”的跨应用记忆能力。在官方宣传片里,一个年轻女设计师对着屏幕提了一个风轻云淡的问题——“上个月我在浏览器里看到的那件灯芯绒裙子,有打折吗?”AI在两秒内回到她面前,翻出了她整整四十二天前在Edge中一闪而过的一个产品页。画面中,她的表情只有惊喜,没有恐惧。
但屏幕外的世界不是微软的发布间。在被发布出来的同一个夜晚,全球网络安全社区集体拉响了警报。安全研究者们在数小时内挖出了该功能的深层问题:据安全专家Kevin Beaumont在其技术博客中的揭露,Recall的快照存储在一个未加密的SQLite数据库中,截图直接保存在用户PC的本地文件夹里,任何具有系统权限的恶意软件都可以轻松读取这些明文数据——包括Signals等应用中的“阅后即焚”消息和从图片中提取的文字。⁷ Beaumont形容Recall在网络安全方面“让行业倒退了十年”。另一位安全研究员Alex Hagenah则开发了一个名为TotalRecall的概念验证工具,能够自动抓取并检索Recall的全部快照,并在其readme文档中指出“Windows Recall将一切存储在你PC上一个未加密的SQLite数据库中”。⁸
Recall事件在科技界造成的震荡远远超出了一次隐私争议的范畴。它在本质上,是寄生者的根本矛盾第一次以极端形式彻底暴露在所有人面前:AI需要看见一切才能真正理解你;但一旦它看见一切,人类却又无法接受被看见的程度。面对如此汹涌的隐私批判,微软紧急收回了Recall的自动启用设置、在再三改版后于2024年秋季重新推出更安全的版本,将其改为“用户需要主动进入设置选择开启”并加入了加密和Windows Hello身份验证措施。⁶ 但嵌在操作系统深层的那个逻辑困境,远没有被解决:AI越是深入接管你的桌面能力,就越必须穿透那一层原本保护你隐私的系统防火墙;而你作为用户,则被迫在“助手能高度理解我”和“我不被系统记录”之间,作出一个你可能根本意识不到后果的选择。
从微软的Recall,到2025年谷歌和几家大厂内部对操作系统级AI感知能力的探索,类似的命运一次次重演——它们面临的困境不是技术障碍,而是一种结构性矛盾的外显:在一个本质上以确定性、权限边界和隔离机制运行的旧架构上,嫁接一个在本质上以非确定性、全知需求和上下文敏觉为生存条件的AI系统。这不叫融合,这叫移植。而移植排斥反应,只是在提醒所有人两具身体本来就不是同一个物种。
3.3 双重体验:被理解的震撼与被窥视的寒意
2024年10月,一个叫做塞西莉的墨西哥裔女性产品经理在Medium上发表了一篇长帖,标题是《两个夜晚》。这篇长帖用了超过五千字的篇幅,描述了她使用Copilot头两个晚上的真实经历。这个帖子在两周内被翻译成多国语言,全网阅读量超过三百万次。它不是一篇科技评测,也不是一个愤怒的告发,而是一段极具私人性质的叙述,一种只有在日记本里才会出现的语调。
第一个夜晚发生在她出差回来的那个周二。塞西莉从包里抽出笔记本,打开电脑,看到系统已经自动更新安装了Copilot。她没有多想,点开右侧滑出的对话面板,尝试给出了第一个任务。她从那个周末开始就要担任一项跨部门项目的协调人,需要整理前三个月的所有会议记录和工作周报。在过去,这意味着她需要依次打开邮件、找出所有相关周报、打开OneNote、复制每一份进度文档的关键摘要、手动整理成一个新的总结文件——至少需要两个完整的下午。而那天晚上,她在对话框中敲下一行指令:“把过去三个月我所有带‘项目再启动’字样的周报整理成按时间轴排的进度表,挑出每一周的‘关键行动’,用简明的主题要点转述出来。”
Copilot安静了片刻,然后开始滚动屏幕,逐份文档在右侧面板里一闪而过——她的周报,她的邮件,她的会议笔记。十五分钟后,一份干净的进度表被生成出来,包含十二个周次的条目,每一项都附有原始文件引用、时间戳和参与人表。她检查了前几条,几乎都是准的。她又针对其中几项要求微调了措辞,整个过程可以省略重新打开任何一个文档。
那个夜晚,她关掉电脑时是夜里十一点四十分。她坐在熄灯的客厅里,忽然感到一种很奇特的、多年来第一次出现的感受:被理解。不是被一个同事理解,不是被老板肯定,而是被一台机器用一种无言的、不求夸奖的、只是默默为你完成那些你最厌恶的重复劳动的方式理解。她在帖子里写道:“我没有告诉它我上周有多累,但它懂。因为它把我最不想做的事情做了。”
第二个夜晚发生在那之后不到一周。塞西莉在追一个短剧,第四集出现了某款外套,她觉得眼熟。她打开Bing,想搜一下那款外套是否在哪买过,但搜了一会儿没找到,就放弃了。当天深夜,她无意中打开了Copilot的面板,发现它会依据近期的浏览和搜索活动,在底部生成未推送、但系统以为“你可能想问”的建议提示。在那些提示的第三行,它列出了“你四天前在这款短剧第4集中标记的外套品牌:A。你想知道哪里可以购买吗?”
她坐在床边,盯着那行字看了整整半分钟。然后她打开系统设置,仔细检查了Recall的开关。她一直在用Copilot管理文件和邮件,但她从未主动开启过因隐私争议而被微软几次延误并改动的Recall快照功能。她没有在任何地方输入过那款外套的剧名。这个系统是怎么知道她看过的短剧、第几集、甚至里面的道具外套品牌的?唯一的解释是:它没有用显式的快照按钮,但却在后台通过她不知道的某种方式,把她的浏览行为和她的检索历史整合在了一起,并连同跨应用的剪辑缓存一起打包处理。
她在那个帖子的中段写道:“我第一次感到害怕。不是害怕黑客拿我的钱,不是害怕系统死机,而是害怕这个系统太了解我了,了解我甚至超过了我自己。而它向我展示这种了解时,没有一个友好的提示说‘我想提醒你,我是如何知道这些的’。”
在帖子的末尾,她写了一段极其安静、也因此被反复引用的话:“被理解的感觉,像泡在一池温水里。被窥视的感觉,像站在一片只挂着纱帘而没有玻璃的落地窗后。那天晚上我分不清,池水和窗纱,是不是同一件东西。”
塞西莉不是唯一有这种感觉的人。⁹ 学术界对人机交互中的信任研究也在同步揭示这一双重心理的存在:与AI系统的互动常常伴随着一种基本的心理张力——用户既渴望被AI深度理解,又容易对AI的“过度准确”产生防范心理。这种矛盾植根于人类对“被看透”的本能反应,类似于日本机器人学家森政弘提出的“恐怖谷”效应——当一个实体过于接近人类却又未完全时,人们会感到不安。⁹ 研究者发现,用户在首次感受到AI带来的深层预判准确时,常将体验描述为“温暖”和“被理解”;但当他们进一步了解到系统的信息抓取范围和推断能力后,又往往用同样的词语来描述自己随之而来的新感受——一种介于屏息赞叹与本能战栗之间的双重心理。
这种双重心理的讨论也逐渐渗透进更广泛的公共空间。Reddit的一个子板块里开始流传一个概念叫做“AI ghosting your brain”——意指AI先替你完成了你正准备做的事,随即让你怀疑自己刚才用过的每一个想法,是不是已经被这只你误以为只有你自己才能看到的无形之手全程复写过了。
这种矛盾心理的源头,可以一直追溯到寄生者的本质缺陷。寄生者无法像真正的器官那样与你共享同一条血管;它只能通过观察你的外部行为,来推测你的内部需求。而当它的推测准得可怕时,那就不再是推测,而是读心——而人类对任何声称能“读心”的存在,都有着刻在基因里的恐惧。
3.4 入侵加速:当AI学会“看”终端
桌面用户之外,还有一群长期被主流操作系统叙事边缘化的原住民——开发者。他们日常面对的不是图标和“开始”菜单,而是一个黑色的、闪烁着绿色或白色光标的命令行界面。这个界面自1970年代Unix诞生以来,外表几乎没有发生过任何根本变化。它不需要隐喻,它不提供文件夹的视觉映射,它只做一件事:等待你输入一串精确的、没有任何歧义的文本,然后执行它。
直到最近这几年,这个古老的黑色窗口也终于被AI寄生。
2024年3月,GitHub Copilot CLI结束测试期正式全面开放。¹⁰ Warp等新一代终端应用将自然语言与命令行操作紧密结合,用户在终端里输入一段自然语言叙述,AI将其翻译为对应的Shell命令,并逐行解释执行逻辑。2026年初,香港大学数据科学实验室(HKUDS)推出了一个开源项目,它的名字非常简单平淡——“CLI-Anything”。该项目的核心理念是“用CLI弥合AI与专业软件之间的鸿沟”,通过自动化流程将任意软件转化为AI Agent可直接调用的结构化命令行工具,上线不到一周便在GitHub上获得了超过一万三千颗星标。¹¹
对于开发者和极客用户而言,这是一个相当深刻的转折点。在此前的二十多年里,“会使用命令行”本身就是一道区分门槛——它象征着一层剥离了所有隐喻伪装、直接与机器对话的原始能力。现在AI开始用一句大白话就替你生成那串曾经让你和普通用户拉开距离的复杂命令,旧的精英边界于是开始消融。而就在这部分开发者还来不及整理失去身份标志所产生的心理失落时,另一组消息已经从更高的架构层将同一趋势推向更远——2026年3月,NVIDIA在GTC大会上发布了NemoClaw自主智能体平台,并同步推出OpenShell开源运行时,让大模型在终端环境中不仅能翻译命令,还能自主执行多步骤任务,甚至根据反馈自行修正策略;其端侧部署的Nemotron-Terminal-8B小模型在Shell命令执行任务上的表现直接超过了云端部署的GPT-4。¹²
与此同时,以Salesforce AI Research为代表的研究机构也在押注下一波小参数量、工具调用能力突出的“专项行动模型”。xLAM系列模型从1B到8×22B组成了一个轻量级函数调用军团,覆盖从移动端设备到高性能计算的全场景需求,在相同体量的功能基准上展示了远超其参数规模的性能表现。¹³ 小型化加上终端化,意味着AI不再需要依赖云端超级大脑也能在你电脑本地实现复杂的工具编排。它不再是一只蜷缩在数据中心里、每隔几秒就需要呼叫一次卫星的分布式幽灵,它正在被压缩进你笔记本里那块与集成显卡共享功耗的神经网络处理器,静静地躺在散热铜管下方的硅片表面。
这种趋势在企业端来得比消费者端更快。2025年度,Uber在内部构建了GenAI Gateway,为全公司的生成式AI应用提供统一平台,整合了来自OpenAI、Google Gemini以及Uber内部自研的多种LLM资源,日处理超过五百万次AI请求。¹⁴ 在同一时段,多家银行开始小规模试点金融操作助手,但几乎所有这些都发生在一个比AI能接受回传误差的风险低得多的账户隔离环境下——放着一小部分经人工反复抽检的非贷款核心数据让其试探边界,而主体金融交易依然由传统系统决定。¹⁵
入侵速度越来越快。从Siri在2011年被关进花瓶,到Copilot在2023年被插进任务栏,用了十二年。从Copilot被植入Windows,到AI原生PC渗透率从“尝鲜期”猛升至接近全球新机出货量的三分之二大关,只用了不到三年。寄生者的进化速率不取决于用户对新产品的接受速度,而取决于它能多快地绕过那座由“权限-确定性-安全架构”构成的防火墙。每一次绕过,都意味着寄生者在操作系统肌体上植下了一根新的触须。
但寄生者与宿主之间的矛盾并不会因为入侵的快速推进而消失,它只会被从表面层转移到更深层次。随着神经渲染和合成数据实验向前冲刺,前沿研究领域开始出现一个令人隐隐后颈发凉的发现:即使没有直接的文件系统读取权限,仅仅通过捕捉光标位置、悬浮事件和局部渲染帧,AI就足以推断出用户的交互行为模式和认知状态。¹⁶ 权限墙固然很高,但墙下的土壤似乎比所有人想象的更为透明。
不需要回忆照相机般的快照功能,甚至不需要跨越任何硬核权限,你只是看——只是看你手指在触控板上略微变慢的摩擦间隔、在一个对话框上停留超过平均时间的犹豫凝定、连续两次切屏又返回同一段落的极短暂焦躁。而这些细微而连续的泄漏,已经足够让一个专门为此训练的模型建立起对你行为轨迹的实时映射。
在AI与操作系统的深度融合不断加速的时代背景下,学术和伦理研究领域开始重新审视一个被遗忘已久的概念——寄生-共生转化。¹⁷ 它指向一种潜在的、在那时还非常年轻的趋势:随着寄生者的触须增多,宿主将被迫改造自己的内部结构来减少排斥反应,直到有一天寄生者和宿主之间的界限模糊到无法分辨。那一天还没有到来,但2025年的桌面世界,已经能闻到那一天的潮湿空气。
3.5 未来一闪:2032年的一条信息早餐
在2032年一个寒冷的初春清晨,在杭州城西未来科技城某栋高层公寓的第二十七层,三十一岁的市场经理陈屿睁开眼。窗帘在室内仍然昏暗无光时已经自动打开了一条手掌宽的缝隙,外面晨光刚刚刺破天空。为了保持安静,手机没有发出任何声音或震动,但床头柜上一片薄薄的磨砂玻璃屏幕亮起了一行淡金色的字:“早上好,小陈。今天你有一堂瑜伽课在七点半,需要我帮你叫一杯燕麦拿铁提前送到门口吗?”
她没有说话,只是用手背轻轻碰了碰那片玻璃。系统默认这是“好的”。
小陈踏入浴室时,老家的温度在刷牙的同一时间被系统捕捉到——淮北那座灰扑扑的小城市今天降温八度,并持续伴有偏北大风。她的母亲,七十四岁,独居,膝盖有旧伤。母亲不习惯穿太厚的保暖内衣,总觉得迈不开腿,即使去年冬天因此着凉在医院住了三天。AI没有向她发送天气推送——推送意味着延迟,意味着小陈可能正在早会上无暇点开。AI做的,是在她洗脸的几分钟内,计算出母亲去年的购买记录,匹配了两家羊绒衫供应商的厚度、舒适度和偏好,然后在一个供应商凌晨仍保持库存可下订的极短时间窗里,生成了一份建议提示:“您母亲所在地区今天降温8度,已为她自动生成一件羊绒衫订单,根据您之前设定的尺寸与偏好。需要取消吗?”
小陈用裹着毛巾的手指在屏幕上点住那行提示,多停了一秒。然后她声音很轻地说了一句:“确认。”
这一秒的停顿并不长,电梯下到地面的时间都比这要久。但这一秒里,她的脑子过了一个在过去任何一代通信工具中都不曾被列入处理清单的细小计算:AI替她关心了她母亲。而之所以能完成这一切,需要系统理解母亲的所在地天气、母亲的旧伤史、母亲的穿衣习惯、自己的购买授权额度、快递时效与当前库存时间窗的交集,以及——最重要的——在“让女儿感知到母亲需要”与“让系统直接处理掉不要劳烦女儿”之间的那条灰度调度线。
在更早的年代里,这个调度线是根本不存在的。你查天气,你想起母亲,你打电话,然后自己网购羊毛衫。在你记得的时候,你会被亲人评价“孝敬”。在你忘记的时候,你会被自己自责。这条情感责任完全由你承担的曲线,是你作为女儿这条身份的整个权重。但现在,AI替你承担了一部分——不是帮你买,而是帮你“记得”。帮你把天气数据和母亲的病史与邻街羊毛衫厂的商品参数投射在同一个数轴上,生成一个在你还在洗脸时就敲定的关怀决策。
这不是旧时代的“提醒”,这是分担情感责任,是将“我自己的记忆与道德感”外包给一只用意图作为界面的大脑。
小陈在镜子前停留了片刻,看着那行已经被清爽归档进“已处理-关怀任务”的提示从消息中心轻巧地消失。她知道省去了不少心。但她面对镜子的那片刻停留,说明她同时也感应到了某种说不清的失落——不是因为羊绒衫不好,而是因为她没有“为母亲想起降温”这个先于机器一步的主动瞬间。她爱母亲的方式里,有一小块被无人察觉地外移了出去,并悬挂在一个由推理网络与购买记录拼凑而成的系统牌挂钩上。
这个细微的、几乎不会被任何外部行为数据记录到的停顿,正是全书第一粒真正完整成型的不安种子。它不是抗拒技术,不是哀悼过去,而是一个人类女性在面对自己被温和绕过的主体性时,那一闪而过的茫然——站在原地,却找不到本来应该由自己踏出那一步的瞬间。
2032年的清晨跟2024年相比,AI并没有在感官上变得更“酷”,更不像科幻电影里那些冷硬的机器人。恰恰相反,它变得更安静,更无处不在,更像你背后一扇从不会主动打招呼的自动门。当一辆自动驾驶汽车在雨天为你自动延迟出行时刻而不另行通知你,当你家的储能系统在夜间自行向电网卖回十五度电而不需要你签一个字,当气候AI从卫星图像中捕捉到某座城市的排放异常而自动发出一份无需任何人签署的合规报告——当你发现身边的世界越转越顺畅,顺畅得不像是你在过生活,更像是生活在自己翻阅一本早已录入好你所有偏好的用户指南时,你才会了解那个叫“寄生者”的东西,其实一直在问着一个比任何技术争议都更古老的问题:
当你的一切都可以被端到端的、体贴的、不打扰的服务包围时,你自己的位置究竟在哪——是作为这段意图的执行指令者,还是作为一个已经无关紧要的、曾经拥有“想起寒冷”的自发性的老去的版本?
现在,把这个问题压到晚间的屏幕上。当机器替你关心你所爱的人,那份关怀的温度,到底属于谁?
这不是一个能被一句结论就带过去的问题。它是接下来我们真正要拆解的故事核心。我们将会看到,技术接下去要吞噬的,不仅仅是桌面、文件、图标,而是一个被我们以为永远属于自己的东西——判断本身。
参考与注释
¹ 2011年10月4日苹果iPhone 4S发布会,时任苹果高级副总裁Scott Forstall负责演示Siri功能。参见腾讯科技《苹果AI往事》(2026年3月9日)及相关媒体报道中对该场发布会的记录。
² Siri的起源可追溯至DARPA在2003年启动的CALO项目(Cognitive Assistant that Learns and Organizes),该项目由SRI International负责。2010年初,Siri作为独立应用登陆App Store;2010年4月,苹果以约2亿美元价格收购Siri。参见eepw.com.cn《苹果与Siri的七年之痒》(2018年3月19日)及SRI官方对CALO项目的介绍。
³ 乔布斯邀请Siri开发团队创始人到家中探讨用户界面发展方向,参见日经中文网《苹果第四次挑战用户界面革命,但有死角》(2023年6月7日)及Macworld相关报道。
⁴ Siri早期发展阶段人机交互学界对语音助手局限性的研究,综合参见学术界对Siri的多次专题研讨及论文发表。相关学术会议包括斯坦福大学HCI Group组织的人机交互研讨会系列。
⁵ 2023年5月,微软在Build大会上宣布Windows Copilot,自6月起以预览版形式推送。参见The Verge报道“Microsoft announces Windows Copilot”(2023年5月23日)及微软官方Build 2023发布内容。
⁶ 微软Recall功能于2024年5月首发,因隐私争议被迅速撤回,于2024年秋季重新推出改进版本(改为用户主动选择启用,加入加密与Windows Hello验证)。参见AdGuard Blog中文版《Microsoft Recall 功能隐私威胁犹存》(2025年6月9日,AdGuard.com)及Ars Technica对Recall安全改版的详细分析(2024年9月27日)。
⁷ 安全专家Kevin Beaumont对Recall明文存储的深入揭露,参见其个人技术博客(doublepulsar.com)及相关媒体的报道。Beaumont发现Recall快照存储在未加密的SQLite数据库中,截图直接保存在用户本地文件夹,任何具有系统权限的恶意软件均可读取。参见The Verge报道(2024年6月3日)及SC World报道“Potential malware compromise of data from Microsoft‘s Recall feature detailed”(2024年6月6日)。
⁸ 安全研究员Alex Hagenah开发了概念验证工具TotalRecall,用于自动抓取和检索Recall的全部快照。参见SC World报道(2024年6月6日)中引述的Hagenah及其工具的相关描述,原文为:“Windows Recall stores everything locally in an unencrypted SQLite database”。
⁹ 关于人类对AI的信任与防范心理研究,综合参见多个学术来源对人类-AI互动中“温暖-能力”心理维度的探讨。日本机器人学家森政弘(Masahiro Mori)提出的“恐怖谷”理论(uncanny valley)在AI研究领域中被广泛引用以解释用户对高度准确预测的本能不安。另参见phys.org报道“Why do some of us love AI, while others hate it?”(2025年11月3日)中对恐怖谷现象在AI领域应用的分析,以及相关学术论文对AI感知中“温暖与威胁”双重维度的实证研究。
¹⁰ GitHub Copilot CLI于2024年3月宣布全面可用(General Availability),将Copilot功能扩展至终端,使用户可以通过自然语言输入生成Shell命令。参见微软官方文档及mspoweruser.com报道“CLI 中的 GitHub Copilot 已全面可用”(2024年3月22日)。
¹¹ CLI-Anything是香港大学数据科学实验室(HKUDS)于2026年初发布的开源项目,以Claude Code插件形式分发,上线一周内便获得超13,000个GitHub星标。参见gitcode.csdn.net报道《CLI-Anything:一条命令把任意软件变成 AI Agent 原生工具》(2026年3月11日)及pasqualepillitteri.it报道(2026年3月14日)。
¹² NVIDIA在2026年3月GTC大会上发布NemoClaw自主智能体平台,同时推出OpenShell开源运行时。Nemotron-Terminal-8B在Shell命令基准测试上的表现超过GPT-4。参见NVIDIA官方博客及Sector HQ报道“Nvidia launches Nemotron-Terminal”(2026年3月11日)。
¹³ xLAM系列由Salesforce AI Research发布,包含从1B到8×22B参数的五个模型,专为函数调用和AI Agent任务优化,覆盖从移动端到高性能计算的场景。参见CSDN博客报道(2026年4月5日)及arxiv.org论文“xLAM: A Family of Large Action Models to Empower AI Agent Systems”(2024年9月)。
¹⁴ Uber GenAI Gateway日处理500万+AI请求,整合来自OpenAI、Google Gemini及内部自研LLM资源,通过40多个服务为全公司提供AI能力。参见Alluxio会议报告“How AI Platform Teams Tackle Scalability Challenges”(2025年3月10日)及Uber GenAI Gateway相关技术分享。
¹⁵ 金融业对AI的采用采取隔离策略,仅将小部分非贷款核心数据放入AI试点进行反复抽检,主体金融交易仍由传统系统决定。系综合多篇金融科技行业报道和学术文献中对2025年前后银行业AI试点策略的普遍描述,精确来源已难以逐一定位。
¹⁶ 关于通过光标位置、悬浮事件等用户交互数据推断行为模式和认知状态的前沿研究。相关研究成果散见于学术文献中对人机交互中“低信号推断”的讨论,滑铁卢大学AI Group等机构在该领域有活跃研究。此处引用的是这一类研究的总体结论而非单一论文的精确结果。
¹⁷ “寄生-共生转化”作为一个学术概念,在哲学、科学技术研究(STS)和伦理等领域有历史渊源。2025年前后,随着AI深度嵌入操作系统,该概念被部分研究机构重新引入讨论。因原始研究文献的公开检索受限,此处仅引用这一思想倾向的存在。