∞ 苹果发布2026年辅助功能更新 AI技术开始成为核心驱动力
苹果公司于5月19日发布了2026年度辅助功能更新计划,为iPhone、Mac和Vision Pro等设备带来多项基于设备端AI处理的新功能,重点涵盖VoiceOver、放大镜、语音控制和辅助功能阅读器等多个领域。本次更新充分展示了苹果如何利用设备端人工智能处理技术提升无障碍体验。

最引人注目的新功能是为未配字幕的视频自动生成字幕的能力。该功能将利用设备端语音识别技术,在iPhone、iPad、Mac、Apple TV和Apple Vision Pro等全系列设备上提供支持。这意味着用户无需依赖网络连接或第三方服务,即可为任何视频内容获得实时字幕显示。
在视觉辅助方面,苹果对VoiceOver的图像浏览器功能进行了重大升级。新版本将使用AI技术为图像生成更详细的描述信息,不过苹果也特别提醒用户,在存在风险或潜在危险的情况下不应完全依赖这些AI生成的描述。此外,用户还可以通过按下操作按钮,直接向AI提问关于摄像头所看到内容的问题。

语音控制系统也迎来了重要改进,将加入自然语言导航功能。同时,辅助功能阅读器将具备总结更复杂材料的能力,帮助有阅读障碍的用户更好地理解内容。
针对Vision Pro头显设备,苹果推出了突破性的眼球追踪控制功能。该系统可以与电动轮椅驱动系统连接,包括美国市场的Tolt和LUCI品牌,支持通过蓝牙或开发者接口进行有线连接。此外,Vision Pro还将获得车辆运动提示功能,以减少用户在移动车辆中佩戴这款售价3499美元头显时的晕动症状。
在硬件配件方面,苹果宣布从今日起通过Apple Store在全球范围内销售与MagSafe兼容的Hikawa Grip & Stand握把支架,提供三种颜色选择。这款配件采用弧形设计,中间带有孔洞,为有特殊握持需求的用户提供更舒适的iPhone使用体验。

其他更新还包括tvOS系统将支持更大字体显示,以及新增用于在FaceTime通话中引入手语翻译员的API接口等。这些辅助功能预计将在今年晚些时候陆续推出。
∞ Google悄然取消Gemini无限使用权限 推出严格时长与周配额限制
Google将在今日举办近年来最重要的 Google I/O 开发者大会之一,预计将重点展示 Gemini 大模型的一系列功能升级与深度整合,并推出将 Gemini 放在核心位置的新一代 Google 电脑产品。 在这一重大发布前夕,Google已经开始为 Gemini 推出全新界面设计,同时在后台悄然上线了一套严格的使用配额机制,终结此前在 Flash 模型上“几乎不限量”的免费体验。

根据最新变更,Gemini 的使用限制页面新增了两类计数器:一是按 5 小时刷新一次的“当前用量”,二是按周期结算的“每周额度”。 当用户在当前 5 小时周期内达到用量上限后,需要等待计数器重置才能继续使用;而一旦耗尽每周总额度,即便短周期计数重置,也仍将被锁定直至周度配额恢复。 Google并未公布一个简单的“消息条数上限”,而是根据所调用的模型类型和具体功能的计算强度来动态扣减额度,使用越重、模型越复杂,触顶速度就越快。
面对新限制,Google在界面中向用户提供了“Google AI Plus”付费方案,宣称可将可用额度翻倍,明显意在通过付费订阅将高强度用户从免费档引导至增值服务。 对于不愿付费的用户而言,Gemini 将不得不退居“工具箱中的一个选项”,在用量封顶后与其他 AI 应用轮换使用。
这一调整并非孤立现象。近几个月,市面上一些 AI 开发环境(如 Windsurf 等)也开始明显收紧免费层级的调用政策,限制并发、缩减上下文或减少可用模型,显示出同样的趋严趋势。 行业信号相当明确:在经历了多年高额算力与研发投入后,投资者愈发希望看到 AI 业务的盈利前景,而非单纯“烧钱扩张”。
过去四年间,大型科技公司在 AI 领域投入了巨额资金,希望率先打造出用户愿意持续付费的产品形态,如今它们开始通过压缩免费空间、强化订阅模式等方式验证商业模式的可行性。 在资本市场层面,美国股市相当一部分上涨动能被认为来自对 AI 赛道的乐观预期,如果像Google这样的科技巨头迟迟无法将 AI 亏损转化为稳定利润,这种预期反转的风险也将随之升高。 接下来几个财报季中,大型科技企业的业绩表现,将成为检验这轮 AI 巨额投入“是否值得”的关键观察窗口。
∞ Andrej Karpathy加盟Anthropic 重返大模型前沿研发一线
现代人工智能领域最具影响力的研究人员之一、OpenAI 联合创始成员安德烈·卡帕西(Andrej Karpathy)正式加入 Anthropic,将专注于大语言模型(LLM)的核心研究与预训练工作。 卡帕西早年是 OpenAI 的创始团队成员之一,曾在公司早期担任研究科学家,其研究领域涵盖计算机视觉、深度学习以及多模态人工智能,在当前 LLM 浪潮兴起之前,就已在图像描述和视觉—语义对齐等方向开展了广泛研究。

卡帕西在社交平台 X 上宣布了这一动向。他表示,自己已经加入 Anthropic,并认为未来几年将是大模型前沿发展尤为关键的阶段,因此非常期待回到研发一线。 他同时强调,自己依然对教育领域充满热情,计划在未来适当时机继续推进相关工作。
在加入 Anthropic 之前,卡帕西曾被埃隆·马斯克招募至特斯拉,担任 AI 总监并领导 Autopilot 视觉团队,是推动特斯拉从依赖雷达和激光雷达转向以摄像头为核心的自动驾驶路线的关键人物之一。 他于 2022 年离开特斯拉。 2023 年,卡帕西重返 OpenAI,参与与 ChatGPT 相关的人工智能研究,并于 2024 年再次离职。 此后,他创办了专注 AI 教育方向的创业公司 Eureka Labs,旨在打造一种面向未来的、“AI 原生”的新型学习体验。
对于致力于开发前沿大模型的 Anthropic 来说,卡帕西的加盟被视为一项重要的人才引进。 当前,Anthropic 正在与 OpenAI、Google DeepMind、xAI 以及 Meta 等公司竞争更强大的前沿模型,其间对顶尖研究人员的争夺尤为激烈。 从卡帕西公开表态来看,他将在 Anthropic 主要聚焦核心研发工作,并暂时搁置此前在教育方向的创业项目。
OpenAI 内部人士也对这一人事变动作出回应。 有人表示,原本希望卡帕西能够回到 OpenAI,但依然为他选择加入任何一家前沿实验室、继续推动这一时代最重要技术的发展感到高兴。 他强调,不应将各家实验室之间的竞争简单视为零和博弈,因为从整体上看,这些机构正在共同推进整个人工智能领域的进步。
在 Anthropic 内部,卡帕西将加入由 Nick Joseph 领导的预训练团队,推动大语言模型预训练阶段的研究进展。 预训练是大语言模型训练流程中的初始关键环节,模型会在这一阶段接触海量数据,从中学习语言模式、语法结构、语义联系以及世界知识,为随后的微调与对齐奠定基础。 卡帕西的加入,被认为有望加速 Anthropic 在这一核心技术环节上的创新步伐。
∞ 罗永浩遭前合伙人炮轰:一辈子都在装猛男 假装自己网络无敌
近期,罗永浩重启海外社交平台X账号,并在平台发布多期播客节目。账号重启当日,罗永浩便密集发布多条推文,语言粗暴,连续怒怼黑粉。有微博网友晒出其在该平台的对线截图,并表示自己此前误解了罗永浩的言辞能力,如今发现,并非罗永浩嘴有多厉害,而是国内网络环境对他有所包容。

此番争议发酵期间,罗永浩的早期合伙人黄斌公开转发相关内容并对其进行指责。
据悉,黄斌曾和罗永浩联合创办牛博网、老罗英语培训,是罗永浩创业初期的核心合作伙伴。
黄斌直言,年近六十的罗永浩刻意打造强势强硬的个人形象,营造出自己在网络中无对手的人设,实际是专挑软柿子捏。

同时他指出,罗永浩网络互动带有明显功利性,仅在对自身有利的情况下进行回应,不利的互动则刻意回避,行事不够坦荡。
据悉,这并非黄斌首次公开批评罗永浩。
2025年12月,黄斌就曾发文评价罗永浩的创业履历,称其多数创业项目均处于亏损状态,唯一盈利的直播业务也并非由他主导。
除此之外,黄斌还爆料,早年老罗英语培训项目曾造成一名投资人300万元的资金损失。

∞ 苹果发布Apple Intelligence无障碍新功能 Vision Pro可眼控轮椅
本周二谷歌年度开发者大会召开前夕,苹果官宣多项依托Apple Intelligence打造的全新无障碍功能升级,涵盖旁白、语音控制、实时识别、视频实时字幕生成等功能。苹果同时表示,此次更新上线后,Vision Pro用户可通过眼部视线操控适配款轮椅。

苹果称,搭载Apple Intelligence图像识别能力的旁白功能,能够更精准解析画面内容,并进行细致描述。例如可识别账单,自动播报金额、到期日期等明细信息,也能更清晰细致地描述照片与各类个人证件资料。
用户如今可借助iPhone开启实时识别功能,利用手机摄像头识别画面内事物,还能继续追问获取更多相关信息。视力不佳人群可将放大器功能设置至操作按键,借助高对比度界面查看内容,同时可通过放大画面、开启闪光灯等语音指令快速调用相关功能。
此次语音指令升级并不仅限于放大器应用。用户可使用自然语言描述需求,直接对屏幕显示内容进行操作。比如在苹果地图中说出“点开优质餐厅攻略”,或是在文件应用里下达“打开紫色文件夹”等指令。
苹果还对阅读器功能进行优化,新版阅读器可顺畅处理含多栏排版、插图及表格的学术论文等复杂文档。
用户可获取人工智能生成的内容摘要,也能原汁原味阅读原文文本,同时保留自定义字体与配色设置。优化后的阅读器可适配阅读障碍、低视力等不同人群的使用需求。
除此之外,苹果新增AI视频字幕生成功能,可为无内置字幕的视频自动生成字幕,包含手机本地拍摄视频、亲友转发视频等。该功能适配iPhone、iPad、Mac、AppleTV以及Apple Vision Pro全平台,用户还可自定义调整字幕显示样式。
苹果还公布一项全新适配方案:Vision Pro用户能够以视线操控兼容型号轮椅。该功能可在各类光线环境下稳定运行,无需重新校准。此功能率先在美国地区适配Tolt与LUCI两款智能驱动系统,同时支持蓝牙与有线外设连接方式。
苹果提及,面向听障人群的人名识别提醒功能现已支持50种语言,当有人呼喊用户姓名时设备会及时提醒;电视系统也将上线超大字体显示模式,同时专为iPhone定制的助听设备,跨设备接力流转体验也将进一步优化。
苹果表示,以上全新无障碍功能将于今年晚些时候正式推送,大概率随全新iOS27系统一同上线。