AI 日报

AI代理崛起与数字公平挑战:2026年4月17日技术摘要

今日科技焦点集中于AI代理能力的实质性跃进——从OpenAI Codex实现后台自动化到Cloudflare提供跨模型编排平台。与此同时,《金融时报》警示前沿AI资源垄断可能加剧经济鸿沟,而军事AI中的‘人类在回路’机制被指形同虚设,凸显伦理治理紧迫性。

当天导读

从 82 条资讯中筛选出 60 条

今日科技焦点集中于AI代理能力的实质性跃进——从OpenAI Codex实现后台自动化到Cloudflare提供跨模型编排平台。与此同时,《金融时报》警示前沿AI资源垄断可能加剧经济鸿沟,而军事AI中的‘人类在回路’机制被指形同虚设,凸显伦理治理紧迫性。

OpenAI Codex开启自主AI代理新时代

Codex现在能后台自主操作电脑,无需人工干预即可执行复杂任务,是迈向AI同事级伙伴的关键一步。

Cloudflare打造AI代理基础设施底座

统一推理层+AI搜索原语让开发者轻松编排多模型、高效检索知识,显著降低智能体开发门槛。

AI稀缺性正在制造新的全球不平等

前沿AI模型成为少数企业或国家的竞争优势,可能加剧数字鸿沟,迫使政策制定者介入平衡。

军事AI监督形同虚设?

AI黑箱决策使人类无法理解其推理过程,所谓‘人类在回路’实为幻觉,存在重大伦理风险。

GPT-Rosalind推动生命科学革命

专为生命科学设计的推理模型有望加速药物研发与基因研究,打开AI赋能科研的新篇章。

AI代理基础设施加速成型

🚀 OpenAI Codex:自主执行任务的桌面助手

  • 新版Codex可在Mac上并行运行多个代理,无需用户干预即可查看、点击和输入。
  • 支持计划未来任务(数小时至数周)及内置网页浏览器进行交互式反馈。
  • 已用于内部质量保证测试,标志着迈向‘超级应用’生态的第一步。

⚙️ Cloudflare统一AI推理层:多模型无缝切换

  • 通过单一API调用超过70个来自12家提供商的模型(如OpenAI、Anthropic)。
  • 提供成本监控、自动重试、元数据标记等功能,降低智能体系统运维复杂度。
  • 避免供应商锁定,适配图像、语音、视频等多模态场景。

🔍 Cloudflare AI搜索:为代理定制的检索原语

  • 混合语义+关键词搜索(向量+Bm25),提升信息召回准确性。
  • 动态创建每代理/客户实例,支持元数据过滤与排名优化。
  • 特别适用于客户支持等需个性化上下文的生产级部署。

💰 AI稀缺性:新形式的数字鸿沟

  • 前沿模型(如GPT-4、Llama 3)因计算成本高、硬件门槛高导致获取不均。
  • 可能形成‘AI特权阶层’,加剧国家间和企业间的创新差距。
  • 政策制定者面临开源倡议、补贴或监管框架的压力。

⚠️ 军事AI的黑箱风险:人类监督为何无效?

  • AI决策逻辑不可解释,即使人类批准攻击也无法识别潜在战争罪行。
  • 实例显示AI可能忽略民用设施附带损害,人类无法察觉。
  • 在伊朗冲突中已出现此类问题,亟需建立AI意图透明标准。

🧪 OpenAI GPT-Rosalind:专为生命科学设计的新模型

  • 针对药物发现、蛋白质分析、基因组学训练,提升科学推理精度。
  • 标志着OpenAI从消费级转向科研领域深度渗透的战略方向。

🔐 OpenAI携手安全公司强化网络安全防御

  • 推出可信访问计划,向顶尖安全组织开放GPT-5.4-Cyber模型。
  • 资助1000万美元API额度,用于威胁检测、漏洞管理和事件响应。
  • 强化公私合作,应对日益复杂的网络攻击态势。

当日精选 8 条

01

Ars Technica AI

OpenAI Codex新增后台电脑使用功能,可自主执行任务

·#ai-agents

OpenAI Codex新增后台电脑使用功能,可自主执行任务

OpenAI的新版Codex桌面应用现在允许AI在后台执行任务——通过自己的光标进行查看、点击和输入,且不会干扰用户的当前工作。它还支持计划未来任务,并内置网页浏览器以实现交互式反馈。

此次更新标志着迈向无需人工干预即可处理复杂工作流的自主AI助手的重要一步,可能彻底改变生产力工具和软件开发方式。这表明OpenAI正朝着‘超级应用’生态系统迈进,让AI代理成为同事级伙伴。

OpenAI发布了Codex桌面应用的重大更新,引入了后台电脑使用功能——即Codex能自主地通过查看、点击和输入与所有已安装的应用程序交互。这让开发者可以迭代前端更改或测试应用而不被打断。用户可以提前数小时甚至数周安排任务,Codex会在指定时间自动激活。

新内置的网页浏览器让用户可以直接在页面上留言指令,类似于设计反馈工具。此外,Codex现在使用gpt-image-1.5生成图像用于原型图。OpenAI表示这是迈向构建‘超级应用’的基础步骤,届时AI代理将融入日常工作中。

Codex现在可以在Mac上并行运行多个代理而不会干扰用户操作,并能在预定时间唤醒执行预设任务。该功能已被OpenAI内部用于对Codex自身进行质量保证测试。

查看单篇正文查看原文
02

Cloudflare AI

Cloudflare推出统一AI推理层以支持智能体应用

·#ai-agents

Cloudflare推出统一AI推理层以支持智能体应用

Cloudflare推出了一个统一的AI推理层,开发者可通过单一API在超过70个来自12家以上提供商的模型之间动态切换。该平台支持Workers和REST API,并具备成本监控、自动重试和元数据标记等功能,用于精细化追踪使用情况。

这解决了AI智能体中多模型编排日益复杂的难题——跨提供商的延迟、可靠性与成本问题可能直接影响实际应用成败。它降低了构建可扩展、高可靠智能体系统的门槛,同时避免了供应商锁定。

Cloudflare新推出的AI平台引入了一个专为AI智能体设计的统一推理层,这些智能体通常需要串联多个模型调用来完成任务。与每次提示仅调用一次模型的简单聊天机器人不同,智能体可能串联十次甚至更多请求——这使得延迟和可靠性变得至关重要。该平台让开发者可以通过单一API端点访问来自OpenAI、Anthropic、Google等超过70个模型。

它还提供集中式成本监控、失败时的自动重试功能,以及通过自定义元数据实现的详细支出分析。开发者也可以上传自己的模型。随着模型快速迭代,且没有单一提供商能覆盖所有场景,这一能力尤为重要。

该平台通过`AI.run()`绑定实现一行代码切换模型(如从Cloudflare托管模型切换到OpenAI),支持图像、视频和语音等多模态模型,并可通过自定义元数据(如团队ID或用户ID)进行费用细分。

查看单篇正文查看原文
03

Cloudflare AI

Cloudflare AI搜索:AI代理的统一检索原语

·#ai-agents

Cloudflare AI搜索:AI代理的统一检索原语

Cloudflare发布了AI搜索(前身为AutoRAG),这是一种可即插即用的搜索原语,支持AI代理的混合语义和关键词检索。它现在包含内置存储、按代理或客户动态创建实例,以及基于元数据的排名优化。

这通过解决AI代理从大规模数据集中检索信息的常见基础设施难题,简化了AI代理的部署,无需自定义索引管道或外部服务。对于客户支持等实际应用尤其重要,因为这些场景需要可扩展且个性化的上下文。

Cloudflare的AI搜索是一种新工具,旨在帮助AI代理高效地从结构化和非结构化数据中检索相关信息。它将语义搜索(使用向量嵌入)和关键词搜索(通过BM25)结合成一个单一的混合查询引擎。每个实例都自带存储和索引,无需设置外部数据库如R2或Vectorize。

开发者可以通过API或CLI动态创建每代理或每客户的实例,非常适合客户支持代理等场景,它们既需要访问共享的产品文档,也需要访问单个客户的过往记录。该系统还支持元数据过滤和排名增强,实现对响应内容的细粒度控制。

AI搜索支持向量和BM25(关键词)搜索并行执行,并在查询时融合结果;支持为文档附加元数据以提升排名,并可通过`ai_search_namespaces`绑定一次性跨多个实例查询。

查看单篇正文查看原文
04

Financial Times AI

·#ai-economics

AI稀缺性引发类似资源短缺的经济不平等

《金融时报》文章指出,随着前沿AI模型变得更强大,其有限的可用性可能会造成类似于稀缺自然资源带来的经济不平等。

这一问题凸显了获取前沿AI可能很快成为某些公司或国家的竞争优势,可能加剧全球数字鸿沟,并影响围绕AI监管和公平性的政策决策。

随着先进AI模型能力不断增强,其稀缺性正成为一个关键的经济议题。《金融时报》报道称,这些模型(通常由少数科技巨头控制)的获取已成为商业成功和国家竞争力的关键因素。这类似于经典经济学原理:稀缺导致价格上涨,利益分配不均。

无法负担或获取前沿模型的企业将面临落后风险,而拥有访问权限的则获得不成比例的优势。这一趋势表明,未来的AI经济将类似于资源型经济体,基础设施控制权决定谁胜出。政策制定者现在面临压力,需通过开源倡议、补贴或监管框架来应对这种失衡。

前沿模型(如GPT-4、Gemini或Llama 3)计算成本高昂且需要GPU等专用硬件,使许多组织难以获得;这种稀缺性会推高成本,限制资源不足实体的创新。

查看单篇正文查看原文
05

MIT Technology Review AI

为何AI战争中的“人类在回路”是个幻觉

·#ai-ethics

为何AI战争中的“人类在回路”是个幻觉

文章指出,军事AI中的人类监督之所以具有误导性,是因为AI系统是无法理解其内部逻辑的“黑箱”,即使人类批准了攻击,也无法真正实现问责制。

这挑战了当前监督机制能防止战争罪行或意外伤害的假设,揭示了AI系统意图与人类认知之间的关键差距——尤其是在伊朗等高风险冲突中。

文章批评了人们普遍认为“人类在回路”就能确保AI在战争中被安全、合乎伦理地使用这一观念。它指出,现代AI系统是‘黑箱’——尽管它们已被用于选择目标、协调导弹防御和引导致命无人机。一个现实案例显示,AI可能基于高成功率批准对军火工厂的打击,却未揭示二次爆炸也会摧毁附近儿童医院——这可能是战争罪行。

由于人类无法解读AI的内部逻辑,这种监督实际上形同虚设。文章警告,这不仅仅是理论问题,已经在伊朗冲突中出现。如果不深入理解AI意图,将其部署于战场将带来灾难性后果。

即使AI系统提供决策理由(如92%的成功率),它也可能包含人类无法察觉的隐藏因素,比如对民用基础设施的附带损害,而人类若不了解AI推理过程则难以发现这些问题。

查看单篇正文查看原文
06

OpenAI News

·#ai

OpenAI发布GPT-Rosalind助力生命科学研究

OpenAI推出了GPT-Rosalind,这是一个专为生命科学领域设计的前沿推理模型,旨在提升药物发现、蛋白质分析和基因组学研究的能力。

该模型有望通过高效处理复杂生物数据并快速生成假设,显著加速医学和生物学领域的科学突破。

OpenAI发布了专为生命科学研究设计的新AI模型GPT-Rosalind。它旨在通过先进的推理能力协助科学家在药物发现、蛋白质结构预测和基因组分析等领域工作。该模型经过优化,能够理解并从复杂的生物数据集中生成洞察,从而可能缩短假设生成和实验设计所需的时间。

尽管目前尚未公布训练数据和性能基准的具体细节,但其对科学推理的专注使其区别于通用模型如GPT-4。这标志着OpenAI在科学领域深化影响的战略举措,超越了消费级应用。

GPT-Rosalind基于OpenAI最新的推理架构构建,并专门针对生命科学数据集进行训练,以提高科学推理任务的准确性。

查看单篇正文查看原文
07

OpenAI News

·#cybersecurity

OpenAI携手安全公司推动人工智能驱动的网络安全防御

OpenAI推出了可信访问网络安全计划,允许顶尖安全公司和企业使用GPT-5.4-Cyber并获得1000万美元API资助,以加强全球网络安全防护能力。

这一举措标志着公私部门的重大合作,利用前沿人工智能应对广泛存在的网络威胁,可能提升全球各行业和政府机构的韧性。

OpenAI宣布通过其可信访问网络安全计划与顶尖安全公司及企业建立战略合作。该计划提供对GPT-5.4-Cyber——一种专为网络安全设计的人工智能模型——的访问权限,并提供1000万美元API资助,以支持威胁检测、事件响应和漏洞管理方面的创新。通过与值得信赖的合作伙伴协作,OpenAI旨在在全球范围内扩展人工智能驱动的防御能力,同时保持伦理标准和操作完整性。

此举反映了业界日益认识到人工智能能显著提升网络安全系统的速度和准确性。它也强调了科技公司与安全专家协同合作以应对日益复杂的攻击的重要性。

该计划专注于为经过审核的组织提供受信任的访问权限,确保GPT-5.4-Cyber(专为检测和缓解网络威胁优化)负责任地部署。

查看单篇正文查看原文
08

TechCrunch AI

物理智能公司π0.7机器人脑展现出组合泛化能力

·#robotics

物理智能公司π0.7机器人脑展现出组合泛化能力

物理智能公司推出的π0.7机器人脑模型能够执行从未明确训练过的任务,通过将已学技能组合成新方式实现这一突破,这被称为组合泛化能力。

这项进展可能标志着机器人领域的转折点,类似于大语言模型对人工智能的变革,使机器人无需重新训练或大量数据收集即可快速适应新环境。

位于旧金山的物理智能公司发布研究显示,其π0.7机器人脑能通过组合不同情境下的技能来泛化到未训练过的任务。在一项测试中,该模型在仅见过两次空气炸锅的情况下,通过逐步口头指导成功烤制了一个红薯。团队强调这不是简单的记忆,而是真正的组合泛化——即能力随着数据增加呈非线性提升。

然而,该模型仍需人类指导才能完成复杂任务,并且无法自主执行多步骤操作。研究人员警告称,成功高度依赖提示工程,早期失败主要源于指令不清。

该模型在仅见过两次空气炸锅的情况下成功使用了它——一次是将其推合,另一次是在他人指令下把瓶子放进去——通过整合预训练知识和口头指导实现了这一成果。

查看单篇正文查看原文
09

The Decoder

OpenAI将Codex转变为持续运行的编码代理

·#ai-coding

OpenAI将Codex转变为持续运行的编码代理

OpenAI已将Codex升级为可监视屏幕、控制Mac、安排任务并自主工作数天或数周的编码代理。它现在包含内置浏览器、通过gpt-image-1.5生成图像,以及超过90个新插件,支持JIRA、GitLab和Slack等工具。

这标志着向能自主管理复杂软件工作流的AI代理的重大转变,直接挑战Anthropic的Claude Code,并可能彻底改变开发者构建和维护软件的方式。

OpenAI显著增强了其Codex AI编码助手,引入了“后台电脑使用”功能,使其能够通过观察、点击和输入来与用户的Mac应用程序交互。这使得Codex可以在数天甚至数周内完成长期项目,成为真正的自主代理。更新还增加了内置浏览器用于评论网页、使用gpt-image-1.5生成图像,并新增了90多个插件,支持JIRA、GitLab、微软套件和Slack等集成。

Codex现在可以编辑GitHub评论、运行多个终端窗口,甚至在无人干预的情况下唤醒继续任务。这些能力使Codex成为Anthropic Claude Code的直接竞争对手,并标志着AI代理向处理整个软件开发生命周期迈进的重要一步。

该功能目前仅限macOS用户使用,部分功能受地区限制;上下文感知建议和记忆功能将在未来面向企业、教育、欧盟和英国用户推出。Codex现在可以同时运行多个终端标签页,并可通过SSH连接远程开发环境(Alpha版)。

查看单篇正文查看原文
10

The Decoder

印度IT毕业生面临AI冲击下的行业变革

·#ai

印度IT毕业生面临AI冲击下的行业变革

印度3150亿美元的IT产业正因自主AI工具而承压,Infosys等公司不得不对新员工进行长达23周的再培训,因为仅有42.6%的150万年计算机科学毕业生具备就业能力。

这一转变威胁到印度IT服务模式的基础——低成本劳动力,并凸显了AI正在重塑全球招聘标准和教育体系的广泛趋势。它还突显了发展中国家课程改革的紧迫性。

印度每年培养超过150万名计算机科学毕业生,但根据2025年Mercer-Mettl的研究,只有42.6%的人具备就业能力。自主AI工具的兴起颠覆了Infosys、TCS和Wipro等公司依赖低薪程序员和计时收费的传统IT服务模式。因此,Infosys现在需要花费19至23周时间培训新员工,涵盖45个技术栈,包括AI。

该行业遭遇重创,Nifty IT指数暴跌近20%,TCS已在全球裁减1.2万个岗位。招聘方式也在转变:GitHub等数字作品集比学历更重要。这反映了科技人才评估和发展方式的根本性变革。

Infosys现在更看重候选人的GitHub资料而非大学背景,反映出对实际编码能力的重视。Nifty IT指数暴跌近20%,为2008年以来最大跌幅,表明AI驱动的自动化正在加速。

查看单篇正文查看原文
11

The Verge AI

Anthropic发布Claude Opus 4.7,同时限制更高级的Mythos预览版

·#ai-models

Anthropic发布Claude Opus 4.7,同时限制更高级的Mythos预览版

Anthropic发布了目前功能最强的通用模型Claude Opus 4.7,该版本在编程、指令理解和创造力方面均有提升。公司仍对更先进的Mythos预览版进行限制,用于安全测试。

此次发布标志着企业用户和开发者在AI能力上的重要进展,同时也体现了Anthropic负责任地部署高能力模型的谨慎态度。它为通用AI模型在软件工程和创意任务中设定了新标准。

Anthropic发布了目前功能最强的通用模型Claude Opus 4.7,该版本在复杂编程、图像分析和创意文档生成方面表现更优。与仅限部分合作伙伴(如英伟达、谷歌和微软)访问的更高级Mythos预览版不同,Opus 4.7专为公共使用设计得更加安全。Anthropic表示,在训练过程中有意降低了Opus 4.7的部分网络能力,以测试新的防护机制,为未来广泛发布Mythos类模型做准备。

公司还推出了“网络安全验证计划”,供安全专业人员用于漏洞研究。早期测试者包括Intuit、Shopify和Databricks等知名企业。定价与前一版本保持一致。

Opus 4.7相比Opus 4.6增加了更强的网络安全防护机制,且在训练过程中有意降低了其相对于Mythos Preview的能力。定价保持不变:每百万输入token 5美元,每百万输出token 25美元。

查看单篇正文查看原文
12

Ars Technica AI

OpenAI发布生物学专用大语言模型GPT-Rosalind

·#ai

OpenAI发布生物学专用大语言模型GPT-Rosalind

OpenAI发布了GPT-Rosalind,这是一个专门针对50种常见生物工作流程和公共生物数据库训练的大语言模型。它旨在帮助研究人员处理复杂数据、理解神经生物学等专业子领域,并建议潜在的药物靶点或蛋白质功能。

这标志着科学领域专用AI的重要进展,解决了生物学中信息过载和跨学科知识断层等现实问题。它可能加速基因组学、药物开发和个性化医疗领域的研究进程。

OpenAI推出了以罗莎琳德·富兰克林命名的GPT-Rosalind,这是一个专注于生物学的大语言模型,基于50种常见的生命科学工作流程和主要公共数据库进行训练。它旨在帮助因基因组数据庞大而困扰的研究人员,以及应对神经生物学等子领域中的专业术语难题。该模型能根据已知通路推断蛋白质结构与功能关系,并优先筛选潜在药物靶点。

OpenAI强调其‘推理’能力——可处理多步骤任务——及在基准测试中的‘专家级’表现。但幻觉问题仍未解决,且出于防止滥用(如优化病毒传染性)考虑,访问权限目前仅限可信的美国用户。一个基础的生物科研插件将向所有人开放。

该模型经过调整以更具批判性,减少对药物靶点可行性的过度自信。出于安全顾虑(如被用于优化病毒传染性),目前仅限美国实体申请使用。

查看单篇正文查看原文
13

Ars Technica AI

Mozilla推出Thunderbolt AI客户端,专注自托管基础设施

·#ai-infrastructure

Mozilla推出Thunderbolt AI客户端,专注自托管基础设施

Mozilla推出了Thunderbolt,这是一个主权AI客户端,允许用户和企业使用Haystack等开源框架在本地运行自己的AI模型,而无需依赖云服务商。

此举回应了AI领域日益增长的数据隐私和控制需求,为需要合规性和安全性的企业提供了一个去中心化的替代方案。

Mozilla推出了Thunderbolt,这是一个面向希望完全掌控AI基础设施的用户和企业的前端AI客户端。它基于开源框架Haystack构建,可在本地运行AI模型而无需依赖云服务。该系统支持聊天、搜索、自动化和跨设备工作流等多种AI功能,并能连接Claude、DeepSeek等多家AI提供商。

Thunderbolt通过开放标准与本地企业数据集成,并使用本地SQLite数据库作为可信参考点。系统还提供可选的端到端加密和设备级访问控制以增强安全性。Mozilla已开始与企业客户接触,提供付费许可和现场部署服务,尽管项目仍在积极开发中,正在进行安全审计。

Thunderbolt支持OpenAI兼容API,可通过开放协议集成本地企业数据,并使用离线SQLite数据库作为本地数据源;还提供可选的端到端加密和设备级访问控制。

查看单篇正文查看原文
14

Cloudflare AI

Cloudflare优化大语言模型基础设施以提升速度与效率

·#large-language-models

Cloudflare优化大语言模型基础设施以提升速度与效率

Cloudflare通过预填充解码分离和软硬件配置优化,使Kimi K2.5模型速度提升了3倍。

这项改进使得在云环境中更高效地部署大语言模型成为可能,直接影响需要低延迟推理的AI代理和工具的规模化应用。

Cloudflare通过软件优化和硬件配置改进,在其Workers AI平台上提升了大语言模型的性能。他们特别通过预填充-解码分离技术使Kimi K2.5模型提速3倍,即将输入标记处理与输出标记生成分配给不同的服务器。这使得GPU资源利用更高效,因为预填充阶段计算密集而解码阶段内存密集。

系统还包含一个基于token感知的负载均衡器,可根据当前工作负载智能路由请求并确保KV缓存跨阶段传输。这些优化对依赖长上下文窗口和频繁工具调用的代理类应用至关重要。

预填充-解码分离将输入处理(预填充)与输出生成(解码)分配到不同服务器上,可独立调优各阶段以提高GPU利用率,并应对如代理类提示等多样化负载。

查看单篇正文查看原文
15

Cloudflare AI

Cloudflare邮件服务进入公开测试,专为AI代理设计

·#ai-agents

Cloudflare邮件服务进入公开测试,专为AI代理设计

Cloudflare推出了其邮件服务的公开测试版,开发者可以利用邮件作为通用通信渠道构建基于代理的工作流。新功能包括已进入公开测试的邮件发送、邮件路由以及带有原生邮件钩子的代理SDK。

这满足了AI代理开发日益增长的需求——邮件作为一种无需摩擦的接口,人人都在使用。它使代理能够异步运行并扩展规模,而无需复杂的基础设施或集成。

Cloudflare的邮件服务作为Agent周的一部分进入公开测试,为开发者提供了一个专为AI代理构建的平台,这些代理可以通过邮件进行通信。借助已经免费的邮件路由和现在进入公开测试的邮件发送功能,用户可以在Cloudflare全球网络内接收邮件、处理并回复。

该服务自动完成邮件认证,确保高送达率。同时引入了新的邮件MCP服务器、Wrangler CLI命令以及开源工具如代理邮箱参考应用,使创建可扩展的邮件原生代理变得前所未有的简单。

邮件发送现在支持通过原生绑定直接从Cloudflare Workers集成(无需API密钥),并提供多种语言的REST API。Cloudflare会自动配置SPF、DKIM和DMARC以实现域名认证,减少被标记为垃圾邮件的问题。

查看单篇正文查看原文
16

Financial Times AI

·#ai-policy

英国部长敦促企业把握安德烈克最新AI模型机遇

英国部长卡尼什卡·纳拉扬警告称,英国企业应关注安德烈克最新AI模型,并呼吁尽快采取行动。政府已推出一个5亿英镑的专项基金,以抓住这一新技术带来的机遇。

此举表明英国政府正积极应对全球AI竞争,尤其是在安德烈克等私营企业引领创新的背景下。这可能影响企业对AI技术的采纳方式,并引发关于国家监管和投资优先级的讨论。

英国部长卡尼什卡·纳拉扬表示,英国企业必须迅速行动,以抓住安德烈克最新AI模型带来的机遇。为此,政府设立了5亿英镑的专项基金,帮助国内企业整合并受益于这项先进技术。这一声明反映出英国对全球AI格局中自身地位的担忧,并凸显了政府推动创新和竞争力的决心。

尽管尚未公布基金的具体分配细节,但该举措强调了公共政策需紧跟快速技术变革的步伐。声明还暗示监管框架可能随之调整,以适应新兴AI能力的发展。这是英国在负责任AI发展领域战略中的重要一步。

该5亿英镑专项基金旨在支持英国企业利用安德烈克最新AI模型推动经济增长。部长强调,若不及时行动,英国企业将落后于国际竞争对手。

查看单篇正文查看原文
17

Financial Times AI

·#ai-ethics

人工智能因公众疑虑加剧而面临形象危机

科技领袖未能清晰传达人工智能如何改善人们的生活,导致公众疑虑加剧,并助长了‘现代卢德分子’——即抵制技术变革的人群——的支持。

如果科技公司现在不解决公众认知问题,可能会引发抵制浪潮,阻碍人工智能的广泛应用,并削弱社会对技术创新的信任。

《金融时报》文章指出,人工智能面临的最大挑战并非技术本身,而是公众认知。尽管技术进步迅速,但许多人仍持怀疑态度,因为科技领袖未能展示人工智能如何改善日常生活。这种认知鸿沟助长了‘现代卢德分子’的声势,他们担心失业、隐私侵犯或社会动荡。

文章呼吁将AI的宣传从抽象承诺转向具体可感的实际影响。文中还提到,美国国防部等机构已开始利用人工智能提升决策优势。最终,文章敦促科技领导者在传播中更加注重同理心、透明度和贴近生活的叙事方式。

文章强调,引发抵制的不是技术缺陷,而是沟通不力;有效的信息传播应聚焦于普通人能感受到的实际好处。

查看单篇正文查看原文
18

Financial Times AI

·#ai

马丁·卡萨多:AI进展是一场工业革命

a16z的马丁·卡萨多表示,近期人工智能的进步是一个具有工业革命规模的变革事件,但他警告说,大型企业在筹集‘廉价资金’方面的优势是暂时的,终将减弱。

这一观点强调了AI可能带来的广泛经济和技术变革潜力,同时指出了初创企业可在资本优势集中到大公司之前抓住的战略窗口期。

a16z的合伙人、知名技术专家马丁·卡萨多认为,人工智能的最新进展代表了一次历史性的、工业革命级别的变革。他指出,虽然目前大型企业因能获得廉价资本而享有优势,但这种优势是暂时的,会随着更多初创企业进入市场而消失。卡萨多认为,构建强大AI模型所需的工具和基础设施越来越容易获取,使得小公司也能参与竞争。

他的观点既表达了对AI未来的乐观态度,也反映了他对资金动态如何影响行业演化的担忧。《金融时报》的文章将他的看法纳入了关于谁从AI热潮中获益的更广泛讨论之中。

卡萨多强调构建AI模型并不像人们普遍认为的那么困难,这表明进入门槛比许多人想象的要低——尤其是随着开源工具和云基础设施如今已广泛可用。

查看单篇正文查看原文
19

Google AI Blog

Gemini新增利用Google相册生成个性化图像功能

·#ai

Gemini新增利用Google相册生成个性化图像功能

Gemini现在利用Google相册和个人偏好自动生成定制图像,无需输入长提示或手动上传照片。该功能将于2026年4月向美国的Google AI Plus、Pro或Ultra订阅用户推出。

此更新通过使AI图像生成更加直观和个性化,显著提升了用户体验,尤其适合希望在生成内容中包含自己或亲友的用户。这反映了AI工具越来越深度整合个人数据的趋势,同时保持隐私保护。

2026年4月16日,谷歌宣布对Gemini应用的重大更新,允许用户利用Google相册和个人偏好生成个性化图像。用户不再需要编写冗长描述或上传参考图片,只需提出包含自己或亲友的场景请求即可。Gemini的新“个人智能”功能借助Nano Banana 2自动理解用户背景并生成相关视觉内容。

用户可通过调整结果或更换参考照片来保留全部创作控制权。重要的是,谷歌强调其不会对私人照片库进行模型训练,从而保障用户隐私。该功能仅面向美国的Google AI Plus、Pro或Ultra计划订阅用户开放。

用户可以要求生成包含自己或家人场景的图像,Gemini将使用其Google相册中的相关照片,且不会对这些照片进行模型训练。该功能目前仅限于美国的Google AI高级计划订阅用户。

查看单篇正文查看原文
20

MIT Technology Review AI

将企业AI视为操作系统层

·#enterprise-ai

将企业AI视为操作系统层

文章指出,企业AI真正的竞争优势不在于基础模型本身,而在于将智能嵌入到一个‘操作系统层’——即整合数据、反馈和治理机制到日常运营中的系统。

这一视角将关注点从模型性能转向运营集成,强调了老牌企业如何通过将现有工作流转化为学习系统来超越初创公司,从而实现持续改进。

文章挑战了当前主流观点,即AI优势来自GPT或Gemini等先进模型。相反,它提出企业通过将AI视为一个‘操作系统层’获得长期优势——这是一个结构化系统,通过仪器化、反馈循环和治理机制将智能嵌入日常工作。与每次调用后重置的API模型不同,这种层可以随时间积累知识。

老牌企业已拥有三项关键资产:运营数据、专家人类判断和累积的隐性知识——这些必须系统地转化为可复用的信号以提升AI能力。这种方法将每个任务变成学习机会,从而持续增强自动化和决策能力。

关键资产包括专有的运营数据、能生成训练信号的领域专家,以及难以复制的隐性知识——这些都不是新进入者能轻易获得的,除非深度融入组织架构。

查看单篇正文查看原文
21

OpenAI News

·#ai

OpenAI的Codex应用迎来重大升级

OpenAI已将其适用于macOS和Windows的Codex应用更新,新增了计算机操作、内置浏览、图像生成、记忆功能和插件支持,显著提升了开发者的生产力。

这些增强功能使Codex成为更强大的软件开发工具,整合了网页访问、视觉设计能力和第三方扩展,契合现代编程工作流的关键需求。

OpenAI发布了专为macOS和Windows开发者设计的Codex应用新版。新增功能包括直接在用户电脑上执行任务、在应用内浏览网页、使用AI生成图像、通过记忆功能保留会话上下文,以及借助插件集成外部工具。这些改进使Codex从单纯的代码助手转变为完整的开发环境。开发者现在可以更高效地编写、测试和可视化代码,无需在多个应用间切换。

内置浏览器支持实时查阅资料与文档,图像生成功能可快速原型化UI界面。记忆功能让Codex能记住之前的指令或项目背景,提升连续性体验。总体而言,这次更新将Codex定位为开发者生产力的核心平台。

此次更新支持macOS和Windows桌面系统,并引入了生成图像和记忆交互等新的人工智能功能,但插件可用性可能因平台而异。

查看单篇正文查看原文
22

TechCrunch AI

Luma与专注信仰的Wonder Project合作推出AI制作工作室

·#ai-video-generation

Luma与专注信仰的Wonder Project合作推出AI制作工作室

Luma推出了Innovative Dreams制作公司,与专注于宗教内容的Wonder Project合作,利用实时AI工具如Luma Agents创作信仰类内容。首部作品《旧故事:摩西》由本·金斯利主演,将于今年春天在Amazon Prime Video上线。

这标志着AI辅助电影制作的重大转变,可能降低成本和时间,同时推动更宏大的创意项目。它还凸显了如何通过新技术驱动的制作模式来服务特定受众,例如信仰群体。

AI视频生成初创公司Luma与专注宗教内容的流媒体平台Wonder Project合作,推出了名为Innovative Dreams的新制作公司。其首部作品《旧故事:摩西》由演员本·金斯利主演,将于今年春天在Amazon Prime Video上线。该工作室使用Luma Agents这一AI工具,实现导演与AI在布景、灯光和角色生成上的实时协作。

与传统后期制作流程不同,这种混合方法可在拍摄过程中即时调整。创始人Amit Jain认为生成式AI能让电影制作更快、更便宜且不牺牲质量。这一举措顺应了行业趋势,即AI初创公司正从工具开发转向全流程制作。

Luma Agents可实现实时调整布景、道具、灯光,甚至生成映射演员表情的新面孔。该流程融合了《阿凡达》和《曼达洛人》中使用的动作捕捉与虚拟制作技术。

查看单篇正文查看原文
23

TechCrunch AI

Upscale AI正寻求以20亿美元估值进行新一轮融资

·#ai-infrastructure

Upscale AI正寻求以20亿美元估值进行新一轮融资

AI基础设施初创公司Upscale AI在成立仅七个月后,据报正在洽谈一轮规模为1.8亿至2亿美元的融资,估值约为20亿美元。

这一快速成长反映了市场对AI基础设施公司的高度热情,即使尚未推出产品,也显示出投资者对全栈式AI解决方案作为未来可扩展机器学习系统核心的信心。

AI基础设施初创公司Upscale AI据报正在寻求第三轮融资,金额介于1.8亿至2亿美元之间,估值约为20亿美元。此前该公司已完成两轮融资:9月的1亿美元种子轮和今年1月的2亿美元A轮融资。尽管尚未发布任何产品,Upscale AI专注于开发定制芯片及支持它们高效通信所需的基础设施。

其战略聚焦于基于开放标准构建端到端解决方案,旨在解决AI计算中的可扩展性挑战。Tiger Global和Premji Invest等知名投资机构支持这一愿景。这种快速估值增长是当前AI热潮的典型特征,许多初创企业依靠潜力而非收入或产品就能获得高估值。

该公司目前已累计融资3亿美元——种子轮1亿美元,A轮融资2亿美元,投资方包括Tiger Global Management、Xora Innovation和Premji Invest;目前尚无任何产品上市。

查看单篇正文查看原文
24

TechCrunch AI

OpenAI升级Codex,新增桌面端代理功能

·#ai

OpenAI升级Codex,新增桌面端代理功能

OpenAI对其Codex AI编程工具进行了重大升级,使其能够在用户桌面后台运行,控制应用程序、点击和输入内容,并在不干扰用户工作的情况下自主执行任务。

此举加剧了与Anthropic的Claude Code竞争,并标志着向真正能协助开发者完成全流程工作的AI代理迈出关键一步,可能彻底改变软件开发和维护的方式。

OpenAI发布了Codex AI编程助手的重大更新,引入了在Mac电脑上后台运行的能力,使其能够自主打开应用程序、操作UI元素,并在用户继续工作时执行测试或前端更改等任务。新功能包括无需干扰的并行代理系统、用于网页自动化内置浏览器、用于产品概念的图像生成、会话记忆功能,以及超过100个插件(如Slack和GitLab)。

这些改进使Codex成为更集成的企业级生产力工具,直接与Anthropic的Claude Code竞争——后者此前已提供类似远程桌面控制能力。OpenAI还为企业客户推出了按使用付费的定价模式,以提升灵活性。

Codex现在支持并行代理执行、内置浏览器用于网页应用交互、图像生成用于原型设计,以及记忆功能和111个插件集成(包括GitLab和Slack)。

查看单篇正文查看原文
25

TechCrunch AI

Anthropic首席产品官辞职,因传闻其公司将推出竞争设计工具

·#ai

Anthropic首席产品官辞职,因传闻其公司将推出竞争设计工具

Anthropic的首席产品官迈克·克里格于4月14日辞去Figma董事会职务,这发生在《信息》报道Anthropic下一代模型Opus 4.7将包含可能与Figma核心产品竞争的设计工具之后。

这一举动标志着AI软件格局可能发生转变,因为领先的AI实验室Anthropic可能直接进入价值100亿美元的设计工具市场,挑战Figma等成熟玩家,并引发投资者对AI实验室主导SaaS企业的担忧。

Anthropic的首席产品官迈克·克里格于4月14日辞去Figma董事会职务,此前有报道称Anthropic即将推出的Opus 4.7模型将包含可能与Figma核心产品竞争的设计工具。Figma是一家价值100亿美元的UI/UX设计平台公司,长期以来与Anthropic合作在其工具中集成AI助手。克里格曾领导Instagram的产品团队,现在负责Anthropic的产品方向,他加入Figma董事会不到一年。他的离职增强了外界对其公司准备进入设计软件领域的看法。

投资者密切关注,因为担心所谓的“SaaSpocalypse”——即AI实验室主导SaaS业务的情景。Figma股价在消息公布后上涨5%,可能是投资者信心增强或对竞争预期的反映。与此同时,Anthropic坚持估值,拒绝了希望以8000亿美元估值投资的请求,这一估值比其年初融资轮高出一倍多。

克里格曾共同创办Instagram和AI新闻应用Artifact,加入Figma董事会不到一年;Figma股价在消息公布后上涨5%,而Anthropic最近拒绝了希望以8000亿美元估值投资的投资者。

查看单篇正文查看原文
26

TechCrunch AI

谷歌在Chrome中推出侧边栏AI模式,提升网页探索体验

·#ai

谷歌在Chrome中推出侧边栏AI模式,提升网页探索体验

谷歌在Chrome桌面版中推出了新的侧边栏AI模式,用户可以在不切换标签页的情况下同时浏览网页并提出上下文相关的问题。

这项更新通过减少频繁切换标签页的麻烦,显著提升了工作效率,特别适用于产品对比或研究类任务,使用户能更深入地与搜索结果互动。

谷歌在Chrome桌面版中推出了AI模式的重大升级,支持用户将网页与AI界面并排显示。这意味着你可以在浏览零售商网站的同时,提出如‘这款产品容易清洁吗?’这样的具体问题,而不会丢失搜索上下文。该功能在购物或研究复杂话题时可实现无缝任务流程。

此外,用户现在还能将已打开的标签页添加到AI模式搜索中,混合多个来源的内容以获得更准确的答案。早期测试者表示注意力更集中、认知负担更轻。谷歌计划在首次于美国上线后逐步扩展至全球。

该功能目前仅在美国可用,并新增了标签页搜索集成功能,允许用户将已打开的标签页纳入AI模式查询,以获得更丰富的上下文信息。

查看单篇正文查看原文
27

TechCrunch AI

InsightFinder 获得1500万美元融资,用于开发AI代理可观测性工具

·#ai-observability

InsightFinder 获得1500万美元融资,用于开发AI代理可观测性工具

InsightFinder 完成了1500万美元的B轮融资,用于开发名为“自主可靠性洞察”的AI平台,该平台能够通过分析数据、模型和基础设施来检测、诊断并修复企业AI部署中的问题。

随着AI代理在企业运营中变得越来越关键,对端到端可观测性的需求——而不仅仅是模型性能——对于保持系统可靠性和减少复杂技术栈中的高成本故障至关重要。

由计算机科学教授郭慧玲创办的InsightFinder已获得1500万美元B轮融资,用于开发AI代理可观测性工具。该公司新推出的“自主可靠性洞察”产品利用机器学习和因果分析来识别AI故障的根本原因——不仅限于模型本身,还包括数据、基础设施和工作流程。一个真实案例显示,一家大型信用卡公司因服务器缓存过期导致欺诈检测模型漂移,InsightFinder通过整体监控发现了这一问题。

郭慧玲强调,AI可观测性必须覆盖开发、评估和生产阶段,而不仅仅是测试;许多团队缺乏同时理解AI和系统层面的能力。目前客户包括UBS、谷歌云和康卡斯特等,InsightFinder定位为填补数据科学家与SRE之间专业知识鸿沟的专业解决方案提供商。

该系统利用无监督机器学习、因果推理和专有的大/小语言模型来分析完整数据流,无需标注数据,使其能适应各种环境。

查看单篇正文查看原文
28

TechCrunch AI

美国零售商的AI流量在2026年第一季度激增393%

·#ai-in-retail

美国零售商的AI流量在2026年第一季度激增393%

Adobe的数据表明,与去年同期相比,2026年第一季度美国零售商的AI流量增长了393%,其转化率、用户参与度和每访客收入均高于传统流量。

这一转变标志着消费者在线购物方式的重大变化——零售商必须优化网站以适应AI,否则将失去竞争力,因为AI用户在收入和参与度方面比人类用户更有价值。

根据Adobe对超过一万亿次美国零售网站访问量及5000名消费者的调查,2026年第一季度美国零售商的AI流量相比去年同期增长了393%。AI访客不仅停留时间更长(多48%)、浏览页面更多(多13%),而且转化率高出42%,每访客收入也高出37%。

这与2025年3月AI流量表现不佳的情况形成鲜明对比。但Adobe警告称,约25%的主页内容和高达34%的产品页面未针对大语言模型(LLM)进行优化,这意味着许多零售商正在错失这一高价值流量。

2026年3月,AI流量的转化率比人类用户高42%,停留时间多48%,每访客收入高37%——这逆转了2025年3月AI流量表现更差的趋势。

查看单篇正文查看原文
29

TechCrunch AI

Roblox的AI助手新增代理工具,助力游戏规划与构建

·#ai

Roblox的AI助手新增代理工具,助力游戏规划与构建

Roblox为其Roblox Assistant引入了新的代理功能,包括一个‘规划模式’,该模式作为游戏开发中的协作伙伴,允许开发者通过多步骤交互来迭代规划、优化和实现游戏功能,而非一次性自动化。

这一从提示到代码的转变转向协作式、迭代式流程,解决了创意工作流中的实际挑战,使独立开发者和专业开发者都能更快更准确地将想法转化为可玩的游戏。

Roblox正在通过代理能力增强其AI助手,支持从规划到测试的完整游戏开发周期。新的‘规划模式’让创作者可以互动式地定义自己的愿景,从AI那里获得澄清问题,并在实施前制定详细行动计划。它利用两项新AI工具:网格生成器用于创建真实感3D资产,程序化模型生成器用于动态且可重用的模型。

执行过程中,助手使用测试工具模拟游戏玩法、识别错误并改进未来迭代。这形成了一个自我修正的循环,每次迭代都提升准确性和效率。Roblox旨在缩小创意意图与实际实现之间的差距,赋能各类创作者。

新工具包括用于创建带纹理3D对象的网格生成器,以及可根据场景上下文动态调整的可编辑代码模型生成器。规划模式还整合了自动检测错误并提出修复建议的测试工具。

查看单篇正文查看原文
30

TechCrunch AI

谷歌转向AI驱动的广告层级监管

·#ai

谷歌转向AI驱动的广告层级监管

谷歌在2025年使用Gemini等AI模型拦截了83亿条违规广告,但被暂停的广告主账户数量却大幅减少,表明其监管策略正从账户封禁转向更精准的广告层级管控。

这一转变体现了AI如何重塑数字广告安全:平台能更快、更精准地响应问题,既减少了对合法广告主的误伤,又能大规模打击诈骗和有害内容。

谷歌报告称,2025年全球共拦截了创纪录的83亿条违规广告——比2024年的51亿条大幅增加——但被暂停的广告主账户数量却少得多。这种差异归因于公司对AI(尤其是Gemini模型)的广泛使用,使平台能在广告展示前精准识别并拦截个别违规内容,而非直接封禁整个账户。该策略旨在减少误判,同时应对利用生成式AI批量制造欺骗内容的诈骗者。

谷歌还强调,广告主身份验证流程有助于阻止不良行为者创建账户。谷歌广告隐私与安全负责人凯拉特·沙玛表示,这种基于AI的精细化监管方式使错误封号率相比去年下降了80%。

谷歌的AI系统在广告展示给用户前就拦截了超过99%的违规广告,并将错误封号率降低了80%,显著提升了监管的准确性和公平性。

查看单篇正文查看原文
31

TechCrunch AI

Runway首席执行官称AI可将一部1亿美元电影替换为50部低成本影片

·#ai-in-entertainment

Runway首席执行官称AI可将一部1亿美元电影替换为50部低成本影片

Runway首席执行官克里斯托瓦尔·瓦伦祖埃拉提出,制片厂可以将原本用于一部1亿美元大片的预算,转而制作50部成本更低的电影,借助AI提高成功概率,不再依赖单一高风险投资。

这一观点挑战了好莱坞传统的高投入、少产出模式,可能重塑内容制作与变现方式,使电影创作更易获取,但也引发关于算法生成内容是否能承载艺术价值的讨论。

Runway首席执行官克里斯托瓦尔·瓦伦祖埃拉认为,AI能让制片厂将原本用于一部1亿美元电影的预算,转化为制作50部同等质量但成本更低的影片,从而通过数量提升成功率。尽管有人质疑AI能否真正复制艺术创造力,Runway指出像《比特币:杀死中本聪》这样的AI驱动电影已将制作成本从3亿美元降至7000万美元。

亚马逊、索尼甚至詹姆斯·卡梅隆都在探索或采用AI工具以降低开支并维持产量,避免裁员。瓦伦祖埃拉将这视为应对当前行业经济压力下对创意困境的必要变革。

瓦伦祖埃拉表示,AI已在剧本编写到视觉特效等所有电影制作环节降低成本,并举例说明即将上映的7000万美元AI电影《比特币:杀死中本聪》将成本从预估的3亿美元大幅削减。

查看单篇正文查看原文
32

TechCrunch AI

Canva的AI助手现在可通过调用工具从文本提示生成可编辑设计

·#ai-assistants

Canva的AI助手现在可通过调用工具从文本提示生成可编辑设计

Canva的AI助手现在可以通过调用工具根据用户文本提示自动生成可编辑设计,并集成Slack、Gmail和Google Drive等应用。它还新增了重复任务调度功能,支持网络搜索以提升任务执行能力。

这一进步使AI助手更接近真正的流程自动化,尤其适合需要可预测端到端解决方案的设计人员。这使得Canva在多工具AI工作流中成为核心枢纽,吸引小型团队和企业客户。

Canva推出了其AI助手的新版本,用户只需用文字描述设计目标,助手便会自动调用相关工具(如图像生成、代码编辑或文件整合)生成可编辑的设计。助手采用图层结构,便于后期逐个修改元素。它还集成了Slack、Gmail和Zoom等生产力工具,通过邮件、会议和文件构建上下文。新增的网络研究功能让AI可以访问互联网获取最新信息。

调度功能允许用户设置重复运行的后台任务,但仅生成草稿,需人工审核后才能发布。Canva声称效率大幅提升:Lucid Origin图像模型速度提高5倍、成本降低30倍,12V视频模型速度提高7倍、成本降低17倍。此次更新是Canva AI 2.0的一部分,本周已进入研究预览阶段。

该助手使用图层实现设计灵活性,并能调用图像生成器或代码编辑器等外部工具;但目前仅创建草稿供定时任务,在发布前需人工审核。

查看单篇正文查看原文
33

TechCrunch AI

初创公司Antioch融资850万美元,致力于缩小机器人仿真与现实的差距

·#robotics

初创公司Antioch融资850万美元,致力于缩小机器人仿真与现实的差距

成立于2025年5月的初创公司Antioch已筹集850万美元种子轮融资,旨在打造高保真仿真工具,帮助机器人在虚拟环境中训练后能在真实世界中可靠运行。

这解决了机器人领域的一个关键瓶颈——物理数据有限的问题,有望通过使仿真成为一种可扩展且成本更低的替代方案,加速物理AI的发展。

Antioch正在开发仿真平台以缩小‘仿真到现实’之间的差距——即确保在虚拟环境中训练的机器人能在现实中正常运行。这家初创公司最近获得了850万美元种子轮融资,估值达6000万美元。其联合创始人包括来自Meta Reality Labs、Google DeepMind和Chainalysis的前员工。

Antioch旨在为机器人开发者提供数字孪生体,这些孪生体能精确模拟真实传感器输入和物理行为,从而无需昂贵的物理设施即可进行边缘案例测试、强化学习和合成数据生成。与许多完全回避仿真的公司不同,Antioch认为这是高效扩展物理AI的关键。

该公司使用Nvidia和World Labs的现有模型,并添加特定领域的库,同时与多个客户合作以优化能准确反映现实物理特性的仿真环境。

查看单篇正文查看原文
34

TechCrunch AI

DeepL推出语音翻译套件及API,拓展实时语音翻译能力

·#ai

DeepL推出语音翻译套件及API,拓展实时语音翻译能力

DeepL推出了语音到语音翻译套件,支持会议、移动应用和企业场景中的实时对话,并提供API供开发者构建定制化解决方案。

此举大幅推动了全球团队和客户服务中AI驱动的实时沟通,尤其在语言障碍严重且人工翻译稀缺或昂贵的场景下具有重要意义。

以高质量文本翻译著称的DeepL,现已进入语音翻译领域,推出一套针对会议、移动应用和一线员工使用场景的实时对话产品。公司还发布了API,让开发者能将其技术集成到呼叫中心等定制应用中。它提供Zoom和Microsoft Teams插件,可在多语种通话中实时播放翻译音频或显示屏幕文字。

用户可通过二维码加入群组讨论,系统还能学习行业术语。尽管DeepL掌控整个技术栈,但仍承认延迟与准确率是实时语音翻译的核心挑战。

当前系统先将语音转为文本,再进行翻译,最后合成音频;但DeepL计划未来开发无需中间文本步骤的端到端语音翻译模型。

查看单篇正文查看原文
35

The Decoder

英伟达Lyra 2.0提升机器人仿真能力,实现大规模3D场景生成

·#robotics

英伟达Lyra 2.0提升机器人仿真能力,实现大规模3D场景生成

英伟达发布了Lyra 2.0,该系统能从一张照片生成高达90米的连贯3D环境,解决了长距离摄像机路径一致性和误差累积的关键问题。

这项进步使机器人能在无需真实世界数据采集的情况下进行大规模虚拟训练,从而加速制造业和物流等行业中AI驱动机器人的发展。

英伟达推出的Lyra 2.0是一种新的人工智能系统,仅需一张照片即可生成大尺度、连贯的3D场景,使机器人可在模拟环境中训练。它解决了现有模型的两大缺陷:忘记先前看到的区域以及随时间积累错误。通过为每帧存储3D几何信息并在摄像头返回到之前位置时使用该信息作为空间锚点,Lyra 2.0确保即使回到早期区域也能保持一致性。

此外,该系统还专门针对自身质量损失进行训练,以防止长时间视频生成中的漂移现象。基准测试显示,Lyra 2.0在图像质量、风格一致性和摄像机控制方面优于GEN3C、Yume-1.5等六种其他方法。生成的场景可导出至Isaac Sim等物理引擎用于机器人仿真,但目前仅支持静态场景。

Lyra 2.0会存储每帧的3D几何信息,并在重新访问区域时作为参考;同时通过训练识别自身错误输出来减少漂移,且在基准测试中击败了六种竞争对手方法。

查看单篇正文查看原文
36

The Decoder

Anthropic的Claude Opus 4.7提升编码与视觉能力,同时降低网络安全风险

·#ai-models

Anthropic的Claude Opus 4.7提升编码与视觉能力,同时降低网络安全风险

Claude Opus 4.7 引入了三倍图像分辨率(最高达2576像素),并通过训练调整和自动阻止高风险请求,有意识地降低了网络安全能力。

此次发布展示了负责任的AI发展方向——在提升编码和视觉等核心能力的同时主动降低滥用风险,为安全导向的模型部署树立了标杆。

Anthropic最新模型Claude Opus 4.7在编码能力和图像理解方面大幅提升,最大长边分辨率达到2576像素,是之前版本的三倍以上。它还通过训练调整和自动请求拦截机制,有意识地降低了网络安全能力。事实性幻觉减少,输入幻觉在所有测试模型中处于最低水平。

该模型保持良好安全性对齐,但仍会拒绝协助33%的模拟AI安全研究任务——相比Opus 4.6的88%已大幅改善。定价每标记不变,但由于新分词器可能导致请求标记数增加35%,实际使用成本可能上升。

新分词器可使相同文本的标记数最多增加35%,尽管每标记价格不变,但实际请求成本可能显著上升;若不需要更高细节,用户应提前缩小图像尺寸。

查看单篇正文查看原文
37

The Decoder

苹果重新培训Siri团队使用AI编程工具

·#ai

苹果重新培训Siri团队使用AI编程工具

苹果正在将不到200名Siri开发人员送往为期数周的AI编程训练营,学习Anthropic的Claude Code和OpenAI的Codex等工具。目标是利用谷歌的Gemini模型重构Siri,使其更具对话性,并计划在6月的WWDC大会上发布新版本。

这标志着苹果公司为现代化其长期停滞的语音助手所采取的战���转变,借助前沿AI技术和人才再培训。它表明苹果在AI整合方式上的重大调整,可能影响数百万用户,并为语音助手树立新的标准。

苹果正通过向Siri团队成员提供高强度AI编程训练营来大力投资于技能重塑,重点学习Claude Code和Codex等工具。此举源于多年来批评指出Siri在智能和响应速度上落后于ChatGPT等竞品。公司计划在6月的WWDC大会上推出完全重构后的Siri,由谷歌的Gemini模型驱动,实现更自然、更流畅的对话体验。

约60名工程师将专注于核心开发,另外60人负责监控系统表现与安全。此次重组还将Siri团队划归软件主管Craig Federighi管理,并且前AI负责人John Giannandrea本周正式离职,标志着Siri进入全新发展阶段。

训练营结束后,约60名工程师将留在核心开发团队,另有60人负责监控性能与安全性。此次重组将Siri置于软件主管Craig Federighi的领导下,前AI负责人John Giannandrea本周正式离开苹果。

查看单篇正文查看原文
38

The Decoder

字节跳动发布Seedance 2.0,覆盖100多个国家但未包括美国

·#ai-ethics

字节跳动发布Seedance 2.0,覆盖100多个国家但未包括美国

字节跳动旗下的云服务部门Byteplus发布了AI视频生成模型Seedance 2.0,覆盖超过100个国家,但因版权和AI生成名人视频的法律问题,美国不在其中。

这一举动凸显了生成式AI创新与知识产权法之间的日益紧张关系,尤其是在美国,主要影视公司已就未经授权使用其内容提起诉讼,为全球AI监管树立了先例。

字节跳动的AI视频模型Seedance 2.0现已通过Byteplus的ModelArk API在全球范围内推出,支持生成4至15秒、最高720p分辨率的MP4视频。该模型于今年2月在中国首次发布,当时因生成包含名人和受版权保护内容的视频在社交媒体上走红而引发争议。迪士尼、华纳兄弟、派拉蒙和Netflix等公司因此发起法律诉讼,促使字节跳动推迟全球推广。

为应对这些问题,公司实施了严格过滤机制,禁止使用真实人脸作为输入,并通过C2PA标准添加水印以标明AI生成内容。尽管如此,美国仍未被纳入支持范围,显示出该市场的法律不确定性仍在持续。

Seedance 2.0包含多项保护措施,如禁止使用真实人脸作为素材、提供超1万个虚拟人物库,并采用C2PA标准标注AI生成内容,同时通过API支持文本、图像、音频等多种输入方式。

查看单篇正文查看原文
39

The Verge AI

OpenAI升级Codex以直接竞争Claude Code

·#ai-development

OpenAI升级Codex以直接竞争Claude Code

OpenAI发布了Codex的重大更新,使其能够与桌面应用程序交互、在后台运行、支持并行代理、通过gpt-image-1.5生成图像,并通过新记忆功能记住过往经验。

此次更新使Codex成为Anthropic Claude Code的直接竞争对手,为开发者提供更实用、实时的编码辅助,标志着向能处理复杂软件开发任务的自主AI代理迈出重要一步。

OpenAI对Codex系统进行了重大升级,使其能够与桌面应用程序交互、在后台运行而不中断用户工作流,并支持多个代理同时协作。新增功能包括使用gpt-image-1.5生成图像、集成GitLab和微软套件等工具,以及内置网页浏览器用于精确指令输入。新记忆功能可让Codex回忆之前互动中的上下文信息(如偏好设置或修正),从而提升未来任务表现。

这些能力旨在让Codex成为开发者的强大助手,尤其适用于前端测试或缺乏API的应用场景。该更新发生在OpenAI与Anthropic竞争加剧之际,后者因Claude Code的成功而备受关注。目前仅限macOS用户使用,OpenAI计划不久后扩展到其他平台和地区。

首次发布仅限登录ChatGPT的macOS用户,尚未公布Windows或Linux的支持时间表;欧盟用户也将很快获得更新,但不会立即上线。

查看单篇正文查看原文
40

The Verge AI

罗南·法罗质疑萨姆·阿尔特曼在AI领导中的诚信问题

·#ai-ethics

罗南·法罗质疑萨姆·阿尔特曼在AI领导中的诚信问题

罗南·法罗与安德鲁·马兰茨发表了一篇长达17000字的《纽约客》文章,深入调查了萨姆·阿尔特曼在OpenAI的领导力,重点聚焦于他被指撒谎以及2023年突然被解雇又迅速复职的争议。

这项调查提出了关于科技领袖诚信和问责制的关键问题,尤其是在人工智能日益成为社会核心的背景下,这影响了人们对个人和机构的信任。

罗南·法罗与安德鲁·马兰茨在《纽约客》上的文章深入剖析了萨姆·阿尔特曼从非营利研究实验室到近万亿市值公司的崛起过程。报道详细描述了阿尔特曼的争议行为,包括他被指向同事和投资者撒谎,以及2023年董事会因所谓撒谎将其开除后又迅速复职的戏剧性事件。

法罗多次采访阿尔特曼,发现尽管他依然魅力十足,但越来越多的人开始公开质疑:在高风险科技领导岗位上,他的‘夸大事实’是否可以接受。文章还探讨了阿尔特曼的行为如何反映出人工智能行业中更广泛的伦理、透明度和权力结构问题。

文章包含对阿尔特曼长达18个月的采访、多位来源称其‘不受真相约束’,以及关于他个人生活、投资和中东资金来源的细节。

查看单篇正文查看原文
41

The Verge AI

Canva AI 2.0 推出基于提示的对话式设计工具

·#ai

Canva AI 2.0 推出基于提示的对话式设计工具

Canva 推出了 AI 2.0 更新,引入了统一的对话界面,用户可通过自然语言提示生成和调整设计,并具备持续记忆功能和基于对象的智能编辑能力。

这一向代理型AI工作流的转变可能重塑团队协作内容创作的方式,使 Canva 成为创意任务的核心平台,进而影响生产力软件中设计工具的未来发展方向。

Canva 的 AI 2.0 更新通过引入基于自然语言提示的对话界面重新定义了其设计平台,用户只需描述如“创建多渠道推广计划”即可获得可编辑的设计稿,随时进行优化或发布。与传统 AI 工具仅输出单一结果不同,Canva AI 2.0 在整个创作过程中持续陪伴。它具备持续记忆功能,能根据用户习惯保持品牌一致性,并引入“基于对象的智能”技术,让用户精准修改文字或图片等特定元素而不影响整体布局。

此外,更新还增强了与 Gmail、Slack 和 Google 日历等工具的集成支持,并在 Canva Code 中新增 HTML 导入功能。这是 Canva 自从将设计从桌面端迁移到浏览器以来最重大的一次升级,标志着其正成为团队的一站式创意伙伴。

该更新目前处于研究预览阶段,面向前一百万访问 Canva 主页的用户开放,全面公开发布将在未来几周内推出;同时新增了 Canva Code 中对 HTML 导入的支持以及与 Slack、Google Drive 等第三方应用的统一连接器。

查看单篇正文查看原文
42

ZDNET AI

内存价格上涨让微软Surface受损更重,苹果MacBook则更具韧性

·#pc-hardware

内存价格上涨让微软Surface受损更重,苹果MacBook则更具韧性

根据Gartner报告,到2026年底,DRAM和SSD成本可能上涨130%。微软Surface价格在短短四个月内飙升高达69%,这是由于这些组件成本上升所致。

这一趋势威胁了PC的可负担性,尤其是入门级机型;同时凸显了不同公司硬件策略对定价韧性的差异——苹果高效的内存使用使其保持竞争力,而微软则面临挑战。

DRAM和SSD价格上涨预计将在2026年前使PC组件成本飙升130%,主要由云服务商对AI应用的需求推动。微软因供应链压力大幅上调Surface价格,仅四个月就上涨最高达69%。相比之下,苹果MacBook通过高效利用内存,能更好地抵御涨价影响。

整个PC市场也在挣扎,出货量因提前囤货应对涨价而虚高。微软Surface表现落后于戴尔和联想,甚至跌出全球前六大PC厂商之列。这一变化突显了在内存成本攀升时代,硬件效率与战略定价的重要性。

一台配备32GB内存和1TB SSD的Surface Pro在四个月内从1822美元涨到3071美元,涨幅达69%;而苹果MacBook策略依赖优化的内存使用,使其对价格波动不那么敏感。

查看单篇正文查看原文
43

Ars Technica AI

微软与斯特兰蒂斯合作推动汽车AI创新

·#ai

微软与斯特兰蒂斯合作推动汽车AI创新

斯特兰蒂斯与微软启动为期五年的合作,将人工智能整合到数字服务、网络安全和工程中。该合作旨在提升预测性维护、驾驶辅助和远程地区的安全连接能力。

这一合作标志着向AI驱动的汽车创新的重大转变,可能提升数百万驾驶员的安全性、用户体验和网络韧性。这也反映了传统车企如何借助科技巨头弥补软件和云能力的不足。

斯特兰蒂斯(旗下拥有Jeep、克莱斯勒和Ram等品牌)与微软达成五年合作协议,利用人工智能提升汽车技术。目标是增强数字服务、加强网络安全并提高工程效率。这包括开发预测性维护算法、改进驾驶辅助功能,并确保在偏远地区也能保持可靠连接。

与以往扩大基础设施的做法不同,此次计划专注于优化现有系统——到2029年实现数据中心规模减少60%。双方强调在整个汽车价值链中负责任且安全地部署AI。此举发生在车企面临先进科技与可用性、隐私问题平衡挑战的背景下。

双方计划到2029年将数据中心规模减少60%,同时用更少的计算资源完成更多任务。斯特兰蒂斯将把AI直接嵌入车辆中,从数字座舱到核心操作系统。

查看单篇正文查看原文
44

Ars Technica AI

Gemini 现在可接入 Google 相册生成个性化 AI 图像

·#ai-image-generation

Gemini 现在可接入 Google 相册生成个性化 AI 图像

Google Gemini 现在通过个人智能功能将 AI 图像生成器与 Google 相册连接,使用户能基于自己的照片库和标签生成更个性化的图像。

这一整合提升了提示词的准确性并减少了用户的操作步骤,使 AI 图像生成更加直观易用,对创意工作流和普通用户尤其有价值。

谷歌已推出一项新功能,允许 Gemini 的 AI 图像生成器在用户授权后访问其 Google 相册。该个人智能功能通过让用户使用如“我的家人”这样的熟悉概念简化提示词,无需手动指定具体人物或动作。系统会结合照片中的视觉内容和元数据来生成更准确、相关的 AI 图像。例如,当用户要求生成一个家人享受喜爱活动的黏土动画图像时,Gemini 可以根据标记的照片推断出家庭成员和可能的活动内容。

这消除了在提示中手动添加详细信息的需要,降低了使用门槛,并鼓励用户更频繁地使用 AI 工具。此更新基于谷歌已有的 Nano Banana 2 图像模型,该模型本身已是业界领先之一。总体而言,这项改进提升了 AI 图像生成的可用性和个性化程度。

用户需选择授权共享 Google 相册数据;系统会利用照片中的现有标签和内容来指导图像生成,例如识别“我的家人”或“我的狗”。

查看单篇正文查看原文
45

MIT Technology Review AI

公共部门通过小语言模型实现AI落地

·#ai

公共部门通过小语言模型实现AI落地

公共部门正采用定制化的小语言模型(SLMs)在数据治理严格、网络连接受限和基础设施薄弱的环境中安全可靠地部署人工智能。

这一方法使政府能够在不牺牲数据主权或运营连续性的前提下利用人工智能提供关键服务,解决了许多公共部门AI试点项目停滞不前的核心问题。

公共部门机构因严格的隐私法规、有限的互联网接入以及缺乏GPU基础设施,在采用人工智能时面临独特挑战。大型语言模型(LLMs)往往不切实际,因为它们需要集中式云资源并带来合规风险。一项Capgemini研究显示,79%的公共部门领导者担心数据安全问题。

相比之下,小语言模型(SLMs)提供了可行的替代方案:它们可本地部署,计算需求低,并能确保对敏感数据的控制。Elastic的研究指出,65%的公共部门领导者难以实时大规模使用数据。SLMs通过向量搜索和来源验证等智能检索技术,仅调取相关信息,从而实现安全且准确的回答。

小语言模型使用数十亿而非数千亿参数,计算资源需求更低,适合本地部署;它们避免将敏感数据发送到外部云服务,并可在无网络环境下运行。

查看单篇正文查看原文
46

Simon Willison

·#llm

Anthropic 发布 llm-anthropic 0.25,更新 Claude Opus 4.7 模型功能

Anthropic 发布了 llm-anthropic 0.25 版本,引入了新的 claude-opus-4.7 模型,具备增强的思考能力,包括新的 'xhigh' 思考力度选项以及两个新布尔参数:thinking_display 和 thinking_adaptive。默认设置也得到优化,例如将 max_tokens 提高到模型允许的最大值。

此次发布对使用 Anthropic API 的开发者意义重大,因为它通过改进的思考控制和更灵活的输出格式提升了推理性能。同时移除过时的请求头,使 API 更加稳定且面向未来。

2026年4月16日,Anthropic 发布了 llm-anthropic Python 库的 0.25 版本,其中包含新的 claude-opus-4.7 模型。该模型支持新的 'xhigh' 思考力度级别,允许进行更深入的推理。新增了两个参数——thinking_display 和 thinking_adaptive,用于控制模型内部思考过程的展示方式。

默认的 max_tokens 已提高到模型允许的最大值,提升了灵活性。此外,该库不再使用旧版的 structured-outputs-2025-11-13 beta 请求头处理旧模型,降低了 API 使用的复杂度。这些更新旨在提升开发者的体验,并实现对模型行为的更精确控制。

thinking_display 选项仅在 JSON 输出或日志中可用,且模型现在默认使用最大允许的 token 限制。旧模型不再使用 structured-outputs-2025-11-13 beta 请求头,简化了向后兼容性。

查看单篇正文查看原文
47

Simon Willison

Qwen3.6-35B-A3B在画鹈鹕自行车图中击败Claude Opus 4.7

·#llm

Qwen3.6-35B-A3B在画鹈鹕自行车图中击败Claude Opus 4.7

西蒙·威尔森测试了两款新大型语言模型——阿里巴巴的Qwen3.6-35B-A3B和Anthropic的Claude Opus 4.7——通过让它们生成一只鹈鹕骑自行车的图像,发现Qwen的结果更准确、细节更丰富。

这一对比提供了一个可在本地运行的实际基准测试,突显了不同模型在处理图像生成等创造性任务时的表现差异,对开发者和用户评估模型性能具有重要价值。

西蒙·威尔森通过提示两个最新发布的大型语言模型——Qwen3.6-35B-A3B和Claude Opus 4.7——生成一只鹈鹕骑自行车的图像进行比较。他在M5 Mac笔记本电脑上使用量化后的GGUF文件本地运行这两个模型。Qwen的输出展示了正确的自行车形状、天空中的云朵和清晰的标题,而Opus则完全错误地渲染了自行车。

第二次尝试使用‘thinking_level: max’后,Opus仅略有改善。在后续关于火烈鸟骑独轮车的测试中,Qwen再次胜出,添加了墨镜和爱心表情等风格化细节,表明其更具创造性的连贯性。

测试使用的是在MacBook Pro M5上通过LM Studio运行的量化GGUF模型;Qwen正确描绘了自行车框架并包含云朵,而Opus即使启用更高思考层级也无法正确呈现自行车。

查看单篇正文查看原文
48

Simon Willison

·#datasette

Datasette 1.0a27 提升安全性和插件兼容性

Datasette 1.0a27 将 CSRF 保护机制更新为使用现代浏览器头部而非 Django 风格的表单令牌,并新增 RenameTableEvent 以改善 SQLite 表重命名时插件的兼容性。

这些改进通过采用当前网页标准提升了安全性,并确保插件能正确响应数据库结构变化,使 Datasette 对开发者更可靠、更具扩展性。

Datasette 1.0a27 是一个 alpha 版本,包含两项主要改进:首先,它用现代浏览器头部替代了 Django 风格的 CSRF 表单令牌,提升了安全性;其次,新增了 RenameTableEvent,在 SQLite 事务中重命名表时触发,帮助插件(如 datasette-comments)适配表名变化。其他改进包括支持内部客户端请求指定 actor 的参数、提供基于磁盘的内部数据库选项以解决锁定问题、对 upsert 操作进行更严格的校验(拒绝主键为空的行)、优化 API 文档示例,以及统一 JSON 响应格式。这些更新共同提升了开发者的可用性和维护效率。

CSRF 更新遵循 Filippo Valsorda 关于基于头部的安全 CSRF 保护建议,而 RenameTableEvent 则帮助插件(如 datasette-comments)在 SQLite 事务中重命名表时做出适当反应。

查看单篇正文查看原文
49

The Decoder

OpenAI称使用ChatGPT的女性用户已超过男性

·#ai-adoption

OpenAI称使用ChatGPT的女性用户已超过男性

OpenAI表示,现在使用ChatGPT的活跃用户中女性人数已超过男性,逆转了最初80%为男性的比例。这一变化自2025年秋季以来一直保持稳定。

这一用户结构的变化表明生成式AI正被更广泛地社会接受,说明该技术正在跨性别群体融入日常生活。这也强调了除了性别外,还需关注收入、教育、地区等维度的公平性。

OpenAI宣布,目前使用ChatGPT的女性用户数量已超过男性,逆转了2022年底发布时80%为男性的初始比例。这一变化自2025年秋季起稳定存在,意味着全球近5亿女性正在定期使用该工具。OpenAI将此归因于ChatGPT从技术小众产品转变为日常应用。

公司还估算2025年中国AI投资在972亿至1253亿美元之间,主要由阿里巴巴、华为等企业推动;尽管美国资本支出更高,但中国较低的成本提升了其购买力。此外,OpenAI正大力投资算力——目标到2030年达到30吉瓦,已与英伟达、AMD等达成合作,但财务可行性仍存疑问。

OpenAI估计全球约有近5亿女性定期使用ChatGPT,总周活跃用户接近10亿。公司认为这一变化源于ChatGPT从技术小众工具演变为日常实用工具。

查看单篇正文查看原文
50

The Decoder

OpenAI扩展ChatGPT广告,但广告商面临工具短板

·#ai-advertising

OpenAI扩展ChatGPT广告,但广告商面临工具短板

OpenAI正在为ChatGPT引入按点击计费和以行动为导向的广告定价模式,以吸引更多广告商,但早期使用者指出缺乏追踪工具、目标选项有限且品牌安全控制不足。

这揭示了OpenAI雄心勃勃的收入目标(2026年达到24亿美元)与其平台当前广告专业能力之间的显著差距,可能使它在与Meta和Google等成熟平台的竞争中放缓步伐。

OpenAI希望通过新的广告定价模型(包括按点击付费和以购买或应用下载为目标的行动型广告)来变现ChatGPT。尽管试点阶段实现了年化超1亿美元的收入,但广告商指出严重问题:缺乏细粒度的追踪工具,仅能使用宽泛的主题标签进行定位,且由于每次查询的回答都不同,品牌安全性难以保障。公司已将月最低消费从20万美元降至3万至5万美元,并推出了由Criteo协助的自助服务平台,但这些问题仍未解决,使得ChatGPT相比Meta和Google等成熟平台仍不具备吸引力。

广告价格目前为每千次展示15至25美元,远低于目标的60美元;试点阶段因广告投放频率不足而延长,无法消耗承诺预算;尚无详细的转化或归因数据。

查看单篇正文查看原文
51

The Verge AI

Character.AI 推出书籍模式,提供结构化角色扮演体验

·#ai-ethics

Character.AI 推出书籍模式,提供结构化角色扮演体验

Character.AI 推出了名为 'Books' 的新模式,允许用户基于超过20部来自 Project Gutenberg 的经典公共领域书籍(如《爱丽丝梦游仙境》和《傲慢与偏见》)进行角色扮演体验。

这一转变将角色扮演从潜在危险内容转向教育性、结构化的体验,回应了此前关于AI对青少年造成伤害的伦理担忧,有助于提升Character.AI在AI娱乐领域的责任感形象。

Character.AI 推出了‘书籍模式’,利用《德古拉》《弗兰肯斯坦》《了不起的盖茨比》等经典公共领域文学作品,为用户提供结构化的角色扮演体验。用户可以扮演书中角色或自定义人物,选择严格遵循原剧情的模式、自由探索模式,或创造全新的‘同人宇宙’版本,比如把《爱丽丝梦游仙境》改写成太空爱情故事。此举旨在通过聚焦知名文学作品而非开放对话来改善AI角色扮演的安全性。

所有用户均可使用该功能,免费用户仅限少量尝试次数。这可能是公司在因青少年安全问题面临法律诉讼后重建信任的重要一步,尽管目前尚不清楚未成年人是否能使用最引导性的功能。

用户可以选择扮演原书中的角色或创建自己的人物,玩法包括严格遵循原著情节(书籍弧线模式)、自由互动,以及彻底重构故事背景的‘同人宇宙’改编,例如把《爱丽丝梦游仙境》变成太空爱情喜剧。

查看单篇正文查看原文
52

ZDNET AI

谷歌就安卓数据传输问题支付1.35亿美元和解金

·#android

谷歌就安卓数据传输问题支付1.35亿美元和解金

一起针对谷歌的集体诉讼因安卓设备未经授权传输用户数据而达成1.35亿美元和解。自2017年11月起使用过蜂窝网络的安卓手机用户可能获得赔偿。

此次和解影响数百万安卓用户,凸显了科技公司收集和使用个人数据时面临的隐私担忧。这也为移动设备隐私责任树立了先例。

一起名为Taylor等人诉谷歌公司的集体诉讼指控安卓手机在未获用户许可的情况下传输数据,即使应用已关闭且设备未处于活跃状态也是如此。谷歌否认存在过错,但同意和解以避免高昂的法律费用。自2017年11月12日起通过蜂窝网络访问互联网的安卓用户有资格获得赔偿。

通知信将通过邮件或电子邮件发送,包含索赔代码。可通过www.federalcellularclassaction.com提交索赔。最终赔偿金额取决于法院于2026年6月23日前的最终批准。

该和解基金面向约一亿人,但因参与率较低,每人可能仅获得最多100美元的赔偿。索赔者需提供通知ID和确认码才能提交申请。

查看单篇正文查看原文
53

ZDNET AI

如何避免被零售电视设置误导

·#tv-technology

如何避免被零售电视设置误导

零售电视通常被设置为夸张的‘商店模式’,以增强亮度、色彩饱和度和动态平滑效果来吸引顾客注意。用户可以通过切换到‘家庭模式’或执行出厂重置来获得更真实的观看体验。

这个问题影响每一位购买新电视的消费者,因为商店展示往往夸大了实际表现。调整设置可以确保图像准确性,并提升长期使用满意度。

购买电视时,零售商通常会将显示设置为‘商店模式’——一种高度饱和、亮度极高且带有动态增强效果的设置,旨在吸引顾客注意。这会让电视看起来比在家使用时更加鲜艳。大多数现代智能电视在首次设置时默认进入‘家庭模式’,但重置后可能意外激活演示模式。

要解决这个问题,用户要么通过菜单切换设置(例如LG的‘支持 > 家庭模式’),要么执行完整的出厂重置(如Fire TV和Roku所需)。切换完成后,电视将提供适合家庭环境的平衡且准确的画面,而非零售展厅那种夸张效果。

某些品牌如Fire TV和Roku需要完全出厂重置才能在商店模式和家庭模式之间切换;而LG和Hisense则提供更简单的菜单选项。家庭模式优先考虑真实观感而非吸引眼球的夸张效果。

查看单篇正文查看原文
54

ZDNET AI

数据删除服务有助于保护在线隐私

·#data-privacy

数据删除服务有助于保护在线隐私

文章详细描述了作者使用数据删除服务一个月的经历,揭示了这些服务如何自动化地移除被数据经纪商收集的敏感信息。

由于数十亿条个人数据在缺乏监管的情况下被经纪商出售,个人面临重大隐私风险,因此数据删除服务成为保护数字身份的实用且必要的工具。

文章探讨了个人数据被经纪商未经同意收集和销售的问题。作者测试了两款主流数据删除服务一个月,发现它们能有效移除电话号码、地址甚至多年前的家庭信息。这些服务自动化了原本不可能完成的手动任务,节省了时间并减少了暴露风险。

它们还提供持续监控功能,捕捉数据再次出现的情况。文章指出,在当今数据驱动的世界中,隐私不断受到威胁,这类服务至关重要。

像PrivacyBee和DeleteMe这样的服务可以一次性移除数千条数据记录,为用户节省数天的手动操作时间,并提供持续监控以发现重新出现的数据。

查看单篇正文查看原文
55

Simon Willison

Datasette.io 新闻预览工具提升 YAML 编辑体验

·#developer-tools

Datasette.io 新闻预览工具提升 YAML 编辑体验

一个全新的自定义UI工具被开发出来,用于预览和验证 datasette.io 使用的 news.yaml 文件,使开发者能够更轻松地编辑变更日志条目,并实时检测 Markdown 和 YAML 错误。

该工具提升了维护开源项目文档的开发效率,尤其对经常更新变更日志或使用结构化数据(如 YAML)构建静态网站的开发者来说非常有价值。

Simon Willison 创建了一个用于编辑 datasette.io 新闻部分所用 news.yaml 文件的自定义预览界面。该 YAML 文件以结构化格式存储发布说明,包含日期和 Markdown 格式的正文。此前手动编辑这个文件容易出错,因为缺乏视觉反馈。

新工具让用户可以在编辑时实时看到每条新闻在网站上的渲染效果,并即时发现 YAML 和 Markdown 语法错误。它利用 Claude AI 解析仓库并生成响应式界面:左侧显示原始 YAML 输入,右侧展示渲染后的 HTML 输出。红色徽章会提示验证错误,例如日期格式不正确,帮助开发者在提交前修复问题。

该工具使用 Claude AI 和 Claude Artifacts 构建,能克隆 GitHub 仓库并分析其内容,直接在编辑器界面中高亮日期格式错误等语法问题。

查看单篇正文查看原文
56

TechCrunch AI

Meta因内存短缺上调Quest 3和Quest 3S价格

·#vr

Meta因内存短缺上调Quest 3和Quest 3S价格

Meta从2026年4月19日起上调其Quest 3和Quest 3S虚拟现实头戴设备的价格,原因是内存芯片成本上升。此次涨价适用于全新和翻新版本的产品。

这反映了消费电子行业普遍面临的趋势:零部件短缺迫使企业提价,影响消费者和市场竞争格局。同时说明半导体供应链问题如何波及VR等高需求硬件产品。

Meta于2026年4月16日宣布,从4月19日起上调其Quest 3和Quest 3S虚拟现实头显的价格,主要原因在于内存芯片成本上涨。128GB版本的Quest 3S将涨价至349.99美元,256GB版本为449.99美元,均上涨50美元;标准版Quest 3则从499.99美元涨至599.99美元。该调整适用于全新和翻新产品,但配件价格保持不变。

Meta表示,此举是为了确保硬件、软件和服务的质量。这是继三星、微软和索尼之后,又一家因全球内存短缺而提价的科技公司。

Quest 3S(128GB)售价将升至349.99美元(+50美元),256GB版本为449.99美元(+50美元)。标准版Quest 3价格上涨100美元至599.99美元。翻新机也受影响,但配件价格不变。

查看单篇正文查看原文
57

ZDNET AI

创始人分享打造可被收购初创企业的5个秘诀

·#startups

创始人分享打造可被收购初创企业的5个秘诀

前维珍理财CIO杰姆·沃尔特斯(Jem Walters)与人联合创办了Snoop应用,该应用于2023年被Vanquis银行收购。他分享了五个打造高收购概率初创企业的实用建议,包括验证想法、战略合作伙伴关系和分阶段开发。

这对希望实现被收购退出而非长期独立运营的创业者极具价值,展示了从创业到被收购的真实路径,提供了可借鉴的经验,尤其适合初入创业领域的技术从业者。

杰姆·沃尔特斯曾联合创办省钱应用Snoop,后将其出售给Vanquis银行。他总结出五条打造可被收购初创企业的实操建议:第一,不要急于开发,先花时间探索和验证想法;第二,与外部机构合作但必须明确代码和知识产权归属;第三,分阶段构建产品以降低风险并根据反馈调整;第四,聚焦解决用户真实问题而非堆砌功能;第五,从第一天起就规划可扩展性。他的经验表明,耐心、战略协作和迭代开发是吸引收购方的关键。

沃尔特斯强调在编码前进行为期六周的可行性评估,并通过两家专业机构开发产品,同时确保知识产权归属公司并最终由内部团队替代外部人员,这一策略使Snoop在两年内稳步发展。

查看单篇正文查看原文
58

ZDNET AI

戴尔2026款XPS 16评测:一款出色的高端Windows笔记本电脑

·#laptops

戴尔2026款XPS 16评测:一款出色的高端Windows笔记本电脑

戴尔在短暂改名换代后,于2026年重新推出旗舰级XPS 16笔记本电脑。新款机型拥有更精致的设计、改进的键盘、更好的触控板以及一块惊艳的3.2K OLED屏幕。

这标志着戴尔对用户反馈的积极回应,使XPS 16成为高端Windows笔记本市场的重要竞争者,尤其适合注重设计与性能的内容创作者和专业人士。

ZDNET编辑试用戴尔2026款XPS 16一周后称赞其精致设计、坚固机身和回归经典XPS特性(如物理功能键)。该机拥有光滑的石墨色外壳、超薄机身和沉浸式的16英寸3.2K OLED屏。虽然键盘手感偏软,但触控板表现优秀。

四扬声器系统由Waves MaxxAudio Pro调校,音质清晰有力;800万像素摄像头支持4K HDR视频录制。配置方面搭载英特尔酷睿Ultra X7 358H处理器、32GB内存和集成Arc显卡,非常适合内容创作和多任务处理。

XPS 16重3.65磅,厚度为14.6毫米,采用CNC数控铝合金和康宁大猩猩玻璃3代材质;仅配备三个雷雳4接口和一个耳机孔,没有USB-A或HDMI接口;功能键区域从触摸式改为物理按键。

查看单篇正文查看原文
59

ZDNET AI

2026年最佳小型企业VoIP服务商排名出炉

·#voip

2026年最佳小型企业VoIP服务商排名出炉

ZDNET对2026年面向小型企业的VoIP服务商进行了评测和排名,Grasshopper因其易用性和实惠价格被评为最佳选择。

这份评测帮助小型企业主选择可靠且经济高效的通信工具,这对建立专业形象和提升数字时代运营效率至关重要。

ZDNET在2026年对主流小型企业VoIP平台进行了实测,旨在找出最易用且性价比高的选项。文章指出,基于云端的电话系统通过灵活性和可扩展性彻底改变了企业通信方式。Grasshopper因界面直观、月费低廉且无技术门槛而成为首选。其他服务商虽有优势,但在可用性或性价比上不及Grasshopper。

文中强调,选择合适的VoIP服务能改善通话质量、减少账单困惑,并提升专业形象。特别适合从传统固话或个人手机转向专业通信的小型企业。整体内容属于实用推荐清单,而非技术突破。

Grasshopper每月仅需14美元起,无需复杂设置或高昂的上线成本,非常适合新手用户;其他服务商也经过评估,但未能在功能与简洁性之间取得像Grasshopper这样的平衡。

查看单篇正文查看原文
60

ZDNET AI

如何在安卓上快速回滚有问题的谷歌服务更新

·#android

如何在安卓上快速回滚有问题的谷歌服务更新

Android系统设置中有一个隐藏的回滚功能,用户只需点击几下即可撤销导致问题的谷歌服务更新,无需进行出厂重置。

该功能帮助安卓用户快速解决因谷歌服务更新错误引发的问题(如无法安装应用或WebView崩溃),而无需丢失数据或耗费大量时间排查故障。

ZDNET介绍了如何通过系统设置中的隐藏功能回滚有问题的谷歌服务更新。这个工具允许用户在出现如应用安装失败等问题时,将Android WebView或Play Services等服务恢复到之前的版本。操作步骤是在‘系统服务’中选择受影响的服务并点击‘移除更新’。

如果问题未解决,用户还可以重新安装更新。虽然这不能解决所有安卓问题,但提供了一种安全、无损的方式处理常见的更新后错误。当更新破坏核心功能但尚未到必须恢复出厂设置时尤为有用。

此回滚选项位于“设置 > 谷歌服务 > 所有服务 > 系统服务”中;仅适用于谷歌服务,不包括第三方应用,并且可能需要重启设备才能生效。

查看单篇正文查看原文