AI 日报

AI 治理与商业化并进:从供应链安全到搜索、代理与算力竞赛

今天的焦点很清晰:AI 正从“能不能做”转向“怎么管、怎么分发、怎么赚钱”。一边是英国和白宫围绕搜索归因、模型审查与发布前测试加码规则,另一边是 OpenAI、微软、Google、Meta 和 Perplexity 继续推进模型、代理与基础设施布局。与此同时,供应链攻击、版权纠纷和企业成本控制提醒市场,AI 的扩张正迅速撞上安全与运营边界。

当天导读

从 51 条资讯中筛选出 25 条

今天的焦点很清晰:AI 正从“能不能做”转向“怎么管、怎么分发、怎么赚钱”。一边是英国和白宫围绕搜索归因、模型审查与发布前测试加码规则,另一边是 OpenAI、微软、Google、Meta 和 Perplexity 继续推进模型、代理与基础设施布局。与此同时,供应链攻击、版权纠纷和企业成本控制提醒市场,AI 的扩张正迅速撞上安全与运营边界。

Red Hat npm 命名空间遭供应链入侵

攻击者借助被盗 GitHub 账户向 @redhat-cloud-services 软件包植入窃密载荷,波及 32 个包、96 个版本,凸显 CI/CD 环境的高风险暴露面。

英国要求谷歌提高 AI 搜索透明度

CMA 要求谷歌为 AI 生成结果提供更清晰的归因与链接,并允许出版商退出 AI 搜索功能而不受普通搜索排名惩罚。

代理产品开始真正进入企业工作流

Meta 的 WhatsApp Business Agent、Perplexity 的本地/云混合路由、以及 Nous 的 Hermes Desktop,显示 AI 正从对话走向实际执行与跨应用协作。

资本继续涌向 AI 基础设施与安全层

Alphabet 的 850 亿美元融资、Coralogix 的 2 亿美元可观测性融资、Cyera 的高估值融资与 Suno 的继续扩张,共同说明市场仍在为 AI 的“卖铲子”和高增长赛道买单。

企业开始为 AI 成本设上限

Uber 对 Claude Code 等 AI 编程工具设置每月 1500 美元上限,说明大规模使用代理式工具后,成本治理已经成为新的管理课题。

今日主题

AI 行业今天呈现出三条最强主线:治理框架加速成形、产品形态向代理与多模态演进、以及资本与算力继续向头部平台集中。从 Red Hat 的 npm 供应链入侵,到谷歌在 AI 搜索归因上让步,再到微软、OpenAI 和 Google DeepMind 的密集发布,产业正在从“能力竞赛”进入“规则与分发竞赛”。

1. 安全与治理:AI 进入更强监管叙事

  • 供应链安全仍是最高优先级风险:Red Hat 的 @redhat-cloud-services npm 命名空间遭入侵,恶意代码通过 preinstall 钩子窃取密钥,波及 32 个软件包、96 个版本([2254])。
  • 英国要求搜索 AI 更透明:CMA 要求谷歌为 AI 生成结果提供更清晰的归因与链接,并允许出版商退出 AI 搜索功能且不受排名惩罚([2255], [2276])。
  • 美国治理走向“自愿审查”:白宫/特朗普相关行政命令推动前沿模型自愿安全测试,同时加强网络防御与滥用执法,但外界质疑其约束力有限([2268], [2273])。
  • OpenAI 继续塑造政策议程:其前沿 AI 治理蓝图强调安全、韧性和国家安全;同时还发布公共政策议程,覆盖青少年保护、劳动力转型和全球标准([2257], [2258])。

2. 模型与产品:推理、多模态和代理化全面推进

  • OpenAI 强化生命科学模型能力:GPT-Rosalind 新增生物推理、药物化学、基因组学分析和实验流程支持,显示模型正被更深度地定制到垂直科研工作流([2256])。
  • 微软继续押注自研模型:MAI-Thinking-1 与 MAI-Code-1-Flash 分别面向推理和编程,并开始进入 Copilot 与 VS Code 生态;Build 相关报道也显示微软希望成为“第四大 AI 实验室”([2259], [2263], [2272])。
  • Google DeepMind 把多模态下放到笔记本:Gemma 4 12B 可在 16GB 设备上本地运行,原生处理文本、图像、音频、语音和视频,进一步推动端侧多模态普及([2261])。
  • Ideogram 4.0 强调可用性:开放权重、原生 2K、透明背景与更好的文字渲染,说明图像生成正从“好看”走向“可生产”([2253])。

3. 代理、工作流与企业落地:从聊天走向执行

  • Meta 让 WhatsApp Business 进入代理时代:Business Agent 全球上线,覆盖客服、线索筛选、预约和产品推荐,并延伸到 Instagram 私信([2265])。
  • Perplexity 推出混合路由架构:任务将在本地与云端之间自动分配,力图在隐私、准确性和能效之间取得平衡([2269])。
  • Nous Research 发布 Hermes Desktop:开源桌面代理把持久记忆、多应用通信、子代理委派与沙箱执行整合到一个跨平台工具中([2271])。
  • Coralogix 押注代理可观测性:2 亿美元融资背后,是企业开始为 AI 代理的监控、排障和治理买单([2266])。

4. 资本、成本与商业现实:扩张并不等于无约束

  • Alphabet 的 850 亿美元融资释放强烈需求信号:这笔创纪录股权发行直接指向 AI 基础设施扩张,也证明公开市场仍愿意为巨额资本开支买单([2260])。
  • Suno 估值翻倍,但版权风险未解:4 亿美元融资把估值推至 54 亿美元,同时与唱片公司的训练数据诉讼仍在升级([2270])。
  • Cyera 与 AI 安全赛道继续高估值融资:据报其估值升至 120 亿美元,反映出市场对数据安全与 AI 防护能力的持续追捧([2267])。
  • Uber 开始限制 AI 编码成本:每个代理式编程工具每月 1500 美元上限,说明企业正在从“试用热潮”转向成本治理([2274])。

5. 基础设施与环境压力

  • Google 承诺降低数据中心用水影响,包括到 2030 年补充的水量超过消耗量,并投资替代水源与当地水利基础设施([2277])。
  • 这与 Alphabet 大规模 AI 投资形成鲜明对照:AI 的扩张不仅需要更多算力,也会带来更高的能源与资源外部性([2260], [2277])。

结语

今天的新闻共同指向一个判断:AI 已经不再只是模型性能竞争,而是安全、分发、成本与基础设施的系统竞争。监管部门在要求透明度和审查路径,企业在推动代理落地和工作流重构,而投资者则继续为下一轮基础设施与安全层买单([2254], [2255], [2268], [2260], [2266])。

当日精选 8 条

01

ZDNET AI

Red Hat 的 npm 命名空间遭供应链攻击

·#supply-chain-security

Red Hat 的 npm 命名空间遭供应链攻击

Red Hat 的 @redhat-cloud-services npm 命名空间遭到入侵,受影响的软件包被植入了窃取凭据的恶意代码。事件被曝光后,Red Hat 已移除相关软件包,并提醒用户检查自己是否安装过受影响版本。

这件事之所以重要,是因为它影响到开发者和 CI/CD 工作流中常用的 Red Hat 可信软件包,窃取到的令牌和密钥可能迅速扩大攻击面。它也说明,一次供应链入侵就能把合法发布渠道变成恶意软件投递通道。

Red Hat 遭遇了一起影响其 @redhat-cloud-services 命名空间中数十个 JavaScript 软件包的 npm 供应链入侵。根据 Red Hat 安全团队和外部研究人员的说法,攻击者利用一个被盗用的 GitHub 账户,向 Red Hat GitHub 组织内维护的软件包注入了恶意代码。受影响的软件包是前端库,会在 Red Hat 产品构建流程中被编译并打包进容器镜像。安全研究人员称,此次攻击共污染了 32 个软件包的 96 个版本,合计每周下载量达到 116,991 次。恶意代码通过 npm 的 preinstall 钩子植入,因此当开发者或构建系统对受影响软件包执行 npm install 时,恶意逻辑会自动运行。Microsoft 威胁情报团队将载荷描述为一个经过混淆的加载器,它会下载并执行第二阶段脚本,用于窃取密钥。

研究人员将这次行动与 Mini Shai-Hulud 的行为联系起来,也有报告把该载荷称为名为 Miasma 的新变种,强调它具有更强的混淆能力和多阶段加载设计。这个类似蠕虫的组件不只是偷取凭据;如果它发现了发布权限,就会把同样的恶意 preinstall 负载重新发布到更多软件包中,从而让每个受害者都变成新的攻击者。独立分析还指出,攻击路径可能与 RedHatInsights/javascript-clients 仓库相关的 GitHub Actions OIDC 令牌被滥用有关。被执行的代码会搜集 GitHub 密钥和令牌、SSH 密钥、AWS、GCP 和 Azure 凭据、Kubernetes 令牌、HashiCorp Vault 数据,以及存放在环境变量或配置文件中的其他 CI/CD 密钥。安全厂商警告称,任何在开发者工作站或自动化环境中安装过受影响版本的人,都应默认相关密钥可能已经泄露。

Aikido 表示,共有 32 个软件包的 96 个版本被入侵,周下载量合计达到 116,991 次。报告称,恶意代码通过 npm 的 preinstall 钩子执行,并用高度混淆的加载器窃取 npm、GitHub、AWS、SSH、Kubernetes、Vault 以及其他 CI/CD 来源中的密钥。

查看单篇正文查看原文
02

Ars Technica AI

英国要求谷歌明确AI搜索链接

·#ai-search

英国要求谷歌明确AI搜索链接

英国竞争与市场管理局(CMA)已要求谷歌改进其 AI 生成搜索功能中对出版商内容的归因,并提供更清晰的链接。谷歌还必须允许出版商退出 AI 搜索功能,包括 AI Overviews,而且不能因此在普通搜索排名中受到惩罚。

这是一项重要的监管举措,可能改变搜索引擎在 AI 产品中使用出版商内容的方式,尤其会影响新闻机构和其他优质内容出版商。它既可能提升用户看到来源的透明度,也可能增强出版商与谷歌谈判内容合作时的筹码。

英国监管机构已要求谷歌让其 AI 搜索产品更加透明,也更有利于出版商。英国竞争与市场管理局表示,谷歌必须为出现在 AI 生成搜索结果中的出版商内容提供更清晰的归因和链接。监管机构还要求谷歌为出版商提供退出 AI 驱动搜索功能的办法,例如 AI Overviews。更重要的是,谷歌不能因为出版商选择退出而惩罚他们,包括不能在普通搜索结果中降低其排名。

CMA 将这一措施称为“全球首例”,并表示这将帮助包括新闻机构在内的出版商更好地与谷歌谈判内容合作。该机构称,这些规则与谷歌在通用搜索服务中被认定为“具有战略市场地位”有关。谷歌表示会遵守这一决定,而 CMA 说明谷歌有九个月时间完成全部要求,但部分功能应更早上线。谷歌还必须公开提交合规报告,附带支持性数据和指标,说明其做了哪些改动以及如何遵守规定。

CMA 给了谷歌九个月完成合规,同时表示部分控制措施应更早上线,且谷歌必须公开提交合规报告,包含关键数据和指标。该裁决还规定,退出 AI 功能不能被用作 AI 功能之外的排名信号,而谷歌已经开始向部分英国网站所有者试运行一些工具。

查看单篇正文查看原文
03

OpenAI News

·#openai

OpenAI为GPT-Rosalind新增能力

OpenAI表示,GPT-Rosalind现在增强了生物推理、药物化学、基因组学分析和实验流程能力。此次更新旨在让该模型在生命科学研究中更实用。

这些升级可能会让GPT-Rosalind在生物学、基因组学和药物发现等研究场景中更有帮助。它也反映出一个更大的趋势:AI模型正被针对科学工作流进行专门优化,而不只是通用聊天。

OpenAI宣布为GPT-Rosalind新增能力,这款模型被定位用于生命科学研究。根据公告,模型现在在生物推理、药物化学专业知识、基因组学分析以及实验流程支持方面都有所增强。此次更新的目标,是让GPT-Rosalind在处理复杂科学问题时更有用。现有摘要没有提供任何新的基准分数、价格变化或开放方式等信息。

它也没有说明这些变化是来自新模型版本、额外训练,还是工具集成。尽管如此,这组能力仍然显示出OpenAI正在把AI系统进一步定制到特定科学任务上。实际上,这可能有助于解释生物数据、支持化学决策,并更高效地组织实验室工作。

这次公告重点提到四个改进方向:生物推理、药物化学、基因组学分析和实验流程。现有材料没有给出基准数据、发布日期或具体技术实现细节。

查看单篇正文查看原文
04

OpenAI News

·#ai-governance

OpenAI提出前沿AI治理蓝图

OpenAI发布了一份关于美国联邦层面治理前沿AI的蓝图,主张建立以安全、韧性和国家安全为核心的框架。该提案出台之际,加州、纽约和伊利诺伊州等州已经在推进各自的前沿AI政策方案。

这项提案可能影响美国政府如何为先进AI系统设定基础规则,尤其是在风险管理和关键监管方面。它也会推动更广泛的讨论:前沿AI究竟应主要由联邦政府、州政府,还是两者协调治理。

OpenAI发布了一份关于前沿AI民主治理的蓝图,旨在为美国联邦政策提供方向。根据给出的简要内容,这份提案把重点放在安全、韧性和国家安全上。此次发布也表明,前沿AI治理已经不仅仅是技术或企业内部的问题,而是一个公共政策议题。搜索结果显示,这一提案与州一级正在推进的政策努力并行,包括加州的 SB 53、纽约的 RAISE Act 以及伊利诺伊州的 SB 315。

这个背景说明,美国对先进AI的治理正在形成多层次格局,而不是只依赖单一国家框架。相关搜索结果还提到,学术和政策界已经在公司、国家和国际层面研究前沿AI治理选项。整体来看,这一消息反映出人们正试图在更强大的AI模型带来更大影响之前,先建立相应的监督机制。该条目没有提供社区讨论内容。

这份蓝图强调三个重点:安全、韧性和国家安全。搜索结果还显示,这一提案处于不断成形的治理格局中,其中包括州级立法以及更广泛的前沿AI监管研究。

查看单篇正文查看原文
05

OpenAI News

·#ai-policy

OpenAI 发布公共政策议程

OpenAI 发布了一份公共政策议程,明确列出其在 AI 安全、青少年保护、劳动力转型和全球标准方面的优先事项。公司表示,这些政策目标旨在确保 AI 能够造福社会。

这之所以重要,是因为 OpenAI 是一家主要的 AI 开发者,其政策议程可能会影响监管机构、行业组织以及其他公司对负责任 AI 治理的思考。其关注点也反映出整个 AI 行业正在同时面对安全、教育、就业和跨境标准等更广泛的压力。

OpenAI 发布了一份公共政策议程,重点讨论人工智能应如何被治理以及如何以负责任的方式部署。该议程围绕四个主题展开:AI 安全、青少年保护、劳动力转型和全球标准。OpenAI 在公告中表示,这些优先事项旨在确保 AI 能够造福社会。这个页面更像是一份政策路线图,而不是产品发布或研究成果公布。

它表明 OpenAI 希望参与并塑造关于监管与负责任采用的更大范围讨论。公告也暗示,公司认为 AI 政策是相互关联的,安全、就业影响和国际协调都需要被同时关注。现有摘要并没有提供任何技术模型细节、基准数据或具体实施方案。总体来看,这则新闻主要是在传达 OpenAI 对关键治理议题的公开立场。

该议程明确强调了安全、青少年保护、劳动力转型和全球标准,而不是发布新产品或新模型。根据现有材料,这是一份政策声明和战略表述,而不是带有性能指标或基准结果的技术更新。

查看单篇正文查看原文
06

Simon Willison

·#llms

微软发布 MAI 推理与编程模型

微软宣布了两款新的文本 LLM:用于推理的 MAI-Thinking-1,以及面向 GitHub Copilot 和 VS Code 的 MAI-Code-1-Flash。微软表示,MAI-Code-1-Flash 正在向 Visual Studio Code 中的 GitHub Copilot 个人用户逐步开放,而 MAI-Thinking-1 目前仅面向部分早期合作伙伴开放。

这标志着微软正在加速将自研专有模型部署到其开发者产品中,意义很大。它可能会影响数百万 GitHub Copilot 和 VS Code 用户的编程体验,同时也表明微软希望对成本、性能和模型行为拥有更强控制。

微软今天早上宣布了两款新的文本 LLM,作为其 MAI 系列的一部分。MAI-Thinking-1 是微软的推理模型,被描述为一个总参数量 1T、激活参数 35B 的稀疏 MoE 模型。微软表示,它目前只向部分早期合作伙伴开放。MAI-Code-1-Flash 是一款面向代码的模型,参数量为 137B,激活参数为 5B。微软称,这款模型是专门为 GitHub Copilot 和 Visual Studio Code 设计的。

该模型正在向 Visual Studio Code 中的 GitHub Copilot 个人用户逐步推出。原始文章作者表示,当时还没有机会实际试用这两款模型。微软还声称两款模型都使用了干净且有授权的数据训练,但后续更新提到技术论文显示其训练流程依赖网页抓取数据,并经过过滤、去重以及移除成人和盗版相关域名等处理。文章还更正了最初对模型规模的误读,强调不能把激活参数量误认为总参数量。

MAI-Thinking-1 被描述为一个总参数量 1T、激活参数 35B 的模型,而 MAI-Code-1-Flash 则是总参数量 137B、激活参数 5B 的模型。微软还表示,这两款模型都是从头训练的,使用了干净、商业许可或“适当授权”的数据,不过关联的技术论文也提到训练数据来自网页抓取并经过了大量过滤。

查看单篇正文查看原文
07

TechCrunch AI

Alphabet 850亿美元AI融资释放强烈需求信号

·#ai-investment

Alphabet 850亿美元AI融资释放强烈需求信号

Alphabet 正通过股票发行筹集创纪录的 850 亿美元,用于支持 Google 的 AI 业务,其中首批 400 亿美元认购超额,最终提升到 450 亿美元。CEO Sundar Pichai 表示,公司还计划在下个季度再出售 400 亿美元。

这次超额认购表明,投资者对 AI 基础设施以及 Alphabet 本身的需求都异常强劲,而不只是对投机性初创公司的兴趣。它还说明,公开市场可能愿意为下一波 AI 公司和 IPO 所需的巨额资本开支提供资金。

TechCrunch 报道称,Alphabet 规模达 850 亿美元的股票发行,已经成为投资者对 AI 相关资产需求强劲的明确信号。公司最初计划出售 400 亿美元的股权工具,其中包括两种类别的股份以及更小面额、便于更多投资者参与的存托股份。由于认购需求异常旺盛,首批发行被超额认购,并在 Sundar Pichai 于 X 上发文后提高到 450 亿美元。买家中包括 Berkshire Hathaway,它购买了价值 100 亿美元的股份。Alphabet 还计划在下个季度再出售 400 亿美元,使总额达到 850 亿美元。

Bloomberg 指出,即便是 800 亿美元也会打破此前的股权融资纪录,而该纪录由 Petrobras 在 2010 年创下,金额为 700 亿美元。文章强调,Alphabet 并不是一家陷入困境的初创公司,而是一家极具盈利能力的企业,第一季度收入达到 1100 亿美元,且利润率较高。尽管如此,这笔募集资金仍将用于 AI,Pichai 将其描述为公司为满足企业和消费者 AI 需求而制定的多年投资战略的一部分。文章还提到,Google 预计今年资本支出将达到 1800 亿至 1900 亿美元,主要投向 AI 基础设施和数据中心。除了 Alphabet 之外,这笔成功融资也被视为整个 AI IPO 管线的积极信号,包括 Anthropic、SpaceX 和 OpenAI,因为公开市场是否愿意长期吸收如此庞大的资金需求,将直接影响整个行业的融资能力。

这次发行包括两种不同类别的股份,以及面向更广泛投资者的小额存托股份。Alphabet 第一季度收入达到 1100 亿美元且利润率较高,公司表示募集资金将用于多年的 AI 投资计划,同时预计今年资本支出将达到 1800 亿至 1900 亿美元。

查看单篇正文查看原文
08

The Decoder

Gemma 4 12B 将原生多模态 AI 带到笔记本电脑

·#multimodal-ai

Gemma 4 12B 将原生多模态 AI 带到笔记本电脑

Google DeepMind 发布了 Gemma 4 12B,这是一个可在仅有 16 GB 内存的设备上本地运行的开放多模态模型。它可原生处理文本、图像、音频、语音和视频分析,Google 还表示它在基准测试中的表现接近更大的 26B 模型。

这让先进的多模态 AI 更适合在设备本地推理,普通用户和开发者对云端 API 的依赖也会降低。它还填补了小型移动模型与更大工作站级模型之间的空白,使一个能力较强的开放模型更容易部署到消费级笔记本上。

Google DeepMind 发布了 Gemma 4 12B,这是一款旨在把多模态 AI 带到普通笔记本电脑上的开放模型。根据 Google 的说法,这个模型只需 16 GB 的系统内存或显存就能本地运行,并且在基准测试中接近更大的 Gemma 4 26B 模型。此次发布填补了 Gemma 4 产品线中的中间层级,介于面向移动设备的小模型和更强大的大模型之间。Google 表示,Gemma 4 12B 能够原生处理文本、图像和音频,不需要为非文本输入单独准备编码器。这样的设计可以降低延迟和内存占用,同时让视觉输入保留空间信息,并把原始音频直接映射为类似 token 的向量。

该模型还支持语音识别、代码生成和视频分析,包括对多分钟视频片段的处理。Google 举例称,它曾分析一段 5 分钟的 Google I/O 主题演讲视频,处理了每秒 1 帧的 313 帧画面以及音频轨道。Google 还称,这个模型足以胜任更复杂的多步推理和智能体工作流,而这些任务过去通常需要更大的 Gemma 变体。Gemma 4 12B 已可通过 Hugging Face、Ollama、LM Studio 等工具获取,并采用 Apache 2.0 许可证,允许商用。

Gemma 4 12B 是首个支持原生音频处理的中型 Gemma 模型,Google 还表示它可以把视频帧和音频结合起来分析多分钟的视频片段。该模型采用 Apache 2.0 许可证,可在 Hugging Face、Ollama、LM Studio 等平台获取,并带有 MTP drafter 以提升速度和效率。

查看单篇正文查看原文
09

The Decoder

Ideogram 4.0 发布:开放权重与原生 2K

·#text-to-image

Ideogram 4.0 发布:开放权重与原生 2K

Ideogram 发布了其文本生成图像模型 4.0 版本,并以开放权重形式提供。此次更新加入了原生 2K 分辨率、透明背景、基于边界框的布局控制以及更好的文字渲染,此外公司还表示可编辑文字和图层功能即将上线。

开放权重让开发者和团队更容易在自己的硬件上运行和微调该模型。新增的更高分辨率输出和更可靠的文字渲染,对标志、海报等实际设计场景尤其重要。

Ideogram 发布了其文本生成图像模型 4.0 版本,并以开放权重形式推出。公司表示,这一版本加入了原生 2K 分辨率、透明背景、更好的文字渲染,以及通过边界框实现的更精确布局控制。官方强调,这些能力对生成标志、海报等设计类内容特别有用。Ideogram 还表示,可编辑文字和图层功能即将上线。该模型的权重和代码可以从 GitHub 下载,并且可以在本地硬件上运行,还支持使用用户自己的数据进行微调。

不过,商业用途需要付费许可。文章援引 DesignArena 榜单称,Ideogram 4.0 在所有开放权重模型中排名第一,但在整体评分上,OpenAI 和 Google 的闭源模型仍然更高。除了 Ideogram 自己的网页和 API 之外,该模型也已接入 Hugging Face、ComfyUI、fal、Runware、Magnific、Krea AI、Leonardo AI、Picsart、Cloudflare、Replicate、Gamma、Flora AI 和 Kittl 等合作平台。文章还提到,在一个基准提示词测试中,它明显优于 Midjourney v8,大致与 Flux 持平,但仍不及 GPT-Image-2、Nano Banana Pro 或 Luma Uni-1.1。作者同时提醒,这只是单个提示词的结果,用户仍应自行测试模型表现。

Ideogram 表示,该模型可从 GitHub 下载,并可用自有数据进行微调,但商业用途需要付费许可。文章还提到,该模型可通过 Ideogram 托管 API 以三种质量档位使用,并已接入多个合作平台;在 DesignArena 榜单上,它位列开放权重模型第一。

查看单篇正文查看原文
10

The Decoder

Build 2026: Microsoft tops Google in image generation while playing catch-up on reasoning

·#microsoft

Build 2026: Microsoft tops Google in image generation while playing catch-up on reasoning

Microsoft’s Build 2026 announcements highlight seven new homegrown AI models, a new Frontier Tuning method, and an always-on agent called Scout, signaling a major push into agentic and enterprise AI.

This is a high-value industry announcement: Microsoft is shipping multiple in-house AI models, including its first reasoning model, plus a new reinforcement-learning tuning approach and an autonomous office agent. The piece is especially relevant because it frames Microsoft as competitive in image generation while still behind on reasoning, which has clear implications for AI product strategy; no comments were provided to assess discussion quality.

Build 2026: Microsoft tops Google in image generation while playing catch-up on reasoning Key Points - Microsoft unveiled seven homegrown AI models at Build 2026, including its first reasoning model, MAI-Thinking-1. In benchmarks, it lands roughly on par with Deepseek V3.2. - A new method called "Frontier Tuning" lets companies adapt models to their own workflows using reinforcement learning. Microsoft says tuned models match GPT-5.4 performance at one-tenth the cost. - Microsoft is also launching "Scout," an always-on background agent that handles office tasks like scheduling and meeting prep.

查看单篇正文查看原文
11

Ars Technica AI

Meta在Alexandr Wang带领下追赶AI

·#meta

Meta在Alexandr Wang带领下追赶AI

Meta已经推出了 Muse Spark,金融时报将其描述为公司迄今最可信的 AI 模型之一,而这一成果出现在马克·扎克伯格约一年前任命 Alexandr Wang 负责重振公司 AI 业务之后。Wang 领导的神秘团队 TBD Lab 在近 12 个月的重组和招人后,也开始拿出可见成果。

Meta 在前沿模型竞赛中一直落后于 OpenAI、Google 和 Anthropic,因此这一进展说明其 AI 重建可能终于开始加速。如果 Muse Spark 真的实现了可靠提升,就可能增强 Meta 在面向消费者的 AI 产品以及更广泛基础模型战略中的竞争力。

一年后,马克·扎克伯格把 Alexandr Wang 放到 Meta AI 重建工作的核心位置,Meta 终于拿出了它迄今最强的进展。金融时报报道称,Meta 在 4 月发布了 Muse Spark,这个模型来自 Wang 领导的神秘研究团队 TBD Lab。报道将其视为 Meta 重建 AI 能力后推出的第一个重要成果。文章指出,扎克伯格之所以选择 Wang,是希望借助一位外部创业者的紧迫感和野心,而不是继续依赖公司原有的 AI 领导班子。

过去近 12 个月里,Wang 组建了一支精英研究团队,据称给出了数百万美元级别的薪酬,并对 Meta AI 组织的部分结构进行了重塑。报道还称,他已经成为 Meta 内部最有影响力的高管之一,去年还与扎克伯格一起出席了由美国总统特朗普主持、在白宫举行的硅谷晚宴。支持者认为,Muse Spark 的发布表明这次重建正在取得效果,而未来几个月推出的后续模型,可能进一步缩小与 OpenAI、Google 和 Anthropic 的差距。不过,文章也提到,Wang 仍然要面对外界对其经验的质疑、早期研究挑战,以及在大型科技巨头内部推进变革时的复杂政治环境。

Wang 并非 Meta 资深研究员,而是一位前创业公司创始人;报道说他通过数百万美元薪酬组建了精英研究团队,并重塑了部分 AI 组织。文章还提到,后续模型预计将在未来几个月推出,但 Wang 也面临经验不足的质疑,以及在大型科技公司内部推进改革时的复杂政治环境。

查看单篇正文查看原文
12

TechCrunch AI

Meta 的 Business Agent 全球上线 WhatsApp

·#ai-agents

Meta 的 Business Agent 全球上线 WhatsApp

Meta 周三表示,其客户支持机器人现已更名为 Meta Business Agent,并在 WhatsApp Business 中全球可用。该公司还将其扩展到 Instagram 私信,同时测试夜间聊天摘要和洞察等新功能。

这使 WhatsApp 不再只是消息应用,而是更直接地成为中小企业的工作流软件。若被广泛采用,Meta 可能会加深中小企业对其消息生态的依赖,同时自动化客服、销售和线索处理。

Meta 正在加大在 WhatsApp 内部的 AI 布局,将其客户支持机器人以 Meta Business Agent 的名义全球上线。公司表示,这次发布是在 WhatsApp Business 中于印度、墨西哥等国家进行了近两年的 AI 代理测试之后推出的。Meta 希望把 WhatsApp 从单纯的聊天应用,变成中小企业可用的工作流层。该代理可以回答客户问题、推荐产品、预约、筛选销售线索,并在必要时把对话转交给人工处理。Meta 还将把这个机器人扩展到 Instagram 私信中。除了正式上线之外,Meta 还在为部分账户测试夜间聊天摘要和洞察功能,覆盖 WhatsApp Business、Instagram Pro、Messenger 和 Meta Business Suite。

公司还在开发更多能力,包括市场调研、突出产品功能、管理日历,以及连接外部工具来提取竞争洞察。Meta 还计划让企业在搜索中更容易被找到,或者在聊天中分享联系方式时被展示出来。对于更大的企业,Meta 正在搭建一个平台,让它们创建可连接 Shopify、Zendesk 和 Shopee 等系统的定制代理。Meta 表示,这项功能将通过 WhatsApp Business Premium 的部分套餐收费,大型企业则会按 token 用量付费。对 Meta 来说,这一步很关键,因为 WhatsApp 过去主要依赖企业消息和 click-to-WhatsApp 广告,而新的 AI 代理为商业通信提供了另一种变现方式。

Meta 表示,该代理可以回答问题、推荐产品、预约、筛选销售线索,并在必要时转接人工。公司还在测试更广泛的能力,例如市场调研、日程管理、竞争洞察,以及一个可连接 Shopify、Zendesk 和 Shopee 等工具的企业定制代理平台。

查看单篇正文查看原文
13

TechCrunch AI

Coralogix 融资 2 亿美元布局 AI 代理监控

·#ai-agents

Coralogix 融资 2 亿美元布局 AI 代理监控

Coralogix 完成了 2 亿美元的 F 轮融资,投后估值达到 16 亿美元。公司表示,这笔资金将用于加速面向 AI 代理和其他自主软件系统的监控、排障和管理产品。

这笔融资表明,投资者正在快速押注 AI 代理的“可观测性层”,而不仅仅是代理本身。随着更多自主软件进入生产环境,企业会更需要工具来理解故障、行为表现和运行风险。

Coralogix 是一家总部位于波士顿、创立于以色列的软件监控初创公司,近日完成了 2 亿美元的 F 轮融资。此次融资后,公司估值达到 16 亿美元,领投方为 Advent 和加拿大养老金计划投资委员会(CPPIB),Greenfield Partners 和 Brighton Park Capital 也参与了投资。到目前为止,Coralogix 的累计融资额已经达到 5.5 亿美元。Coralogix 正在押注一个核心趋势:随着 AI 代理变得更普遍,企业将更需要工具来监控、排障并管理这些越来越自主的系统。AI 代理可以写代码、调查问题并完成过去需要人工工程师处理的任务,因此它们上线后的运行可见性变得更重要。Coralogix 的核心产品属于可观测性领域,它会收集并分析日志、指标和链路追踪等数据,帮助客户发现故障、调查事故并优化应用。

该平台目前服务全球 5000 多家客户,包括 IBM、Tradeweb 和 JFrog。首席执行官 Ariel Assaraf 表示,AI 的普及正在改变客户与产品的交互方式,超过一半的企业客户已经在使用 Coralogix 的 AI 代理 Olly,或通过命令行和 agentic 接口调用自己的 AI 模型来排查事件和查询数据。他认为,传统仪表盘的重要性正在下降,工程师越来越希望直接向 AI 助手提问,了解系统出了什么问题以及该如何修复。公司还表示,过去一年营收增长超过 60%,目前约有 30 家客户每年付费超过 100 万美元,并且公司在一年前就已突破 1 亿美元年化收入。Coralogix 目前在全球拥有 600 多名员工,其中约 100 人在印度,印度团队已成为支持亚洲客户的区域枢纽,同时帮助公司拓展当地大型企业,尤其是金融机构。公司称,这笔新资金不会只是为了延长现金储备,而是将用于加快 AI 产品、安全产品和全球扩张。

Coralogix 表示,超过一半的企业客户已经在使用其 AI 代理 Olly,或通过命令行和 agentic 接口调用自己的 AI 模型来排查事件和查询数据。公司过去一年营收增长超过 60%,年化收入已超过 1 亿美元,全球客户超过 5000 家,包括 IBM、Tradeweb 和 JFrog。

查看单篇正文查看原文
14

TechCrunch AI

Cyera 寻求 120 亿美元估值融资

·#cybersecurity

Cyera 寻求 120 亿美元估值融资

据报道,Cyera 正在敲定一轮至少 3 亿美元的融资,由 Evolution Equity Partners 领投,估值达到 120 亿美元。若交易完成,这将发生在其 5 个月前刚完成 4 亿美元 F 轮融资之后,并使公司累计融资至少达到 20 亿美元。

据报道的定价相当于 80 倍 ARR,这个估值倍数即使放在高速增长的软件公司中也非常激进,尤其是对一家仍在亏损的公司而言更是如此。这也反映出投资者对能够受益于企业 AI 采用趋势的网络安全和数据安全平台依然保持强烈需求。

Cyera 是一家成立于 2021 年的数据存储安全公司,据报道正在敲定一轮至少 3 亿美元的新融资。四名知情人士称,这轮融资由 Evolution Equity Partners 领投,估值为 120 亿美元。Calcalist 最先报道了这笔交易,而 TechCrunch 的消息人士补充了有关公司收入和支出的细节。三名知情人士告诉 TechCrunch,Cyera 的年度经常性收入已超过 1.5 亿美元。尽管如此,消息人士表示,公司距离盈利仍然很远,而且花钱速度快于收入增长。按这一估值计算,Cyera 的 ARR 倍数约为 80 倍,这一水平甚至高于许多投资者对高速增长 AI 初创公司的定价。

PitchBook 数据显示,Cyera 今年已经新增了 500 个岗位,说明其招聘力度很大,尤其集中在销售团队。Cyera 发言人则否认了相关说法,称文中引用的数据“在事实上和程度上都严重不准确”,而 Evolution Equity Partners 没有回应置评请求。如果交易完成,这将发生在公司 5 个月前刚完成 4 亿美元 F 轮融资之后,当时估值为 90 亿美元,由 Blackstone 领投,Accel、Coatue、Lightspeed、Redpoint、Sapphire、Sequoia、Cyberstarts 等老股东跟投。此次融资也将使 Cyera 的累计融资总额至少达到 20 亿美元。公司受益于企业希望用其平台保护数据、抵御被 AI 武器化的攻击者,同时也用资金收购了 Ryft 和成立不到一年的 Genie Security 等网络安全初创公司。

TechCrunch 的消息人士称,Cyera 的年度经常性收入已超过 1.5 亿美元,但公司仍然入不敷出,并把大量资金用于招聘,尤其是销售岗位。公司近期还动用融资收购了更小的网络安全初创公司,包括 Ryft 和 Genie Security。

查看单篇正文查看原文
15

The Decoder

白宫推动自愿式AI安全审查

·#ai-policy

白宫推动自愿式AI安全审查

白宫发布了一项新的行政命令,允许 AI 开发者在模型发布前自愿提交前沿模型接受政府安全测试。该命令还要求联邦机构加强网络防御、扩大 AI 驱动的防护工具,并加大对利用 AI 实施网络滥用行为的执法力度。

这释放了一个重要政策信号:美国可能会以非强制审批的方式管理前沿 AI,而不是立即建立硬性许可制度。它可能影响大型实验室、联邦机构和网络安全团队在模型安全、漏洞披露与滥用防范方面的协作方式。

白宫发布了一项聚焦 AI 创新与安全的新行政命令。根据该命令,特朗普总统要求联邦机构在 30 天内加强政府系统的网络防御,并扩大 AI 驱动的防护工具使用。国防部、CISA 和财政部被要求与 AI 产业合作,建立一个软件漏洞信息共享中心。该命令还为所谓的“受监管前沿模型”建立了一个自愿框架,允许开发者在模型发布前将其提交给政府进行安全测试。与此同时,命令明确表示不会设置强制性的审批流程。

除了模型审查之外,它还要求加强对利用 AI 实施网络攻击的刑事执法,并加快招聘网络安全专家。文章指出,这项政策可能部分受到围绕 AI 网络安全风险的持续争论影响,包括 Claude Mythos 引发的讨论。文章还提到,Google DeepMind、Microsoft 和 xAI 已与 CAISI 达成协议,在发布前提交新模型接受审查,而 OpenAI 和 Anthropic 也早在 2024 年签署了类似安排。整体来看,这项命令显示政府在释放明确监管意图的同时,仍试图把参与包装成自愿且不过度繁琐。

据报道,该命令要求包括国防部、CISA 和财政部在内的机构在 30 天内与产业伙伴建立软件漏洞信息共享机制。它明确表示审查框架是自愿的,不是强制审批流程,同时还要求加快招聘网络安全专家,并加强对 AI 相关网络攻击的刑事追诉。

查看单篇正文查看原文
16

The Decoder

Perplexity 推出本地云端混合 AI 路由

·#ai-agents

Perplexity 推出本地云端混合 AI 路由

Perplexity 宣布了一套混合式 AI 编排系统,能够自动决定每个任务是在本地设备还是云端运行。该系统将从 7 月起集成到其 Always-on 代理产品 Personal Computer 中。

这种做法旨在在隐私、准确性和能效之间取得平衡:敏感数据留在本地,计算密集型任务则交给云端模型处理。如果被广泛采用,这类路由方式可能减少对中心化算力的依赖,并让本地优先的 AI 代理更实用。

Perplexity 宣布了一套混合式 AI 编排系统,可以实时决定某个任务应在用户本地电脑上处理,还是交给云端模型完成。该公司表示,这样做的目标是同时优化准确性、隐私和能效。像金融文件和健康数据这类敏感信息会尽量留在设备本地处理。计算量更大的请求则会被路由到云端模型。Perplexity 是与 Intel 一起发布这套系统的,但强调这个框架是模型无关的。

公司还表示,该方案也可以运行在其他硬件上,例如 Nvidia 的 RTX Spark。Perplexity 计划把这项能力集成到今年 3 月推出的 Always-on 代理产品 Personal Computer 中,并从 7 月开始上线。公司认为,把常规任务转移到本地设备可以减少对中心化基础设施的需求,也有助于简化数据主权问题。Perplexity 还表示,由于其商业模式奖励的是正确答案而不是更高的算力消耗,因此优化效率本身就是一种天然激励。

Perplexity 表示,金融文件和健康信息等敏感数据会保留在本地,而计算密集型任务会发送到云端模型。该公司与 Intel 一起推出了这一系统,但表示这个框架是模型无关的,也可以运行在 Nvidia RTX Spark 等硬件上。

查看单篇正文查看原文
17

The Decoder

Suno估值升至54亿美元,版权诉讼升级

·#ai-music

Suno估值升至54亿美元,版权诉讼升级

人工智能音乐初创公司Suno完成了4亿美元融资,估值达到54亿美元,较7个月前翻了一倍。此次融资由Bond Capital领投,IVP、Forerunner、Union Square Ventures,以及现有投资方Lightspeed和Menlo Ventures参与。

这笔融资表明投资者对AI生成音乐仍然高度看好,也让Suno在估值上成为该赛道的领跑者。与此同时,它与大型唱片公司的法律冲突说明,版权风险仍是生成式AI企业面临的核心问题。

人工智能音乐初创公司Suno在最新一轮融资中筹集了4亿美元,投后估值达到54亿美元。这个估值相较7个月前翻了一倍,也让Suno成为AI音乐领域估值最高的创业公司。此次融资由Bond Capital领投,IVP、Forerunner、Union Square Ventures,以及现有投资方Lightspeed和Menlo Ventures参与。Suno的产品可以根据文本提示在几秒钟内生成完整歌曲,并支持用户选择风格、乐器和歌词。联合创始人兼首席执行官Mikey Shulman表示,这笔资金将用于新产品、增长和招聘。公司目前拥有超过200万订阅用户,并预计年收入将达到3亿美元。

Suno现有约200名员工,预计到今年年底团队规模最多将扩大70%。不过,公司也正陷入与大型唱片公司的重大版权诉讼。环球音乐集团和索尼音乐娱乐指控Suno使用了“数百万”受版权保护的录音来训练其AI模型。Suno已向美国马萨诸塞州联邦地区法院申请将训练数据的确切规模保密,理由是公开后可能让竞争对手逆向推断其方法。此前,华纳音乐集团已在2025年11月与Suno达成和解并签署许可协议。

Suno表示,其平台可以在几秒钟内根据文本提示生成完整歌曲,并支持选择风格、乐器和歌词。公司称其订阅用户已超过200万,年收入有望达到3亿美元,同时约200人的团队预计到今年年底将增长多达70%。

查看单篇正文查看原文
18

The Decoder

Nous Research 发布 Hermes Desktop 桌面 AI 代理

·#ai-agents

Nous Research 发布 Hermes Desktop 桌面 AI 代理

Nous Research 发布了 Hermes Desktop,这是一款采用 MIT 许可证的开源 AI 代理应用,目前已在 Windows、macOS 和 Linux 上开放公测。该应用把持久记忆、多应用通信、子代理委派和沙箱执行后端整合到一个跨平台桌面软件中。

这次发布的重要性在于,它把开发者和重度用户真正需要的多项代理能力结合到了一起:跨平台支持、长期记忆以及受控执行环境。它有可能让开源 AI 代理更适合在聊天应用、电子邮件和终端任务等真实工作流中使用。

Nous Research 发布了 Hermes Desktop,这是一款采用 MIT 许可证的开源 AI 代理应用。该桌面程序目前以公开预览版形式提供,支持 Windows、macOS 和 Linux。根据介绍,Hermes 设计为可跨多个通信渠道工作,包括 Telegram、Discord、Slack、WhatsApp、Signal、电子邮件和终端。它具备持久记忆能力,可以保存项目和解决路径,从而让任务能够跨时间继续推进。

该代理还支持自然语言任务规划,用户可以直接用日常语言描述需求。除了基础辅助功能外,Hermes 还可以把工作委派给子代理,这些子代理拥有自己的终端和 Python 脚本;它还能进行网页搜索、生成图片以及朗读文本。为了安全执行任务,系统提供五种沙箱后端:本地、Docker、SSH、Singularity 和 Modal。通过 Nous Portal,用户可以在免费和付费方案中访问 300 多个 AI 模型,相关文档也已在线提供。

Hermes Desktop 可以跨 Telegram、Discord、Slack、WhatsApp、Signal、电子邮件和终端运行,还能把任务委派给拥有自己终端和 Python 脚本的子代理。它还支持五种沙箱执行后端:本地、Docker、SSH、Singularity 和 Modal;同时,Nous Portal 在免费和付费方案中提供 300 多个 AI 模型的访问。

查看单篇正文查看原文
19

The Verge AI

微软想跻身顶级AI实验室

·#microsoft

微软想跻身顶级AI实验室

在 Build 上,微软宣布进一步加大独立 AI 研发力度,包括其首个自研推理模型 MAI-Thinking-1,以及多个面向图像、语音、转录和编程的新模型。微软 AI 负责人 Mustafa Suleyman 表示,公司希望成为全球第四家主要 AI 实验室,与 Google DeepMind、OpenAI 和 Anthropic 并列。

这标志着微软正从长期依赖 OpenAI 转向更独立的 AI 战略,并希望以自身实力参与前沿模型竞争。若这一转型成功,可能会重塑企业 AI 产品、定价方式以及整个行业的云合作格局。

微软在年度 Build 大会上展示了更独立的 AI 战略,发布内容覆盖模型、智能体和安全工具等多个方向。公司推出了 MAI-Thinking-1,这是微软首个自研推理模型,同时还发布了另外六个面向图像、语音、转录和编程的新模型。微软将 MAI-Thinking-1 描述为一个中型模型,强调它是从零开始构建的,面向复杂数学、编程和企业级部署。Mustafa Suleyman 说,微软的目标是成为全球前四大 AI 实验室之一,与 Google DeepMind、OpenAI 和 Anthropic 并列。他还表示,微软必须证明自己能够完全依靠自身能力构建前沿模型,而不是依赖其他公司的成果。

Suleyman 说,改变的关键节点是微软与 OpenAI 重新谈判合同,这使微软可以在更大规模上训练模型,并用自己的知识产权和数据追求 superintelligence。Satya Nadella 也把这次大会描述为微软面对行业剧变、重新把握新机会的时刻。微软还重点介绍了 MDASH,这是一款 AI 网络安全工具,Nadella 称其结合了 100 个 AI 智能体,找漏洞的能力比单一模型更强。微软在 AI 智能体上的布局也反映出围绕 OpenClaw 等开源智能体平台的竞争加剧,公司特别强调其对 Windows 的支持。

Suleyman 强调,MAI-Thinking-1 是用微软自己的知识产权和数据从头训练的,没有通过其他公司的模型进行蒸馏。微软称该模型面向复杂数学、编程和企业部署,而且在某些任务上的成本可能低于 OpenAI 的对应模型。

查看单篇正文查看原文
20

Ars Technica AI

特朗普的AI测试令面临执行乏力

·#ai-policy

特朗普的AI测试令面临执行乏力

特朗普签署了一项行政令,扩大政府对前沿AI模型的自愿安全测试。该命令并未对AI公司提出强制要求,而是依赖企业与政府的自愿协作。

这项命令旨在传递美国重视AI安全的信号,同时尽量不放慢创新和部署速度。批评者认为,由于网络安全和监督团队被削弱,政府实际上难以开展有实质约束力的审查。

周二,特朗普签署了一项行政令,扩大政府对前沿AI模型进行自愿安全测试的努力。该命令被包装为一种机制,旨在确保“最先进、最安全的技术”能够迅速部署,以应对国家面临的各种威胁。与此同时,它明确没有对AI公司施加新的强制要求。相反,它建立的是一个让企业与政府就安全审查进行自愿合作的流程。

特朗普表示,政府将继续推进一种“美国优先”的网络安全努力,以同时增强国家安全和美国在AI领域的主导地位。文章认为,这种做法可能主要停留在象征层面,让外界看起来政府正在积极监督AI风险,但实际上并不会显著改变模型部署方式。文章还提到,特朗普此前曾取消一场原计划为更早版本行政令举行的签署活动,据报道这与政府内部在网络安全专家和主张放松监管的官员之间的冲突有关。尽管最终签署时没有举行带有CEO参与的大型活动,审阅文本的专家表示,最终版本与此前泄露、并引发业界反弹的草案相比,变化并不大。

特朗普政府将这项命令描述为避免“过度繁重的监管”,并称其属于“美国优先”的网络安全努力,旨在同时强化国家安全和AI主导地位。文章指出,最终版本与此前泄露并引发业内反弹的草案相比,变化并不大。

查看单篇正文查看原文
21

Simon Willison

·#ai-coding-assistants

Uber限制AI编码工具支出

Uber已将员工在Claude Code等AI编程工具上的支出限制为每个工具每月1500美元。该政策只适用于代理式编程软件,并且是在最近几个月内推出的,目的是控制快速上升的AI成本。

这表明一家大型公司正在从广泛采用AI转向更严格的预算控制,因为代理式编程工具在大规模使用时成本很高。它也向其他企业发出信号:AI带来的效率提升,可能伴随着可观的运营支出。

Uber根据彭博社的报道,已将所有员工在每个AI编程工具上的token支出限制为每月1500美元。该限制适用于Cursor和Anthropic的Claude Code等代理式编程软件。Uber表示,这些限制是在最近几个月内实施的,原因是AI使用量和成本都在上升。该政策采用按工具分别计算的方式,因此一个工具上的花费不会占用另一个工具的预算。

文章作者Simon Willison认为,这是一种应对超支的合理方式,明显比那些鼓励员工尽可能消耗token的激励机制更理性。他还指出,这一上限也大致反映了Uber预期这些工具能带来的价值,因为如果每名工程师同时活跃使用多个工具,年度预算会相当可观。文章把这一举措与Uber 2026年的AI预算超支联系起来,说明企业级定价正在成为重度AI用户必须面对的现实。Willison还提到,Anthropic和OpenAI面向个人用户的补贴订阅方案,无法以同样条件提供给Uber这样的公司。

据彭博社报道,这一上限是每个工具每月1500美元,因此某个工具的花费不会影响另一个工具的额度。该限制覆盖Cursor和Anthropic的Claude Code等工具,这些工具可以读取本地代码、修改代码、运行测试,并生成可供审查的拉取请求。

查看单篇正文查看原文
22

TechCrunch AI

These two founders left Goldman and Meta to build voice AI for markets everyone else overlooked | TechCrunch

·#voice-ai

These two founders left Goldman and Meta to build voice AI for markets everyone else overlooked | TechCrunch

TechCrunch covers AethexAI, a new voice AI startup raising $3 million to build localized customer support tools for African and Middle Eastern markets using its own small model and orchestration stack.

A relevant startup funding and product-launch story in voice AI, with some technical interest in building localized models for Africa and the Middle East. It’s useful industry news but not a major breakthrough; no comments or discussion quality were provided to assess community debate.

Customer support and service are among the hottest sectors in voice AI right now. But building a product that sounds human and responds without noticeable delay turns out to be much harder in some markets than others — and most of the major players weren’t built with Africa and the Middle East in mind. AethexAI, a startup founded last year to close that gap, has raised $3 million in pre-seed funding led by 4DX Ventures, with participation from Enza Capital, Dorm Room Fund, Mojo Ventures, and Stanford GSB 26 Fund. Individual investors include Stanford faculty, telecom executives, and AI researchers from Anthropic.

查看单篇正文查看原文
23

The Decoder

Google 增加 AI 搜索退出控制

·#google-search

Google 增加 AI 搜索退出控制

Google 正在为 Search Console 增加新的控制项,允许网站运营者选择不让自己的内容出现在 AI Overviews 和 AI Mode 中。与此同时,Google 还推出了独立的 AI 搜索表现报告,按展示次数、页面、国家和设备进行拆分统计。

这让出版商可以正式限制自己的内容出现在 Google 的 AI 回答中,同时不影响常规网页排名,这在 AI 搜索重塑流量分配的背景下很重要。它也表明,监管机构和出版商对 Google 提高 AI 搜索透明度与可控性的压力正在上升。

Google 正在推出新的 Search Console 工具,让网站运营者更好地控制其内容在 AI 搜索功能中的呈现方式。Google 表示,AI Overviews 的月活跃用户已超过 25 亿,AI Mode 也已超过 10 亿。借助新的开关,发布者可以选择自己的内容是否出现在 AI Overviews 或 AI Mode 中。Google 说明,选择退出后,网站将不再出现在这些 AI 功能里,但不会影响其在标准搜索中的排名。

与此同时,Google 还将提供新的独立报告,把 AI 功能相关的数据单独拆分出来,包括展示次数、页面、国家和设备。该功能最初会在英国进行测试。报道认为,这一上线与英国竞争与市场管理局(CMA)的压力有关,因为该机构今天发布了首个针对 Google 的行为准则,要求 Google 允许出版商从 AI 搜索功能中移除内容,在 AI 生成结果中清楚标注来源,并且只有在获得同意后才能用出版商内容微调模型。文章还指出,这些控制未必会真正削弱 Google,因为它仍然可以从大量其他来源构建 AI 回答,而出版商则继续承担流量流失和引用风险。

Google 表示,这项退出设置不会在生成式 AI 搜索功能之外作为排名信号使用,因此常规搜索可见性应不受影响。该功能首先会在英国进行测试,因为英国竞争与市场管理局(CMA)也在推动新的规则,要求来源标注以及出版商对模型训练的同意。

查看单篇正文查看原文
24

The Verge AI

谷歌承诺降低数据中心用水影响

·#ai-infrastructure

谷歌承诺降低数据中心用水影响

谷歌宣布了针对数据中心用水的五项新承诺,其中包括到 2030 年实现“补充的水量超过消耗的水量”。公司还表示,将投资当地水利基础设施,寻找替代水源,并更透明地披露用水情况。

这一举措发生在 AI 数据中心因环境影响、尤其是冷却用水问题而受到越来越多审视之际。如果谷歌真正落实,这套做法可能会成为社区和其他云服务商在面对类似舆论压力时的参考模板。

谷歌宣布了一套新的承诺,旨在降低其数据中心对水资源的影响,而这正发生在美国各地对 AI 扩张的反对声音不断升高之际。公司在周三发布的一篇博客中表示,希望到 2030 年实现数据中心“补充”的水量超过实际消耗的水量。谷歌还承诺投资当地供水基础设施、为设施寻找替代水源,并更透明地报告年度用水情况。谷歌全球基础设施与可持续发展负责人 Ben Townsend 表示,公司希望提供一份可供社区参考的“蓝图”,帮助他们评估未来的数据中心项目。他认为,社区应该能够追问企业是否真正把流域和当地利益放在首位,以及企业准备如何应对这些问题。

这些承诺发布之际,Alphabet 正寻求通过股票出售筹集 800 亿美元,用于 AI 基础设施扩张。最近的 Gallup 民调显示,超过 70% 的美国人反对在自己所在地区建设数据中心,环境影响和过量用水是主要反对原因。谷歌全球基础设施副总裁 Bikash Koley 写道,水冷相较风冷可将能耗降低约 10%。他还表示,谷歌会继续寻找再生废水等替代水源,并将投入 1700 万美元支持横跨七个州的水资源管理项目。

谷歌表示,水冷相较风冷可将数据中心能耗降低约 10%,但公司也承认必须保护当地水资源。谷歌计划在部分地点使用再生废水等替代水源,并宣布投入 1700 万美元支持横跨七个州的水资源管理项目。

查看单篇正文查看原文
25

ZDNET AI

如何降低联网汽车的隐私风险

·#privacy

如何降低联网汽车的隐私风险

ZDNET发布了一篇消费者指南,解释现代汽车收集和共享的个人与驾驶数据远远多于老款车型。文章给出了五条专家建议,帮助车主减少汽车向第三方发送的信息量。

联网汽车已经处在交通、云服务和类似监控式数据收集的交汇点上,因此隐私风险不再只存在于手机和电脑中。这些建议对购买或驾驶新车的人都很重要,尤其是在位置追踪、驾驶评分和与保险相关的车载遥测系统普及的情况下。

ZDNET认为,与十年前甚至更早的车型相比,如今的汽车已经变成了高度数据化的设备。除了明显的便利功能之外,新车越来越依赖计算机、传感器、卫星通信、移动连接和云服务,这些系统不仅能监控车辆状态,也能监控驾驶者。文章指出,很多成年人会关注电脑和智能手机上的隐私问题,却忽视了汽车也在收集大量个人信息。作者把这视为一个到2026年仍在加剧的隐私问题,因为联网汽车的数据共享正在不断增加。

文章详细介绍了智能汽车中的主要技术,包括信息娱乐系统、GPS导航、地图功能、手机同步、车载诊断、传感器、摄像头、紧急服务联动,以及遥测或EDR黑匣子设备。文章强调,这些系统可能暴露你住在哪里、去过哪里,以及你如何驾驶。随后,文章给出实用建议,帮助读者减少汽车向第三方传输的信息,并理解哪些数据正在被收集、如何尽量限制这些数据流动。

文章列举了现代汽车常见的数据来源,包括信息娱乐系统、GPS、手机同步、车载摄像头、诊断系统、传感器,以及类似黑匣子的车载遥测或事件数据记录器设备。文章还指出,这些功能虽然是为了便利或安全而设计,但仍可能把位置、驾驶行为和与设备关联的信息暴露给汽车厂商或其他第三方。

查看单篇正文查看原文