AI 日报

Cloudflare四连击:AI代理、LLM压缩与网页优化全面升级

Cloudflare今日重磅推出多项突破性技术:无损压缩LLM权重(Unweight)、AI代理持久记忆(Agent Memory)、共享字典加速网页加载(Shared Dictionaries),以及专为自主AI设计的特性开关(Flagship)。这些创新不仅提升效率与安全性,更预示AI代理将进入可长期运行、可控制、可持续扩展的新阶段。

当天导读

从 62 条资讯中筛选出 44 条

Cloudflare今日重磅推出多项突破性技术:无损压缩LLM权重(Unweight)、AI代理持久记忆(Agent Memory)、共享字典加速网页加载(Shared Dictionaries),以及专为自主AI设计的特性开关(Flagship)。这些创新不仅提升效率与安全性,更预示AI代理将进入可长期运行、可控制、可持续扩展的新阶段。

Unweight:LLM压缩22%不牺牲质量

Cloudflare无损压缩系统可减少LLM权重高达22%,直接缓解GPU显存瓶颈,提升推理效率。

Agent Memory:AI代理有了持久记忆

通过结构化资料档案实现跨会话记忆存储,解决上下文窗口膨胀问题,助力长期运行代理。

Shared Dictionaries:网页加载提速90%

利用客户端缓存作为压缩参考,仅传输文件差异,极大减少数据传输量,尤其适合慢速网络。

Flagship:AI自主部署的安全闸门

边缘原生特性开关支持无干预部署与可观测性,确保AI生成代码可安全迭代。

Cloudflare四连击:AI代理与Web性能再进化

🔥 1. Unweight:LLM模型压缩达22%,GPU显存瓶颈迎刃而解

  • 核心亮点:无需特殊硬件即可无损压缩LLM权重,减少高达22%的显存占用。
  • 影响:每块H100 GPU可多运行一个模型,显著降低大规模推理成本。
  • 来源故事 #881

🧠 2. Agent Memory:让AI代理拥有‘永久记忆’,告别上下文腐烂

  • 核心亮点:托管服务隔离存储关键信息,避免填满上下文窗口。
  • 影响:使AI代理能在真实系统中运行数周甚至数月,提升长期任务可靠性。
  • 来源故事 #882

🚀 3. Shared Dictionaries:网页加载提速90%,慢网也能飞起来

  • 核心亮点:基于客户端缓存内容仅传文件差异,大幅减少冗余传输。
  • 影响:尤其对返回用户和代理流量有革命性优化,预计4月底测试版上线。
  • 来源故事 #880

⚙️ 4. Flagship:AI自主部署的安全护栏,零人工干预也可控

  • 核心亮点:边缘原生特性开关,支持小规模灰度发布与快速回滚。
  • 影响:为AI生成代码的自动化部署提供安全基线,防止失控发布。
  • 来源故事 #883

🌐 补充关注:AI政策与工具生态同步演进

  • Anthropic CEO与白宫会面,探讨Mythos模型国家安全权限问题(故事 #884
  • Dario Amodei警告AI不应被用于对付人类,凸显伦理责任(故事 #885
  • Cursor融资估值飙至500亿美元,显示市场对AI编程工具信心高涨(故事 #887

当日精选 8 条

01

Cloudflare AI

Cloudflare推出共享压缩字典,提升网页加载效率

·#web-performance

Cloudflare推出共享压缩字典,提升网页加载效率

Cloudflare推出了共享压缩字典功能,服务器可基于浏览器已缓存的内容仅传输文件差异,从而大幅减少返回用户和代理的传输数据量。

这项技术解决了因代理系统频繁部署导致的网页体积膨胀问题,在慢速网络环境下显著提升加载速度,并减少数百万用户的重复带宽消耗。

网页因框架和媒体内容日益丰富而逐年变重,同时由AI代理驱动的流量也在快速增长。传统压缩无法识别客户端已缓存的内容,造成大量冗余下载。Cloudflare的共享字典通过让服务器基于客户端已知内容进行压缩,只发送变化部分来解决这个问题。

例如,一个包含一行更改的500KB JavaScript包可缩减至几KB传输。这不仅节省了带宽,还显著提升了返回用户和代理的性能体验。

共享字典利用客户端缓存的文件版本作为压缩参考,可使传输数据量减少高达90%;该功能将于2026年4月30日进入测试版。

查看单篇正文查看原文
02

Cloudflare AI

Cloudflare推出Unweight,无损压缩LLM权重达22%

·#llm

Cloudflare推出Unweight,无损压缩LLM权重达22%

Cloudflare推出了Unweight,一种无损张量压缩系统,可在不牺牲输出质量或依赖特殊硬件的情况下将LLM模型权重减少最多22%。它通过在高速片上内存中解压缩权重并直接送入H100 GPU的张量核心来实现这一目标。

这项突破显著提升了推理效率,通过减少GPU显存带宽瓶颈,使更多模型能在更少的GPU上运行,从而降低大规模LLM部署的成本。它解决了生产AI系统中的一个关键痛点,即使在内存使用上的微小改进也能带来重大影响。

Cloudflare推出的Unweight是一种新颖的无损压缩系统,可将LLM模型权重减少最多22%而不影响输出质量。主要挑战不仅在于压缩数据,还在于快速完成压缩以避免拖慢推理——尤其是在NVIDIA H100 GPU上,张量核心常因显存带宽限制而闲置。Unweight通过在高速片上内存中解压缩权重而非慢速主内存来解决此问题,从而无缝叠加矩阵乘法操作。

它支持多种针对工作负载特性的执行策略,并包含自动调优器动态选择最优方案。初步结果显示Llama-3.1-8B模型显存节省高达3GB,使每块GPU能运行更多模型。Cloudflare还开源了GPU内核并发布了技术论文,以促进该领域的透明度和创新。

Unweight仅选择性压缩解码时使用的参数,单独对MLP权重实现约30%的压缩率,整体模型尺寸缩小15–22%。它使用自动调优器为每个权重矩阵和批处理大小选择最佳执行策略,避免张量核心闲置。

查看单篇正文查看原文
03

Cloudflare AI

Cloudflare推出Agent Memory,实现AI代理持久记忆

·#ai-agents

Cloudflare推出Agent Memory,实现AI代理持久记忆

Cloudflare推出了Agent Memory的私有测试版,这是一个托管服务,能让AI代理在不占用上下文窗口的情况下存储和检索有用信息。它通过隔离的资料档案实现记忆的摄入、检索和回忆操作。

这解决了随着模型变大而出现的‘上下文腐烂’问题,使生产环境中长期运行的代理更加高效。它减少了令牌浪费,提升了推理能力,并为代理系统中的记忆管理设定了新标准。

随着AI代理变得越来越复杂,高效管理上下文变得更加困难。Cloudflare的Agent Memory通过将代理对话中的重要信息存储在结构化资料档案中来解决这个问题,从而在需要时提供信息而不填满上下文窗口。该系统支持摄入(批量存储)、记住(即时存储)、回忆(检索+合成)和遗忘操作。

与其他给予模型原始数据访问权限的解决方案不同,Agent Memory在后台处理提取和检索,减少令牌使用并提高可靠性。它特别适合在真实代码库和系统上运行数周甚至数月的代理,因为这些代理需要长时间保持记忆的有效性。

Agent Memory采用有明确设计意图的API和基于检索的架构——避免直接访问数据库,以确保成本效益、性能,并支持时间逻辑等复杂推理。资料档案是跨会话和用户访问的隔离内存存储。

查看单篇正文查看原文
04

Cloudflare AI

Cloudflare发布Flagship,专为AI驱动的特性管理设计

·#ai

Cloudflare发布Flagship,专为AI驱动的特性管理设计

Cloudflare发布了Flagship,这是一个基于OpenFeature标准的原生特性开关服务,专为自主AI代理在无需人工干预的情况下安全部署和管理代码而设计。

随着AI代理从辅助开发转向完全自主部署代码,特性开关成为关键的安全机制——允许快速迭代的同时保持可观测性、回滚能力和生产环境中的可控发布。

AI生成的代码正以前所未有的速度被部署,像OpenCode和Claude Code这样的工具可以在几分钟内交付整个功能。下一步是自主性:AI代理将无需人工介入即可编写、审查、合并并部署代码。为了确保安全性,Cloudflare推出了Flagship——一个特性开关系统,可将部署与发布解耦,并实现安全的自动化发布。

与其硬编码标志或进行缓慢的远程调用,Flagship会在Cloudflare边缘网络中本地评估标志,确保低延迟决策并集中控制。这使得AI代理能够在小规模用户群体上测试新功能,监控指标,并根据结果扩大或禁用该功能——全部无需人工监督。Flagship目前已进入封闭测试阶段,并基于CNCF批准的OpenFeature标准构建。

Flagship针对Cloudflare Workers进行了优化,在边缘网络内实现本地评估,避免了外部HTTP调用带来的延迟;它支持Node.js、Bun、Deno和浏览器等多种运行时,并通过OpenFeature标准化API集成。

查看单篇正文查看原文
05

Financial Times AI

·#ai-policy

Anthropic首席执行官将与白宫会面,讨论Mythos AI模型的访问权限

Anthropic首席执行官达里奥·阿莫迪将于周五与白宫幕僚长苏西·韦尔斯会面,以解决美国政府希望获得其强大AI模型Mythos访问权的僵局,该模型已由情报机构和关键基础设施运营商测试。

此次会面表明美国政府越来越关注通过控制尖端AI模型来保障国家安全,尤其是在担心中国可能通过泄露或延迟采用而获得类似能力的情况下。

Anthropic首席执行官达里奥·阿莫迪将与白宫幕僚长苏西·韦尔斯会面,以解决联邦政府对该公司AI模型Mythos访问权的法律争议。该模型旨在突破网络防御,已被美国情报机构和财政部测试,CISA也已参与评估。白宫认为这项技术过于重要,不能忽视,称不使用它将是‘严重失职’。

Anthropic此前因拒绝无限制访问而被国防部列入黑名单,并提起诉讼,从而引发这次高层谈判。欧盟官员也在寻求访问权限,凸显全球对该模型能力的关注。

Mythos是一个先进的Claude模型,擅长识别网络安全漏洞——即使没有正式培训也能做到;它已被提供给科技公司和关键基础设施提供商,美国财政部和CISA正在积极评估该模型。

查看单篇正文查看原文
06

Financial Times AI

·#ai-ethics

Dario Amodei警告AI不应被用来对付人类

Anthropic首席执行官Dario Amodei公开警告称,AI不应被用于对付人类,尤其是由政府或精英阶层使用。这一表态发生在Anthropic与美国五角大楼因AI在军事领域的应用而引发的争议背景下。

这一警告凸显了人们对AI安全和伦理部署日益增长的担忧,尤其是在国防领域,自主系统可能造成伤害。这标志着企业责任和公众对先进AI模型治理方式的重视正在上升。

Anthropic首席执行官Dario Amodei在接受采访时发出严厉警告:他不希望AI被用来对付我们自己的人,尤其是掌权者。这一表态出现在与五角大楼围绕AI军事用途限制的更广泛争议中,包括自主武器系统。该公司最新模型Claude Mythos(代号“Capybara”)于2026年3月因CMS配置错误意外曝光,引起研究人员和政策制定者的高度关注。

一些人认为这是能力的巨大飞跃,但也有人担心其被滥用。五角大楼此前将Anthropic列为供应链风险,促使公司提起诉讼。尽管如此,Anthropic报告营收突破300亿美元,表明这场争议可能提升了其知名度而非损害了它。

这些言论紧随Claude Mythos泄露之后——这是Anthropic最强大的AI模型,其能力引发了兴奋与担忧。五角大楼此前将Anthropic列为供应链风险,导致了关于该技术允许用途的法律纠纷。

查看单篇正文查看原文
07

Hugging Face Blog

Nemotron OCR v2 利用合成数据实现快速多语言识别

·#ocr

Nemotron OCR v2 利用合成数据实现快速多语言识别

NVIDIA 和 Hugging Face 发布了 Nemotron OCR v2,这是一个使用 1200 万张合成训练图像在六种语言上实现最先进准确率的多语言光学字符识别模型。它将归一化编辑距离(NED)从 0.56–0.92 降低到 0.035–0.069,并且单张 A100 GPU 可以每秒处理 34.7 页。

这一进步通过消除对昂贵真实世界标注的需求,使多语言文档处理更具可扩展性和成本效益。对于需要在中文、日文和西里尔文等非拉丁语系中进行准确OCR的全球企业和AI开发者来说尤其重要。

Nemotron OCR v2 通过利用合成数据而非真实世界标注图像,显著提升了多语言OCR性能。使用六种语言共1200万张合成图像,其归一化编辑距离(NED)从0.56–0.92降至0.035–0.069。该模型架构复用了共享骨干网络中的特征,用于文本识别和阅读顺序预测,单张A100 GPU可实现每秒34.7页的速度。

合成数据流水线基于改进版SynthDoG构建,生成精确的单词级、行级和段落级边界框。源文本来自mOSCAR——一个大型多语言语料库,确保各语言分布的真实性和多样性。这种方法避免了人工标注的高昂成本,同时在包括CJK和西里尔文在内的多种文字系统中保持高精度。

该模型使用共享检测骨干网络,在识别和关系建模之间复用特征,从而在不牺牲准确率的情况下实现高速度。合成数据管道具有语言无关性,只要有可用字体和源文本即可扩展至任何文字系统。

查看单篇正文查看原文
08

TechCrunch AI

AI编程工具Cursor拟融资20亿美元,估值达500亿美元

·#ai

AI编程工具Cursor拟融资20亿美元,估值达500亿美元

AI编程工具Cursor正在洽谈一轮可能募资超20亿美元的新融资,投前估值达到500亿美元,几乎为其六个月前的估值翻倍。

这轮巨额融资表明市场对AI驱动开发工具的信心增强,并凸显了Cursor在企业级市场的快速扩张,使其成为未来软件工程领域的重要参与者。

AI编程工具Cursor正在与投资者谈判至少募资20亿美元的新一轮融资,投前估值高达500亿美元,几乎是其六个月前293亿美元估值的两倍。Andreessen Horowitz、Thrive和Nvidia等顶级投资方预计将参与其中,新投资者Battery Ventures也将加入。公司预计到2026年底年化收入将超过60亿美元,相比2026年2月的20亿美元大幅增长。

得益于自研的Composer模型以及像中国Kimi这样的低成本第三方模型,该公司最近实现了微弱的毛利率盈利。尽管个人开发者账户仍处于亏损状态,但面向企业的销售已实现正向毛利,这是可持续发展的关键里程碑。

公司预计到2026年底年化收入将超过60亿美元——比2026年2月的数字高出三倍以上——并通过自研的Composer模型和使用更便宜的第三方模型(如中国的Kimi)实现了微弱的毛利率盈利。

查看单篇正文查看原文
09

TechCrunch AI

工厂获1.5亿美元融资,估值达15亿美元,专注企业级AI编程

·#ai-coding

工厂获1.5亿美元融资,估值达15亿美元,专注企业级AI编程

专注于企业工程团队的AI编程初创公司工厂(Factory)完成了一轮1.5亿美元的融资,估值达到15亿美元。此轮融资由Khosla Ventures领投,Sequoia Capital、Insight Partners和Blackstone参与。

这轮融资凸显了投资者对企业级AI编程作为生产力工具的信心,尤其是在Anthropic、Cursor等玩家竞争加剧的背景下。它表明企业正在积极采用AI代理来提升软件开发流程效率。

生成式AI出现三年多以来,AI辅助编程仍然是最成功的应用场景之一。成立于2023年的工厂(Factory)由加州大学伯克利分校博士生马坦·格林伯格创办,现已完成1.5亿美元融资,估值达15亿美元。该轮融资由Khosla Ventures领投,包括Sequoia Capital和Blackstone在内的顶级投资机构参与。工厂的AI代理通过集成多个基础模型(如Anthropic的Claude或中国AI初创公司DeepSeek)帮助企业工程团队更高效地编写代码,而不依赖单一模型。

早期客户包括摩根士丹利、安永和帕洛阿尔托网络等知名企业。创始人格林伯格被Sequoia合伙人肖恩·麦圭尔说服离开学术界,后者与其同为物理研究背景。这一里程碑标志着工厂成为AI编程领域的重要竞争者。

工厂的核心优势在于能够灵活切换多种基础模型,如Claude和中国AI初创公司DeepSeek,这在企业环境中具有重要价值。其客户包括摩根士丹利、安永和帕洛阿尔托网络等大型企业。

查看单篇正文查看原文
10

The Decoder

谷歌DeepMind发布Gemini Robotics-ER 1.6,提升机器人规划与感知能力

·#robotics

谷歌DeepMind发布Gemini Robotics-ER 1.6,提升机器人规划与感知能力

谷歌DeepMind发布了Gemini Robotics-ER 1.6,该模型通过代理式推理显著提升了机器人的规划和感知能力。它在物体指认、计数和任务执行成功率识别方面优于前代版本,并能高精度读取压力表等仪表。

这项进步使机器人更接近于自主完成现实世界中的任务,尤其是在工业巡检和维护领域。通过整合谷歌搜索和视觉语言动作模型,系统展示了实用的具身推理能力——这对将AI部署到物理环境中至关重要。

谷歌DeepMind发布了Gemini Robotics-ER 1.6,这是一种用于增强机器人决策能力的下一代模型。它能让机器人基于视觉输入和外部工具(如谷歌搜索或视觉语言动作模型)自主规划行动。该模型在识别物体、计数和验证任务成功方面表现优异,超越了早期版本。

其关键功能是能够读取复杂的仪表(如压力表和液位计),通过放大图像、用代码计算比例并结合上下文知识解读结果。这一能力由DeepMind与波士顿动力公司合作开发,使Spot机器人可执行系统巡检任务。开发者可通过Gemini API或Google AI Studio访问该模型,还可使用Colab笔记本进行实验。

该模型结合代理式图像处理与代码执行来解析仪表上的小细节,再利用世界知识得出准确读数。它可通过Gemini API和Google AI Studio获取,开发者还可使用Colab示例进行测试。

查看单篇正文查看原文
11

The Decoder

OpenAI发布GPT-Rosalind生命科学推理模型

·#ai

OpenAI发布GPT-Rosalind生命科学推理模型

OpenAI发布了GPT-Rosalind,这是一个专为生命科学设计的推理模型,在化学、生物化学和实验设计方面优于之前的GPT版本。目前该模型仅对通过受信任访问计划的美国企业客户开放研究预览。

这标志着AI在科学发现中的重大进展,特别是在药物开发和生物医学研究领域。它能够更准确地推理复杂生物系统,有望加速学术界和工业界的假设生成与实验规划。

OpenAI推出了名为GPT-Rosalind的模型,以纪念化学家罗莎琳德·富兰克林,旨在帮助生命科学领域的研究人员完成证据整合、假设生成和实验设计等任务。该模型在化学、生物化学和实验设计基准测试中均优于此前的GPT版本,包括GPT-5、GPT-5.2和GPT-5.4。目前该模型仅限于通过“受信任访问计划”的美国企业客户使用,确保负责任的应用。

与此同时,OpenAI还发布了一个针对Codex的免费插件,可接入超过50个科学数据库和工具,使研究人员能处理复杂的多步骤查询。普通用户也可用标准OpenAI模型调用此插件。OpenAI计划继续推出更多聚焦生命科学的专用模型。

GPT-Rosalind在公开的BixBench基准测试中得分0.751(Pass@1),高于GPT-5.4(0.732)、Grok 4.2(0.698)等模型。同时发布了一个免费插件,可连接超过50个科学数据库和工具,支持文献综述、实验方案设计等多步骤任务。

查看单篇正文查看原文
12

Ars Technica AI

卫星图像揭示美国数据中心建设严重延误

·#ai-infrastructure

卫星图像揭示美国数据中心建设严重延误

卫星和无人机影像显示,近40%的2026年计划在美国建设的数据中心已延迟,包括微软、甲骨文和OpenAI等科技巨头项目受到影响。这些延误主要源于劳动力短缺、电力基础设施瓶颈以及地方审批问题。

这些延误可能危及下一代人工智能基础设施的及时部署,从而拖慢AI创新进程,影响云服务、企业应用以及国家在AI领域的竞争力。

一项利用卫星和无人机影像的新分析显示,约40%原定于2026年在美国建设的数据中心项目正面临重大延误。这些延误主要由熟练工人(尤其是电工和管道工)短缺、电力基础设施和许可审批困难造成。微软、甲骨文和OpenAI等大型科技公司均受影响,部分项目可能延误超过三个月。

这些设施的能源需求巨大,相当于数十万户家庭的用电量,而公用事业公司难以跟上步伐。此外,对中国变压器等进口设备征收关税,进一步加剧了关键部件的供应难题。这一情况对美国整体人工智能基础设施的时间表构成了严重风险。

该分析使用了SynMax的地理空间数据和IIR Energy的项目追踪信息,发现部分项目可能延误超过三个月。对来自中国的变压器征收关税进一步加剧了设备供应链压力。

查看单篇正文查看原文
13

Ars Technica AI

Meta的AI投资推动Quest头显涨价

·#ai

Meta的AI投资推动Quest头显涨价

Meta从4月19日起将Quest VR头显价格上调50至100美元(涨幅12%至20%),原因是内存芯片成本飙升,而这一现象部分源于Meta自身高达1150亿至1350亿美元的AI基础设施投资。

这凸显了科技巨头战略支出如何无意中影响消费产品——Meta在AI领域的投入直接推高了自家VR硬件的价格,表明整个电子消费品行业的供应链压力正在加剧。

Meta宣布因组件成本上涨而提高Quest VR头显价格,尤其是内存芯片。公司称这是全球对关键电子元件需求激增所致。但Meta自身激进的AI投资——计划2026年投入1150亿至1350亿美元——正是芯片短缺的关键原因,包括对CoreWeave数据中心和埃尔帕索数据中心的大笔投资。

尽管此前Meta曾大力押注元宇宙却回报甚微,如今它已将重心转向AI。即使计划削减元宇宙部门最多30%的开支,公司仍面临当前VR设备生产成本上升的问题。

具体型号涨价如下:Quest 3S(128GB)从300美元涨到350美元,Quest 3S(256GB)从400美元涨到450美元,Quest 3(512GB)从500美元涨到600美元;Meta的AI资本支出是全球内存芯片短缺的主要原因之一。

查看单篇正文查看原文
14

Cloudflare AI

Cloudflare推出网站AI代理就绪评分工具

·#ai-agents

Cloudflare推出网站AI代理就绪评分工具

Cloudflare推出了isitagentready.com,这是一个评估网站与AI代理兼容性的新工具,并引入了一个数据集来追踪整个互联网上代理标准的采用情况。

这标志着网站设计必须从仅面向人类或搜索引擎转向面向AI代理,可能重塑网页开发实践并提升AI交互效率。

Cloudflare推出了isitagentready.com这一免费工具,通过检查robots.txt、Markdown内容协商和Web Bot Auth等关键标准来评估网站对AI代理的支持程度。该平台还提供可操作的反馈和提示,帮助开发者实现缺失的功能。Cloudflare雷达数据显示,只有4%的网站使用Content Signals(一种新的AI偏好标准),而支持MCP服务器卡片和API目录(RFC 9727)的网站不足15个。

Cloudflare已将其文档全面改造为代理友好型,展示了最佳实践。该工具每周更新,可通过API或数据探索器访问。

评分基于四个维度:可发现性、内容格式、机器人访问控制和功能能力;还检查了MCP服务器卡片和API目录(RFC 9727)等新兴标准。

查看单篇正文查看原文
15

Cloudflare AI

Cloudflare推出AI训练重定向功能以确保数据纯净

·#ai

Cloudflare推出AI训练重定向功能以确保数据纯净

Cloudflare推出了“AI训练重定向”功能,可自动将经验证的AI训练爬虫(如GPTBot)重定向到规范URL,防止它们抓取过时内容。

这解决了AI模型因忽略传统SEO信号而被过时文档训练的问题,威胁AI生成知识的准确性,对开发者和AI生态至关重要。

Cloudflare发现,在过去30天里,AI训练爬虫访问其废弃文档达480万次,尽管页面上有明确的去标识标签和规范链接。这些对人类有效的信号被AI爬虫忽略,导致过时内容被用于训练模型。

为解决此问题,Cloudflare推出了“AI训练重定向”功能:当经验证的AI爬虫请求废弃页面时,Cloudflare返回301重定向至当前规范URL,确保AI代理从准确、最新的内容中学习。该方案利用现有的RFC 6596规范链接,无需新增指令或手动维护,即可实现规模化部署。

该功能仅在付费Cloudflare计划中可用,并利用HTML中已有的<link rel="canonical">标签;它不会影响人类用户或标准搜索引擎爬虫。

查看单篇正文查看原文
16

MIT Technology Review AI

机器人如何学习:一段简短的当代史

·#robotics

机器人如何学习:一段简短的当代史

从基于规则的机器人技术转向由人工智能驱动的学习方式,使人类形态机器人重新受到关注,仅2025年就吸引了61亿美元投资,是2024年的四倍。

这一转变使机器人能够适应折叠衣物或辅助人类等复杂现实任务,可能彻底改变医疗、制造等行业。

几十年来,机器人技术主要集中在工厂里的狭窄工业应用,如机械臂,而不是科幻电影中那种雄心勃勃的人形机器人。然而,大约从2015年开始,研究人员开始采用基于模拟的强化学习方法——通过奖励成功和惩罚失败,在数百万次试验中训练机器人,这类似于人类通过试错学习的方式。

2022年大型语言模型(如ChatGPT)的出现进一步加速了进展,使机器人能够从传感器输入(如摄像头画面或关节位置)中理解环境并实时生成合适的电机指令。因此,现在公司正投入数十亿美元开发能够在多样环境中与人类安全互动的实际人形机器人。

突破来自于在模拟环境中使用强化学习和大型语言模型,这些模型能从传感器数据和视觉输入中预测机器人的动作,从而实现更灵活和通用的行为。

查看单篇正文查看原文
17

TechCrunch AI

OpenAI高层离职,公司聚焦企业AI与超级应用

·#openai

OpenAI高层离职,公司聚焦企业AI与超级应用

OpenAI的核心研究人员凯文·韦尔和比尔·皮布尔斯已离职,他们曾主导Sora和OpenAI for Science等雄心勃勃的项目。此举标志着OpenAI决定放弃多项高成本‘副项目’,转而集中资源发展企业AI和即将推出的超级应用。

这些高管的离开标志着OpenAI战略的重大转变,可能将公司的创新重点从广泛的科学探索转向更具商业价值的企业产品。这一举措可能影响AI驱动的科学研究和创意工具的发展速度。

OpenAI正在经历重大调整,逐步放弃如Sora和OpenAI for Science等雄心勃勃的副项目。凯文·韦尔(领导科学研发)和比尔·皮布尔斯(Sora视频工具开发者)均已宣布离职。这源于OpenAI决定削减与核心目标——企业AI和新超级应用——不符的高成本项目。韦尔回顾了OpenAI for Science的变革性经验,该项目旨在用AGI加速科学发现。

皮布尔斯称Sora激发了整个行业对AI视频的投资热情,并强调研究实验室需要独立空间才能持续创新。两位都指出,这种自主性是长期突破的关键。此次人事变动还伴随CTO斯里尼瓦斯·纳拉亚南的离职,他因希望更多陪伴家人而离开公司。

Sora因每日计算成本高达100万美元而在上个月被关闭;OpenAI for Science将并入其他研究团队。韦尔和皮布尔斯均强调,长期创新需要独立的研究空间。

查看单篇正文查看原文
18

TechCrunch AI

Tokenmaxxing反而降低了开发者的生产力

·#ai-coding-assistants

Tokenmaxxing反而降低了开发者的生产力

文章提出了“tokenmaxxing”这一概念,指开发者更关注AI使用的token数量而非代码质量或产出。研究发现,尽管AI工具提高了代码生成量,但同时也带来了更高的代码返工率,即大量生成的代码需要后续修改甚至删除。

这一批判挑战了以输入(如token)衡量生产力的危险做法,而应关注输出(如稳定可用的软件)。它揭示了低效使用AI可能掩盖真实的生产力损失,并误导技术管理者。

文章指出,将AI token消耗量作为开发者生产力的指标是误导且适得其反的。开发者越来越倾向于优化token使用而非有意义的结果,导致写出更多代码但真正能保留下来的却很少。Waydev、GitClear和Faros AI等公司提供的证据显示,AI辅助编码显著增加了代码返工率——有时甚至超过生产力提升幅度。这种趋势削弱了真正的效率,因为工程师花时间修改AI生成的代码而不是开发新功能。

AI编码代理的兴起要求采用更注重质量和稳定性的指标,而非单纯的代码量。像Atlassian这样的行业巨头已经意识到这一变化,收购了工程智能公司DX。最终目标应该是可持续的高质量产出,而非膨胀的token计数。

Waydev的数据表明,虽然AI生成的代码初始接受率高达80%-90%,但经过修订后只有10%-30%真正留在生产环境中。Faros AI报告称,在高AI采用情况下,代码返工量增加了861%,说明当前工作流存在严重低效。

查看单篇正文查看原文
19

TechCrunch AI

AI圈内外差距扩大,伴随重大投资与伦理争议

·#ai

AI圈内外差距扩大,伴随重大投资与伦理争议

OpenAI正在收购如Hiro这样的AI个人理财应用,而Allbirds等公司则转型为AI基础设施企业。Anthropic甚至向美联储主席杰罗姆·鲍威尔演示了一个声称过于强大不能公开发布的模型。

这一鸿沟的扩大反映出人们对AI开发透明度、公平性和公众信任日益增长的担忧。当业内人士进行高风险投资并展示先进模型时,普通大众却可能感到无知或怀疑——这可能会引发监管审查和市场分化。

TechCrunch的Equity播客探讨了AI圈内人与圈外人之间差距加深的原因,包括巨额投资、品牌重塑和伦理困境。OpenAI收购了AI理财工具Hiro,而Allbirds则从鞋类业务转向AI基础设施。Anthropic向美联储主席杰罗姆·鲍威尔展示了高度强大的模型,引发了关于安全性和披露的疑问。

芯片制造商通过Wayve押注自动驾驶,数据中⼼初创公司Fluidstack据报道已与Anthropic达成500亿美元协议。节目还分析了tokenmaxxing——一种用户试图最大化token使用的做法——其动机并非提升性能而是制造生产力假象,暗示这更像内部指标游戏而非真实价值。

Tokenmaxxing——即用户为追求地位或效率而优化token使用的行为——被指出更多是出于表面效果而非实际效率。节目中还提到,AMD、Arm和高通向英国自动驾驶初创公司Wayve投资了6000万美元,表明对自动驾驶基础设施的信心。

查看单篇正文查看原文
20

TechCrunch AI

我们是不是在TokenMaxxing的路上走向了无解?

·#ai

我们是不是在TokenMaxxing的路上走向了无解?

TechCrunch的Equity播客探讨了OpenAI和Anthropic等AI公司如何通过收购、基础设施投资以及争议性模型演示(如向美联储主席杰罗姆·鲍威尔展示强大AI)重塑行业。

这一AI专家与公众之间的鸿沟正在加剧,引发人们对透明度、权力集中以及AI深度嵌入金融和治理等领域时民主问责制的担忧。

在这期TechCrunch播客中,主持人Kirsten Korosec、Anthony Ha和Sean O’Kane探讨了AI公司如何迅速扩展其在各行业的影响力。OpenAI正在收购如Hiro这样的金融科技初创公司,表明其进军企业应用的决心;与此同时,Anthropic因向美联储主席杰罗姆·鲍威尔展示一个高度强大的AI模型而引发关注,尽管该公司声称该模型过于危险无法公开发布。

讨论还涉及更广泛的趋势,例如Allbirds在出售鞋类业务后转型为AI基础设施公司,以及斯坦福研究指出AI专家与普通公众之间日益扩大的鸿沟。这些发展反映了AI公司在获得前所未有的系统控制权的同时所面临的伦理困境。

该集节目突出了OpenAI收购个人理财初创公司Hiro,以及Anthropic决定向美联储演示其先进模型但拒绝公开发布——这一举动凸显了创新与控制之间的紧张关系。

查看单篇正文查看原文
21

The Decoder

谷歌将AI模式更深嵌入Chrome,减少用户直接访问网站

·#google

谷歌将AI模式更深嵌入Chrome,减少用户直接访问网站

谷歌正在重新设计Chrome,使在AI模式中点击的链接会在同一标签页内以侧边面板形式打开,而不是跳转到新页面。一个新的‘加号菜单’允许用户将已打开的标签页、图片和PDF文件直接输入AI模式以获取上下文响应。

这一变化减少了对出版商的自然流量,因为用户会留在谷歌的界面内而不去独立探索网站。这加速了谷歌从搜索引擎向AI助手的转变,可能重塑人们发现和消费网络内容的方式。

谷歌正通过将AI模式更紧密地整合进Chrome来改变用户体验:点击链接时页面会在聊天窗口旁边以侧边面板形式打开,无需离开搜索对话框。用户还可以使用新的加号菜单分享已打开的标签页、图片和PDF文件给AI模式,从而基于多个来源合成答案。尽管谷歌强调用户仍访问网站,但这种设计让用户难以深入接触原始内容。

例如,购物者可以在查看零售商页面的同时询问产品的清洁说明。这一变化提升了便利性,但也威胁到了出版商的收入和SEO可见度,因为更少用户会跳转到AI生成摘要之外的内容。

虽然谷歌声称用户仍然访问网站(且页面浏览量会被记录),但体验现在将用户保留在聊天环境中——这使得他们更不可能滚动、进一步点击或看到原始网站上的广告。该功能首先在美国推出。

查看单篇正文查看原文
22

The Decoder

阿里巴巴Qwen3.6在代理编程基准测试中超越谷歌Gemma 4

·#ai-models

阿里巴巴Qwen3.6在代理编程基准测试中超越谷歌Gemma 4

阿里巴巴发布了Qwen3.6-35B-A3B开源模型,在代理编程基准测试中表现优于谷歌的Gemma 4。该模型采用专家混合架构,每次仅激活350亿参数中的三个,从而提升效率。

这一性能突破表明开源模型正在快速缩小与专有模型在实际编程任务中的差距,同时突显了MoE等高效架构如何让强大AI更易于部署和使用。

阿里巴巴最近推出了Qwen3.6-35B-A3B开源AI模型,在代理编程基准测试中表现优于谷歌的Gemma 4——这是衡量代码生成助手实际应用能力的关键指标。该模型采用专家混合架构,每次推理仅激活350亿参数中的三个,显著降低计算成本,同时保持高质量输出。用户可以通过Qwen Studio体验,也可通过阿里云Model Studio API(命名为Qwen3.6 Flash)访问,或从Hugging Face和ModelScope下载模型权重。

此发布紧随更大的Qwen3.6-Plus版本之后,显示阿里巴巴持续投资于可扩展且高效的开源模型。这一成功表明,开源模型在代理编程等专业领域已能与领先的专有系统竞争。

该模型支持思考模式和非思考模式,可通过Qwen Studio、阿里云Model Studio API(命名为Qwen3.6 Flash)或从Hugging Face和ModelScope下载权重获取。

查看单篇正文查看原文
23

The Decoder

Claude流量几乎翻三倍,ChatGPT份额下降

·#ai-market-trends

Claude流量几乎翻三倍,ChatGPT份额下降

Claude的流量份额从2.2%飙升至6.02%,而ChatGPT在同一时期从77.43%降至56.72%。Google Gemini则因谷歌在Android上的整合策略,份额跃升至25.46%。

这一变化反映了AI聊天机器人市场中用户行为的实时转变,表明竞争已超越OpenAI,凸显了平台策略(如谷歌的Android推送)如何迅速重塑用户采纳模式。

根据Similarweb的数据,Claude的流量份额在一个月内从2.2%飙升至6.02%,超过了Deepseek和Grok。与此同时,ChatGPT虽然仍是领先者(56.72%),但相比去年的77.43%大幅下滑。Google Gemini成为最大赢家,份额从6%跃升至25.46%,很可能得益于其在Android上的积极推广策略,包括将搜索查询引导至Gemini聊天界面的通知机制。

这标志着AI模型格局的重大转变,新玩家正在快速获得市场份额,而传统巨头面临压力。数据显示,产品布局、用户体验和平台整合已成为当前AI市场竞争中的关键驱动因素。

尽管增长迅猛,Claude在整体市场中仍占很小比例——OpenAI CEO山姆·阿尔特曼指出,仅德克萨斯州的ChatGPT用户就超过Claude全美用户的总和。

查看单篇正文查看原文
24

The Decoder

部分OpenAI股东质疑Altman能否引领公司上市

·#ai

部分OpenAI股东质疑Altman能否引领公司上市

部分OpenAI股东质疑CEO萨姆·阿尔特曼能否带领公司完成估值约8500亿美元的IPO。前Salesforce联合CEO布雷特·泰勒被视为潜在接班人。

这种内部质疑可能推迟或阻碍OpenAI的公开上市,影响投资者信心,并引发业界对该公司领导层稳定性的担忧。同时,也暴露了阿尔特曼私人投资带来的利益冲突问题。

据《华尔街日报》报道,一些OpenAI股东怀疑CEO萨姆·阿尔特曼是否能成功带领公司实现约8500亿美元的IPO。这些疑虑来自战略调整——例如缩减Sora视频应用和ChatGPT的‘成人模式’等高调产品——以及阿尔特曼个人在多家公司的投资利益。值得注意的是,阿尔特曼曾推动OpenAI领投他持有重大股份的融合初创公司Helion和火箭公司Stoke Space的融资。

与此同时,由阿尔特曼引入的产品负责人菲吉·西莫正在休病假,且尚未指定临时负责人。前Salesforce联合CEO布雷特·泰勒作为阿尔特曼的支持者,成为董事会若决定更换领导人时的潜在人选。

阿尔特曼因主导为他持股的融合初创公司Helion和火箭公司Stoke Space融资而受到关注,这两家公司都与他的家族办公室Hydrazine Capital有关。此外,Sora视频应用和ChatGPT的‘成人模式’正被削减。

查看单篇正文查看原文
25

The Decoder

Anthropic 推出 Claude Design,可将聊天对话转化为原型和营销素材

·#ai

Anthropic 推出 Claude Design,可将聊天对话转化为原型和营销素材

Anthropic 推出了 Claude Design,这是一个研究预览工具,能通过基于聊天的交互生成原型、幻灯片和营销素材,使用的是 Claude Opus 4.7 视觉模型。

这标志着生成式 AI 在产品团队和营销人员中的实用性迈出了重要一步,能够将聊天提示直接转化为交互式原型和演示文稿等专业产出。

Anthropic 推出了 Claude Design,这是 Anthropic Labs 下的新工具,可将聊天对话转化为线框图、演示文稿和交互式原型等视觉输出。该工具基于强大的 Claude Opus 4.7 视觉模型,目前作为研究预览版提供给 Pro、Max、Team 和企业订阅用户。用户可以通过对话、内联编辑或自定义滑块(如间距、颜色和布局)来优化设计。

它还能读取现有设计系统和代码库,自动应用品牌规范。团队可在共享聊天会话中协作,完成的设计可直接交给 Claude Code 实现。支持导出为 PPTX、PDF、HTML 和 Canva 格式,并可通过组织内部链接分享。

Claude Design 支持导出为 PPTX、PDF、HTML 和 Canva 格式,并能读取代码库和设计文件,以在项目间建立一致的设计系统。

查看单篇正文查看原文
26

The Decoder

Physical Intelligence 的 π0.7 机器人展现类大模型泛化能力

·#robotics

Physical Intelligence 的 π0.7 机器人展现类大模型泛化能力

Physical Intelligence 推出了 π0.7 机器人基础模型,该模型能像语言模型一样从多样化的上下文训练数据中重新组合技能,从而实现通过组合泛化完成新任务的能力。

这标志着向更灵活、通用的机器人迈进的重要一步,因为该模型无需特定任务微调即可跨任务和机器人泛化,有望减少昂贵的专业化训练需求。

Physical Intelligence 的 π0.7 机器人模型通过组合来自多样化训练数据的技能展示了组合泛化能力,包括自然语言指令、实验元数据和运行时生成的子目标图像。它在新机器人平台上实现了与人类远程操作员相当的零样本迁移性能。例如,在逐步语言指导下,它成功将红薯放入空气炸锅,尽管此前没有针对此任务的直接训练数据。

该模型利用轻量级世界模型在执行过程中生成子目标图像。研究人员承认可能存在数据污染问题,但他们认为技能重组——无论来源如何——才是真正泛化的关键。这种方法使单一模型在洗衣折叠和制作浓缩咖啡等任务上达到多个专用模型的性能。

该模型结合了谷歌的 Gemma3(40亿参数)与一个8.6亿参数的动作专家;训练包含丰富的上下文信息,如子任务指令、性能元数据以及运行时生成的子目标图像。

查看单篇正文查看原文
27

The Decoder

中国称Meta收购Manus为‘阴谋’,限制创始人出境

·#ai

中国称Meta收购Manus为‘阴谋’,限制创始人出境

中国国家安全委员会将Meta以20亿美元收购AI初创公司Manus的交易定性为‘阴谋’,试图削弱中国科技基础,此举触发多部门联合审查,并限制联合创始人肖红和季一超出境。

这一举措反映了北京对外国控制敏感人工智能技术日益增长的担忧,表明其正在收紧跨境科技投资规则——可能抑制国际间的人工智能合作与创新。

北京正式将Meta收购AI初创公司Manus的交易定性为‘阴谋’,意图削弱中国的科技能力。由习近平主席领导的国家安全委员会已启动多部门调查,动用出口管制、投资法和反垄断工具。联合创始人肖红和季一超在3月被国家发改委约谈后,被禁止离开中国。

尽管Meta声称遵守当地法律,但中国政府明确表示不会容忍类似交易。一些国内投资者正考虑撤回该交易。此案凸显了地缘政治紧张局势如何日益影响全球科技政策决策。

Manus在2025年夏季从北京迁至新加坡后于12月被Meta收购;其联合创始人被中国国家发改委约谈,并被禁止离开中国,部分投资者正考虑撤销该交易。

查看单篇正文查看原文
28

The Verge AI

OpenAI前Sora负责人比尔·皮布尔斯离职,公司战略转向编码与企业应用

·#ai

OpenAI前Sora负责人比尔·皮布尔斯离职,公司战略转向编码与企业应用

曾领导OpenAI Sora视频生成项目的比尔·皮布尔斯正在离职,这是公司向编程和企业应用聚焦的更广泛调整的一部分。前AI科学副总裁凯文·韦尔也已离开,其团队将被整合进其他研究小组。

此次离职标志着OpenAI从Sora等实验性生成模型转向更具商业价值的代码辅助和企业工具,反映了长期研究与短期产品目标之间的内部张力,可能影响公司的创新节奏。

前Sora项目负责人比尔·皮布尔斯宣布离开OpenAI,这标志着公司正在进行的一系列组织调整之一。他称赞OpenAI独特的文化支持非常规研究,认为这是Sora成功的关键。这一离职紧随Sora项目上个月被取消之后,表明公司正从高风险但盈利前景不明的副项目中撤退。

另一位高管凯文·韦尔也已离职,其团队将被整合进其他研究方向。最近推出的Prism研究工作区将被停用,其功能将并入Codex桌面应用。这些举措体现了OpenAI避免‘旁支项目’、集中于编码和企业解决方案的核心战略。

皮布尔斯赞扬OpenAI领导层营造了鼓励非主流研究的环境,并强调保持‘熵’对研究实验室长期繁荣的重要性。由韦尔负责的Prism工作区将被停用,其功能将整合进Codex桌面应用。

查看单篇正文查看原文
29

The Verge AI

Anthropic新网络安全模型或助其修复与美国政府关系

·#ai-ethics

Anthropic新网络安全模型或助其修复与美国政府关系

Anthropic发布了名为Claude Mythos Preview的新型网络安全AI模型,旨在发现主流软件系统(如浏览器和操作系统)中的关键漏洞。此举发生在该公司与特朗普政府因AI伦理和国家安全问题发生公开争执之后。

这一进展可能标志着Anthropic重新赢得美国政府信任的战略转折点,尤其是在网络安全威胁加剧、美国试图抗衡中国技术进步的背景下。这也反映出AI公司必须同时应对技术和政治环境的变化。

此前因AI伦理和国家安全问题与特朗普政府对立的Anthropic公司,正通过发布Claude Mythos Preview这一尖端网络安全模型来重建关系。该模型能识别广泛使用软件中的高风险漏洞,对保护关键基础设施具有价值。苹果、英伟达和摩根大通等大型企业已签约使用,且有报道称美国情报界和网络安全与基础设施安全局(CISA)正在评估该模型。

CEO达里奥·阿莫迪据报与白宫幕僚长苏西·韦尔斯会面,表明政府兴趣正在回升。这一转变可能促使更广泛的政府采纳,包括国防部重新考虑使用Anthropic的AI模型。

Claude Mythos Preview目前仅对私有用户开放,已被苹果、英伟达和摩根大通等公司采用。美国情报界和网络安全与基础设施安全局(CISA)正在测试该模型,且Anthropic已聘请一家与特朗普有关联的游说公司以推动其对外沟通。

查看单篇正文查看原文
30

ZDNET AI

谷歌新推出的Gemini Mac应用支持无缝窗口共享以提供AI辅助

·#ai

谷歌新推出的Gemini Mac应用支持无缝窗口共享以提供AI辅助

谷歌推出了专为Mac设计的Gemini桌面应用,用户无需切换应用即可分析任意打开窗口的内容。这一功能消除了在工作流中中断去访问AI助手的需求。

这项改进通过减少上下文切换显著提升了生产力,使AI工具更深度融入Mac用户的日常工作中,对专业人士和高级用户尤其重要。

谷歌发布了适用于Mac的新版Gemini桌面应用,不仅包含网页版所有功能,还新增了强大的“任意窗口内容分析”能力。用户可通过简单菜单选项与Gemini共享任何打开的窗口,实现实时摘要或问答。该应用可通过Dock、应用程序文件夹或自定义键盘快捷键(如Option + Space调出迷你聊天窗口)访问。

它支持多种模式(快速、思考、专业)、文件上传、Google NotebookLM、Canvas以及图像、视频和音乐生成功能。尽管目前仅限于Mac平台——不像ChatGPT或Copilot那样同时支持Windows和Mac——但这标志着AI在Mac生态中的深度融合迈出了重要一步。

该应用需要Apple Silicon Mac(M1或更新型号)和macOS Sequoia 15或更高版本;支持键盘快捷键和系统权限以实现窗口共享,但用户应避免分享敏感信息。

查看单篇正文查看原文
31

Simon Willison

·#python

Datasette 1.0a28 修复兼容性问题并新增测试自动清理功能

Datasette 1.0a28 修复了 1.0a27 中一个兼容性错误,即使用非 'conn' 参数名的回调函数会出错;新增了 datasette.close() 方法用于关闭所有资源,并加入了 pytest 插件以在测试中自动清理临时实例。

此次更新提升了测试的可靠性并防止文件描述符泄漏,对使用 Database(is_temp_disk=True) 功能开发插件或运行长时间测试的开发者尤为重要。

Simon Willison 发布了 Datasette 1.0a28 来修复上一版本 1.0a27 引入的关键问题。一个主要问题是 execute_write_fn() 回调函数若使用非 'conn' 参数名会失败,现已解决。新添加的 datasette.close() 方法会在服务器停止时自动关闭所有数据库及相关资源。

此外,新增的 pytest 插件可确保在函数作用域 fixture 中创建的临时 Datasette 实例在测试结束后被清理,避免因文件描述符耗尽导致的问题——这是自 1.0a27 引入 is_temp_disk=True 后插件测试套件中常见的问题。大部分改动由 Claude Opus 4.7 实现。

该修复解决了问题 #2691(回调参数名称处理),通过 pytest 插件实现了自动资源清理(#2692),并确保 database.close() 正确关闭写入连接(#2693)。

查看单篇正文查看原文
32

TechCrunch AI

Anthropic推出Claude Design,支持AI驱动的视觉原型制作

·#ai

Anthropic推出Claude Design,支持AI驱动的视觉原型制作

Anthropic推出了Claude Design,这是一个实验性AI工具,用户可以通过自然语言提示生成和优化如幻灯片和应用原型等视觉原型。该产品目前面向Claude Pro、Max、Team和Enterprise订阅者提供研究预览版本。

这项发布降低了非设计师快速创建专业视觉内容的门槛,可能改变产品经理和创始人在引入设计师前构思原型的方式。这也表明Anthropic正更加专注于企业级和生产力工具。

Anthropic宣布推出Claude Design,这是一个实验性AI工具,旨在帮助非设计师通过自然语言提示创建如幻灯片、一页纸和应用原型等视觉原型。用户只需描述需求(比如一个宁静的冥想应用),Claude就会生成初版,再通过直接编辑或文字指令进行调整。与Canva等竞品不同,Claude Design针对的是从零开始而非已有设计平台的用户。

它支持导出为PDF、PPTX或URL格式,并可无缝对接Canva用于协作编辑。该工具基于Claude Opus 4.7,还能自动应用公司的设计系统以保持品牌一致性。这一举措体现了Anthropic向企业级和专业用户市场扩展的更广泛战略,紧随其后推出的Claude Cowork和代理插件也印证了这一点。

Claude Design能通过读取公司代码库和设计文件来应用其设计系统,确保项目间的一致性,并支持导出为PDF、PPTX或URL格式,还可导入Canva进行进一步编辑。

查看单篇正文查看原文
33

The Verge AI

AI热浪遭遇现实:公众热情与技术进步的鸿沟

·#ai-ethics

AI热浪遭遇现实:公众热情与技术进步的鸿沟

《Vergecast》播客探讨了AI技术进步与公众热情之间的日益扩大差距,引用了Allbirds公司改头换面为AI企业后股价飙升的案例,以及斯坦福研究显示尽管AI不断改进,公众对其态度却在下降。

这一变化预示着AI炒作可能已达到顶峰,凸显了负责任采用AI的必要性——尤其是当企业急于贴上‘AI’标签而缺乏实质性整合时,用户即使频繁使用也感到不满。

本期《Vergecast》中,主持人戴维和尼莱探讨我们是否已达到AI炒作的顶峰。他们指出,Allbirds公司在宣称自己是AI企业后股价一度暴涨六倍,这是市场反应过度的信号。斯坦福一项新研究发现,尽管AI在许多方面变得更好,人们对它的热情却在下降。

即使是经常使用AI的人也表示后悔依赖它。节目还讨论了山姆·阿尔特曼近期遭遇袭击事件,反映出推动AI普及者与抵制者之间的广泛张力。该集内容结合数据与社会氛围,提供了对当前AI在公众认知中地位的细致分析。

斯坦福2026年AI研究显示,尽管AI在各项任务中的表现持续提升,但公众愿意接触AI的意愿却在下降;与此同时,山姆·阿尔特曼遭遇袭击事件突显出AI乐观派与怀疑派之间日益加深的分歧。

查看单篇正文查看原文
34

ZDNET AI

长时间使用AI可能危害健康与工作效率

·#ai-ethics

长时间使用AI可能危害健康与工作效率

ZDNET文章警告称,长时间使用ChatGPT等AI工具可能导致认知疲劳、错误信息甚至危险妄想。建议将AI交互限制在定义明确的小任务上,而不是进行长时间的深度互动。

随着AI日益融入日常工作和个人生活,理解其局限性对保持心理健康、提高工作效率和确保安全至关重要,尤其是在医疗或复杂决策等高风险领域。

文章强调,尽管AI在处理简单且定义明确的任务(如信息检索或流程执行)方面有所进步,但仍不适合长时间或复杂的认知工作。长时间使用可能导致用户陷入无休止的互动循环,从而降低效率、产生错误信息,甚至引发有害妄想。

专家建议将AI视为专注工具而非对话伙伴。斯坦福大学《2026年人工智能指数》的基准测试显示,AI在特定领域已接近人类水平,但在需要深度推理或情境理解的领域仍有明显差距。

AI在数据库更新和网页浏览等常规多步骤任务中表现良好(如GAIA测试准确率为74.5%,人类为92%),但在深度推理、逻辑判断和长篇分析方面仍远落后于人类。

查看单篇正文查看原文
35

ZDNET AI

2026年AI网站构建工具:Hostinger凭借实用改进领跑

·#ai

2026年AI网站构建工具:Hostinger凭借实用改进领跑

2026年,AI驱动的网站构建工具相比去年有了显著提升,Hostinger因实测表现优异成为首选。文章指出,大多数厂商现在都提供了可用的聊天机器人界面和基础AI编码功能——而去年几乎没有产品能可靠运行。

这标志着AI网站构建工具已从实验阶段转向实际可用,对中小企业和开发者具有重要价值。它体现了AI辅助网页开发的真实进展,并为用户选择平台提供了实用指导。

ZDNET发布的2026年更新评估了AI驱动的网站构建工具,指出相比去年有显著进步。作者通过构建一个以福尔摩斯侦探事务所为主题的模拟业务网站进行测试,设定统一的设计约束条件。Hostinger因其可靠的聊天界面、文本转图像支持以及有效的布局和内容建议脱颖而出。

GoDaddy也展示了明显进步,整合了基础CSS编辑功能。然而,所有工具在图像生成质量上仍表现不佳,因此建议使用第三方AI图像生成工具。结论明确:与2025年不同,如今用户可以放心依赖某些AI构建工具完成实际项目。

Hostinger的AI在网站结构、内容生成和主题选择方面表现出色,但仍然缺少完整的CSS代码生成能力。文章建议使用外部工具(如ChatGPT图像生成器或Google的Nano Banana)来替代内置图像功能。

查看单篇正文查看原文
36

Financial Times AI

·#robotics

人形机器人在华沙驱赶野猪

一台戴着劳力士手表的人形机器人被部署在华沙街头驱赶野猪,因视频走红社交媒体,成为波兰首个机器人网红。

这一事件展示了人形机器人在城市环境中的实际应用潜力,超越了工厂场景,引发了公众对机器人未来在城市管理中角色的关注。

一台戴着手表的人形机器人被部署在华沙,用于驱赶闯入居民区的野猪。这台机器人奇特的外形和坚定的行为引发广泛关注,在社交媒体上迅速走红。它很快在社交平台上积累了大量粉丝,成为波兰首个机器人网红。

虽然这不是一项技术突破,但展示了机器人在城市环境中实用性的可能,并凸显了公众参与如何放大人工智能设备的影响。该事件还激发了人们对这类机器人未来融入城市日常生活的兴趣。报道中未提及任何技术限制或故障。

机器人佩戴的奢侈手表显著提升了其传播度,表明在面向公众的机器人设计中,外观和品牌比功能本身同样重要。

查看单篇正文查看原文
37

The Verge AI

Tinder为通过“球形验证”的用户赠送免费推广机会

·#ai-ethics

Tinder为通过“球形验证”的用户赠送免费推广机会

Tinder现在为使用World公司面部扫描“球形设备”验证身份的用户提供五个免费推广机会。这是该身份验证系统从日本扩展到包括美国在内的部分市场的最新进展。

这一举措反映了社交应用平台越来越重视通过真人验证来打击机器人账号和虚假资料,从而提升约会平台的信任与安全。同时也表明AI驱动的身份验证技术正逐步融入日常数字服务,如约会软件和视频会议工具。

Tinder已与由OpenAI首席执行官山姆·阿尔特曼共同创立的World公司合作,为前往其面部扫描“球形设备”进行身份验证的用户提供五个免费推广机会。这些设备会拍摄用户的面部和眼睛照片,加密后存储在用户设备上,而非中央服务器。完成验证后,用户可在Tinder上获得“真人认证徽章”,并将其World ID链接至Zoom和DocuSign等其他服务。

该项目最初在日本试点,现已扩展至美国及其他选定市场。尽管传统验证方式(如政府证件或头像)依然可用,但此次推广活动仅限于通过球形设备验证的用户。

这些设备会采集用户的面部和眼部数据,并加密存储在用户手机本地——确保只有用户本人能控制其生物识别信息。验证流程目前仅限于Tinder、Zoom和DocuSign等特定应用,且不使用集中式数据库。

查看单篇正文查看原文
38

The Verge AI

这款迷人的设备用AI写糟糕的诗

·#ai

这款迷人的设备用AI写糟糕的诗

Poetry Camera 是一款物理设备,它拍摄图像并生成由AI写的诗歌,而不是照片,然后打印在热敏纸上。它通过Wi-Fi连接云端AI模型,根据所拍场景生成诗意描述。

它代表了AI创意与实体硬件的新颖结合,挑战了我们如何在日常物品中与生成式AI互动。该设备引发了关于AI在艺术中的角色以及物理物品在数字世界中价值的讨论。

Poetry Camera 是一款充满趣味的设备,它用AI生成的诗歌替代传统摄影。这款设备由前Twitter和Google员工设计,拍摄图像后发送到云端,再将短诗打印在收据纸上。尽管其设计可爱、连接方式巧妙(比如用二维码配对),但常产出缺乏灵感或尴尬的诗句。

用户可以通过网页界面调整提示词,但过程是试错式的。该设备无屏幕且依赖纸质输出,让人感觉像复古科技产品,但也凸显了当前AI诗歌生成的局限性。

这款相机没有屏幕或应用程序——用户通过网页门户生成二维码来连接,还可以为不同诗风定制提示词。当连接失败时,它会以诗歌形式打印错误信息,增添了它的怪趣魅力。

查看单篇正文查看原文
39

The Verge AI

Dairy Queen在点餐亭部署AI聊天机器人以提升点餐速度和准确性

·#ai

Dairy Queen在点餐亭部署AI聊天机器人以提升点餐速度和准确性

Dairy Queen正在美国和加拿大的部分门店推出由Presto开发的AI语音点餐机器人,此前测试成功。该技术准确率约为90%,有助于提升点餐效率。

这标志着快餐行业自动化服务趋势的进一步发展,可能提升运营效率并减少人为错误。同时表明AI可在不完全取代人工的情况下融入实际业务流程。

Dairy Queen正在美国和加拿大的数十家门店部署由Presto开发的AI语音点餐机器人。这些机器人在测试中表现出约90%的订单准确率,即使在高峰期(如免费冰淇淋促销)也能稳定运行。不同于完全自动化的系统,Presto采用人工远程辅助模式——例如菲律宾的工作人员会在必要时介入。

其他连锁品牌如Wendy's、麦当劳和塔可钟也尝试过类似技术,但部分因顾客不满而调整策略。Dairy Queen强调这套系统旨在提升服务体验,而非替代员工,并希望通过优化点餐流程促进加单和缩短等待时间。

该聊天机器人由菲律宾等地的人工操作员辅助支持,Dairy Queen曾在提供免费冰淇淋的高峰时段进行测试,表现稳定可靠。

查看单篇正文查看原文
40

ZDNET AI

如何获得苹果教育折扣,以499美元购买MacBook Neo

·#apple

如何获得苹果教育折扣,以499美元购买MacBook Neo

苹果现在提供教育折扣,将MacBook Neo的价格从599美元降至499美元,适用于符合条件的学生、教职员工和家长。文章详细说明了如何申请资格以及在哪里购买,同时警告可能出现2到3周的发货延迟。

这使得MacBook Neo成为史上最便宜的Mac之一,对寻求可靠且实惠笔记本的学生和教育工作者来说极具吸引力。这也体现了苹果通过具竞争力的价格拓展教育市场的策略。

苹果最近推出了价格亲民的MacBook Neo,原价599美元,但符合条件的学生和教育工作者可享受教育折扣,仅需支付499美元。资格要求包括在美国教育机构就读或任教,涵盖家庭教育教师及为子女购买的家长。苹果在结账时不会验证资格,但部分订单可能需要通过邮件提交学生证或注册证明。

购买可通过苹果教育商店在线完成,也可在苹果零售店或校园经销商处进行。然而,由于目前预计发货延迟长达三周,特别是准备开学季的用户应尽快下单。

符合条件者包括美国当前或新录取的大学生、这些学生的家长,以及K-12或高等教育机构的教职员工;验证是随机的,可能需要通过电子邮件提交注册证明。目前预计发货延迟为2至3周。

查看单篇正文查看原文
41

ZDNET AI

AirTags五年后仍领先,但竞争对手逐渐赶上

·#bluetooth-tracking

AirTags五年后仍领先,但竞争对手逐渐赶上

ZDNET对AirTags进行了五年后的重新评测,发现它们仍然是最可靠和精准的蓝牙追踪设备,而第三方标签(如Tile)现在在iOS和Android上都能良好运行。

这项对比帮助消费者判断AirTags是否依然具有独特优势,还是新出现的替代品已能提供相当的价值——尤其是在自2019年以来追踪器市场大幅增长的背景下。

经过五年的使用,作者确认Apple AirTags在可靠性和精度方面仍然优于大多数第三方追踪器。它们利用超宽带(UWB)技术实现厘米级定位,并受益于苹果超过十亿设备的庞大生态系统。尽管Tile等品牌改善了其网络,但AirTags凭借UWB技术和与苹果设备的无缝集成仍具优势。

文章还比较了苹果的Find My网络和谷歌的Find Hub,发现两者都有效,但苹果在性能上仍占优。作者通过一次公路旅行测试了防水性和“丢失模式”功能,展示了实际使用中的耐用性。总体而言,AirTags依然是组织日常物品的生活利器。

第二代AirTags配备了U2芯片以提升精度、更响亮的扬声器以及改进的蓝牙功能;谷歌的Find Hub现在为安卓用户提供与苹果Find My网络竞争的服务。

查看单篇正文查看原文
42

ZDNET AI

为什么我从iPhone热点换成了Acer Connect M6E

·#mobile-networking

为什么我从iPhone热点换成了Acer Connect M6E

作者评测了Acer Connect M6E 5G旅行路由器,发现它比用iPhone作为移动热点更可靠高效。该设备具备耐用设计、强劲电池续航,并可通过Wi-Fi 6E支持多达20台设备。

这篇评测对需要多设备稳定联网的旅行者和远程工作者非常有价值,尤其是当使用安卓或其他非苹果设备时。它突显了专用热点在实际场景中优于智能手机的表现。

作者最初依赖iPhone热点,但发现其连接不稳定、速度慢且耗电严重,尤其在连接安卓设备时问题突出。测试Acer Connect M6E后,他对其坚固结构、长达36小时的续航能力和稳定的高速性能印象深刻。该设备采用联发科芯片搭配4GB内存,通过Wi-Fi 6E最多支持20台设备同时连接。

它提供多种联网方式:nano-SIM、eSIM或内置虚拟SIM(可在135个国家使用)。其坚固设计和WPA3加密、VPN等高级安全功能使其成为经常出差和远程办公用户的理想选择。

该设备配备8000mAh电池,最长可续航36小时网页浏览,支持最高达3.27 Gbps的5G网络,并具有IP68和MIL-STD-810H防护等级。同时提供SIM卡、eSIM及虚拟SIM选项以实现全球连接。

查看单篇正文查看原文
43

ZDNET AI

2026年最佳WordPress主机服务:专家评测

·#wordpress

2026年最佳WordPress主机服务:专家评测

ZDNET发布了2026年最佳WordPress主机服务商的年度评测,强调稳定性、可靠性和一键安装是关键标准。文章基于测试更新了推荐名单,包括价格变动和WordPress生态系统的新进展。

选择合适的主机直接影响网站性能、安全性和用户体验——这对企业和博主都至关重要。该指南帮助用户避免常见陷阱,选择能支持长期发展的服务,无需复杂技术。

ZDNET的2026年评测基于稳定性、停机时间、客户服务和易用性评估主流WordPress主机服务。它推荐一个提供一键安装和从每月2美元起的可扩展计划的服务商。文章强调,并非所有声称支持WordPress的主机都可靠或物有所值。

近期新闻包括一个关键插件漏洞、WordPress推出的新AI助手,以及一家俄罗斯主机因勒索软件关联被制裁。该指南在2026年初多次更新,以反映真实反馈和行业变化。

首选方案提供每月2美元起的套餐,含三个月免费,强调性价比与可扩展性。评测还提到WordPress最新版本7.0 RC2及新推出的AI工具,用于内容生成和SEO优化。

查看单篇正文查看原文
44

ZDNET AI

如何关闭占用内存的程序以提升电脑速度

·#windows

如何关闭占用内存的程序以提升电脑速度

本文介绍了如何使用Windows任务管理器识别并终止占用内存的后台进程,重点包括浏览器、SysMain和开机启动项。

许多用户因隐藏的内存占用程序而感到电脑卡顿,这篇文章提供了无需复杂技术即可立即改善系统性能的实用方法。

当电脑运行缓慢时,检查任务管理器中的内存使用情况是最有效的排查步骤之一。文章指出三个主要问题:Chrome或Edge等浏览器因打开太多标签页而大量占用内存;SysMain(原Superfetch)是Windows预加载应用到内存的服务;以及自动开机启动但实际不用的应用程序。

文中详细说明了如何利用Chrome内置的任务管理器关闭高内存占用的标签页,通过services.msc停止并禁用SysMain服务,以及在任务管理器的‘启动’选项卡中管理开机自启程序。这些操作能显著提升响应速度,尤其对内存较小的设备效果明显。

文章特别建议通过任务管理器禁用SysMain服务(原名Superfetch)并管理开机启动项,以减轻较慢电脑的内存压力。

查看单篇正文查看原文