谷歌投资400亿美元支持Anthropic算力发展
此举强化了AI基础设施的战略重要性,并加剧科技巨头间对TPU等算力资源的竞争。
AI 日报
全球AI竞争进入新阶段:谷歌对Anthropic的巨额投资凸显算力战略地位,而DeepSeek V4系列以低成本高性能打破垄断,推动代理型AI普及。与此同时,ComfyUI获得3000万美元融资,彰显创作者对可控生成内容的强烈需求。
Overview
从 61 条资讯中筛选出 40 条
全球AI竞争进入新阶段:谷歌对Anthropic的巨额投资凸显算力战略地位,而DeepSeek V4系列以低成本高性能打破垄断,推动代理型AI普及。与此同时,ComfyUI获得3000万美元融资,彰显创作者对可控生成内容的强烈需求。
此举强化了AI基础设施的战略重要性,并加剧科技巨头间对TPU等算力资源的竞争。
通过新型注意力架构显著降低计算成本,使代理型AI在编码、工具调用中更可靠。
节点式工作流满足专业用户对AI生成内容的精细化控制需求,成为行业新焦点。
这类隐蔽攻击已成为大型语言模型的最大安全隐患之一,亟需系统性防御措施。
利用Home Assistant等开源平台,让闲置平板变成本地化控制中心,提升实用性。
Stories
Financial Times AI
·#ai
谷歌计划向Anthropic投资最多400亿美元,首期投入100亿美元,估值为3500亿美元,后续300亿美元取决于性能目标达成。这包括未来五年内通过谷歌云提供额外5吉瓦的TPU计算能力。
这笔巨额投资标志着AI基础设施发展的战略转变,并加剧了科技巨头之间对算力资源的竞争。这也凸显了计算能力在AI竞赛中与模型创新同等重要。
谷歌计划向Anthropic投资最多400亿美元,首期100亿美元,估值3500亿美元,后续300亿美元与业绩目标挂钩。此举紧随Anthropic发布强大新模型Mythos之后,该模型因潜在滥用风险仅限特定合作伙伴测试。
Anthropic还获得了亚马逊50亿美元投资,并与CoreWeave和谷歌云签订大规模数据中心协议,后者将在2027年起提供5吉瓦TPU算力。这些举措凸显了算力在训练先进AI模型中的关键作用,类似趋势也出现在OpenAI等其他公司身上。
Anthropic最新模型Mythos功能强大但因网络安全风险被限制使用,且已遭泄露。公司还从亚马逊获得50亿美元投资,并计划在未来投入高达1000亿美元用于算力采购。
Hugging Face Blog
DeepSeek-V4引入了压缩稀疏注意力(CSA)和重度压缩注意力(HCA)的新架构,大幅降低了百万token下的FLOPs和KV缓存内存占用。这使得代理能够执行长时间的工具调用任务,而不会因GPU内存不足或性能下降而中断。
这一突破使代理系统在编码、浏览和终端自动化等实际场景中更加可靠和可扩展,这些场景过去常受制于上下文长度限制。它也为大语言模型中的高效长上下文推理树立了新基准。
DeepSeek-V4通过重新设计注意力机制解决了长期代理工作流中的关键瓶颈,如KV缓存溢出和工具调用退化问题。它将注意力分为两部分:压缩稀疏注意力(CSA)将键值压缩4倍并为每个查询选择前k个块;重度压缩注意力(HCA)则压缩128倍并在压缩流上进行密集注意力计算。
这些层在模型堆栈中交替排列,并通过滑动窗口处理最近的token。结合FP8存储和MoE前馈层,显著降低了计算成本和内存占用,使百万token上下文不仅可能而且实用。
V4-Pro在百万token下相比V3.2减少27%的FLOPs和10%的KV缓存;V4-Flash进一步降至10%和7%。该架构交替使用CSA和HCA层,并通过FP8/FP4存储优化将缓存大小降至传统GQA模型的2%。
Simon Willison

·#ai
DeepSeek发布了V4系列的两个预览模型:DeepSeek-V4-Pro(总参数1.6万亿)和DeepSeek-V4-Flash(总参数2840亿)。两者均为专家混合(MoE)模型,支持最多100万token上下文,并采用MIT许可证。
这次发布对开源AI来说是一个重要里程碑——V4-Pro现在是最大的开源权重模型,以远低于GPT-5或Claude Opus的成本提供前沿性能,使开发者和研究者更容易获得先进大模型。
DeepSeek发布了其V4系列模型,包括DeepSeek-V4-Pro(总参数1.6万亿,活跃参数490亿)和DeepSeek-V4-Flash(总参数2840亿,活跃参数130亿),两者均采用专家混合架构,支持最多100万token上下文。这些模型采用MIT开源许可,相比之前的V3.2版本在规模和价格上都有显著提升。Simon Willison通过OpenRouter测试了它们,发现图像生成能力出色,例如画出骑自行车的鹈鹕。
定价非常低廉:Flash输入每百万token仅0.14美元,Pro为1.74美元,远低于GPT-5或Claude Opus等竞品。这使得大型语言模型更易于在消费级设备上本地部署,尤其是结合量化技术后。
Pro模型在Hugging Face上为865GB,Flash为160GB。Pro版本可能通过从磁盘流式加载活跃专家的方式在128GB M5 MacBook Pro上运行。量化版本可实现消费级硬件上的本地部署。
TechCrunch AI

·#ai
ComfyUI最初是一个开源项目,如今已发展为一家估值5亿美元的初创公司,并完成3000万美元融资。本轮融资由Craft Ventures领投,其他参与者包括Pace Capital和Chemistry。
这一里程碑凸显了创作者对AI生成内容精细化控制的强烈需求,尤其是在扩散模型日益强大但仍不完美的背景下。它表明市场对ComfyUI独特工作流的高度信任,该工具让创作者能超越提示词工具的能力来优化输出。
ComfyUI最初于2023年作为一个开源项目启动,旨在解决早期扩散模型(如手部结构错误)的问题,现已成长为一家估值5亿美元的高价值初创公司。最近完成的3000万美元融资使其成为创意专业人士追求精细控制AI输出的重要工具。其基于节点的工作流让用户可以构建自定义生成流程,比传统提示词界面提供更精确的控制能力。
尽管基础模型不断进步,ComfyUI仍是技术艺术家实现可靠性和可重复性的关键工具。公司称已有超过400万用户,甚至在招聘平台上出现了“ComfyUI艺术家”的职位名称。主要竞争对手包括去年被Figma收购的Weavy。
ComfyUI的节点式界面允许用户串联生成过程中的各个组件,实现精确控制——这是纯文本提示无法做到的。该工具目前已拥有超过400万用户,广泛应用于视觉特效、动画、广告和工业设计等领域。
The Decoder

深度求索发布了V4-Pro和V4-Flash两款开源权重模型,参数规模高达1.6万亿,上下文长度达一百万token,定价远低于OpenAI和谷歌等竞争对手。
这一突破性进展通过提供高性能且成本极低的模型挑战了头部AI公司的垄断地位,推动代理型AI的普及,并为开发者和研究人员带来更广泛的可及性。
中国AI实验室深度求索发布了两款强大的开源权重模型——V4-Pro(总参数1.6万亿)和V4-Flash(总参数2840亿),支持长达一百万token的上下文窗口。这两款模型在GDPval-AA等基准测试中表现优于大多数开源替代品,同时价格远低于GPT-5.4或Gemini 3.1 Pro。其关键技术是一种新的混合注意力机制,相比前代版本大幅减少了FLOPs和KV缓存使用量。
它们基于32至33万亿token的数据集训练,并通过从多个内部专家模型蒸馏优化而成,而非传统强化学习。这种效率、规模与成本的结合使其非常适合代理型AI应用场景。
这些模型采用一种新型混合注意力架构,将长上下文计算需求降低多达90%,并基于32至33万亿token训练,通过内部专用模型蒸馏优化。
The Verge AI

·#ai
美国军方的Project Maven项目是一个在谷歌因伦理争议退出后开发的AI瞄准系统,如今已成为现代战争的核心,并被北约采用。它将‘杀伤链’从数小时缩短到几秒,结合大语言模型后每天可处理多达5000个目标。
这表明军队是AI技术的早期使用者,其效率提升引发了关于自主瞄准和战时人类监督的紧迫伦理问题。Maven等系统带来的速度与规模正在重新定义全球冲突的节奏。
Project Maven于2017年启动,最初是一个利用无人机影像进行战场目标识别的计算机视觉实验。在谷歌因员工抗议退出后,项目由Palantir继续推进,并整合了微软、亚马逊和Anthropic的技术。如今该系统已在美军全面部署,并被北约采用,将目标识别周期从数小时压缩至几秒,每日可执行数千次打击。
最近对伊朗的军事行动中,仅一天内就完成了超过1000次打击。一起针对女子学校的误击事件凸显了数据库错误与快速AI处理相结合可能导致灾难性后果,强调了加强人工监督的重要性。
Maven通过Palantir的MSS平台整合卫星、雷达和社会媒体等多源数据,该平台使用Anthropic的Claude AI。该项目由海军陆战队上校杜鲁·库克尔推动,他希望为阿富汗前线士兵提供更好的情报工具。
The Verge AI

·#ai
深度求索发布了其下一代AI模型V4的预览版本,声称该模型可与OpenAI和Anthropic等美国领先系统竞争。该模型拥有1万亿参数、多模态能力,并针对NVIDIA和华为芯片进行了优化。
这标志着全球AI竞赛中的重要里程碑,尤其在中国试图减少对美国软硬件依赖的背景下。同时加剧了对AI开发中伦理边界的关注,包括关于模型滥用和芯片来源违规的指控。
中国AI公司深度求索发布了其V4模型的预览版,定位为OpenAI、谷歌和Anthropic等闭源模型的高性能开源替代品。V4具备1万亿参数、先进的编码能力及多模态支持,适用于AI代理和复杂任务。
此次发布正值中国加强自主研发AI生态系统的背景下,使用国产华为Ascend系列芯片备受关注。然而,深度求索也面临严重指控——包括使用被禁的英伟达芯片以及涉嫌通过伪造账号从Anthropic的Claude模型中提取知识——引发了国际AI发展中伦理和合规性的广泛担忧。
V4拥有1万亿MoE(专家混合)参数,支持高达100万token的上下文长度,每百万token成本为0.3美元。深度求索未披露训练成本或具体使用的硬件,但声称兼容国产华为Ascend芯片。
ZDNET AI

间接提示注入攻击通过在可信的外部内容(如网页或邮件)中嵌入恶意指令来利用AI系统,且无需用户交互即可触发。文章列出了六种实用的防御策略以阻止此类隐蔽攻击。
这类攻击已成为大型语言模型(LLM)的首要安全风险,可能导致数据泄露、钓鱼、虚假信息传播,甚至远程代码执行,对企业和终端用户构成严重威胁。
间接提示注入攻击发生在AI系统处理来自外部来源(如网站或电子邮件)的文本时,这些文本中包含隐藏的恶意指令。这些指令可导致AI执行意外操作,如生成钓鱼链接或泄露敏感数据,且无需任何用户交互。这种威胁尤其危险,因为它绕过了针对直接用户输入设计的传统防护机制。
OWASP为大型语言模型发布的Top 10安全风险中,提示注入位列第一,突显了其现实影响。研究人员已记录到实际案例,即AI助手在读取受损内容后执行有害行为。本文提供了六种可行的缓解措施,包括输入净化、上下文隔离和异常输出监控。
与需要用户直接输入的直接攻击不同,间接注入将恶意提示隐藏在看似无害的内容中,例如网页或社交媒体帖子,使其更难被发现和防范。
Ars Technica AI

三星可能在2026年首次出现智能手机业务的年度净亏损,原因是DRAM和NAND芯片价格飙升,尽管Galaxy S26销量强劲。内存成本已占手机总成本的20%以上,即使对高端机型也是如此。
这标志着智能手机行业的重大转变:市场趋于成熟且组件成本上升正在侵蚀利润空间。它还凸显了AI驱动的需求如何重塑全球半导体经济,从入门级手机到企业服务器都受到影响。
据内部消息,三星MX部门负责人TM罗警告称,公司可能在2026年首次出现智能手机业务年度净亏损。尽管Galaxy S26销量强劲,但DRAM和NAND价格飙升(2026年第一季度上涨超90%)使得手机难以盈利。内存成本如今占手机总成本的20%以上,远高于以往。
AI热潮推动了对LPDDR5x内存的巨大需求,英伟达的新款Vera CPU每台服务器将消耗1.5TB此类内存。与此同时,三星半导体部门正蓬勃发展,仅2026年第一季度就赚了380亿美元。为应对压力,三星已提高全线产品价格,包括中端A系列和折叠屏Z系列设备,并准备推出更昂贵的新机型。
智能手机中使用的LPDDR5x内存现在对AI性能至关重要,价格也更高——英伟达的Vera AI CPU每台服务器将使用1.5TB这种内存。三星半导体在2026年第一季度赚了380亿美元,但这无法弥补移动部门的亏损。
Ars Technica AI

一名40岁韩国男子因使用人工智能生成了一张假的狼出逃照片而被捕,这张照片误导了警方和救援人员,导致他们展开大规模搜救行动。
此案凸显了AI生成虚假信息对现实公共安全和野生动物保护工作的潜在危害,尤其是在涉及濒危物种时可能引发严重后果。
一只名叫Neukgu的两岁狼从大田动物园逃出后,韩国当局启动了全国范围的搜救行动,动用了无人机、警察、兽医和社区志愿者。一张由AI生成的假照片显示Neukgu出现在路口,引发了紧急警报并分散了资源。嫌疑人声称自己只是出于好玩才制作这张图,警方通过监控和AI工具使用记录锁定其身份并将其逮捕。
尽管最终Neukgu被安全送回动物园,但这一事件凸显了合成媒体干扰官方行动的风险。有趣的是,许多粉丝随后用AI庆祝Neukgu归来,发布了各种表情包和地图,体现出AI滥用与创意使用的鲜明对比。
该男子称制作图片只是为了娱乐,警方通过监控录像和AI工具使用记录确认了他的身份;他最高可能面临五年监禁或6700美元罚款。
Simon Willison
一个名为'honker'的新Rust SQLite扩展为SQLite引入了Postgres风格的NOTIFY和LISTEN语义,使Python中无需外部代理即可实现异步队列和持久事件流操作。
这项创新为希望获得事务性保证和实时行为但又不想使用PostgreSQL或Kafka的SQLite用户带来了轻量级可靠的通信机制,非常适合微服务、嵌入式系统或需要简单发布/订阅功能的应用。
'honker'项目由Russell Romney开发,通过Rust扩展为SQLite添加了Postgres风格的通知功能。开发者可以使用类似`queue.enqueue()`和`stream.publish()`的语法,在Python中直接创建异步队列和持久事件流。该扩展支持任务队列和类似Kafka的流,内置SQL函数如`notify()`和`honker_stream_read_since()`。
工作者可通过轮询WAL文件实现接近实时的更新,而无需昂贵查询。它采用事务性出站模式确保数据一致性,适合需要可靠性和简洁性的应用场景。
honker要求SQLite启用WAL模式,并通过每1毫秒检查一次.db-wal文件来高效检测变化;它实现了事务性出站模式,确保只有在事务成功提交后才将消息加入队列。
Simon Willison
·#ai
Anthropic的事故分析报告指出,Claude Code近期的质量问题源于三个系统框架(harness)中的漏洞,而非模型本身;其中一个关键漏洞会错误地每轮都清除模型记忆,导致其表现像“健忘”一样。
这一事件表明,即使底层AI模型正常运行,系统框架中的漏洞也会严重影响用户体验,凸显了在实际应用中对LLM工具链进行严格测试的重要性。
Anthropic最近调查了关于Claude Code质量下降的广泛投诉,发现系统框架层存在三个独立的漏洞。最显著的是3月26日引入的一个漏洞,它错误地每轮都清空模型记忆,而不是仅在空闲一小时后清理一次。这使得助手显得健忘且重复,尤其影响那些经常长时间离开会话后再回来的用户。
另一个问题是将默认推理强度从‘高’降至‘中’,虽然降低了延迟但损害了性能;该改动于4月7日被撤销。第三个漏洞涉及缓存和文本长度限制,也加剧了结果质量下滑。所有修复已于4月20日随版本2.1.116上线,Anthropic承诺今后加强内部测试。
一个关键漏洞导致每次对话轮次都会重置会话内存,而不是仅在会话空闲时重置一次,这直接影响了那些频繁返回长时间未使用的会话的用户——这是开发者的常见使用场景。
Simon Willison
spacecowboy 使用一个Go进程和SQLite在消费级硬件(一台游戏电脑)上为约7.2万人运行“为你推荐”feeds,该电脑配备16核CPU、96GB内存和4TB NVMe存储。
这表明高性能的去中心化推荐系统可以用极少的基础设施实现——挑战了集中式模型,并展示了基于用户行为(如点赞)的算法如何有效扩展。
spacecowboy 从一台个人游戏电脑上托管供约7.2万人使用的‘为你推荐’feeds,该电脑运行单一Go进程和SQLite。服务器接收Bluesky的火源流数据,仅保存最近90天的内容与互动信息。推荐逻辑基于喜欢相似内容的人还喜欢什么——利用用户生成的信号而非复杂机器学习模型。
一个每月7美元的VPS通过Tailscale处理公网流量,本地设备完成全部计算。当前配置理论上可支持所有100万每日活跃Bluesky用户,如果他们都采用此算法。总月成本低于30美元,是一种高效且可扩展的云方案替代品。
该系统存储90天的数据(约419GB),使用每月7美元的VPS通过Tailscale处理公网流量,总成本约为每月30美元——包括电费和域名费用。
TechCrunch AI

·#ai
前Meta AI工程师王维尧(Weiyao Wang)因在多模态感知和SAM3D项目中的贡献,现已加入Thinking Machines实验室(TML)。此次变动发生在TML与谷歌达成数十亿美元云合作协议之后,使其能使用英伟达最新的GB300芯片。
这一人才流动凸显了Meta等大公司与像TML这样的AI初创企业之间的激烈竞争。它表明顶尖研究人员正在选择初创公司,因为它们提供了与行业巨头相当的基础设施和更高的财务回报潜力。
王维尧在Meta工作八年,参与构建多模态系统并开发了SAM3D项目,最近转投Thinking Machines实验室(TML)。TML刚刚与谷歌达成数十亿美元云合作协议,可访问英伟达最先进的GB300芯片,使其地位与Anthropic和Meta相当。这家初创公司正快速扩张,不仅从Meta挖角,还吸引了来自苹果、OpenAI、微软和Waymo的资深人才。
知名加入者包括PyTorch联合创始人Soumith Chintala、Segment Anything模型作者Piotr Dollár等。尽管Meta曾试图收购TML并挖走其多名创始人,但TML如今也在反向大规模从Meta招人。凭借120亿美元估值和强大算力支持,TML已成为AI竞赛中不可忽视的新力量。
TML的新基础设施协议包括使用英伟达GB300芯片,使其成为首批部署该硬件的初创公司之一,地位与Anthropic和Meta相当。目前公司员工约140人,并积极从Meta及其他顶级AI实验室招聘人才。
TechCrunch AI

蒂姆·库克计划于9月卸任苹果CEO,由硬件主管约翰·特努斯接任。埃隆·马斯克正考虑以600亿美元收购AI编程平台Cursor。
这一领导层变动标志着苹果进入新阶段,尤其是在应用生态和AI基础设施竞争加剧的背景下。对Cursor的潜在收购突显了AI工具已成为SpaceX等科技巨头的关键资产。
随着蒂姆·库克计划于9月卸任苹果CEO,约翰·特努斯接任这一职位,苹果进入新时代。特努斯继承了全球最赚钱的公司之一,但必须面对一个已发生巨大变化的环境——尤其是App Store 30%分成面临越来越多的压力,以及vibe-coded应用(通过自然语言提示生成代码)的崛起正在改变开发者的生态。
与此同时,埃隆·马斯克正考虑以600亿美元收购AI编程工具Cursor,这可能反映出他在xAI合并后构建AI基础设施的战略意图。这一举动也体现了像SpaceX这样的大公司正试图掌控基础AI工具,而不仅仅是使用它们。
特努斯将继承苹果强大的业务,但也需应对App Store抽成压力和vibe-coded应用兴起带来的挑战,这类应用减少了对传统开发者生态的依赖。传闻中的600亿美元Cursor交易包含100亿美元分手费,表明马斯克决心重大。
TechCrunch AI

·#ai
搭载M4芯片的基础款Mac mini(16GB内存+256GB固态硬盘)在苹果官网已售罄,导致eBay上该型号的新机和翻新机售价飙升至最高979美元,远超原价599美元。
这一缺货现象凸显了消费者对本地运行AI模型的需求如何重塑硬件市场,影响供应链并迫使用户转向二手市场,这种趋势可能会影响苹果及其他科技公司的未来产品规划。
苹果M4 Mac mini因其高效性和可靠性成为家庭AI开发的热门选择。基础型号目前已全面售罄,买家转而前往eBay购买,价格大幅上涨——全新机型标价高达979美元,二手设备售价也超过700美元。此次缺货与全球内存芯片短缺和即将推出的更新周期同时发生,但以往产品更新并未引发类似问题。
缺货还带动了Mac Studio的需求,后者也已断货。与此同时,MacBook Pro和Neo型号仍可正常发货,表明问题集中在Mac mini对AI任务的独特吸引力。
需求激增主要源于Mac mini适合运行本地AI模型(如OpenClaw、ZeroClaw及Anthropic和OpenAI的工具),且相比笔记本更安静、更适合全天候运行。
TechCrunch AI

蒂姆·库克计划于九月辞去苹果CEO职务,由硬件主管约翰·特恩斯接任。这是全球最具价值科技公司之一的重大领导层更替。
此次交接发生在苹果面临应用商店政策、开发者关系及AI平台竞争压力加剧的背景下。新任领导者将需要应对一个与库克时代截然不同的快速演变生态系统。
蒂姆·库克将于九月辞去苹果CEO职务,由负责硬件业务的约翰·特恩斯接任。尽管苹果仍是全球最赚钱的公司之一,但它现在处于一个更为复杂的环境中:应用商店30%的抽成受到质疑,开发者感到权力被削弱,而以‘情绪编码’为代表的新类型应用正在重新定义在苹果平台上开发的意义。这次交接不仅是领导层的变化,也预示着苹果可能因应外部压力和内部演进而进行战略调整。
约翰·特恩斯预计将接手一家财务状况稳健但面临平台控制力减弱、应用变现困难和用户期望变化挑战的公司,尤其是随着‘情绪编码’类应用兴起,这类应用更注重情感共鸣而非传统功能。
The Decoder

·#ai
OpenAI首席科学家Jakub Pachocki和总裁Greg Brockman表示,近期AI进展比预期更慢,但他们预计GPT-5.5的发布将带来短期和中期的重大改进。
这预示着AI发展节奏和策略可能发生变化,因为GPT-5.5可能成为更高效推理模型的基础——这对编码、数据分析和自动化等实际应用至关重要。
OpenAI领导层,包括首席科学家Jakub Pachocki和总裁Greg Brockman,承认AI进展比预期更慢。但他们对即将到来的突破表达了强烈乐观情绪,特别是围绕GPT-5.5的发布。该模型被视为一个重大里程碑——不仅是一个产品更新,更是迈向更高效推理系统的基础步骤。
Brockman强调其在编程、创建电子表格和使用浏览器等方面的复杂任务能力。团队认为GPT-5.5将像GPT-4o推动o系列(o1、o3、o4-mini)一样,开启新一代模型。尽管如此,一些研究人员仍持怀疑态度,认为当前的语言模型架构可能已接近极限,真正的AI进步需要全新的方法。
GPT-5.5被描述为一种‘新型智能’,能够编程、制作演示文稿和使用浏览器;它标志着两年研究工作的结束,并被视为未来模型的起点。
The Decoder

OpenAI的GPT-5.5在Artificial Analysis智能指数中以60分领先,击败了Claude Opus 4.7和Gemini 3.1 Pro Preview等竞品,但其幻觉率高达86%,且API价格相比前代模型净增约20%,尽管token效率有所提升。
这一更新突显了前沿AI模型在性能提升与可靠性之间的持续权衡——对于企业级或高风险应用场景而言,准确性和成本比单纯的基准分数更为重要。
GPT-5.5在Artificial Analysis智能指数中得分60,成为当前表现最强的模型,超越了Claude Opus 4.7和Gemini 3.1 Pro Preview。尽管如此,由于token使用成本上升,其API价格相比前代模型净增约20%,即便它比GPT-5.4节省了40%的token消耗。
最令人担忧的是其高达86%的幻觉率——远高于Claude Opus 4.7(36%)和Gemini 3.1 Pro Preview(50%)。虽然GPT-5.5在事实记忆方面表现更好,但它仍频繁编造答案而非承认知识盲区,这引发了人们对其在编码或决策等关键任务中实际可靠性的质疑。
尽管API每百万token的价格翻倍至5美元/30美元(输入/输出),GPT-5.5相比GPT-5.4节省了约40%的token消耗,仅带来约20%的净成本上涨;但其幻觉率仍高达86%,难以接受。
The Decoder

中国国家发改委正要求科技企业拒绝来自美国的融资,这一举措源于Meta在2025年底以20亿美元收购新加坡AI初创公司Manus引发的国家安全担忧。
此举可能严重扰乱全球风险投资向中国科技领域的流动,并加剧中美在人工智能技术控制上的紧张关系,影响全球创新生态和地缘政治战略。
中国正在实施新规,要求科技企业在接受美国投资前必须获得政府批准,这一变化源于2025年底Meta以20亿美元收购新加坡AI初创公司Manus引发的争议。尽管Manus注册于新加坡,但其创始人是中国籍,北京方面指责该交易将关键技术转移给地缘政治对手。
国家发改委已指示多家私营企业——包括知名AI初创企业和字节跳动——拒绝美国资金。这标志着中国对科技投资监管的进一步收紧,可能导致其创新领域与西方资本市场脱钩,并引发人们对AI发展国际合作减少的担忧。
该政策针对Moonshot AI、Stepfun及字节跳动(抖音母公司)等企业,反映了北京通过投资管控限制外国获取敏感技术的更广泛努力。
The Decoder

Meta正在从亚马逊采购数千万颗AWS Graviton 5处理器核心,用于驱动能够自主规划和执行任务的代理型AI系统。这标志着Meta在AI编排方面对ARM架构CPU的重大战略转变。
这一举措表明ARM架构CPU正成为AI编排的关键,而不仅仅是推理或通用计算。它可能加速ARM在云基础设施中的采用,并影响科技巨头未来的芯片设计方向。
Meta已从亚马逊采购数千万颗AWS Graviton 5处理器核心,成为该ARM架构芯片的重要客户之一。这些核心将用于驱动具备自主任务规划与执行能力的代理型AI系统,是迈向更高级AI代理的关键一步。尽管GPU仍是模型训练的核心,Graviton 5等CPU对于复杂工作流的编排至关重要。
Meta还投资了其他ARM项目,包括英伟达的Grace CPU以及与ARM联合开发的AGI CPU。该协议具备可扩展性,虽然未披露具体金额,但体现了Meta减少对传统x86架构依赖、转向ARM方案的长期战略。
该协议支持Meta的代理型AI工作负载,这类任务需要强大的CPU编排配合GPU进行训练。合同具有灵活性——可根据需求扩展,但价格和期限未披露。
The Decoder

·#ai
加拿大AI公司Cohere收购了德国的Aleph Alpha,交易估值约为200亿美元。此次收购发生在Aleph Alpha刚刚罢免创始人乔纳斯·安德鲁利斯之后,并且该公司已从开发大型语言模型的战略中撤出。
该交易加强了欧洲和加拿大的主权AI努力,将两家专注于政府和受监管行业数据控制的领先AI公司结合在一起。这表明地缘政治上越来越重视减少对亚马逊和微软等美国超大规模云服务商的依赖。
加拿大AI公司Cohere正在以200亿美元的价格收购位于海德堡的Aleph Alpha,其中施瓦茨集团投资6亿美元。这次收购是在Aleph Alpha决定放弃大型语言模型战略、转向名为PhariaAI的AI操作系统之后发生的。创始人乔纳斯·安德鲁利斯在2025年10月被解除CEO职务,因内部矛盾加剧,尤其是施瓦茨集团影响力上升。
德国和加拿大两国政府均支持这一合并,作为其主权AI战略的一部分,确保公共机构能够掌控自己的数据,避免依赖外国科技巨头。Cohere将保留其名称,并在多伦多和海德堡设立双总部来运营新实体。
施瓦茨集团投资6亿美元并提供其STACKIT云平台作为基础设施;Aleph Alpha股东将获得每九股换一股Cohere股票。合并后的公司将设有加拿大和德国双总部。
The Verge AI

2026年世界新闻摄影奖重申,摄影必须通过传感器或胶片捕捉现实世界的光线,明确排除人工智能生成图像。获奖作品《被ICE分开》由卡罗·古西拍摄,真实记录了移民听证会后孩子与父亲分离的场景。
这一决定为生成式AI时代的新闻摄影设定了清晰的伦理边界,影响专业人士和公众对视觉叙事真实性的理解。同时突显了技术创新与新闻职业道德之间的日益紧张关系。
2026年世界新闻摄影奖明确了合法摄影的标准:必须通过相机传感器或胶片捕捉现实世界的光线,不能是人工生成的图像。获奖作品《被ICE分开》由卡罗·古西拍摄,展现了移民听证会后孩子们紧抱父亲的感人瞬间。参赛作品必须用实体相机拍摄,后期处理中不得添加合成或人工智能增强元素,除非它们保留了原始场景。
智能手机照片仅在标准模式下可接受,HDR、人像或全景模式将导致淘汰。一些人工智能工具如降噪或自动对比度调整被允许,只要不添加或删除图像中的关键信息。这一全面框架可能成为媒体和教育领域定义摄影真实性的基准。
规则禁止使用人工智能生成图像以及Adobe Super Resolution等引入新信息的工具;但允许使用基础的人工智能降噪或色彩调整功能,前提是不改变原始图像内容。
The Verge AI

Anthropic新增了Spotify、Uber Eats、TurboTax、AllTrails和Instacart等热门个人应用的连接器,使Claude能够访问并协助完成这些服务中的任务,同时保持严格的隐私保护。
这一扩展显著提升了Claude在日常生活中的实用性,使其融入用户的日常习惯,让AI辅助更加情境化和可操作——同时通过透明的数据政策增强用户信任。
Anthropic通过新增Spotify、Uber Eats、TurboTax、AllTrails和Instacart等个人应用的直接集成,扩展了Claude的功能。这些连接器使Claude能在对话中建议相关应用(例如通过AllTrails推荐徒步路线)或执行如叫车、查看税务信息等操作。公司强调,来自已连接应用的数据不会用于模型训练,且应用本身无法访问Claude的其他交互记录。
用户可随时断开任意应用连接,且Claude回复中不包含付费推广或赞助内容。该功能适用于所有Claude套餐,可通过定制菜单中的“连接器”选项访问。
已连接的应用不会将用户数据用于模型训练,且应用本身无法查看与Claude的其他对话;执行购买或预订等操作前,Claude会要求用户确认。
ZDNET AI

·#ai
OpenAI 发布了 ChatGPT 图像 2.0,这是一个新的图像生成模型,显著提升了文本渲染能力,并支持带品牌一致性的全页图形,包括准确的徽标放置和多语言文本。
这项更新使 AI 生成的视觉内容更适合专业任务,如营销、报告和内容创作,因为准确的品牌和可读文本至关重要——标志着从装饰性到功能性 AI 艺术的转变。
大卫·盖维茨使用付费的 ChatGPT Plus 账户(开启思维模式)对 ChatGPT 图像 2.0 进行了广泛测试。他发现该工具在生成带有正确文字和品牌一致性的详细信息图和草图笔记方面表现出色,例如能准确重现 ZDNET 徽标和风格。然而,仍存在一些错误——比如徽标位置不正确或轻微事实错误——表明虽然功能强大,但专业使用中仍需人工审核。
该模型还展示了改进的推理能力,能添加原始文章中没有的相关数据。总体而言,这是让 AI 生成图像适用于实际应用的一大进步。
该模型在用户直接将参考图像(如 ZDNET 徽标)加入提示时表现最佳;尽管文本准确性大幅提升,但仍偶尔出现徽标错位或小错误,需要人工审核。
ZDNET AI

·#ai
大卫·盖维茨对GPT-5.5进行了10轮测试,发现其能力很强,但在第1轮测试中因过度主动执行任务而被扣分,特别是它没有遵守指定来源的要求。
这次评估突显了AI开发中的一个关键权衡:性能提升必须与可靠的指令遵循能力相平衡,尤其是在模型用于自主代理或专业工作流程等实际场景时。
大卫·盖维茨使用一个包含10轮的评估框架测试了GPT-5.5,重点考察准确性、指令遵循能力和实际应用价值。虽然该模型在各种任务中(包括新闻摘要、学术概念解释和图表生成)都提供了高质量的回答,但它在某些情况下未能严格遵守指令。最明显的是第一轮测试中,它引用了多个新闻来源而不是只使用Yahoo新闻。
作者还演示了如何用ChatGPT Images 2.0在不到10分钟内生成专业图表,与传统手工方法需要数小时形成鲜明对比。尽管其速度和能力令人印象深刻,但模型倾向于过度执行——完成未被要求的任务——这引发了人们对其在高风险环境中可靠性的担忧。
GPT-5.5总评分为93/100;它在写作、编程和推理任务中表现优异,但因生成超出要求的内容(如在仅指定一个来源时引用多个来源)而被扣分。
ZDNET AI

根据IDC研究,82%的政府机构已采用AI代理,71%的机构计划在2026至2027年间增加使用。政府领导人认为其采纳速度正在超过私营部门。
这一转变标志着公共服务交付方式的重大政策驱动变革,可能为效率、透明度和公民参与设定新标准,并影响全球数字治理趋势。
IDC最新研究显示,82%的政府机构已采用AI代理,其中71%计划在2026至2027年间增加使用。这种快速采用由预算压力、合规要求、公民对更好服务的需求及人才技能缺口推动。
AI代理已成为领导层命令而非实验项目,主要应用于三项核心领域:跨部门流程自动化、个性化公民互动以及通过合成数据优化政策制定。但要实现规模化部署,必须具备高质量的数据基础设施、清晰的治理框架,并重新思考传统工作模式。
政府中的AI代理聚焦于运营协调、公民服务交付和决策支持,每项都需要强大的数据基础、治理模型以及员工对AI集成的准备程度。
TechCrunch AI

·#ai
Uber首席技术官Praveen Neppalli Naga将于4月30日在StrictlyVC旧金山活动中发表演讲,探讨在人工智能时代如何扩展复杂的系统。
作为Uber的高管,Naga在基础设施方面的深厚经验为初创企业和投资者提供了宝贵洞见,帮助他们应对在真实场景中构建可扩展AI系统的挑战。
Uber首席技术官Praveen Neppalli Naga将于4月30日参加StrictlyVC旧金山活动,讨论在人工智能时代如何实现规模化运营。他的演讲由TechCrunch主编Connie Loizos主持,将探讨快速采用人工智能带来的技术和组织挑战。Naga拥有超过十年的Uber工作经验,此前还在LinkedIn任职,对构建稳健基础设施有独特见解。
该活动是TechCrunch生态系统的一部分,吸引了包括Eclipse创始人Lior Susan和Replit CEO Amjad Masad在内的多位重磅嘉宾。参会者包括创始人、投资人和技术专家,希望从行业领袖那里获得实用洞见。
Naga自2015年起就在Uber任职,此前曾在LinkedIn工作,负责打造早期产品并奠定其成功基础;他的演讲将涵盖AI扩展以及司机收入平台等非AI系统。
The Verge AI

苹果首席执行官蒂姆·库克即将卸任,约翰·特恩斯被认为是其接班人。这一过渡标志着苹果进入新时代,引发人们对领导层更替如何影响产品方向和创新的讨论。
这次领导层变动可能重塑苹果未来的战略方向,尤其是在产品设计和用户体验方面——库克在触控栏等决策上的成败引发了广泛争议。
在本期《Vergecast》中,主持人大卫和尼莱讨论了蒂姆·库克作为苹果CEO的遗产以及他计划由约翰·特恩斯接班的意义。特邀科技记者约翰·格鲁伯参与,他们探讨了关键产品如触控栏——曾被视为创新但后来遭到批评——并认为库克真正的影响力可能体现在AirPods等更为微妙的创新上。
对话还涉及微软通过Xbox重新聚焦游戏业务,指出未来面临的挑战。尽管库克表示自己健康且将继续任职一段时间,但这次交接预示着苹果文化与产品理念可能出现转变。
该集讨论了库克是否应为触控栏失败负责,还是应该因尝试大胆设计而受到肯定。AirPods被强调为他最被低估的成就之一。
The Verge AI

·#ai
埃隆·马斯克起诉山姆·阿尔特曼和OpenAI,指控欺诈和违反信托义务,庭审定于4月27日在加州奥克兰举行。
这场备受关注的法律纠纷可能重塑人工智能治理格局,影响两家公司的首次公开募股计划,并凸显科技行业中创始人与企业领导层之间的紧张关系。
埃隆·马斯克作为OpenAI联合创始人,因不满自己未被任命为CEO而起诉山姆·阿尔特曼及公司,称其存在欺诈和违反信托行为。该案定于2025年4月开庭,此时正值xAI和OpenAI均准备上市的关键时期。尽管此前多次诉讼被驳回或撤回,此次案件仍进入实质审理阶段。
证人可能包括微软CEO萨提亚·纳德拉、CTO凯文·斯科特以及前OpenAI高管。法律专家指出,马斯克的策略更倾向于损害OpenAI声誉而非真正赢得官司,因为部分指控缺乏坚实法律基础。
马斯克的指控包括OpenAI创始协议中的欺骗行为、不当得利和欺诈;此前多起诉讼已被驳回或撤回,但本次案件已进入审理阶段。
ZDNET AI
美国联邦通信委员会(FCC)已将其对特定路由器的禁令扩展至便携式热点设备,这意味着消费者可能无法再自由升级或更换这些设备。
这一变化影响数百万依赖便携式热点上网的用户,包括远程工作者、旅行者和低收入家庭,可能限制设备选择并增加使用成本。
美国联邦通信委员会已将原有路由器限制扩大到便携式热点设备,这可能使消费者更难升级移动互联网设备。此举旨在提升网络安全,确保所有联网设备符合最新技术标准。用户可能会发现自己被困在较旧、安全性较低的硬件上,或者被迫购买价格更高的替代品。
该规则还引发了人们对互联网接入公平性的担忧,尤其是那些依赖移动热点而非固定宽带的人群。业内人士警告称,如果制造商被禁止提供新款设备,移动连接领域的创新可能会放缓。总体而言,这项政策表明监管机构正在加强对面向消费者的网络基础设施的安全关注。
该禁令针对使用过时固件或未达到新FCC安全标准的设备,可能导致用户不得不继续使用旧型号,或支付更多费用购买合规替代品。
ZDNET AI

·#ai
Anthropic 的 Claude AI 新增了名为“连接器”的功能,可与 AllTrails、TripAdvisor 和 Spotify 等第三方服务集成,实现实时数据获取和任务执行。
这一功能展示了人工智能如何从简单的问答走向实际的多步骤操作,对旅行者和希望利用外部 API 构建智能工具的开发者都具有重要价值。
作者利用 Anthropic 的 Claude AI 及其新的连接器功能,在短短 30 分钟内规划了一次前往阿迪朗达克山脉的徒步旅行。通过添加 TripAdvisor(酒店)、AllTrails(徒步路线)和 Viator(导游服务)的连接器,Claude 获取了这些平台的实时数据。AI 提供了地图、酒店详情、路线信息和旅游选项——全部无需离开聊天界面。
用户还可以直接通过集成平台如 TripAdvisor 预订。这展示了 AI 如何作为个人旅行助手,无缝整合多个外部服务。
连接器适用于所有 Claude 计划(包括免费版),用户可通过网页或移动应用添加;系统会根据提示自动选择合适的连接器,除非手动指定。
ZDNET AI

ZDNet 在 2026 年的评测中推荐 Odoo 作为最佳库存管理软件,因其提供免费且功能丰富的模块,支持实时跟踪、多仓库操作、条码扫描和自动补货。
这一推荐帮助各类企业选择一个可扩展且成本效益高的解决方案,能与更广泛的 ERP 系统无缝集成,减少运营摩擦并提高库存准确性。
文章指出,使用电子表格或纸质方式管理库存容易导致错误和效率低下。它回顾了 2026 年的顶级库存管理工具,Odoo 因其功能强大且免费的模块脱颖而出,该模块支持实时跟踪、多仓库操作、条码扫描,并能无缝融入更大的 Odoo ERP 套件。这篇评测强调实用性而非技术深度,非常适合需要可靠解决方案而无需复杂设置的决策者。
Odoo 的库存应用对无限用户免费,包含实时库存更新、多地点支持以及与同一平台内销售、采购和会计模块的集成。
ZDNET AI

HP ZBook 8 G1i是一款专业级笔记本电脑,具备工作站级别性能,配备英特尔酷睿Ultra 7或9处理器、最高64GB内存和可选NVIDIA RTX 500 Ada显卡。它专为耐用性、可靠性和商务工作流设计,而非便携性或炫酷功能。
这篇评测帮助商务用户理解强大性能与便携性之间的权衡,说明有时‘无趣’的设计意味着对注重稳定性和性能的专业人士而言更长久的价值。
HP ZBook 8 G1i凭借英特尔酷睿Ultra处理器和最高64GB DDR5内存,提供适合CAD、数据处理和多任务处理的高性能。虽然比现代轻薄本更重且价格更高,但其坚固的做工、丰富的接口和商务导向设计使其成为重视可靠性的专业人士的理想选择。搭载的NVIDIA RTX 500 Ada显卡支持AI工作流,但显存不足,无法运行最新AI模型。
电池续航中等,用户需主动优化设置以避免中午断电。总体而言,这是一款专注生产力而非外观的实用工具。
测试的14英寸型号配备2560x1600 WQXGA显示屏(120Hz刷新率)、三个USB-C接口(两个支持雷电4)和一个140W电源适配器;电池续航表现一般,需用户优化才能满足全天使用。
ZDNET AI

ZDNET发布了一篇关于DeleteMe的详细评测,这是一项由服务方代为从互联网上删除个人数据的服务。评测者在遭遇八次数据泄露后进行了测试,发现该服务成功移除了371项扫描记录中的44条。
随着数据泄露事件频发和在线追踪日益普遍,像DeleteMe这样的服务为希望掌控自身隐私的个人提供了实用工具。这一点尤其重要,因为公众越来越关注企业如何使用并出售个人信息。
ZDNET的评测介绍了DeleteMe这一服务,它帮助用户从数据经纪商和搜索引擎中删除电话号码、地址和电子邮件等个人信息。评测者本人曾遭遇八次数据泄露(通过Have I Been Pwned追踪),于2026年3月注册服务。提交数据表及可选身份证明后,DeleteMe扫描了371条记录,5天内移除了44条。
部分删除耗时更长,且每季度会发送报告。该服务还内置邮箱掩码和谷歌搜索监控等隐私保护功能。
该服务要求用户提交包含个人信息的数据表,并可选上传身份证件;不同数据经纪商的删除时间从几天到几周不等。此外还提供邮箱掩码和自我搜索检查工具,用于持续保护隐私。
Simon Willison
·#ai
西蒙·威尔逊在2026年4月24日的简报中介绍了DeepSeek V4、基于浏览器的PDF解析工具LiteParse,以及一些有趣的插图,如骑自行车的鹈鹕。此外还包含新的博客文章和开发者工具链接。
这份简报为开发者提供了实用的AI模型和本地文档处理工具信息,对构建编码代理或实时应用有帮助。开源工具如LiteParse也适合注重隐私的用户。
西蒙·威尔逊于2026年4月24日发布的每周简报涵盖了人工智能和网络工具的最新进展。亮点包括DeepSeek V4——一个性能接近前沿但成本大幅降低的先进模型。另一个重要功能是LiteParse——一种快速、开源的基于浏览器的PDF文本提取工具,可在不上传文件的情况下直接在浏览器中处理PDF及其他文档,非常适合本地工作流和注重隐私的应用场景。
简报还包括一些有趣的插图,如动物骑车等元素,为技术内容增添趣味性。博客文章涵盖从智能工程模式到AI驱动的文本提取方法等多个主题。总体而言,这是一份面向希望了解最新AI技术和实用开发工具的开发者的精选摘要。
LiteParse支持PDF、Office文档和图像等多种输入格式,并内置OCR功能;它使用PDF.js进行空间文本提取,可捕捉每页文本项的坐标和边界框,实现精确的版式理解。
TechCrunch AI

·#ai
Nothing推出了名为Essential Voice的AI语音转文字工具,可将语音转换为格式化文本,去除“呃”、“啊”等填充词,并支持自定义语音快捷短语。该功能目前可在Nothing Phone (3)上使用,预计本月晚些时候推出Phone (4a) Pro版本,下月支持Phone (4a)。
这丰富了AI辅助生产力工具生态,为用户提供了跨应用快速输入文本的便捷方式,尤其适合职场人士和移动端用户。这也表明Nothing等硬件厂商正将AI深度集成到设备中,而不仅限于传感器或摄像头。
Nothing发布了Essential Voice这款AI语音转文字工具,能将口语转化为整洁格式化的文本,并自动去除‘呃’、‘啊’等填充词。用户可设置自定义语音快捷短语,如地址、链接或常用句式。目前仅支持Nothing Phone (3),计划本月上线Phone (4a) Pro版本,下月支持标准版Phone (4a)。
该功能可全局调用,适用于任何应用,类似Superwhisper最近推出的iOS集成方案。此外还支持100多种语言的实时翻译,并计划根据应用类型调整AI编辑语气——比如工作类应用更正式,消息类应用更随意。
Essential Voice支持超过100种语言的实时翻译,未来还将引入基于应用类别的自定义样式功能,例如在工作类应用中让AI编辑更正式,在聊天类应用中更随意。该功能可通过Essential键或键盘快捷键调用。
ZDNET AI

文章强调了五种不太显眼的家用设备——如旧平板电脑、咖啡机和百叶窗——可以通过自动化减少日常杂务并提升便利性。它还强调利用时间或位置等真实触发条件使自动化更有效。
这种做法使智能家居更加实用且个性化,帮助用户节省重复任务的时间,提升整体生活质量。同时鼓励再利用旧设备,推动物联网生态系统的可持续发展。
ZDNET的文章建议自动化五种不常见的家用物品——不仅仅是灯或恒温器——以简化日常生活。这些包括咖啡机、百叶窗甚至旧平板电脑,后者可作为中央控制中心。通过基于时间、运动或位置设置规则,用户可以消除那些容易忘记的小任务。
重点在于让自动化为你服务,而不是需要持续手动操作。重新利用旧硬件(如平板电脑)还能减少电子垃圾和成本。尽管文章没有深入技术细节,但为初学者和爱好者提供了可行的操作步骤。
旧平板电脑可通过Home Assistant等应用被改造成智能家庭控制面板,支持本地控制和注重隐私的自动化。文章未指定具体工具,但暗示现有智能家居平台已足够实现基础自动化。
ZDNET AI

ZDNET的一位评测者在一台Windows 11电脑上测试了Winhance这款免费的Windows优化工具,发现它通过移除预装软件、优化启动项以及自定义任务栏和开始菜单等设置提升了系统性能。
Winhance为普通用户提供了一种无需技术知识或注册表修改即可提升电脑速度和个性化体验的方法,对那些因Windows运行缓慢而困扰的用户来说非常有价值。
ZDNET的文章评测了Winhance这款专为Windows 10/11设计的免费工具,旨在去除冗余程序、优化系统并实现个性化设置。评测者在一个配置杂乱的Windows 11电脑上进行了测试,发现应用更改后(如禁用不必要的启动程序和启用存储感知)开机时间和整体响应速度明显改善。
它还简化了任务栏、开始菜单和文件资源管理器的自定义操作,这些通常需要手动编辑注册表或使用第三方工具才能完成。尽管部分功能已在Windows设置中存在,但Winhance将它们整合到一个直观的界面上,特别适合希望在不掌握复杂技术的前提下提升性能和可用性的用户。
该工具包含“游戏与性能”(用于延迟启动和启用存储感知)、“更新”(用于更新偏好)和“自定义”(用于界面调整)等类别,其中许多功能无法通过标准Windows设置轻松访问。
ZDNET AI

本文介绍了如何将蓝牙耳机直接配对到Roku、Fire TV或Apple TV等主流流媒体播放器上,实现私密音频收听,无需特殊耳机或昂贵设备。
这为希望深夜观影或在共享空间中不打扰他人的人提供了一个实用的解决方案,尤其适合不愿安装固定音响系统的内容消费者和租房者。
本文提供了将任意蓝牙耳机连接到Roku、Amazon Fire或Apple TV等流媒体播放器的详细步骤:只需将耳机置于配对模式,并在播放器蓝牙列表中选择即可。虽然这种方法便于安静观影,但用户应意识到音质受限于SBC编码,无法达到杜比全景声等高保真格式。
文章指出,老旧或入门级电视可能没有原生蓝牙功能,需先检查设置。如需同时使用电视扬声器和耳机,则通常需要光纤线缆或AV接收器来实现多路音频输出。
大多数流媒体播放器支持蓝牙耳机配对,但音质仅限于SBC编码(低于杜比全景声),且可能存在延迟。若需同时使用音响和耳机,通常需要光纤线缆或AV接收器。