Anthropic源码泄露暴露AI公司基础安全短板
因打包错误意外公开近51万行TypeScript代码,凸显AI公司在软件交付环节的系统性风险。
AI 日报
今日AI领域焦点集中于安全漏洞与监管博弈。Anthropic意外暴露Claude Code完整源码引发业界震动,而加州在联邦反对下坚持自主AI治理,同时OpenAI巨额融资彰显资本对AI基础设施的押注。这些事件共同揭示了AI从技术突破走向责任落地的关键阶段。
Overview
从 57 条资讯中筛选出 29 条
今日AI领域焦点集中于安全漏洞与监管博弈。Anthropic意外暴露Claude Code完整源码引发业界震动,而加州在联邦反对下坚持自主AI治理,同时OpenAI巨额融资彰显资本对AI基础设施的押注。这些事件共同揭示了AI从技术突破走向责任落地的关键阶段。
因打包错误意外公开近51万行TypeScript代码,凸显AI公司在软件交付环节的系统性风险。
要求承包商实施防偏见、防虚假信息措施,并保留对联邦供应链风险的独立审查权。
包括30亿美元散户资金,估值达8520亿美元,为未来IPO铺路并推动全球AI基础设施建设。
实验室高分无法预测真实团队协作中的表现,呼吁转向HAIC框架进行长期评估。
Veo 3.1 Lite成为最经济高效的视频生成模型,助力开发者快速迭代AI应用。
昆尼皮亚克大学调查显示,美国有15%成年人愿意让AI担任直属上司,反映职场自动化趋势。
近2000个TypeScript文件和51.2万行代码意外公开,未涉及客户数据但包含未发布模型引用。
要求承包商防范偏见和虚假信息,并保留独立审查联邦供应链风险的权利。
学生破坏AI作品,学校被迫引入批判性AI使用课程以应对就业焦虑。
包括散户投资者参与,月收入20亿美元,计划推出广告变现模式。
自称获得5530亿美元订单,但OpenAI付款确定性存疑。
当前测试忽略现实团队流程,导致高分模型在医院等场景失败。
多模态训练中自然涌现“音视频氛围编码”能力,颠覆传统交互方式。
支持文本/图像到视频生成,定价低于Veo 3.1 Fast一半,强化竞争地位。
旨在构建围绕“视频智能”的生态系统,超越单一视频生成工具定位。
反映AI管理角色逐渐被接受,Workday、亚马逊已部署AI代理替代中层管理。
用户可通过文字指令修改图片内容,水印微弱易被裁掉,引发真实性担忧。
引发关于科技巨头如何铭记创始人的广泛讨论,强调早期愿景的重要性。
Stories
Ars Technica AI

Anthropic 在 Claude Code 的 npm 包版本 2.1.88 中意外包含了源映射文件,导致近 2000 个 TypeScript 文件和超过 51.2 万行代码被公开。该漏洞很快被安全研究员 Chaofan Shou 发现,并在 GitHub 上广泛传播。
此次事件暴露了 Anthropic 最受欢迎产品之一的核心工具代码,可能让竞争对手得以逆向工程或复制其功能。这也凸显了人工智能公司在软件打包和内部管控方面持续存在的风险。
Anthropic 在 npm 包版本 2.1.88 中意外包含了源映射文件,导致其 Claude Code 命令行接口的全部源代码(近 2000 个文件,超 51.2 万行 TypeScript 代码)被公开。安全研究员 Chaofan Shou 首先发现该漏洞并分享了归档文件;数小时内,代码上传至公共 GitHub 仓库,被 fork 数万次。
Anthropic 承认这是人为失误,不是安全漏洞,且未泄露任何客户敏感信息。开发者已开始分析代码,部分人揭示了该工具使用的内存架构和验证机制。
此次泄露不涉及任何客户数据或凭证——Anthropic 已确认这是打包错误而非安全漏洞。代码中还包含对未发布模型和功能的引用,进一步提升了泄露内容的战略价值。
Ars Technica AI

Anthropic通过分析22个职业中任务的分解情况,衡量了大型语言模型(LLM)执行工作内容的理论能力,得出结论:LLM理论上可以完成许多领域至少80%的任务。这一指标基于2023年由OpenAI等机构发布的报告,而非Anthropic自身的实证测试或未来性能预测。
该分析突出了理论潜力与实际影响之间的关键差距,敦促政策制定者和研究人员区分AI在理论上能做什么与现实中将做什么。这引发了关于如何在不高估即时冲击的前提下为AI驱动的劳动力市场变化做好准备的重要问题。
Anthropic发布了一份报告,显示大型语言模型(LLM)在多个职业中理论上可以完成80%甚至更多的具体任务,包括艺术媒体、法律和管理等领域。然而,这一数据并非来自Anthropic自身的测试,而是来自2023年由OpenAI和宾夕法尼亚大学合著的一项研究。
该方法通过将工作分解为离散任务,并基于认知特征和访谈数据估计AI的适配度。尽管图表暗示了巨大的自动化潜力,但作者强调,这并不意味着这些工作很快会被完全替代——现实因素如采用成本、法规和组织准备程度对实际实施起着重要作用。
“理论能力”指标依赖于推测性假设,而非当前模型的实际表现,并且假设如果AI理论上能完成某项任务,它最终就会取代人类工作者——这是一个有缺陷的假设,因为现实世界中的采用障碍(如成本、监管和流程整合)可能限制其落地。
MIT Technology Review AI

文章指出,当前的AI基准测试是在孤立环境中评估模型,而非它们实际部署时的协作环境。作者提出了一种名为HAIC(人机情境特定评估)的新框架,用于在人类团队和组织流程中长期评估AI表现。
这一批评至关重要,因为它揭示了实验室性能与现实影响之间的重大差距,导致对AI能力的误判、资源浪费以及医疗、商业等领域未被识别的系统性风险。它呼吁我们重新思考衡量AI成功的方式。
几十年来,AI一直通过是否优于人类完成单个任务来评判——比如下棋或医学影像分析——但这种方法忽略了AI的实际使用方式:在团队和组织中经过长时间运行。作者基于在医疗、非营利机构和技术中心的实地调研指出,高分基准测试往往无法预测现实中的有效性。
例如,测试中表现出色的AI工具可能因与本地报告标准不匹配而在医院流程中拖慢效率。解决方案在于转向HAIC基准——不仅评估准确率,还要考察AI在人类团队、决策过程和随时间演化的环境中如何集成。
现实部署表明,即使得分最高的AI模型在融入放射科医生等多人员协作流程时也会失败。所提出的HAIC基准侧重于长期、团队导向的评估,而非孤立任务的准确性。
OpenAI News
·#ai
OpenAI已获得1220亿美元的新融资,用于扩展前沿人工智能研究、投资下一代计算基础设施,并满足全球对ChatGPT和Codex等产品日益增长的需求。
这笔巨额投资标志着人工智能发展的关键转折点,将加快创新速度、扩大先进模型的可及性,并增强企业AI领域的竞争,可能重塑医疗到软件工程等多个行业。
OpenAI宣布了一项创纪录的1220亿美元融资,以加速前沿人工智能模型的发展并提升全球计算能力。该投资旨在推动能够更高效处理复杂现实任务的下一代AI系统。它还旨在满足企业对ChatGPT和Codex等AI工具不断增长的需求。公司计划建设专用基础设施,以支持高性能AI推理与训练。
这一举措预计将影响AI在全球范围内的开发、部署和监管方式。尽管目前GPU仍是主流,但未来FPGA等架构可能在可扩展AI系统中发挥更大作用。OpenAI的战略与整个行业向生成式AI专用计算方向发展的趋势一致。
这笔资金将支持硬件升级(如定制芯片和数据中心)和软件改进,目标是降低大规模AI训练和推理的成本并提高效率。
TechCrunch AI

·#ai
OpenAI完成了创纪录的1220亿美元融资,估值达到8520亿美元,其中包括通过银行渠道和ETF获得的30亿美元散户资金,以及一笔47亿美元未动用的循环信贷额度。
此次巨额融资彰显了投资者对OpenAI未来的高度信心,而散户投资者的参与标志着私人科技巨头进入公众市场的重大转变,可能加速其IPO进程并重塑AI投资格局。
OpenAI完成了史上最大的1220亿美元融资,估值高达8520亿美元,由软银、安德里森·霍罗威茨及多家科技巨头共同推动。约30亿美元来自散户投资者,通过银行和ARK Invest等ETF实现更广泛的公众接入。公司还扩大了未动用的47亿美元循环信贷额度,以增强财务灵活性而非应对短期流动性需求。
OpenAI称其月收入达20亿美元,周活跃用户超过9亿,企业端收入已占总收入的40%。它强调GPT-5.4在企业级应用中的快速增长,并自称为‘AI超级应用’,目标成为人们使用AI的主要入口。这轮融资不仅是为了获取资本,更是为潜在的IPO做准备。
本轮融资由软银和安德里森·霍罗威茨联合主导,亚马逊、英伟达、微软等均参与;OpenAI还披露月收入达20亿美元,每周活跃用户超9亿,并计划推出广告作为新增收入来源。
The Decoder

加州州长加文·纽森签署行政命令,要求州承包商实施防范非法内容、偏见和虚假信息的AI安全措施。该命令还规定对AI生成的图像和视频进行水印标记,并允许加州独立审查联邦供应链风险认定。
这标志着AI治理的重大转变,加州在联邦反对下坚持自身监管权——尤其是针对五角大楼对Anthropic的禁令而言意义重大。它为各州如何在公共采购中强制执行负责任的AI使用树立了先例,并可能影响未来的联邦政策。
加州已成为美国首个要求与州政府合作的企业实施全面AI保障措施的州。行政命令要求承包商防止有害偏见、非法内容和虚假信息,并强制对AI生成的媒体打上水印。面对五角大楼将Anthropic列为供应链风险等联邦行动,加州保留自行评估的权利。
120天内,州政府将制定负责任AI使用的认证标准。这一举措体现了加州在AI伦理和自主性上的领导决心,尤其在特朗普政府试图阻止州级AI立法的背景下。
企业需在120天内通过加州采购与技术机构制定的新认证来证明其符合伦理AI实践。如果某公司被联邦政府列为供应链风险,加州将进行独立审查后再决定是否继续与其合作。
The Verge AI

艺术学生和教育工作者正在抗议生成式AI快速融入创意教育,包括加州艺术学院(CalArts)和阿拉斯加大学费尔班克斯分校等校园内发生破坏AI生成作品的事件和抗议活动。
这一转变不仅威胁艺术毕业生的未来就业前景,也挑战了创意教育的核心价值,迫使学校重新思考课程设置,同时应对人工智能对人类创造力和劳动力影响的伦理问题。
生成式AI正在全球范围内引发艺术学生和教师的强烈焦虑。从抗议者物理破坏AI生成艺术品到学校政策调整,这种冲击显而易见。学生们感到自己的未来职业正被能比人类更快生成图像、音乐和视频的工具所削弱。
尽管像加州艺术学院和普拉特学院这样的学校强调理解AI的伦理和技术方面,而非取代传统技能,但其他学校则面临来自认为AI威胁其生计的学生的反弹。拥抱AI以推动创新与保护人类创造力之间的张力已成为艺术教育讨论的核心。
一些机构如加州艺术学院和普拉特学院现在要求学生对AI工具进行批判性参与——不仅是使用,还包括技术限制、伦理和法律影响,同时也认识到偏见训练数据和环境成本等风险。
Financial Times AI
能源行业专家大卫·克兰指出,数据中心应承担满足其不断增长电力需求所需的基础设施成本,而不是将费用转嫁给消费者或依赖公共投资。
随着人工智能的发展,电力需求激增(某些地区高达267%),这可能使电网承压并推高电费,除非公平透明地分配成本,否则将影响整个社会的能源可持续性。
前NRG能源公司首席执行官、美国能源政策重要人物大卫·克兰警告称,数据中心必须承担支持人工智能计算所需的新电力基础设施建设的全部费用。他指出,目前由公用事业公司和费率支付者资助输电线路和变电站的做法,对非AI用户造成了不公平负担。在弗吉尼亚州和马里兰州等地区,由于AI数据中心的巨大需求,批发电价已飙升至五年前的2.67倍,这些成本正被转嫁给居民和商业用户。
克兰的观点反映了关于谁应为数字经济的能源基础投资融资的日益激烈讨论。虽然人工智能带来巨大变革潜力,但其基础设施需求要求谨慎规划和公平的成本分摊机制。
电价上涨不仅涉及当前用电量,还包括未来电网升级的投资,例如马里兰州和弗吉尼亚州的数据中心周边地区,用户需为现有和未来的电网建设买单。
Google AI Blog

·#ai
谷歌发布了Veo 3.1 Lite,这是一个支持文本到视频和图像到视频的低成本视频生成模型,可自定义分辨率(720p/1080p)和时长(4秒、6秒、8秒)。该模型现已通过Gemini API和Google AI Studio的付费预览版提供。
此次发布降低了开发者构建AI视频工具的门槛,使高质量视频生成更加易得且经济实惠——这在生成式AI快速发展的视频领域至关重要。
谷歌宣布推出Veo 3.1 Lite,这是一个专为开发者设计的轻量级、高性价比视频生成模型。它支持文本到视频和图像到视频生成,并提供灵活的设置,包括分辨率(720p或1080p)、画面比例(横屏或竖屏)和时长(4秒、6秒或8秒)。该模型现已通过Gemini API和Google AI Studio的付费预览版上线。
此外,谷歌还下调了Veo 3.1 Fast的价格以进一步推动开发者采用。配套的演示应用帮助用户快速迭代制作理想视频。这一举措体现了谷歌致力于让专业级视频AI工具惠及更多人群的承诺。
Veo 3.1 Lite支持横屏(16:9)和竖屏(9:16)比例,成本随时长调整。它还包含一个用于迭代创作视频的演示应用,且Gemini API中视频存储时间为2天。
MIT Technology Review AI

·#ai
文章指出,企业必须从使用通用大语言模型转向利用专有数据和领域特定逻辑定制AI模型,以获得可持续的竞争优势。
这种转变使企业能够将独特的专业知识嵌入AI系统中,形成通用模型无法复制的护城河——在汽车、金融和公共部门等高度专业化或受监管的行业中尤为重要。
随着新大语言模型迭代带来的提升趋于平缓,领域专用AI模型如今能带来质的飞跃。通过整合专有数据和内部逻辑,企业可以将自身专业知识固化到AI系统中。
Mistral AI与企业合作推动这一转型:一家网络硬件公司通过定制训练提升了代码理解能力;一家汽车公司自动化了碰撞测试分析并成为工程协作者;东南亚某政府机构构建了一个本土化基础模型,支持本地语言和文化。成功的关键在于将AI视为基础设施而非一次性实验,并重新思考其在企业中的角色。
定制化不仅仅是微调,而是将组织知识直接融入模型权重中,这一点已在软件工程、汽车研发和政府机构主权AI的实际案例中得到体现。
TechCrunch AI

NomadicML 获得了 840 万美元种子轮融资,用于开发一个平台,利用视觉语言模型对自动驾驶车辆和机器人产生的海量视频数据进行结构化并实现搜索。
这解决了自动驾驶系统开发中的关键瓶颈——无结构化视频数据管理问题,从而加快训练速度、提升边缘案例发现效率,并优化车队监控。
由 Mustafa Bal 和 Varun Krishnan 创立的 NomadicML 已获得 840 万美元种子轮融资,估值达 5000 万美元,旨在解决自动驾驶车辆和机器人生成的海量视频数据难以组织的问题。目前企业依赖人工标注,效率低且无法扩展。Nomadic 的平台利用视觉语言模型将原始视频转化为可搜索的结构化数据,使工程师能够快速找到罕见但关键的事件,如警察指挥下闯红灯或特定桥梁下的行驶情况,从而加速合规检查和 AI 模型训练。
早期客户包括 Zoox、三菱电机和 Zendar,他们表示相比外包,效率大幅提升。该公司还赢得了英伟达 GTC 演讲比赛的第一名,显示出行业高度认可。
该平台被设计为一种“代理式推理系统”,能理解自然语言查询,并使用多个模型识别视频中的相关动作,而不仅仅是标注内容。
TechCrunch AI

·#ai
Runway推出了1000万美元的风险投资基金和Builders计划,为专注于人工智能、媒体和世界模拟的早期初创企业提供免费API积分。该举措旨在构建一个围绕“视频智能”的生态系统,超越其核心的视频生成工具。
这一举措标志着Runway从工具提供商向平台赋能者的战略转变,尤其是在影视、营销和药物发现等行业中推动下一代AI应用的发展。这也反映了行业趋势:领先的AI公司投资生态系统建设以加速创新。
Runway作为AI视频生成领域的领导者,通过推出1000万美元风险投资基金和Builders计划扩展了其雄心。这些举措将为在人工智能、媒体和世界模拟领域发展的早期初创企业提供免费API积分和投资支持。联合创始人Alejandro Matamala-Ortiz强调,Runway希望借助视频智能解锁它无法独自探索的新应用场景。
基金聚焦于推动AI前沿技术的团队、应用层开发者以及叙事与媒体创新者。Runway已支持LanceDB和Cartesia等初创企业,这些公司与其多模态AI模型愿景高度契合。这是迈向以视频为核心数据模态的更广泛AI生态系统的重大一步。
该基金面向种子轮至C轮融资的初创企业,单笔投资最高达50万美元,由现有投资者和合作伙伴出资启动。该项目支持三大类团队:前沿AI架构、应用层开发者以及新型内容创作者。
TechCrunch AI

·#ai
Ring推出了一个基于人工智能的应用商店,允许开发者为超过一亿台摄像头开发新功能,覆盖老年人照护、商业分析和租赁管理等新领域。首批合作应用包括Density的Routines(用于监测老人日常行为)和QueueFlow(用于统计公共场所等待时间)。
这标志着Ring从面向消费者的智能硬件向企业级服务的战略转型,利用其庞大的摄像头网络和AI能力挖掘新的收入来源和应用场景。这也展示了物联网平台如何从基础安防走向增值服务。
亚马逊旗下Ring推出了一个基于AI的应用商店,服务于其超一亿台部署的摄像头,目标是从家庭安防扩展到老年人照护、员工数据分析和房产管理等领域。该商店在2026年CES上首次亮相,支持第三方应用,如Density的Routines可检测老人跌倒或日常习惯变化,以及QueueFlow用于测量商业场所的拥堵情况。Ring创始人兼CEO杰米·西明诺表示,AI解锁了此前从未想象过的长尾应用场景。
但鉴于过去因监控问题引发的批评,Ring将禁止使用人脸识别或车牌识别等功能的应用。平台通过让用户外部安装合作方应用的方式,避开苹果和谷歌应用商店的抽成。
该应用商店目前仅对美国用户开放,且不会直接集成到Ring主App中——用户需单独下载合作伙伴的应用程序。Ring明确禁止具有隐私侵犯性质的功能,如人脸识别或车牌识别,以避免引发类似过去的公众争议。
TechCrunch AI

广泛使用的AI网关LiteLLM在发现Delve涉嫌提供虚假认证并牵涉到其开源版本遭受恶意软件攻击后,终止了与该合规公司的合作。
这一举动凸显了AI合规认证流程中的严重漏洞,引发了人们对第三方审计可信度的担忧——这对依赖此类保障的开发者和企业来说是一个关键问题。
广受欢迎的开源AI网关LiteLLM宣布终止与合规公司Delve的合作,原因是后者被指控提供虚假认证,并且近期发生的恶意软件攻击已入侵其开源版本。该公司曾通过Delve获得两项安全认证,而Delve被指伪造数据并使用未经认证的审计人员。
一名匿名举报人泄露了疑似违规证据,促使LiteLLM的CTO宣布转用Vanta并聘请独立审计机构。这一决定反映了业界对AI合规供应商日益增长的不信任,也强调了AI治理生态系统中透明度和问责制的重要性。
LiteLLM将改用Vanta作为新的合规服务商,并聘请独立审计机构验证其控制措施,此前匿名举报人提供了证据,表明Delve存在欺诈行为,且最近发生了窃取凭证的恶意软件事件。
The Decoder

甲骨文公司正计划裁掉2万至3万人,以筹集高达100亿美元的现金流,用于其雄心勃勃的500亿美元人工智能基础设施项目。自今年1月宣布该计划以来,该公司股价已下跌约四分之一。
这一举措标志着甲骨文向AI基础设施投资的重大战略转变,可能影响其他企业软件公司做出类似财务牺牲。同时,它也引发了对大规模AI支出可持续性的质疑,尤其是在合作伙伴如OpenAI的收入前景不确定的情况下。
甲骨文正在裁掉2万到3万名员工——约占其员工总数的12%至18%,以资助一项500亿美元的人工智能基础设施计划。截至2025年5月,该公司拥有16.2万名员工,但拒绝就裁员发表评论。自今年1月宣布AI投资计划以来,甲骨文股价已下跌约四分之一。
联合首席执行官克莱·马古伊尔克指出AI硬件需求强劲,并声称获得5530亿美元的保证收入,其中包括来自OpenAI的4550亿美元订单。然而,分析人士指出,OpenAI自身财务状况堪忧,这使得这些付款能否兑现仍存疑问。Meta也在据报道计划大规模裁员,以覆盖其自身的AI基础设施成本。
裁员是甲骨文为应对AI支出带来的债务上升而采取的措施;TD Cowen估计这些裁员每年可释放多达100亿美元现金流。甲骨文声称获得了5530亿美元的保证收入,其中包括来自OpenAI的4550亿美元,但这笔付款的确定性仍存疑。
The Decoder

谷歌DeepMind推出了Veo 3.1 Lite,这是成本更低的视频生成模型,价格不到Veo 3.1 Fast的一半,同时保持相同速度。它支持文本到视频和图像到视频生成,分辨率为720p和1080p,支持竖屏和横屏。
此举让开发者和初创公司更容易使用AI视频生成工具,尤其是在OpenAI关闭Sora之后。这使谷歌在由中国模型(如阿里巴巴的Seedance 2.0)主导的市场中更具竞争力。
谷歌DeepMind发布了Veo 3.1 Lite,这是目前最经济高效的视频生成模型。其成本比Veo 3.1 Fast低超过50%,同时保持相同速度。该模型支持720p和1080p分辨率的视频生成,支持竖屏和横屏,视频时长为4秒、6秒或8秒。
720p视频每秒定价从0.05美元起。这一发布恰逢OpenAI关闭Sora,使得谷歌成为该领域的主要玩家之一,与阿里巴巴的Seedance 2.0等中国竞争对手并列。开发者可通过Gemini API和Google AI Studio访问此模型。
720p视频每秒定价从0.05美元起,该模型现已通过Gemini API和Google AI Studio提供。谷歌还宣布从4月7日起下调Veo 3.1 Fast的价格。
The Decoder

生成式AI显著加快了客户服务、编程和写作等单个任务的速度,但由于验证成本高、指标不完善和组织惰性,这些效率提升很少能转化为企业的实际经济收益。
从任务层面到企业整体生产力的鸿沟揭示了AI落地的关键瓶颈:企业必须解决模型部署之外的系统性问题,才能真正实现价值。
文章指出,尽管生成式AI在特定任务上表现优异(如处理客户工单或编写代码),却常常无法提升企业的整体生产力。这是因为现实工作包含复杂的子任务链、审批流程、中断和验证开销,而这些并未体现在基准测试中。问题在于,企业往往假设任务效率提升会自动带来经济效益,却忽视了度量体系缺失、员工抵触和知识型岗位缺乏结构化绩效追踪等实际障碍。
研究显示AI辅助可使任务完成速度提高14%至55%,但这些收益常被验证输出所需时间、将AI整合进现有流程以及知识型工作中缺乏有效生产力衡量所抵消。
The Decoder

·#ai
阿里巴巴通义千问Qwen3.5-Omni模型展示了无需专门训练即可从语音和视频输入中生成代码的能力。它在音频基准测试中优于谷歌Gemini 3.1 Pro,并支持74种语言的语音识别。
这一能力可能彻底改变人类与AI的交互方式,实现通过自然对话和视觉上下文进行无手编程。这表明扩大多模态训练规模可能激发未被明确教授却非常实用的新技能。
阿里巴巴发布了Qwen3.5-Omni,这是一个能处理文本、图像、音频和视频的多模态AI模型。它支持高达256,000个token的上下文长度,可处理超过10小时音频或400秒720p视频。最令人惊讶的是,该模型在大规模多模态训练中意外获得了从语音指令和视频片段中编写功能代码的能力——而这种能力从未被专门训练过。
团队称其为“音视频氛围编码”(audio-visual vibe coding)。此外,模型还能从媒体中生成带时间戳、角色描述和声音提示的详细脚本。新推出的ARIA机制通过动态同步文本和音频标记改善了实时语音输出质量。
该模型基于超过一亿小时的音视频数据原生预训练,采用混合注意力-专家混合(MoE)架构,并引入ARIA(自适应速率交错对齐)技术以提升实时语音合成质量。代码生成能力是在训练扩展过程中自然涌现的‘新兴能力’。
The Decoder

Nebius集团宣布将在芬兰拉普阿市建设一个价值100亿美元、功率达310兆瓦的人工智能数据中心,由Polarnode公司承建,分阶段于2027年开始运营。该设施将支持欧洲范围内的大规模人工智能训练,且不绑定单一客户。
这是欧洲最大规模的人工智能基础设施项目之一,凸显了低成本、可再生能源驱动的数据中心对AI发展的战略意义。其靠近俄罗斯的位置也带来了地缘政治影响,尤其是在技术供应链和能源安全日益受关注的背景下。
Nebius集团正在芬兰拉普阿市建设一个价值100亿美元的数据中心,靠近俄罗斯边境。该设施容量为310兆瓦,将是欧洲最大的人工智能数据中心之一。由芬兰开发商Polarnode负责施工,从2027年起分阶段投入使用。
该中心将用于训练AI模型并运行各类应用,不局限于单一客户。Nebius选择芬兰是因为这里电价低、可再生能源丰富,且气候凉爽利于降温。该项目标志着欧洲人工智能基础设施的重大投资,也是公司首次在北美之外进行如此大规模的扩展。
该选址利用芬兰低廉的电价、丰富的可再生能源和天然低温气候来降低冷却成本——这是数据中心经济中的关键因素。它将占Nebius总规划容量的大约10%,也是该公司在美国以外最大的设施。
The Decoder

OpenAI 发布了一个插件,将自家的 Codex 编程助手直接嵌入 Anthropic 的 Claude Code 中,提供代码审查、对抗性审查和后台任务移交功能。该插件在 OpenAI 的基础设施上运行,并需要 ChatGPT 订阅或 API 密钥。
这一举措使 OpenAI 能更有效地在企业编程领域竞争,因为它不是强迫开发者切换工具,而是直接进入他们已使用的 Claude Code 工作流。这还为未来模型升级和生态系统的持续使用建立了持久接触点。
OpenAI 发布了一个插件,将自家的 Codex AI 编程助手嵌入 Anthropic 的 Claude Code 中,允许用户进行标准代码审查、激进的对抗性审查,并将任务委托给后台的 Codex。OpenAI 没有等待开发者转向 Codex,而是直接将其带入主流平台。每次审查都在 OpenAI 的服务器上运行,生成使用数据并建立持续互动点。
该插件无需安装新软件——它复用现有 Codex 设置和凭证。一个“审查门”功能确保没有代码在 Codex 审查通过前被提交。这一战略转变与 OpenAI 更广泛的计划一致:聚焦企业客户,并将 ChatGPT、Codex 和 Atlas 合并为一个桌面应用程序。
该插件使用用户机器上已安装的 Codex 实例,并包含一个“审查门”功能,阻止 Claude Code 在 Codex 审查完成前提交更改。它支持 Node.js 18.18 或更高版本,已在 GitHub 上发布,获得超过 3,700 个星标。
The Verge AI

三星Galaxy S26在其相册应用中引入了基于自然语言的AI照片编辑功能,用户可通过简单文字指令修改图片内容,如添加人物或更换衣物——这一功能虽效仿谷歌,但表现出更少的限制。
这标志着我们对数字记忆认知的重大转变——如果照片可以轻松被修改成从未发生的样子,就动摇了个人和共享视觉历史的真实性,尤其是在这类工具变得普及的情况下。
三星Galaxy S26配备AI照片编辑器,允许用户通过自然语言命令编辑图片,例如添加朋友或更换服装。虽然它避免了制造犯罪场景等极端篡改,但在细微、合理的范围内扭曲现实方面表现突出。该工具效果不够逼真,常呈现卡通化结果,但对于日常使用已足够可信。
三星添加了小水印和内容凭证,但这些信息难以发现。这引发了关于用户如何在无明显标识的情况下重塑记忆的伦理担忧。
该AI工具设有防止有害编辑的防护机制(例如删除衣物或添加武器),但仍允许误导性修改,比如将名人插入照片;标明AI使用的水印很小且容易被裁掉。
Simon Willison
·#llm
Simon Willison 发布了 datasette-llm 0.1a4,新增功能可为不同模型用途配置独立的 API 密钥——例如为 gpt-5.4-mini 的增强任务分配专用密钥。该版本还附带了用于测试 API 密钥的 llm-echo 0.3 工具。
此功能通过按使用场景隔离访问权限,提升了 LLM 工作流的安全性和组织性——例如将增强任务与聊天或摘要任务分开管理。在需要精细化控制模型使用的生产环境中,这对治理至关重要。
2026年3月31日,Simon Willison 发布了 datasette-llm 0.1a4,引入了为不同模型用途分配唯一 API 密钥的功能——例如为 gpt-5.4-mini 的增强任务分配专属密钥。这使得开发者和管理员可以在 Datasette 应用中更安全、清晰地管理不同 LLM 功能的访问权限。
为了支持这一新功能的测试,他还发布了 llm-echo 0.3 工具,用于验证 API 密钥。此次更新体现了 Datasette LLM 插件生态系统的持续改进,包括对异步模型处理和插件钩子(如 register_models())的优化,整体提升了开发者构建数据驱动 AI 功能时的灵活性和可控性。
该版本允许用户为特定模型角色(如“增强”、“聊天”)分配不同的 API 密钥,提升可审计性和降低密钥配置错误的风险。同时新增了 llm-echo 0.3 工具,便于开发阶段测试密钥配置。
TechCrunch AI

·#ai
Yupp是一家众筹式AI模型对比平台,在获得a16z加密货币的克里斯·迪克森3300万美元投资后,仅运营不到一年便宣布关闭,尽管它已拥有130万用户和排行榜。
此次关闭凸显了即使拥有大量用户和知名投资人,也难以通过AI数据收集实现盈利,为快速变化的AI市场中的产品-市场契合度提供了重要教训。
Yupp由潘卡吉·古普塔和吉拉德·米什内于2025年创立,旨在对800多个AI模型(包括OpenAI、谷歌和Anthropic的模型)进行众包比较。用户可以并排测试回复,并评分哪个模型表现��佳。公司称拥有130万用户和每月数百万条偏好数据。
尽管获得了由a16z加密货币的克里斯·迪克森领投的3300万美元种子轮融资,以及超过45位天使投资者的支持(包括杰夫·戴恩和比兹·斯通),它仍未能实现可持续的产品-市场契合度。创始人表示,AI技术的快速迭代和模型厂商重心转向代理系统而非人类反馈是主要原因。该公司现已关闭,部分员工将加入知名AI公司。
Yupp每月收集数百万条来自800多个AI模型的用户偏好,但未能从实验室获得足够收入维持运营,因为模型提供商越来越依赖专家驱动的反馈循环。
TechCrunch AI

亚马逊推出了 Alexa+ 的新功能,用户可通过自然语言在单次对话中从优步外卖和Grubhub下单。用户可在点餐过程中随时修改菜品、添加饮料,无需重新开始流程。
该更新显著提升了 Alexa+ 用户的语音点餐体验,使其更加直观高效,契合人工智能助手的行业趋势。同时通过将热门外卖服务整合进其智能家居平台,增强了亚马逊生态系统的竞争力。
亚马逊为其 Alexa+ 助手新增了支持优步外卖和Grubhub的对话式订餐功能。用户现在可以在一次连续对话中探索菜系、提问、修改订单并添加甜点等附加项。该功能利用生成式AI减少来回交互,模拟人们在餐厅点餐的方式。
使用前需通过 Alexa 应用绑定外卖账户,之后历史订单将自动同步。此功能首先面向配备 Echo Show 8 及以上设备的 Alexa+ 用户推出,亚马逊认为这是未来扩展至生鲜购物和旅行预订的基础。这标志着智能家庭中更贴近人类交互方式的 AI 技术迈出了重要一步。
该功能目前仅对配备 Echo Show 8 或更大屏幕的 Alexa+ 订阅用户开放,需通过 Alexa 应用程序绑定 Grubhub 或优步外卖账户。历史订单会自动同步,便于快速重订喜爱的餐品。
TechCrunch AI

昆尼皮亚克大学于2026年3月进行的一项民意调查发现,15%的美国人愿意让AI程序担任直属主管,这标志着人们对AI管理角色的态度出现了显著变化。
这反映了人们对AI担任领导角色的日益接受,预示着自动化可能重塑组织层级结构,影响人力资源策略、员工信任和各行各业的工作安全。
根据昆尼皮亚克大学2026年3月的一项民意调查,15%的美国人表示愿意接受AI作为直属主管,负责分配任务和安排日程。这项针对1397名美国成年人的调查还显示,70%的受访者认为AI将减少整体就业机会,其中30%的在职人士担心自己的工作会被AI取代。Workday和亚马逊等公司已经开始使用AI代理处理管理职责,亚马逊甚至因AI驱动的工作流程变革而裁掉数千名经理。
Uber工程师还创建了一个CEO达拉·科斯罗沙希的AI模型,在正式会议前筛选提案。这些进展表明一种被称为“大扁平化”的趋势正在形成,传统管理层级正通过自动化被逐步淘汰。
该调查涵盖1397名美国成年人,结果显示尽管大多数人反对AI主管,但Workday和亚马逊等公司已开始部署AI处理费用审批和中层管理替代等任务。
The Verge AI

·#ai
Apple 的 CarPlay 现在支持仅通过语音与 ChatGPT 对话,驾驶员可以通过语音命令与 AI 助手互动,而无需在屏幕上看到文字。该功能需要 iOS 26.4 或更高版本以及最新版的 ChatGPT 应用。
这一更新通过实现免提交互提升了车内 AI 助手的可用性,提高了驾驶时的安全性和便利性。这也标志着将先进 AI 能力整合进汽车系统的更广泛趋势。
苹果通过 iOS 26.4 更新在 CarPlay 中新增了对语音对话类应用(如 ChatGPT)的支持。这使得用户可以仅通过语音与 ChatGPT 互动,而无需在车载屏幕上看到文字。虽然该应用不会显示聊天记录或消息,但仍保留了静音和结束对话等基本控制按钮。
用户必须手动打开应用,不能使用唤醒词激活。这一改动符合苹果减少驾驶分心的策略,限制了车内视觉交互。
CarPlay 版本的 ChatGPT 不会显示任何文字回复——根据苹果开发者指南,仅允许语音输出。用户仍可查看最近的对话记录,并通过屏幕上的按钮控制会话。
ZDNET AI

三星Galaxy Watch 4及更新型号现在可在美启用血压监测功能,但需使用外接血压计每28天校准一次。该功能在其他地区已多年可用,但在美国因FDA审批而延迟。
这项更新对关注健康的用户意义重大,特别是那些因紧张导致诊室血压偏高的“白大衣综合征”人群。它可实现日常血压连续监测,提升健康数据的准确性,并改善医患沟通。
经过多年的等待,美国三星Galaxy手表用户现在可以使用兼容设备(如Galaxy Watch 4和Ultra 2025)监测血压。手表本身不直接测量血压,而是通过认证血压计进行校准——每28天需要重新校准一次。该功能旨在帮助用户全天跟踪血压趋势,特别适合那些因紧张导致诊室血压升高的“白大衣综合征”人群。
虽然不能替代医学诊断,但它能提供有价值的现实数据供医生参考。与苹果仅通过30天模式检测高血压不同,三星提供实际的收缩压和舒张压读数。早期使用者表示,即使使用非官方方法也能获得相当准确的结果,但官方版本确保了更高的可靠性和合规性。
用户需在安卓手机上下载Samsung Health Monitor应用并配对手表;首次设置和每月校准都需要认证的血压计。该功能不能替代医疗诊断,但有助于追踪趋势并验证如白大衣高血压等状况。
ZDNET AI

谷歌推出了一项新功能,用户可以更改Gmail用户名(@gmail.com前的部分),而不会丢失任何账户数据,包括邮件、照片和Google云端硬盘中的文件。
这项更新解决了数百万用户长期以来的痛点:他们希望更换过时或令人后悔的邮箱地址,同时保留对所有服务和数据的访问权限。
谷歌已正式推出更改Gmail地址而不会丢失任何账户数据的功能。此前,如果用户想放弃旧用户名,必须创建一个全新的账户——这既繁琐又破坏性很强。现在,当你更改地址时,旧地址会变成备用邮箱,继续接收邮件,甚至还能用来发信。
这意味着你无需更新每一个使用旧邮箱的服务。该功能可在桌面端、安卓和iOS设备上通过myaccount.google.com访问。谷歌将此操作限制为每年仅一次,且一生最多更改三次,总共四个关联地址。
你每年只能更改一次Gmail地址,一生最多更改三次;旧地址会变成备用邮箱,仍可接收邮件,并可选择用它发信。
ZDNET AI

苹果公司将于2026年4月迎来成立50周年,但其官方声明和首席执行官蒂姆·库克的贺信中均未提及史蒂夫·乔布斯和史蒂夫·沃兹尼亚克。文章指出,这两位创始人对苹果早期的成功起到了决定性作用,因此这一遗漏令人遗憾。
这一疏忽引发了关于企业如何铭记创始人的讨论,尤其是在这些创始人曾以远见和冒险精神奠定今日万亿市值帝国基础的情况下。这也反映了科技巨头在品牌塑造、创新传承与文化记忆方面的深层问题。
苹果公司将于2026年4月1日迎来50周年纪念,但其庆祝活动却未提及两位联合创始人史蒂夫·乔布斯和史蒂夫·沃兹尼亚克。尽管CEO蒂姆·库克称颂“异类”和“叛逆者”,却忽略了正是他们践行了这种精神。文章回顾了苹果从车库初创企业到全球科技巨头的发展历程,强调沃兹尼亚克的工程才华与乔布斯的营销眼光共同催生了Apple II——这款设备让计算机走进教室和家庭。
虽然苹果后来的成功依赖于生态锁定和奢侈品定位,但最初的愿景是让技术变得可及并普及。此次周年庆典中完全未提及乔布斯或沃兹尼亚克,既具象征意义也引发争议。
1976年乔布斯家车库中打造的Apple I是一款面向极客的裸电路板;1977年发布的Apple II则成为主流产品,定义了X世代的个人计算体验。自Apple Watch以来,苹果尚未推出任何重大新产品。