Topic
#ai
按主题聚合的新闻视图。
Topic Feed
主题:ai
共 341 条

Origin Lab 融资 800 万美元打造游戏数据市场
Origin Lab 宣布完成 800 万美元种子轮融资,由 Lightspeed Ventures 领投。该公司希望搭建一个授权视频游戏数据的交易市场,把游戏发行商与正在构建世界模型的 AI 实验室连接起来,包括面向机器人方向的团队以及 AMI Labs 和 World Labs 这类机构。

Thinking Machines 推进全双工 AI 对话
由前 OpenAI CTO Mira Murati 创立的 Thinking Machines Lab 宣布推出“交互模型”,目标是实现全双工对话,让模型能够一边接收输入、一边生成回应。公司称其 TML-Interaction-Small 模型的响应时间为 0.40 秒,并计划在未来几个月先开放有限研究预览,之后于今年晚些时候扩大发布。

Thinking Machines推出实时交互模型
由前 OpenAI CTO Mira Murati 创立的 AI 初创公司 Thinking Machines 表示,它正在开发一种名为“交互模型”的系统,能够通过音频、视频和文本与用户实时协作。公司还展示了几个示例,包括在故事中识别动物、实时翻译语音,以及提醒用户自己在驼背。

Cloudflare因AI效率提升裁员1100人
Cloudflare表示将裁员约1100人,约占员工总数的20%,这是公司16年来首次大规模裁员。公司将这一决定归因于AI带来的效率提升,同时公布季度营收达到6.398亿美元,创下历史新高。

DeepL 裁员约 250 人并重组为 AI 原生组织
DeepL 表示将裁减约 250 名员工,同时重组为一家“AI 原生”公司。首席执行官兼创始人 Jarek Kutylowski 在 LinkedIn 上宣布了这一决定,并称公司还将扩大其实时语音翻译业务。
OpenAI在API中加入实时语音模型
OpenAI在其API中发布了新的实时语音模型,这些模型可以进行推理、翻译和语音转录。此次更新旨在帮助开发者构建更自然、更智能的语音体验。

DeepSeek 首轮融资估值或达 450 亿美元
据报道,DeepSeek 正在洽谈其首轮风险投资融资,短短几周内估值已从约 200 亿美元飙升至最高 450 亿美元。报道称,这将是这家中国 AI 实验室首次引入外部投资者。
Meta因Llama训练版权主张遭起诉
Meta及其首席执行官马克·扎克伯格被多家大型出版商起诉,指控其在训练Llama AI模型时存在“规模巨大”的版权侵权行为。诉讼核心是指控Meta在构建其基础模型时未经授权使用了受版权保护的作品。

ChatGPT和Perplexity AI在CarPlay语音助手测试中胜过Siri
苹果已为CarPlay添加了对第三方AI语音助手(如ChatGPT和Perplexity AI)的支持,使用户可以在驾驶时免提使用这些服务。作者测试了这两个应用,发现它们在处理复杂问题方面比Siri更出色。

TechCrunch 排名 2025 年最佳 AI 语音转文字应用
TechCrunch 对 2025 年最优秀的 AI 语音转文字应用进行了评测和排名,强调了大语言模型(LLM)带来的语音识别准确率提升和智能格式化功能。文章对比了 Wispr Flow、Willow、Monologue、Superwhisper、VoiceTypr 和 Aqua 等应用,涵盖隐私保护、自定义选项和离线支持等功能。

埃隆·马斯克称自己愚蠢,曾资助OpenAI
埃隆·马斯克正在起诉OpenAI,声称他早期投入的3800万美元帮助建立了价值8000亿美元的公司,并认为该组织违背了其最初的非营利使命。他在联邦法院作证时表示,是他提出了这个想法、招募了关键人员(如伊利亚·苏茨克弗),并提供了全部初始资金。

五角大楼与英伟达、微软、亚马逊签署AI协议用于机密网络
美国国防部已与英伟达、微软、亚马逊云服务和Reflection AI达成协议,允许他们在影响等级6和7的机密网络上部署AI模型,供军事人员合法使用。

大科技公司AI支出预计2026年达7250亿美元
谷歌、亚马逊、微软和Meta等科技巨头预计将在2026年投入7250亿美元用于人工智能,较去年的4100亿美元增长了77%。这一激增反映了基础设施成本上升、算力短缺以及向按用量计费模式转变的趋势。

微软在Word中引入AI法律代理进行合同审查
微软推出了一个专门的AI法律代理,嵌入到Word中,可逐条款审查合同、标记风险并建议修改,同时保持格式和合规性。该功能目前仅对美国M365 Copilot用户的Frontier计划成员开放。

Adobe Photoshop 新AI工具可将2D对象旋转至3D空间
Photoshop v27.6 引入了名为“旋转对象”的新功能,这是一项利用AI的技术,允许用户将2D图像在3D空间中旋转并生成缺失的部分。它能与现有的“调和”功能无缝配合,实现逼真的合成效果。

ChatGPT 图像2.0在印度火爆,但全球采用率仍有限
OpenAI最新推出的ChatGPT图像2.0功能上线一周内,在印度获得约500万次下载,而其他地区仅显示出小幅增长。

Anthropic计划融资500亿美元,估值超9000亿美元
Anthropic正在筹备一笔可能高达500亿美元的融资,估值或将超过9000亿美元,这可能是其上市前的最后一轮融资。投资者被要求在48小时内提交投资意向,该轮融资预计两周内完成。

马斯克律师在作证期间可能犯下关键错误
在马斯克与阿尔特曼诉讼案中,杰里德·伯奇尔作证时,一张纸条揭示了xAI曾提交974亿美元的报价以收购OpenAI非营利资产——这一细节此前未向法庭披露。法官随后在陪审团离场时直接质询伯奇尔,引发对其律师团队披露不充分的担忧。

谷歌Gemini AI助手登陆数百万辆汽车
谷歌正在将其先进的Gemini AI助手部署到搭载Google内置系统的车辆中,使驾驶员能够进行更自然的对话式交互。该更新将通过软件升级方式提供给现有车辆,并不限于通用汽车车型。

谷歌Gemini AI助手将登陆搭载谷歌系统的汽车
谷歌正在向搭载谷歌系统的汽车推送其Gemini AI助手,取代现有的谷歌助手。这项更新将通过软件升级提升语音交互和车辆特定功能,适用于新旧车型。

X推出AI驱动的广告平台以提升收入
X(前身为Twitter)推出了一个由人工智能驱动的全新广告平台,包含现代化的检索和排序系统,旨在帮助营销人员更精准地投放广告并提升效果。

ChatGPT 图像 2.0 能够精准重设计应用界面
作者将两个实际的应用界面输入到 ChatGPT 图像 2.0 中,发现它能识别设计问题并生成有意义的改进建议,包括更清晰的布局、更好的标题区域和更直观的图标。

谷歌计划到2026年投资1900亿美元用于AI和云基础设施
Alphabet计划到2026年投资高达1900亿美元用于AI和云基础设施,谷歌云收入同比增长63%,达到200多亿美元。CEO桑达尔·皮查伊表示,用户喜欢AI概览并更频繁地返回搜索。

Anthropic推出BioMysteryBench,显示Claude在生物信息学领域达到人类专家水平
Anthropic推出了BioMysteryBench,这是一个基于真实、杂乱数据的新基准测试,用于评估AI模型在生物信息学任务中的表现。Claude Mythos Preview在76个可解决的问题上达到人类专家水平,在23个极难问题中取得了30%的成功率。

Meta企业AI每周处理千万次对话
Meta的企业AI助手现在每周处理约1000万次对话,较年初的100万次大幅增长。公司已将测试版扩展至全球多个地区,并计划未来推出付费模式。

Anthropic正在评估估值超9000亿美元的融资方案
Anthropic正在评估可能使公司估值超过9000亿美元的投资者提案,这可能使其成为全球最有价值的人工智能初创企业。该公司此前已拒绝了估值在8000亿美元或更高的多个提案,表明其希望获得更高估值。
谷歌领跑科技巨头AI投资计划,总额达7250亿美元
谷歌母公司Alphabet在AI投资上领先其他科技巨头,整个行业计划投入7250亿美元。与此同时,Meta因资本支出增加股价下跌6.5%,而Alphabet的云业务增长速度超过了亚马逊和微软。

软银将推出机器人公司Roze AI,目标估值1000亿美元IPO
软银正在创建名为Roze AI的机器人公司,专注于自动化美国数据中心建设,并已开始筹备可能在2026年底进行的估值达1000亿美元的首次公开募股(IPO)。

Anthropic拟以9000亿美元估值融资500亿美元,或为最后一轮私有融资
Anthropic正考虑以9000亿美元估值融资500亿美元,这一轮可能是其上市前的最后一轮融资,反映了投资者的强烈兴趣和公司快速增长。

微软将免费使用OpenAI的AI模型至2032年
微软CEO萨蒂亚·纳德拉确认,微软将充分利用其到2032年免版税访问OpenAI最先进AI模型的权利。这标志着微软对OpenAI技术独家使用权的终结,并允许OpenAI与亚马逊等竞争对手合作。

微软报告2000万付费Copilot用户且使用率高
微软宣布其企业版Copilot已拥有2000万付费座位,用户活跃度与Outlook相当。公司还全面推出了Copilot的代理功能,支持在文档中执行多步骤操作。
谷歌和Meta上调AI支出预测
Meta将2026年AI支出预测上调至1250亿至1450亿美元,谷歌也加大了对AI基础设施的投资。与此同时,Facebook股价下跌7%,而Alphabet、微软和亚马逊的云业务增长强劲。

Runway首席执行官称AI视频只是开始,世界模型才是未来
Runway首席执行官克里斯托瓦尔·瓦伦苏埃拉表示,AI生成视频只是迈向通用世界模型的一步——这些高级AI系统能够模拟和理解现实世界,用于游戏、机器人技术甚至通用人工智能(AGI)。

谷歌相册推出受《霹雳娇娃》启发的AI数字衣橱功能
谷歌相册推出了一项基于人工智能的新功能,可将用户衣物照片转化为虚拟衣橱,支持搭配组合和虚拟试穿。该功能直接灵感来自1995年电影《霹雳娇娃》中雪儿的标志性数字衣橱。

谷歌在谷歌电视上扩展Gemini人工智能功能,加入图像与视频生成工具
谷歌正在将新的Gemini人工智能功能引入谷歌电视,包括图像生成工具Nano Banana和视频创作工具Veo,最初面向美国市场的TCL设备推出。

Google相册推出AI虚拟衣橱功能,可试穿已有衣物
Google相册推出了一个基于AI的虚拟衣橱功能,用户可以通过图库中已有的衣物照片创建搭配组合。该功能支持虚拟试穿上衣、下装、裙子、连衣裙和鞋子等单品。

OpenAI研究者称数学是通往AGI的关键路径
OpenAI的研究员塞巴斯蒂安·布贝克和埃斯特·柳指出,AI在数学推理上的快速进展——例如仅用12小时就解决了一个42年前的优化问题——是迈向人工通用智能(AGI)的重要标志。他们表示,模型现在能处理以前不可能完成的复杂、多日推理任务。

ChatGPT下载量放缓,卸载率上升,影响OpenAI上市前景
ChatGPT 用户增长显著放缓,卸载率大幅上升——2024年4月同比激增413%,而竞争对手如Claude则正在快速崛起。这一趋势与OpenAI计划中的IPO同步出现,并引发公司内部对收入和用户增长目标的担忧。

甲骨文豪赌3000亿美元押注OpenAI,押注其AI未来
甲骨文与OpenAI签署了一份为期五年、价值3000亿美元的计算资源合同,标志着该公司从传统数据库业务全面转向人工智能基础设施。这是历史上规模最大的科技合作之一,彰显了甲骨文对AI热潮的全力押注。

OpenAI在结束微软独家合作后登陆AWS
在与微软终止独家协议一天后,OpenAI在AWS Bedrock平台上推出了三项新服务,包括GPT-5.4、Codex和Bedrock托管代理。这些服务目前处于有限预览阶段,标志着OpenAI云战略的重大转变。

英伟达发布Nemotron 3 Nano Omni,公开训练数据细节
英伟达发布了Nemotron 3 Nano Omni,这是一个拥有300亿参数的开源多模态模型,使用7170亿个标记进行训练,其中包含来自Qwen、GPT-OSS和DeepSeek-OCR等模型的合成数据,并提供商业使用授权和完整的训练流程透明度。
人工智能推动下一代Robotaxi全球部署
人工智能的进步正在加速Robotaxi(无人出租车)的全球部署,从早期的小规模测试转向大规模应用,标志着自动驾驶技术进入新阶段。

亚马逊AWS在独家授权解除后迅速推出新OpenAI产品
亚马逊AWS在微软对OpenAI产品的独家授权终止后,迅速推出了最新的OpenAI模型、代码生成工具Codex以及名为Bedrock Managed Agents的新代理服务。

亚马逊推出产品页面上的AI语音问答功能
亚马逊推出了名为“加入聊天”的新功能,用户可通过文字或语音提问,获得由AI实时生成的对话式音频回答。该AI会整合产品详情、评论和上下文信息,提供个性化且动态的回答。

仅训练于1931年前文本的AI模型想象2026年是一个蒸汽驱动的世界
研究人员构建了名为'talkie'的130亿参数语言模型,该模型仅使用1931年以前出版的文本进行训练,它将2026年设想为以蒸汽船、铁路和二战前乐观主义为主的世界。

Claude现已可直接接入Photoshop、Blender和Ableton
Anthropic发布了新的连接器,使Claude能够直接与Adobe创意云应用(如Photoshop和Premiere)、Blender的Python API以及Ableton文档进行交互。用户可以通过自然语言在这些创意工具中检索数据、执行操作并生成内容。

GitHub将于2026年6月起按实际AI使用量计费Copilot用户
从2026年6月1日起,GitHub将从固定的每月请求模式转向基于令牌的计费系统,用户根据AI交互中实际消耗的输入、输出和缓存令牌数量付费。

Canonical 的 AI 策略强调开放性和用户选择权
Canonical 正在将 AI 集成到 Ubuntu 26.04 及以后版本中,重点在于开源模型、默认本地推理以及用户可选择启用的 AI 功能——这与微软集中式的 Copilot 策略形成鲜明对比。

YouTube测试AI驱动的‘Ask YouTube’功能,提供引导式答案
YouTube正在测试名为“Ask YouTube”的新AI搜索功能,该功能能为旅行计划或食谱等查询提供分步、多模态(文本+视频)的回答。
马修·伊格莱西亚斯谈AI编程:从随性编码转向专业工具
马修·伊格莱西亚斯表示,在使用AI编程工具五个月后,他不再想进行‘随性编码’——即个人对AI辅助开发的随意尝试——而是更希望专业公司利用这些工具为消费者打造更好、更便宜的软件产品。

红帽工程师发布Tank OS,提升OpenClaw AI代理部署安全性
红帽高级软件工程师Sally O’Malley发布了Tank OS,这是一个开源工具,可在Linux系统上通过安全隔离的Podman容器运行OpenClaw AI代理。它支持个人用户和企业IT团队的安全自动部署及多实例运行。

OpenAI终止与微软的独家云合作
OpenAI 和微软已修改合作关系,允许 OpenAI 将其模型部署在 AWS 和谷歌云等其他云平台上,同时微软保留到 2032 年的非独家知识产权许可,并继续作为主要云合作伙伴。

GitHub Copilot 从2026年6月起转向按token计费
从2026年6月1日起,GitHub Copilot将从当前的高级请求单位(PRU)系统转为基于使用量的计费模式,采用AI积分按token消耗计费。这意味着用户需按输入、输出和缓存token的API费率付费。

中国阻止Meta以20亿美元收购AI初创公司Manus
中国正式阻止了Meta对AI初创公司Manus的20亿美元收购,理由是国家安全问题,并要求Meta在2026年4月27日前撤销交易。该决定是在2025年12月完成收购后,由中国监管机构数月审查的结果。

戴维·西尔弗筹集11亿美元打造无需人类数据的AI
前DeepMind研究员戴维·西尔弗为新成立的人工智能实验室Ineffable Intelligence筹集了11亿美元,目标是开发一种完全通过强化学习(而非人类标注数据)进行自我学习的“超级学习者”。

微软与OpenAI重新谈判协议,删除AGI条款
微软和OpenAI重新谈判了合作关系,删除了此前规定收入分成和独家云服务访问权的“通用人工智能(AGI)条款”。OpenAI现在可以使用任何云服务商——包括亚马逊AWS或谷歌云——同时微软仍是其主要云合作伙伴,并保留从外部合作中获得的收入分成。

Skye人工智能主屏幕应用获投资方青睐,即将登陆iPhone
由Signull Labs开发的iPhone应用Skye正在私测阶段,它通过iOS小部件构建一个‘代理式主屏幕’,提供个性化洞察、提醒和情境化帮助,无需打开聊天机器人或应用。该应用已获得超358万美元的种子轮融资,并在正式发布前吸引了数万名用户加入等待名单。

ChatGPT Images 2.0 在图像生成测试中胜过 Gemini Nano Banana
一次实测对比显示,ChatGPT Images 2.0 在图像生成任务中得分 97%,而谷歌的 Gemini Nano Banana 得分为 85%。测试重点在于包含文本和情境感知能力。

OpenAI与微软终止独家协议并删除AGI条款
OpenAI与微软重新调整了合作关系,取消了排他性条款和有争议的AGI条款。OpenAI现在可以将其AI产品分发到任何云服务商平台,而微软则保留至2032年的非独占许可权。

企业因数据基础设施薄弱而难以采用人工智能
企业尽管有强烈的AI雄心,但在规模化部署AI时仍面临巨大障碍,主要原因是数据系统碎片化且缺乏治理。Databricks高管强调,统一、开放且受控的数据基础设施对实现有效AI至关重要。

人工智能正在将汽车设计从草图转变为数字模型
通用汽车正在使用Vizcom等AI工具,将手绘草图在数小时内转化为3D模型和动画,而过去这一过程需要数月。Neural Concept的AI驱动计算流体动力学(CFD)软件使捷豹路虎将空气动力学模拟时间从4小时缩短到1分钟。

湾区房主用土地换Anthropic股权
投资银行家Storm Duncan提出用位于米尔谷的一处13英亩地产换取AI公司Anthropic的股权。他称这是战略性资产配置调整,将房地产持仓换成AI股票,并在锁定期保留20%的股份增值权益。

OpenAI终止Codex模型,整合进GPT-5.5
OpenAI再次终止了独立的Codex编程模型,将其能力整合进GPT-5.5。该版本在代理式编程、计算机使用效率方面有显著提升,并且完成相同任务所需的token更少。

OpenAI建议开发者摒弃旧提示词以适配GPT-5.5
OpenAI发布了针对GPT-5.5的新提示工程指南,建议开发者放弃旧有的提示词,改用简洁、基于角色的目标导向指令,而不是繁琐的步骤说明。

GPT-5.5虽登顶基准测试但频繁幻觉且API费用上涨20%
GPT-5.5在多个AI基准测试中排名第一,但在BullshitBench这类欺骗性问题上仍频繁产生幻觉,且其API价格比GPT-5.4高出约20%,尽管每轮推理使用的token更少。

Cohere与Aleph Alpha合并打造欧洲主权人工智能
加拿大AI初创公司Cohere正在收购德国的Aleph Alpha,并获得Schwarz集团支持,以创建一个专注于为企业和欧洲公共部门提供主权人工智能解决方案的新实体。

为什么东京是2026年最重要的科技目的地
2026年4月27日至29日在东京大都会展览馆举办的SusHi Tech东京大会聚焦四大具体技术领域:AI基础设施、机器人技术、城市韧性及AI驱动的娱乐,并通过现场演示、专家讲座以及与TechCrunch的合作,选出一家初创企业参加其Disrupt Startup Battlefield比赛。
OpenAI 在 GPT-5.4 中整合 Codex,GPT-5.5 进一步提升代理能力
罗曼·于埃证实,OpenAI 从 GPT-5.4 版本开始将 Codex 整合进主模型中,不再有独立的代码处理路径。GPT-5.5 进一步增强了代理式编程、计算机操作以及在计算机上执行各类任务的能力。

OpenAI发布GPT-5.5,以双倍API价格提供代理型智能能力
OpenAI发布了GPT-5.5,这是一种能够自主处理编程、研究和数据分析等复杂任务的代理型模型。该模型现已通过API提供,价格是之前版本的两倍,标准版和Pro版均面向付费用户推出。

谷歌向AI初创公司Anthropic投资最高400亿美元
谷歌计划向AI初创公司Anthropic投资最多400亿美元,其中100亿美元基于其当前3800亿美元的估值,其余300亿美元与特定绩效目标挂钩。这延续了谷歌此前已投入超过30亿美元的合作关系。
OpenAI发布GPT-5.5提示指南供开发者使用
OpenAI发布了针对GPT-5.5的新提示指南,提供实用技巧,例如在长时间运行任务中发送早期用户更新,并使用`openai-docs`技能将代码迁移到新模型。

谷歌将投资最多400亿美元入股Anthropic
谷歌计划向AI初创公司Anthropic投资至少100亿美元,若达到特定绩效目标,投资金额可能增至400亿美元。这紧随亚马逊此前宣布的50亿美元投资之后,后者同样与绩效挂钩。

Meta AI工程师加入Thinking Machines实验室,该实验室刚达成巨额云合作
前Meta AI工程师王维尧(Weiyao Wang)因在多模态感知和SAM3D项目中的贡献,现已加入Thinking Machines实验室(TML)。此次变动发生在TML与谷歌达成数十亿美元云合作协议之后,使其能使用英伟达最新的GB300芯片。

ComfyUI获投3000万美元,估值达5亿美元
ComfyUI最初是一个开源项目,如今已发展为一家估值5亿美元的初创公司,并完成3000万美元融资。本轮融资由Craft Ventures领投,其他参与者包括Pace Capital和Chemistry。

OpenAI首席科学家称AI进展‘出人意料地缓慢’,但承诺将迎来重大飞跃
OpenAI首席科学家Jakub Pachocki和总裁Greg Brockman表示,近期AI进展比预期更慢,但他们预计GPT-5.5的发布将带来短期和中期的重大改进。
谷歌将投资高达400亿美元支持Anthropic的AI算力发展
谷歌计划向Anthropic投资最多400亿美元,首期投入100亿美元,估值为3500亿美元,后续300亿美元取决于性能目标达成。这包括未来五年内通过谷歌云提供额外5吉瓦的TPU计算能力。

Claude AI 利用连接器30分钟规划徒步旅行
Anthropic 的 Claude AI 新增了名为“连接器”的功能,可与 AllTrails、TripAdvisor 和 Spotify 等第三方服务集成,实现实时数据获取和任务执行。

美军在Claude之前就已广泛采用AI
美国军方的Project Maven项目是一个在谷歌因伦理争议退出后开发的AI瞄准系统,如今已成为现代战争的核心,并被北约采用。它将‘杀伤链’从数小时缩短到几秒,结合大语言模型后每天可处理多达5000个目标。

Mac mini缺货推高eBay价格,AI需求成主因
搭载M4芯片的基础款Mac mini(16GB内存+256GB固态硬盘)在苹果官网已售罄,导致eBay上该型号的新机和翻新机售价飙升至最高979美元,远超原价599美元。

Uber首席技术官将在StrictlyVC旧金山活动中探讨AI驱动的系统扩展
Uber首席技术官Praveen Neppalli Naga将于4月30日在StrictlyVC旧金山活动中发表演讲,探讨在人工智能时代如何扩展复杂的系统。

Nothing发布AI语音转文字工具Essential Voice
Nothing推出了名为Essential Voice的AI语音转文字工具,可将语音转换为格式化文本,去除“呃”、“啊”等填充词,并支持自定义语音快捷短语。该功能目前可在Nothing Phone (3)上使用,预计本月晚些时候推出Phone (4a) Pro版本,下月支持Phone (4a)。

ChatGPT 图像 2.0:文本准确图形生成的重大飞跃
OpenAI 发布了 ChatGPT 图像 2.0,这是一个新的图像生成模型,显著提升了文本渲染能力,并支持带品牌一致性的全页图形,包括准确的徽标放置和多语言文本。

Cohere以200亿美元收购Aleph Alpha,正值其创始人被罢免
加拿大AI公司Cohere收购了德国的Aleph Alpha,交易估值约为200亿美元。此次收购发生在Aleph Alpha刚刚罢免创始人乔纳斯·安德鲁利斯之后,并且该公司已从开发大型语言模型的战略中撤出。

GPT-5.5测试得分93/100,因过于积极而扣分
大卫·盖维茨对GPT-5.5进行了10轮测试,发现其能力很强,但在第1轮测试中因过度主动执行任务而被扣分,特别是它没有遵守指定来源的要求。


深度求索发布V4模型预览,对标美国领先AI系统
深度求索发布了其下一代AI模型V4的预览版本,声称该模型可与OpenAI和Anthropic等美国领先系统竞争。该模型拥有1万亿参数、多模态能力,并针对NVIDIA和华为芯片进行了优化。

DeepSeek V4:最大开源模型,成本低性能高
DeepSeek发布了V4系列的两个预览模型:DeepSeek-V4-Pro(总参数1.6万亿)和DeepSeek-V4-Flash(总参数2840亿)。两者均为专家混合(MoE)模型,支持最多100万token上下文,并采用MIT许可证。
西蒙·威尔逊每周简报聚焦AI与PDF工具
西蒙·威尔逊在2026年4月24日的简报中介绍了DeepSeek V4、基于浏览器的PDF解析工具LiteParse,以及一些有趣的插图,如骑自行车的鹈鹕。此外还包含新的博客文章和开发者工具链接。
Anthropic修复导致Claude Code质量下降的三个漏洞
Anthropic的事故分析报告指出,Claude Code近期的质量问题源于三个系统框架(harness)中的漏洞,而非模型本身;其中一个关键漏洞会错误地每轮都清除模型记忆,导致其表现像“健忘”一样。

Sierra收购AI初创公司Fragment以增强代理开发能力
由布雷特·泰勒创立的Sierra收购了YC支持的法国AI初创公司Fragment,以加强其代理开发能力。这是Sierra在几个月内第三次公开收购,此前已收购Opera Tech和Receptive AI。

Meta因AI投资计划裁员10%员工
Meta计划在5月裁员约8000人,并关闭6000个开放职位,这是其为支持人工智能基础设施投资和启动Meta超级智能实验室而进行重组的一部分。

Noscroll:AI机器人帮你完成信息过载的刷屏任务
Noscroll是一款新推出的AI驱动机器人,能监控社交媒体、新闻网站和其他在线来源,仅通过短信发送重要更新。它最近上线,允许用户定制关注话题,并按自己偏好的频率接收精选摘要。

OpenAI发布GPT-5.5,向多功能AI超级应用迈进
OpenAI发布了其迄今为止最先进的模型GPT-5.5,相比之前的GPT-5.4版本,它更快、更直观,并且在代理计算方面表现更好。公司认为这是实现其设想的‘超级应用’的关键一步,该应用将整合ChatGPT、Codex和AI浏览器等功能。

特朗普顾问称中国大规模复制美国AI模型
前特朗普科学顾问迈克尔·克拉茨奥斯声称,中国行为体正系统性地大规模复制美国AI模型,使用蒸馏和代理账户技术。该过程涉及从大型美国模型中提取知识,以创建性能相似但成本更低的小型模型。
微软向7%美国员工提供自愿离职方案,同时计划投入1400亿美元用于AI
微软正在向其美国员工中约7%的人提供自愿离职补偿方案,作为其为今年投入1400亿美元人工智能投资而调整业务结构的一部分。

数据中心燃气项目排放或超一国水平
《WIRED》对空气许可文件的审查显示,仅与xAI和微软等主要人工智能公司相关的11个天然气项目每年可能排放超过1.29亿吨温室气体,这一数字超过了摩洛哥2024年的排放量。

AI星系探测者加剧全球GPU短缺
天文学家正越来越多地使用GPU来分析来自新太空望远镜(如南希·格雷丝·罗曼望远镜和薇拉·C·鲁宾天文台)的海量数据,这些望远镜每天将产生数十TB的数据,远超哈勃望远镜等旧设备的能力。

微软在Word、Excel和PowerPoint中推出Agent模式
微软在Word、Excel和PowerPoint中推出了Agent模式,使Copilot能够根据自然语言指令直接对文档进行多步骤编辑。这标志着Copilot从以往仅能回答问题的被动角色转变为能主动操作内容的智能助手。
Anthropic与Freshfields合作开发法律AI工具
人工智能公司Anthropic与顶级律师事务所Freshfields达成协议,共同开发可向其他律所和法律从业者销售的法律AI工具。
DeepSeek融资以防止人才流失,目标估值200亿美元
中国AI初创公司DeepSeek首次进行融资,旨在防止核心研究人员被竞争对手挖走,并计划达到200亿美元的估值。
私募股权公司与OpenAI和Anthropic洽谈合资企业
OpenAI和Anthropic正在与私募股权公司谈判,计划成立合资企业,将人工智能技术应用于商业环境。
特斯拉计划投入250亿美元发展AI、机器人和芯片工厂
特斯拉CEO埃隆·马斯克宣布将投资250亿美元,重点用于自动驾驶出租车、卡车、人形机器人(Optimus)以及德克萨斯州奥斯汀的两家新芯片工厂——一家用于电动车和机器人,另一家用于人工智能数据中心和卫星。

谷歌更新Workspace,加入AI助手功能
谷歌推出了Workspace Intelligence人工智能系统,可自动化处理Gmail、日历、聊天、云端硬盘和电子表格中的任务。新增功能包括在文档中使用AI生成内容,以及通过提示词构建和填充电子表格,声称数据录入速度最高提升9倍。

X 推出基于 Grok 的定制时间线,实现 AI 驱动的内容推荐
X 推出了基于 Grok 的定制时间线功能,用户可将超过 75 个主题的个性化内容固定到主页。该功能目前仅对付费 iOS 用户开放,标志着平台从用户创建社区向 AI 驱动内容推荐的战略转变。

索尼AI乒乓球机器人击败顶尖选手
索尼开发的AI乒乓球机器人Ace能够与顶级人类选手对战,并在一些比赛中获胜,其核心技术包括八关节机械臂、九个摄像头组成的三维视觉系统和球速与旋转追踪能力。

谷歌增强Chrome企业版AI自动化与安全控制功能
谷歌为Chrome企业版引入了自动浏览(Auto Browse)、技能(Skills)和Gemini摘要功能,实现AI驱动的任务自动化、可重复使用的流程以及IT团队对AI使用情况的更好掌控。

谷歌为职场用户在Chrome中加入AI自动浏览功能
谷歌正在为企业用户引入Chrome中的‘自动浏览’功能,允许Gemini人工智能执行数据录入、日程安排和竞争对手研究等任务,但最终操作前需人工确认。

谷歌新AI工具简化电影选址与卫星图像分析
谷歌在Cloud Next大会上推出了三项新的AI成像工具:Maps Imagery Grounding可将AI生成图像锚定到真实的街景中;Aerial and Satellite Insights可在BigQuery中快速分析航空和卫星影像;以及两个Earth AI模型,无需定制训练即可识别桥梁、道路等物体。

Anthropic的Mythos人工智能被排除在CISA美国网络安全工作之外
Anthropic的新网络安全AI模型Mythos Preview已被包括国家安全局(NSA)和商务部在内的多个联邦机构采用,但负责国家网络安全协调的核心机构——网络安全与基础设施安全局(CISA)却未获得访问权限。

谷歌将AI摘要功能引入企业版Gmail
谷歌正在将其AI摘要功能扩展至企业、教育等用户群体的Gmail中,用户可通过自然语言提问,直接获得来自多封邮件的简洁总结,无需逐一打开邮件。

Google Meet的AI笔记功能现已支持面对面及跨平台会议
谷歌的AI会议笔记功能(由Gemini驱动)现在不仅支持Google Meet,还扩展到了面对面会议以及Zoom和微软Teams上的会议。用户无论在何种会议形式下,都可以通过Meet移动或桌面应用开始录音。
索尼AI机器人‘Ace’在乒乓球比赛中击败顶尖人类选手
索尼的AI驱动机器人‘Ace’在比赛中击败了顶尖人类乒乓球选手,展示了其在动态环境中实时决策和物理协调的能力。

Anthropic因算力限制暂时从Pro计划中移除Claude Code
Anthropic曾短暂将Claude Code从其20美元的Pro计划中移除,仅针对新用户,随后因公众反对恢复。一位经理承认,当前订阅计划并未为如今这种高算力需求的AI工具(如编码功能)设计。

AI 应用 Huxe 个性化我的早晨流程
由前谷歌工程师开发的 Huxe 应用程序会根据用户的日历、邮件和新闻兴趣生成每日定制播客。它以简短的音频形式提供当天的重要事项提醒,包括日程安排、关键邮件和相关新闻,无需查看屏幕。

SpaceX押注600亿美元收购Cursor以增强xAI的编码能力
SpaceX已获得以600亿美元收购AI编程初创公司Cursor的期权,若交易失败将支付100亿美元分手费。此举旨在通过利用Cursor的专业能力和xAI的计算基础设施来弥补xAI在编程工具上的短板。

谷歌地图将为企事业单位引入生成式AI场景创建功能
谷歌在其地图平台中引入了新的生成式AI功能,企业用户可通过文本提示在街景中生成并动画化真实场景。同时推出了两个新的地球AI影像模型和增强的卫星数据分析工具。

人工智能成功依赖数据底座,而非仅靠模型
SAP的Irfan Khan强调,企业人工智能的成功更多取决于高质量、富含业务上下文的数据,而非模型性能或算力。公司正从传统的数据聚合转向构建能跨系统保留业务上下文的数据底座。

Claude Code定价变动引发混乱
Anthropic短暂地在其定价页面上将Claude Code标记为仅限于每月100美元的Max计划,移除了其在每月20美元Pro计划中的位置——但几小时后又恢复原状且未作说明。

SpaceX预留600亿美元选项收购AI编程初创公司Cursor
SpaceX与AI编程编辑器Cursor达成合作,并保留了今年晚些时候以600亿美元收购该公司的权利。该交易还包括一种选择:支付100亿美元用于合作开发。

人形机器人正通过人类动作数据进行训练
机器人公司正在通过应用程序和远程控制机器人收集真实世界中的人类动作数据,用于训练人形机器人,这与语言模型利用文本数据训练的方式类似。这种方法旨在提升机器人在现实世界中的灵巧性和表现力,超越模拟环境的局限。

LLMs+ 旨在自主解决复杂问题
文章提出了 LLMs+ 的概念,这是一种下一代大型语言模型,旨在自主处理多步骤、复杂的任务。关键技术进展包括用于效率提升的专家混合架构和用于管理长上下文窗口的递归 LLM。

中国开源AI战略挑战硅谷
中国顶级AI实验室(如DeepSeek、Z.ai和阿里巴巴的Qwen)正在发布强大的开源权重模型,开发者可以下载并定制,标志着从API收费模式转向社区驱动采纳的战略转变。

2026年塑造人工智能未来的十大关键趋势
麻省理工科技评论发布了一份精选的10大AI趋势清单,这些趋势正在推动创新并改变人工智能领域的权力格局。包括人形机器人训练数据、LLMs+、升级版诈骗、世界模型、军事AI整合、武器化深度伪造、代理编排、监控担忧、中国开源策略以及AI科学家的崛起。

测试ChatGPT图像2.0:寻找戴无线电的浣熊
OpenAI发布了ChatGPT图像2.0,这是一个显著改进的图像生成模型,相比前代版本能更好地处理像“哪里有拿着无线电的浣熊”这样的复杂提示。

ChatGPT 图像2.0引入推理与网络搜索,实现更智能的图像生成
OpenAI 的 ChatGPT 图像 2.0 引入了‘思考模式’,使模型能在生成图像前进行推理甚至联网搜索,支持从单个提示生成最多八张一致的图像,并显著提升文本、UI 元素和复杂场景的准确性。

OpenAI 推出 ChatGPT 图像生成器 2.0,支持联网搜索与多图生成
OpenAI 推出了 ChatGPT 图像生成器 2.0,新增‘思考’能力,可联网搜索、推理图像结构,并从单个提示中生成最多八张风格一致的图像。

谷歌推出Deep Research和Deep Research Max代理
谷歌推出了两个基于Gemini 3.1 Pro模型的自主研究代理——Deep Research和Deep Research Max,旨在为开发者自动化复杂的、数据密集型的研究工作流程。

亚马逊投资50亿美元入股Anthropic用于AI芯片和基础设施
亚马逊向Anthropic追加投资50亿美元,使其总投资达到130亿美元,并获得高达5吉瓦的AI计算能力。这包括使用亚马逊自研的Trainium系列AI芯片,甚至包括尚未上市的Trainium4芯片。

Steve Cosman用企鹅骑自行车项目污染AI训练数据
Steve Cosman 创建了一个 GitHub 项目,故意将荒诞的企鹅骑自行车图像加入用于训练生成式 AI 模型的公共数据集中。Simon Willison 将其视为一种‘训练数据投毒’行为,旨在暴露模型漏洞。


Yelp升级AI聊天机器人成数字管家
Yelp大幅升级了其AI聊天机器人,现在称为Yelp助理,可作为数字管家,在单次对话中回答问题、提供建议并完成预订。该助手现已通过一个全新的“助理”标签页覆盖所有类别,并集成DoorDash、Grubhub、Vagaro和Zocdoc等服务。

亚马逊投资330亿美元入股Anthropic,后者承诺在AWS上花费超1000亿美元
亚马逊将对AI初创公司Anthropic的投资增至330亿美元,并承诺未来十年内花费超1000亿美元用于AWS服务和亚马逊定制AI芯片。

杰夫·贝索斯接近完成对AI实验室Project Prometheus的100亿美元融资
杰夫·贝索斯即将完成对AI实验室“Project Prometheus”的100亿美元融资,该实验室估值达380亿美元。该实验室位于旧金山,并在伦敦和苏黎世设有办公室,专注于为工业应用开发具备物理感知能力的AI系统。
OpenAI扩大Codex在企业中的应用范围
OpenAI推出了Codex实验室,并与埃森哲、普华永道和Infosys合作,将Codex部署到企业软件开发生命周期中,每周活跃用户达到400万。

谷歌将Gemini AI助手扩展至七个亚太国家
谷歌已将Chrome中的Gemini功能扩展到澳大利亚、印度尼西亚、日本、菲律宾、新加坡、韩国和越南等七个亚太国家。该功能包含一个侧边栏助手,可集成日历、邮件、地图和Nano Banana 2图像生成工具。


OpenAI的Codex现在通过屏幕录制构建上下文记忆
OpenAI推出了Chronicle功能,该功能通过记录用户屏幕来构建上下文记忆。这些记忆帮助Codex理解正在进行的任务、使用的工具和项目,而无需用户每次都重新解释背景信息。

Cloudflare构建定制化AI代码审查系统
Cloudflare开发了一个基于CI的编排系统,利用OpenCode运行多个专业AI代理进行代码审查,取代了那些无法满足其规模需求的固定式商用工具。
北方信托称人工智能热潮将引发广泛去通胀
北方信托旗下资产管理业务负责人(管理资产达1.4万亿美元)预测,人工智能将释放巨大的生产力提升潜力,从而引发广泛的去通胀效应。


Anthropic营收激增引发万亿估值讨论
Anthropic的年化收入已突破300亿美元,较去年增长超过三倍,主要得益于Claude Code等产品和利润率的显著提升。公司目前暂无新融资计划,部分投资者正考虑给予其万亿估值。

德国法院裁定AI漫画改编照片不构成版权侵权
德国高等地区法院于2026年4月2日裁定,只要AI生成的漫画没有复制原照片中受保护的元素(如构图、光影或视角),就不构成对原作的版权侵犯。


即使最好的AI模型在复杂真实图表上性能也下降近一半
新基准测试RealChart2Code显示,即使最先进的AI模型在分析复杂的真实世界图表时,性能也会下降近一半,远低于在简单合成数据上的表现。

应用商店因AI推动迎来新应用爆发
市场情报公司Appfigures数据显示,2026年第一季度全球应用发布量同比增长60%,其中iOS平台增长达80%,而截至2026年4月,两个平台的应用发布量同比激增104%。这打破了人们认为AI会削弱应用使用的预期。

自改进AI初创公司融资5亿美元,估值达40亿美元
一家仅成立四个月的AI初创公司Recursive Superintelligence,由来自OpenAI、谷歌DeepMind和Salesforce的顶尖研究人员创办,已获得至少5亿美元融资,投前估值达40亿美元。该轮融资非常火爆,公司可能最终筹集高达10亿美元。

深度求索首次寻求外部融资,估值达100亿美元
中国AI初创公司深度求索正寻求首次外部融资,目标金额至少为3亿美元,估值达100亿美元或更高。这标志着该公司从此前完全依赖私募基金高瓴资本管理的内部资金支持转向外部投资。


OpenAI前Sora负责人比尔·皮布尔斯离职,公司战略转向编码与企业应用
曾领导OpenAI Sora视频生成项目的比尔·皮布尔斯正在离职,这是公司向编程和企业应用聚焦的更广泛调整的一部分。前AI科学副总裁凯文·韦尔也已离开,其团队将被整合进其他研究小组。

AI编程工具Cursor拟融资20亿美元,估值达500亿美元
AI编程工具Cursor正在洽谈一轮可能募资超20亿美元的新融资,投前估值达到500亿美元,几乎为其六个月前的估值翻倍。

这款迷人的设备用AI写糟糕的诗
Poetry Camera 是一款物理设备,它拍摄图像并生成由AI写的诗歌,而不是照片,然后打印在热敏纸上。它通过Wi-Fi连接云端AI模型,根据所拍场景生成诗意描述。

部分OpenAI股东质疑Altman能否引领公司上市
部分OpenAI股东质疑CEO萨姆·阿尔特曼能否带领公司完成估值约8500亿美元的IPO。前Salesforce联合CEO布雷特·泰勒被视为潜在接班人。

Meta的AI投资推动Quest头显涨价
Meta从4月19日起将Quest VR头显价格上调50至100美元(涨幅12%至20%),原因是内存芯片成本飙升,而这一现象部分源于Meta自身高达1150亿至1350亿美元的AI基础设施投资。

Anthropic 推出 Claude Design,可将聊天对话转化为原型和营销素材
Anthropic 推出了 Claude Design,这是一个研究预览工具,能通过基于聊天的交互生成原型、幻灯片和营销素材,使用的是 Claude Opus 4.7 视觉模型。

AI圈内外差距扩大,伴随重大投资与伦理争议
OpenAI正在收购如Hiro这样的AI个人理财应用,而Allbirds等公司则转型为AI基础设施企业。Anthropic甚至向美联储主席杰罗姆·鲍威尔演示了一个声称过于强大不能公开发布的模型。

Dairy Queen在点餐亭部署AI聊天机器人以提升点餐速度和准确性
Dairy Queen正在美国和加拿大的部分门店推出由Presto开发的AI语音点餐机器人,此前测试成功。该技术准确率约为90%,有助于提升点餐效率。

Anthropic推出Claude Design,支持AI驱动的视觉原型制作
Anthropic推出了Claude Design,这是一个实验性AI工具,用户可以通过自然语言提示生成和优化如幻灯片和应用原型等视觉原型。该产品目前面向Claude Pro、Max、Team和Enterprise订阅者提供研究预览版本。

Cloudflare推出AI训练重定向功能以确保数据纯净
Cloudflare推出了“AI训练重定向”功能,可自动将经验证的AI训练爬虫(如GPTBot)重定向到规范URL,防止它们抓取过时内容。

我们是不是在TokenMaxxing的路上走向了无解?
TechCrunch的Equity播客探讨了OpenAI和Anthropic等AI公司如何通过收购、基础设施投资以及争议性模型演示(如向美联储主席杰罗姆·鲍威尔展示强大AI)重塑行业。

Cloudflare发布Flagship,专为AI驱动的特性管理设计
Cloudflare发布了Flagship,这是一个基于OpenFeature标准的原生特性开关服务,专为自主AI代理在无需人工干预的情况下安全部署和管理代码而设计。

谷歌新推出的Gemini Mac应用支持无缝窗口共享以提供AI辅助
谷歌推出了专为Mac设计的Gemini桌面应用,用户无需切换应用即可分析任意打开窗口的内容。这一功能消除了在工作流中中断去访问AI助手的需求。

OpenAI发布GPT-Rosalind生命科学推理模型
OpenAI发布了GPT-Rosalind,这是一个专为生命科学设计的推理模型,在化学、生物化学和实验设计方面优于之前的GPT版本。目前该模型仅对通过受信任访问计划的美国企业客户开放研究预览。

中国称Meta收购Manus为‘阴谋’,限制创始人出境
中国国家安全委员会将Meta以20亿美元收购AI初创公司Manus的交易定性为‘阴谋’,试图削弱中国科技基础,此举触发多部门联合审查,并限制联合创始人肖红和季一超出境。

2026年AI网站构建工具:Hostinger凭借实用改进领跑
2026年,AI驱动的网站构建工具相比去年有了显著提升,Hostinger因实测表现优异成为首选。文章指出,大多数厂商现在都提供了可用的聊天机器人界面和基础AI编码功能——而去年几乎没有产品能可靠运行。

OpenAI发布生物学专用大语言模型GPT-Rosalind
OpenAI发布了GPT-Rosalind,这是一个专门针对50种常见生物工作流程和公共生物数据库训练的大语言模型。它旨在帮助研究人员处理复杂数据、理解神经生物学等专业子领域,并建议潜在的药物靶点或蛋白质功能。

OpenAI升级Codex,新增桌面端代理功能
OpenAI对其Codex AI编程工具进行了重大升级,使其能够在用户桌面后台运行,控制应用程序、点击和输入内容,并在不干扰用户工作的情况下自主执行任务。

Anthropic首席产品官辞职,因传闻其公司将推出竞争设计工具
Anthropic的首席产品官迈克·克里格于4月14日辞去Figma董事会职务,这发生在《信息》报道Anthropic下一代模型Opus 4.7将包含可能与Figma核心产品竞争的设计工具之后。

微软与斯特兰蒂斯合作推动汽车AI创新
斯特兰蒂斯与微软启动为期五年的合作,将人工智能整合到数字服务、网络安全和工程中。该合作旨在提升预测性维护、驾驶辅助和远程地区的安全连接能力。

谷歌在Chrome中推出侧边栏AI模式,提升网页探索体验
谷歌在Chrome桌面版中推出了新的侧边栏AI模式,用户可以在不切换标签页的情况下同时浏览网页并提出上下文相关的问题。

印度IT毕业生面临AI冲击下的行业变革
印度3150亿美元的IT产业正因自主AI工具而承压,Infosys等公司不得不对新员工进行长达23周的再培训,因为仅有42.6%的150万年计算机科学毕业生具备就业能力。

Roblox的AI助手新增代理工具,助力游戏规划与构建
Roblox为其Roblox Assistant引入了新的代理功能,包括一个‘规划模式’,该模式作为游戏开发中的协作伙伴,允许开发者通过多步骤交互来迭代规划、优化和实现游戏功能,而非一次性自动化。

Gemini新增利用Google相册生成个性化图像功能
Gemini现在利用Google相册和个人偏好自动生成定制图像,无需输入长提示或手动上传照片。该功能将于2026年4月向美国的Google AI Plus、Pro或Ultra订阅用户推出。

苹果重新培训Siri团队使用AI编程工具
苹果正在将不到200名Siri开发人员送往为期数周的AI编程训练营,学习Anthropic的Claude Code和OpenAI的Codex等工具。目标是利用谷歌的Gemini模型重构Siri,使其更具对话性,并计划在6月的WWDC大会上发布新版本。

谷歌转向AI驱动的广告层级监管
谷歌在2025年使用Gemini等AI模型拦截了83亿条违规广告,但被暂停的广告主账户数量却大幅减少,表明其监管策略正从账户封禁转向更精准的广告层级管控。

Canva AI 2.0 推出基于提示的对话式设计工具
Canva 推出了 AI 2.0 更新,引入了统一的对话界面,用户可通过自然语言提示生成和调整设计,并具备持续记忆功能和基于对象的智能编辑能力。

公共部门通过小语言模型实现AI落地
公共部门正采用定制化的小语言模型(SLMs)在数据治理严格、网络连接受限和基础设施薄弱的环境中安全可靠地部署人工智能。
OpenAI的Codex应用迎来重大升级
OpenAI已将其适用于macOS和Windows的Codex应用更新,新增了计算机操作、内置浏览、图像生成、记忆功能和插件支持,显著提升了开发者的生产力。

DeepL推出语音翻译套件及API,拓展实时语音翻译能力
DeepL推出了语音到语音翻译套件,支持会议、移动应用和企业场景中的实时对话,并提供API供开发者构建定制化解决方案。
马丁·卡萨多:AI进展是一场工业革命
a16z的马丁·卡萨多表示,近期人工智能的进步是一个具有工业革命规模的变革事件,但他警告说,大型企业在筹集‘廉价资金’方面的优势是暂时的,终将减弱。
OpenAI发布GPT-Rosalind助力生命科学研究
OpenAI推出了GPT-Rosalind,这是一个专为生命科学领域设计的前沿推理模型,旨在提升药物发现、蛋白质分析和基因组学研究的能力。

OpenAI更新代理SDK,引入沙箱和控制机制以提升企业级代理安全性
OpenAI发布了其代理SDK的新版本,新增沙箱功能和面向前沿模型的控制机制,帮助企业构建更安全、可控的AI代理。

Hightouch凭借AI营销工具实现年收入1亿美元里程碑
Hightouch是一家成立七年的初创公司,通过提供AI驱动的工具使营销人员无需依赖设计团队即可创建品牌广告内容,从而实现了1亿美元的年经常性收入(ARR)。该公司在2024年底推出AI服务后的20个月内新增了7000万美元的ARR。

领英数据表明AI尚未导致招聘下降
领英首席全球事务和法律官布莱克·劳特表示,其经济图谱数据显示自2022年以来招聘减少了20%,但没有证据表明AI是原因。相反,利率上升被认为是更可能的原因。


谷歌推出原生Gemini Mac应用,支持系统级快捷键
谷歌发布了适用于macOS的原生Gemini应用,用户可通过Option + Space快捷键随时调出AI助手。该应用支持屏幕共享、本地文件交互以及图像和视频等AI生成内容功能。

Adobe推出Firefly AI助手,统一创意工作流
Adobe推出了Firefly AI助手,这是一个基于聊天的界面,可在Photoshop、Premiere和Illustrator等Creative Cloud应用中协调多模态任务。它能动态显示相关控件(如滑块),并根据用户输入实时调整。

Allbirds出售鞋类业务后更名为NewBird AI
Allbirds以3900万美元的价格出售了其鞋类品牌和资产,并更名为NewBird AI,成为GPU即服务提供商。该公司还从一家未披露的机构投资者处获得了5000万美元的可转换融资。

雷德·霍夫曼支持将AI使用量作为生产力指标
LinkedIn联合创始人雷德·霍夫曼在Semafor世界经济峰会上公开支持‘tokenmaxxing’——即通过追踪员工使用的AI令牌数量来衡量其对AI工具的参与度,尽管该做法在硅谷引发争议。

Adobe推出Firefly AI助手,实现自然语言编辑
Adobe推出了Firefly AI助手,这是一个对话式界面,用户可以用自然语言提示来编辑项目,而无需手动选择工具。该功能基于Project Moonlight技术,即将在Firefly平台上上线。

MIT:AI对工作的冲击将逐步显现而非突然爆发
MIT研究人员发现,到2029年,AI可以在没有人工干预的情况下完成60%的文本类任务达到‘最低可接受水平’,但只有26%能达到‘优质水平’。该研究指出,AI的影响将是渐进式的,而非突然的岗位替代。

Anthropic增长挑战OpenAI的8520亿美元估值
OpenAI投资者正在质疑其8520亿美元的估值,因为Anthropic的年收入飙升至300亿美元,二级市场估值达到3800亿美元。一些投资者现在认为Anthropic比OpenAI更具投资吸引力。

格雷格·布罗克曼预测AI将让小团队借助算力实现大组织产出
OpenAI总裁格雷格·布罗克曼预测,只要能负担得起计算资源,小型团队就能达到大型组织的产出水平。他认为计算机将越来越多地为用户完成工作,而不是要求人们去适应计算机。

谷歌为Chrome浏览器新增AI技能功能,支持重复使用提示词
谷歌在Chrome浏览器中推出了名为“技能”的新功能,允许用户保存并跨不同网站重复使用由Gemini驱动的AI提示词,只需点击一下即可调用。用户可以通过斜杠(/)或加号(+)按钮在Gemini界面中创建、编辑和应用这些技能。

将AI提示词变为Chrome中的一键工具
谷歌推出了‘Chrome技能’功能,让用户可以将AI提示词保存为一键工具,在多个网页上重复使用。用户只需点击或输入斜杠(/)即可在任意标签页中运行已保存的提示。

谷歌将Gemini个人智能功能扩展至印度
谷歌已将Gemini个人智能功能引入印度,用户可通过连接Gmail、照片等服务向Gemini提问获取个性化回答。初期仅对AI Pro和AI Ultra用户开放,未来几周将面向免费用户推出。

麻省理工科技评论推出年度AI重点趋势榜单
麻省理工科技评论宣布推出全新的年度榜单《当下值得关注的10项AI事物》,聚焦可能塑造未来的AI发展。该榜单将于2026年4月21日在其EmTech AI大会上首次揭晓,并于当天在线发布。

OpenAI收购AI理财初创公司Hiro,旨在获取人才与技术
OpenAI收购了2024年成立的AI个人理财初创公司Hiro Finance,所有员工将加入OpenAI。Hiro将于2026年4月20日关闭运营,并在5月13日前删除所有用户数据,表明这是一次典型的‘人才收购’(acqui-hire)。
OpenAI发布GPT-5.4-Cyber,面向经认证的网络安全人员
OpenAI通过发布专为防御性网络安全用途微调的GPT-5.4-Cyber模型,扩展了其可信访问网络安全计划。该版本允许经过认证的防御者获得更宽松的AI能力,同时保持严格的身份验证和安全防护。

OpenAI新模型Spud将全面提升产品,直指Anthropic虚增营收
OpenAI内部备忘录披露了一个名为“Spud”的新模型,将显著提升所有产品性能,并推出名为“Frontier”的代理平台及与亚马逊的深度合作。备忘录还指控竞争对手Anthropic通过按毛收入而非净收入记账的方式虚增了约80亿美元营收。

为何人们对AI的看法如此分裂
斯坦福大学2026年AI指数显示,美国拥有超过5400个数据中心,占据全球AI基础设施主导地位,并指出全球AI硬件供应链严重依赖台湾的台积电制造高端芯片。

Vercel CEO表示公司已准备好上市,AI推动收入激增
Vercel首席执行官吉列尔莫·劳奇宣布公司已具备上市条件,因非开发者使用AI创建应用带来的年经常性收入(ARR)从2024年初的1亿美元飙升至2026年2月的3.4亿美元。

Meta打造马克·扎克伯格AI版本与员工互动
Meta正在开发一个基于马克·扎克伯格举止、语调和公开言论训练的逼真AI形象,用于与员工互动。这是Meta将AI融入内部运营并增强员工与领导层联系的更广泛计划的一部分。

马克·扎克伯格或将拥有AI克隆体用于会议
Meta正在训练一个基于马克·扎克伯格声音、举止和公开言论的AI克隆体,用于与员工互动。如果实验成功,公司可能会扩展该功能,让创作者也能创建自己的AI虚拟形象。

2026年AI指数报告揭示快速进展与系统性挑战
斯坦福大学发布的2026年AI指数报告显示,尽管存在泡沫担忧,AI模型仍在持续快速进步,且采用速度超过以往任何技术浪潮,但基础设施、政策和就业市场正难以跟上步伐。

OpenAI在伦敦开设可容纳500多名员工的新办公室
OpenAI已租下伦敦国王十字区约8200平方米的空间,用于容纳超过500名员工——是其目前英国约200名员工的两倍以上。这标志着该公司在美国以外地区研究影响力的显著扩大。

特朗普官员鼓励银行测试Anthropic的Mythos人工智能模型
美国财政部部长斯科特·贝森特和美联储主席杰罗姆·鲍威尔正在敦促大型银行测试Anthropic的新模型Mythos,用于检测网络安全漏洞。尽管该模型访问受限且Anthropic与特朗普政府之间存在法律纠纷,高盛、花旗银行、美国银行和摩根士丹利等机构正被报道在测试此模型。

Cloudflare启动Agents Week,重新定义AI时代的互联网基础设施
Cloudflare推出了Agents Week,探索为AI时代构建下一代互联网基础设施。这标志着从传统的‘一对多’模型(如微服务)转向‘一对一’的代理架构,每个用户都有一个独特的、动态的执行环境。

在HumanX人工智能大会上,Claude成为热议焦点
在旧金山举行的HumanX人工智能大会上,Claude成为与会者和供应商中最常被讨论的AI聊天机器人,表明企业界和开发者对ChatGPT的兴趣可能正在下降。

研究人员定义世界模型,排除文本到视频生成器
来自北京大学、快手科技等机构的研究团队提出了一个严格的AI‘世界模型’定义,明确排除了Sora等文本到视频生成器。他们还发布了OpenWorldLib开源框架,包含感知、合成、推理、3D重建和记忆五个模块。

AI编程工具竞争日趋激烈
2025年初,Anthropic发布了Claude Code工具,并搭载Opus 4.5模型,该模型能让开发者仅用几句文字描述就生成可运行的原型代码,无需复杂提示或反复检查。

Arcee AI打造开源400B参数推理模型,性能媲美Claude Opus
Arcee AI动用了一半风险投资资金开发了Trinity-Large-Thinking,这是一个拥有4000亿参数的开源推理模型,采用MoE架构,在代理任务中可与Claude Opus竞争。它通过专家混合设计每token仅激活约130亿参数,实现高效推理。

谷歌Gemma 4将代理型AI带入手机,数据永不离开设备
谷歌发布了Gemma 4,这是一个可在智能手机上完全本地运行的开源AI模型,能够自主调用维基百科搜索和地图等工具而无需云端连接。该模型支持文本、图像和音频处理,并通过一个免费的应用程序在Android和iOS上提供。

泄露文件暗示Valve正在测试AI用于Steam安全
4月7日更新的泄露Steam客户端文件中提到了一个名为“SteamGPT”的系统,这似乎是一个用于自动处理事件审查和分析可疑账户行为的内部AI工具。

美国中央情报局计划将AI助手整合进所有分析平台
美国中央情报局计划在未来几年内将其所有分析平台都整合AI助手,此前已成功生成首份完全自主的情报报告。这些工具将协助分析师起草报告、验证发现并识别趋势。

OpenAI推出每月100美元的ChatGPT Pro订阅,面向重度Codex用户
OpenAI推出了每月100美元的新版ChatGPT Pro订阅,Codex使用量比20美元的Plus套餐高出5倍,旨在吸引重度用户,并直接与Anthropic的Claude Max套餐竞争。

OpenAI推出每月100美元Pro计划,强化Codex访问权限
OpenAI推出了新的每月100美元Pro计划,重点提升开发者对Codex的使用额度,相比20美元的Plus计划提供5倍的编码能力。该计划旨在直接挑战Anthropic的100美元Claude Code服务。

OpenAI将Pro计划价格降至100美元,针对重度Codex用户
OpenAI推出了新的每月100美元Pro计划,专为重度Codex用户设计,价格是原价的一半,并提供比20美元Plus计划多五倍的使用额度。旧的200美元Pro计划已从定价页面移除,表明可能正在逐步淘汰。

谷歌Gemini现在可在聊天中生成可交互的可视化图表
谷歌Gemini现在可以生成交互式可视化内容,如3D模型和模拟场景,用户可在聊天界面中直接调整参数、旋转视角或实时修改变量进行探索。

人工智能行业面临盈利十字路口
Anthropic 和 OpenAI 正面临巨大压力,必须在基础设施成本压垮公司之前实现盈利;最近关停 Sora 视频生成应用并限制 OpenClaw 使用权限等举措,表明它们正在迅速调整以应对变现现实。


数据领导者利用AI解决集成难题并实现自动化
来自汤森路透、Create音乐集团和Booking.com的五位数据领导者分享了他们如何利用人工智能和自动化来简化数据集成,提升并购中的一致性,并在全球运营中协调复杂的管道流程。

YouTube推出AI虚拟形象工具供创作者使用
YouTube推出了一个AI驱动的虚拟形象功能,让创作者可以生成自己的数字分身出现在短视频中。用户需按要求录制一段自拍视频来训练模型,且该形象只能用于创作者自己原创的内容。

Waypoint-1.5 让高保真互动世界走进消费级显卡
Waypoint-1.5 是下一代实时视频世界模型,可在消费级显卡(如 RTX 3090–5090)上实现最高 720p/60FPS 渲染,并新增 360p 模式以适配更广泛的硬件,包括游戏笔记本和苹果 M 系列芯片设备。

Meta发布Muse Spark模型,支持推理模式和工具调用
Meta发布了Muse Spark模型,这是一个性能可与GPT-5.4和Gemini 3.1 Pro媲美的托管大模型,可在meta.ai上使用两种模式:‘即时’用于快速响应,‘思考’用于深度推理。该模型还公开了16个可用工具,包括网页搜索、浏览器导航和Meta内部社交内容检索。

AWS首席执行官为同时投资Anthropic和OpenAI辩护
AWS首席执行官马特·加曼表示,亚马逊对OpenAI的500亿美元投资以及对Anthropic的80亿美元投资并不构成问题,因为AWS长期以来一直擅长处理与竞争伙伴之间的关系。

Meta发布Muse Spark,其超智能实验室的首个公开AI模型
Meta发布了Muse Spark,这是其新成立的超智能实验室推出的首款模型,旨在利用Instagram、Facebook和Threads的内容提供个性化AI体验。这标志着Meta从开源Llama系列向深度社交媒体整合的专有模型的战略转变。

Stability AI 推出品牌工作室,实现品牌一致的图像生成
Stability AI 推出了 Brand Studio 平台,使品牌能够使用定制模型、模板和智能模型选择功能生成一致的 AI 图像。该平台包含 Brand Central(用于训练品牌专属模型)、Producer Mode(自动化视觉生产)和 Precision Inpainting(精准修复图像特定区域)等功能。

Databricks联合创始人获ACM奖,称AGI已存在
Databricks联合创始人Matei Zaharia因创建Apache Spark而获得2026年ACM计算奖,并声称人工通用智能(AGI)已经存在,只是我们尚未意识到它的形态。

穆斯塔法·苏莱曼:AI发展不会很快遇到瓶颈
穆斯塔法·苏莱曼指出,由于计算能力和训练数据的激增,人工智能的发展将继续保持指数级增长——自2010年以来,训练数据增加了万亿倍。他强调了三项关键技术进步推动这一趋势:更快的芯片(如英伟达和Maia 200),更高的内存带宽(HBM3),以及通过NVLink/InfiniBand连接的大规模GPU集群。

Atlassian在Confluence中推出AI工具和代理服务
Atlassian推出了Remix这一可视化AI工具,可从Confluence数据生成图表和图形,并通过模型上下文协议(MCP)集成了三个第三方代理,用于原型设计、应用开发和演示文稿创建。

谷歌低调发布iOS离线AI语音转文字应用
谷歌低调推出了名为‘Google AI Edge Eloquent’的免费iOS应用,该应用基于本地Gemma模型实现离线语音转文字,并提供去除填充词和文本格式化等功能。

Arcee发布4000亿参数开源AI模型Trinity Large Thinking
美国初创公司Arcee发布了名为Trinity Large Thinking的4000亿参数开源语言模型,这是目前由非中国公司发布的最强大的开放权重模型。该模型采用Apache 2.0许可证,旨在为西方企业提供一个安全的、不依赖中国大模型的替代方案。

GLM-5.1无需明确指令即可生成SVG和CSS动画
来自Z.ai的754B参数开源模型GLM-5.1在未被明确要求的情况下,自动生成了一个包含SVG图像和CSS动画的完整HTML页面。

谷歌AI摘要正确率91%,但可验证性下降
AI初创公司Oumi的一项研究发现,使用Gemini 3时,谷歌AI摘要的正确率为91%,比Gemini 2的85%有所提高。但只有44%的正确答案可以通过链接来源验证——这一比例从Gemini 2时期的63%下降。

Anthropic发布新型AI模型Mythos用于网络安全计划
Anthropic发布了其强大的新AI模型Mythos的预览版,作为名为Project Glasswing的网络安全计划的一部分,该计划涉及12家大型科技公司。该模型识别出数千个关键的零日漏洞。

微软Bing团队开源多语言嵌入模型Harrier
微软Bing团队发布了Harrier,这是一个支持超过100种语言的开源嵌入模型,上下文窗口达32,000个token,并基于超过20亿条训练样本和GPT-5生成的合成数据训练而成。该模型包含三个版本——270亿参数、6亿参数和2.7亿参数,并在Hugging Face上以MIT许可证开放。


谷歌地图新增AI照片自动配文功能
谷歌地图现在利用其Gemini人工智能模型为用户上传的照片和视频自动生成文字说明。该功能目前仅在美国的iOS设备上以英文提供,未来几个月将扩展到全球并支持安卓系统。


富裕投资者绕过风投,直接投资AI初创企业
私人财富管理机构和家族办公室正在越来越多地直接投资早期人工智能初创公司,跳过了传统的风险投资公司。这一转变以Arena Private Wealth对AI芯片初创公司Positron的2.3亿美元领投轮为代表。

Meta计划开源部分新AI模型
Meta计划在亚历山大·王(Alexandr Wang)领导下,将其新开发的部分AI模型开源。与以往的Llama模型不同,Meta将保留部分组件专有,并排除最大规模的模型供公众使用。

印度初创公司Rocket推出AI平台,提供麦肯锡级别的产品策略
印度初创公司Rocket推出了Rocket 1.0平台,利用人工智能生成类似麦肯锡咨询报告的详细产品策略文档。该平台将研究、竞争情报和产品规划整合到一个工作流中。

前OpenAI高管发起1亿美元Zero Shot风投基金
由前OpenAI高管领导的新风投基金Zero Shot已成功完成首期1亿美元融资,并投资了Worktrace AI和Foundry Robotics等初创企业。

谷歌低调发布iOS端离线AI语音转录应用
谷歌低调发布了名为‘Google AI Edge Eloquent’的iOS离线语音转录应用,该应用基于Gemma模型实现实时转录和本地文本优化,无需联网即可使用。

Gemini AI在Android Auto上表现卓越,能处理多步骤任务
谷歌已将Gemini AI集成到Android Auto中,使其能够处理从查找餐厅信息到从邮件中提取地址等简单和复杂的多步骤任务,并保持对话连贯性。

如何使用 ChatGPT 新增的 Spotify、DoorDash、Uber 等应用集成功能
ChatGPT 现在支持与 Spotify、DoorDash、Uber、Angi、Booking.com、Canva 和 Coursera 等应用直接集成,用户可以通过自然语言提示完成创建播放列表、预订酒店或设计图形等任务。

西班牙Xoople完成1.3亿美元B轮融资,打造面向AI的地球数据卫星星座
西班牙初创公司Xoople完成了1.3亿美元B轮融资,用于开发一套卫星星座,为人工智能模型提供高精度地球观测数据,并与美国航天国防承包商L3Harris Technologies达成协议,共同开发传感器。

像Accio这样的AI工具正在重塑小卖家的产品决策方式
阿里巴巴旗下的AI采购工具Accio自2024年推出以来,帮助像Mike McClary这样的小型在线卖家快速找到制造商并优化产品设计。它将一个手电筒的制造成本从每单位17美元降至约2.5美元,并将开发周期从数月缩短至一个月。

阿里巴巴Qwen团队构建HopChain修复AI视觉推理错误
阿里巴巴Qwen团队与清华大学共同开发了HopChain框架,通过生成多步骤图像问题来暴露并纠正视觉语言模型在推理过程中累积的错误。

谷歌AI边缘画廊应用上线,支持本地运行Gemma模型
谷歌发布了AI边缘画廊应用,用户可在iPhone上直接运行Gemma 4模型(E2B和E4B)。该应用包含图像问答、最多30秒的音频转录功能,以及基于HTML工具的互动技能演示。

因AI驱动的内存短缺,树莓派价格飙升
树莓派主板的价格大幅上涨——16GB型号最高涨幅达150美元,这是由AI数据中心推动的DRAM成本急剧上升所致。这已是两个月内的第二次大幅涨价,LPDDR4内存价格在过去一年中飙升了七倍。
八年期盼,三个月用AI打造开发工具
拉利特·马甘蒂仅用三个月就用AI完成了syntaqlite——一个功能强大的SQLite开发工具套件,这之前他构思了八年。该项目包括一个解析器、格式化工具和验证器,能高度匹配官方SQLite语法。
ChatGPT被边缘群体用于健康咨询
匿名化的美国ChatGPT数据显示,每周约有200万条关于健康保险的消息,以及60万条来自‘医院荒漠’人群的医疗相关查询——这些地区最近的医院需30分钟车程才能到达。十次消息中有七次发生在诊所非营业时间。

Gemini在谷歌地图中规划一天行程,出人意料地成功
谷歌的Gemini人工智能已集成到谷歌地图中,以“Ask Maps”形式出现,允许用户根据实时数据、交通方式和偏好请求个性化行程。作者通过要求使用公共交通工具制定全天行程来测试该功能,并发现了一些超出她日常探索习惯的新颖且有用的建议。

日本物理AI聚焦:解决劳动力短缺,而非取代岗位
2026年3月,日本经济产业省宣布目标到2040年占据全球物理AI市场30%份额,这主要由严重劳动力短缺和人口下降驱动。Mujin等公司正在部署基于软件的机器人控制系统,利用现有硬件自动化物流和制造任务。

Grammarly改名Superhuman,转向AI生产力平台
Grammarly于2025年10月更名为Superhuman,从写作辅助工具转型为AI驱动的生产力平台。这一转变包括推出并迅速下架了名为“专家评审”的功能,该功能未经许可使用了真实专家(甚至已故学者)的名字。

AI聊天机器人流量增速是社交媒体的七倍
根据Similarweb的数据,AI聊天机器人流量的增长速度是社交媒体的七倍,尽管其总流量仍落后四倍。分析显示,虽然社交媒体在整体流量上仍占主导地位,但AI工具正在迅速追赶。

阿里通义团队推出新算法提升AI推理深度
阿里通义团队推出了FIPO(未来KL影响策略优化)算法,这是一种新颖的强化学习方法,根据每个token对后续推理步骤的影响来分配不同奖励,而不是给所有token相同的奖励。

Anthropic终止Claude Code订阅者免费使用OpenClaw服务
从2026年4月4日起,Claude Code订阅用户将无法再使用其订阅额度来访问OpenClaw等第三方工具,而需通过单独的按量付费模式支付费用。

Netflix开源VOID框架,实现视频物体移除并还原物理影响
Netflix发布了VOID框架,该框架不仅能从视频中移除物体,还能真实模拟这些物体原本引起的物理交互效果,如碰撞或运动影响。

OpenAI因高管健康问题进行领导层调整
多位OpenAI高管,包括Fidji Simo、Kate Rouch和Brad Lightcap,因健康原因暂时离开岗位。临时职责已重新分配,Greg Brockman将接管产品事务,Denise Dresser则接替Lightcap的大部分工作。

Anthropic以4亿美元收购一家小型AI制药初创公司
Anthropic以约4亿美元的股份收购了成立仅八个月、员工不足十人的AI生物技术初创公司Coefficient Bio。这笔交易的核心在于该团队的专业技能,而非公司的规模或产品成熟度。
AI驱动的安全报告在Linux内核社区激增
Willy Tarreau指出,Linux内核安全漏洞报告数量从两年前每周2到3个猛增至每天5到10个,主要归因于AI工具的使用。现在重复发现的问题变得常见,表明AI正在产生有效且可复现的结果。

Anthropic以4亿美元收购Coefficient Bio,加强AI医疗布局
Anthropic以4亿美元股票交易收购了隐形生物技术初创公司Coefficient Bio。此次收购包括约10名来自Coefficient Bio的员工,他们将加入Anthropic的健康与生命科学团队。

OpenAI AGI部署负责人因健康原因休假
OpenAI负责AGI部署的高管Fidji Simo因神经免疫疾病需休病假。产品管理将由总裁Greg Brockman接管,其他高管如首席运营官Brad Lightcap和首席营销官Kate Rouch也已决定离职或转岗。

AI公司为数据中心建设天然气发电厂
微软、谷歌和Meta正在投资建设大型天然气发电厂,为它们的AI数据中心提供电力。这些项目包括微软在德克萨斯州建设的5吉瓦电厂、谷歌在北德克萨斯州建设的933兆瓦电厂,以及Meta在路易斯安那州Hyperion数据中心新增的七个电厂,总容量达7.46吉瓦。

苹果音乐AI播放列表游乐场根据提示生成定制播放列表
苹果音乐在iOS 16.4中推出了Playlist Playground功能,这是一个基于用户提示(如“锻炼播放列表”或“类似Tame Impala的歌曲”)生成定制播放列表的生成式AI工具。该功能让用户无需手动操作即可获得符合特定情绪或活动的音乐集合。

Anthropic解释Claude Code使用量快速消耗的原因
Anthropic指出,Claude Code使用量快速消耗的主要原因是高峰时段的使用限制和不断扩大的上下文窗口。公司还推出了效率改进措施和产品内提示,帮助用户更好地管理使用限额。

OpenAI收购科技播客TBPN以塑造人工智能舆论
OpenAI已收购于2024年10月上线的科技类播客节目TBPN,交易金额为数亿美元。这标志着OpenAI的战略转变,此前该公司曾承诺专注于核心产品如ChatGPT,避免涉足‘副业’。

ChatGPT现在与Apple CarPlay集成,支持免提语音交互
OpenAI的ChatGPT应用现已支持与Apple CarPlay直接集成,使用户在驾驶时可以进行完整的免提语音对话。这需要iOS 26.4或更高版本、最新版的ChatGPT应用以及支持CarPlay的车辆。

Gemini现在支持从ChatGPT或Claude导入聊天记录
谷歌的Gemini AI现在新增了记忆导入功能,允许用户将来自其他AI助手(如ChatGPT或Claude)的聊天记录、偏好和个人背景信息导入。这使得Gemini能够基于你的过往互动进行个性化回应,而无需重新开始。

OpenAI收购科技访谈节目TBPN
OpenAI已收购由约翰·库根主持的热门科技访谈节目TBPN,该节目常邀请AI和科技行业的高管嘉宾。收购包括其团队,他们将加入OpenAI的战略部门,同时保留节目内容的编辑独立性。

微软发布三大基础AI模型以抗衡竞争对手
微软AI宣布推出三种新的基础模型:MAI-Transcribe-1用于语音转文字,MAI-Voice-1用于音频生成,MAI-Image-2用于图像生成。这些模型现已在微软Foundry和MAI Playground上线,其中语音转录的定价从每小时0.36美元起。

微软MAI-Transcribe-1速度提升2.5倍,支持25种语言
微软推出了MAI-Transcribe-1语音转文字模型,其运行速度比前代快2.5倍,每小时音频成本为0.36美元。该模型支持25种语言,并在FLEURS基准测试中实现了最低的词错误率。

谷歌发布Gemma 4并采用Apache 2.0许可证以提升开发者自由度
谷歌发布了Gemma 4系列开放权重AI模型,包含四种针对本地部署优化的尺寸,并从自定义许可证转向更宽松的Apache 2.0许可证。

谷歌推出Gemini API的Flex和Priority服务层级
谷歌在Gemini API中新增了Flex和Priority两种服务层级,开发者无需处理异步工作流即可平衡成本与可靠性。Flex为延迟容忍型任务提供50%的成本节省,Priority则确保关键应用的高可靠性。

Anthropic的DMCA删除请求意外移除了合法的GitHub分支
Anthropic向GitHub发送了一份针对泄露的Claude Code源代码的DMCA删除请求,但意外移除了超过8000个官方公共仓库的合法分支。该公司随后撤回了通知,并要求GitHub恢复受影响仓库的访问权限。

英伟达用288张GPU创下MLPerf新纪录
英伟达在MLPerf推理v6.0测试中使用最多288张GPU创下新纪录,主要针对DeepSeek-R1和GPT-OSS-120B模型;而AMD和英特尔则提交了不同配置和基准下的结果。

Anthropic意外删除数千个GitHub仓库
Anthropic在试图删除其Claude Code应用的泄露源代码时,意外触发了约8100个GitHub仓库的下架。该公司随后撤回了大部分下架通知,仅保留了包含意外发布代码的一个仓库及其96个分支。

Holo3 在企业级自主AI领域实现突破
Hugging Face推出的Holo3模型在OSWorld-Verified基准测试中取得78.85%的成绩,仅使用100亿活跃参数,性能超越许多更大规模的专有模型,且为开源、低成本架构。

Cognichip 融资6000万美元,用AI设计芯片
成立于2024年的初创公司Cognichip刚刚融资6000万美元,用于开发AI工具以加速计算机芯片的设计过程。该公司声称其AI模型可将芯片开发成本降低超过75%,并将时间缩短一半以上。

我用Gmail的AI工具在10分钟内完成数小时工作
作者仅用三个特定提示就利用Gmail内置的AI功能自动化处理了一项持续一年项目的邮件线程整理任务,将数小时的手动工作压缩到不到10分钟。

谷歌AI创建高分辨率卫星地图助力保护巴西森林
谷歌利用早期2000年代的历史数据开发出一张高分辨率的巴西卫星影像地图,精度比以往高出六倍。该地图现在可在Google Earth和Earth Engine中使用,能精准识别森林砍伐区域。

谷歌发布2026年3月Gemini人工智能更新
谷歌在2026年3月推出了一系列AI改进,重点提升Gemini对日常任务(如旅行、工作和健康)的理解与帮助能力。关键更新包括扩展Search Live功能、增强Personal Intelligence,并在Docs、Sheets、地图和Pixel设备中引入新工具。

AI可自动为你按下Stream Deck按钮
Elgato的Stream Deck 7.4更新加入了Model Context Protocol(MCP)支持,使ChatGPT和Claude等AI助手无需手动操作即可触发设备上的宏命令和动作。

零工在家中训练人形机器人
来自50多个国家的零工正在用智能手机录制日常动作,如叠衣服和做饭,为训练人形机器人提供真实世界的行为数据。Micro1等公司收集这些数据供特斯拉、Figure AI等机器人企业使用。

OpenAI融资1220亿美元并发布ChatGPT超级应用
OpenAI已完成1220亿美元的融资,估值达8520亿美元,并正式推出ChatGPT超级应用,该应用将ChatGPT、Codex代码代理、网络搜索及其他智能体功能整合到一个以代理为核心的界面中。
经济激励将推动AI写出更好的代码
崔秀勋认为,AI模型会自然地写出高质量、可维护的代码,因为从长远来看这更便宜且效率更高。这是由市场竞争驱动的——能帮助开发者更快交付可靠功能的AI工具将胜出。

Salesforce为Slack推出30项AI功能,含可重复使用的AI技能
Salesforce宣布为Slack推出30项新的AI功能,其中最引人注目的是可重复使用的AI技能,允许用户定义任务并跨不同场景应用到Slackbot。这些技能能自动从Slack频道和连接的应用程序中提取数据,生成可执行计划并安排会议。

OpenAI完成1220亿美元融资,估值达8520亿美元,引入散户投资者
OpenAI完成了创纪录的1220亿美元融资,估值达到8520亿美元,其中包括通过银行渠道和ETF获得的30亿美元散户资金,以及一笔47亿美元未动用的循环信贷额度。

ChatGPT 现可通过语音在 Apple CarPlay 中使用
Apple 的 CarPlay 现在支持仅通过语音与 ChatGPT 对话,驾驶员可以通过语音命令与 AI 助手互动,而无需在屏幕上看到文字。该功能需要 iOS 26.4 或更高版本以及最新版的 ChatGPT 应用。

Yupp AI在融资3300万美元后关闭,尽管已有130万用户
Yupp是一家众筹式AI模型对比平台,在获得a16z加密货币的克里斯·迪克森3300万美元投资后,仅运营不到一年便宣布关闭,尽管它已拥有130万用户和排行榜。

谷歌发布Veo 3.1 Lite,提供更实惠的视频生成服务
谷歌发布了Veo 3.1 Lite,这是一个支持文本到视频和图像到视频的低成本视频生成模型,可自定义分辨率(720p/1080p)和时长(4秒、6秒、8秒)。该模型现已通过Gemini API和Google AI Studio的付费预览版提供。


Runway推出1000万美元基金和Builders计划支持AI初创企业
Runway推出了1000万美元的风险投资基金和Builders计划,为专注于人工智能、媒体和世界模拟的早期初创企业提供免费API积分。该举措旨在构建一个围绕“视频智能”的生态系统,超越其核心的视频生成工具。

Ring推出AI应用商店,拓展至家庭安防之外的领域
Ring推出了一个基于人工智能的应用商店,允许开发者为超过一亿台摄像头开发新功能,覆盖老年人照护、商业分析和租赁管理等新领域。首批合作应用包括Density的Routines(用于监测老人日常行为)和QueueFlow(用于统计公共场所等待时间)。
OpenAI融资1220亿美元加速前沿人工智能发展
OpenAI已获得1220亿美元的新融资,用于扩展前沿人工智能研究、投资下一代计算基础设施,并满足全球对ChatGPT和Codex等产品日益增长的需求。

通义千问Qwen3.5-Omni无需训练即可从语音和视频中编写代码
阿里巴巴通义千问Qwen3.5-Omni模型展示了无需专门训练即可从语音和视频输入中生成代码的能力。它在音频基准测试中优于谷歌Gemini 3.1 Pro,并支持74种语言的语音识别。

Okta首席执行官谈AI时代的身份管理
Okta首席执行官Todd McKinnon探讨了AI代理的兴起如何迫使Okta重新思考身份管理,不再局限于人类用户,并通过整合大语言模型和代理安全措施来应对‘SaaS末日’挑战。

OpenAI因日耗百万美元且用户锐减而取消Sora
OpenAI在Sora视频生成应用上线数月内用户数量减半,每日成本约一百万美元后决定关停该产品。公司将其计算资源重新分配到编码、推理和代理型AI等更具战略价值的方向。

OpenAI因成本过高和用户参与度低关闭Sora
OpenAI在发布Sora仅六个月后突然关闭了这款AI视频生成工具,原因是每日运营成本高达约100万美元,且用户数量从峰值100万下降到不足50万。

Bluesky新AI助手Attie让用户用自然语言定制内容流
Bluesky推出了由Anthropic的Claude驱动的AI助手Attie,用户可以用自然语言创建自定义社交内容流。该工具目前处于封闭测试阶段,可通过attie.ai访问。

Naver的首尔世界模型利用真实街景数据减少AI幻觉
Naver开发了首尔世界模型(SWM),这是一种基于120万张街景图像真实几何结构生成准确、一致城市视频的视频世界模型。它在视觉质量和时间一致性上优于六个现有模型,并且无需重新训练即可推广到釜山和安娜堡等陌生城市。

Claude新增从ChatGPT或Gemini导入记忆功能
Anthropic的Claude人工智能现在支持导入功能,用户可以将来自ChatGPT、Google Gemini或微软Copilot等其他AI服务的偏好、个人信息和对话背景一次性迁移过来。

Bluesky推出Attie,一款用于定制社交信息流的AI应用
Bluesky推出了Attie,这是一个独立的AI应用,利用Anthropic的Claude模型让用户通过自然语言指令创建个性化社交信息流。它基于AT协议运行,使用户无需编程即可构建和管理信息流。

谷歌Gemini API代理技能显著提升AI编程助手能力
谷歌推出了Gemini API的新‘代理技能’,让AI编程助手能获取最新的SDK文档、模型信息和示例代码,解决了模型不了解自身更新的问题。

Anthropic的Claude付费用户数量激增
一项对数十亿条匿名美国信用卡交易数据的分析显示,Anthropic的Claude在2026年1月至2月期间获得了创纪录的付费订阅用户增长。这一增长归因于高调的营销活动,包括针对OpenAI的超级碗广告,以及与国防部关于AI伦理的公开争端。

OpenAI因财务压力取消Sora视频生成器
OpenAI突然中止了其视频生成项目Sora,撤回了将其集成到ChatGPT中的计划,并终止了一项价值10亿美元的迪士尼合作。公司现在更关注盈利,而非像Sora或ChatGPT成人模式这样的雄心勃勃的AI项目。

Meta的超智能体在任务和学习机制上都能自我提升
Meta与大学研究人员开发了‘超智能体’——一种不仅能完成任务,还能优化自身学习机制的AI系统。这一突破使AI不仅能提升任务表现,还能改进自身的学习方式,打破了自适应AI长期存在的限制。

OpenAI计划于2026年4月起逐步停用Sora,API在9月关闭
OpenAI宣布分两个阶段终止其Sora文本转视频模型:网页和移动应用将于2026年4月26日停止服务,API则于同年9月24日关闭。用户被敦促在此日期前下载自己的内容。

OpenAI为Codex添加插件功能以追赶竞争对手
OpenAI在其代码助手Codex中引入了插件支持,使用户能够通过一键安装的方式集成GitHub、Gmail和Cloudflare等外部服务。这些插件包含技能、应用集成和MCP(模型上下文协议)服务器,但并未带来新的核心功能。

软银400亿美元贷款暗示OpenAI或于2026年上市
软银从摩根大通、高盛及四家日本银行获得了一笔400亿美元的无担保贷款,用于兑现其对OpenAI的300亿美元投资承诺。该贷款期限仅一年,表明贷款方预计OpenAI即将上市,可能在2026年底前完成。

谷歌Gemini更新支持从ChatGPT和Claude导入记忆
谷歌已更新其Gemini人工智能,允许用户通过简单提示或ZIP文件上传(最大5GB)从其他模型如ChatGPT和Claude导入记忆,包括聊天历史、偏好和提醒。这是跨平台AI互操作性趋势的一部分。

Meta的TRIBE v2模型可预测大脑对感官刺激的反应
Meta的TRIBE v2人工智能模型能够以高于单个fMRI扫描的准确度预测人类大脑对图像、声音和语言的反应。该模型基于720名受试者超过1000小时的fMRI数据训练而成,并使用Llama 3.2、Wav2Vec-Bert-2.0和Video-JEPA-2等预训练模型进行输入处理。

Anthropic泄露显示‘Claude Mythos’测试分数创纪录
Anthropic内部文件泄露显示,一款名为‘Claude Mythos’(也称‘Capybara’)的新AI模型在编程、学术推理和网络安全等测试中得分远超此前的Claude Opus 4.6模型。

OpenAI关闭Sora引发AI抵制浪潮
OpenAI已停止其文本生成视频模型Sora,反映出社会对AI扩张的日益抵制。这一决定与肯塔基州因AI数据中心用地引发的土地争议等现实世界的反抗相呼应。

OpenAI关闭Sora,AI基础设施遭遇公众抵制
OpenAI已关闭其视频生成工具Sora,同时一位肯塔基州土地所有者拒绝了价值2600万美元的报价,不愿将农场用于建设AI数据中心。这些事件凸显了公众对AI扩张的日益抵制。

谷歌Gemini新增AI记忆导入功能以提升连续性
谷歌Gemini现在支持通过两个新功能从其他AI模型导入记忆和聊天历史:‘导入记忆’和‘导入聊天记录’。用户可以通过复制提示词或上传一个最多5GB的.zip文件,将偏好和过往对话在不同AI之间转移。

苹果将允许第三方AI聊天机器人接入Siri
苹果计划在iOS 27中允许用户通过名为“Extensions”的新系统将谷歌的Gemini和Anthropic的Claude等第三方AI聊天机器人接入Siri,这标志着其AI助手策略的重大转变。

苹果AI播放列表游乐场无法提供相关音乐
一位用户测试了苹果音乐新推出的AI播放列表游乐场Beta功能,发现它在生成特定音乐类型(如器乐黑金属、现代嘻哈和工业舞曲)的播放列表时持续失败。

谷歌扩展AI搜索助手至200多个国家,支持多语言对话
谷歌利用新的Gemini 3.1 Flash Live模型,将Search Live功能扩展到200多个国家和地区及数十种语言,支持实时语音和摄像头交互。


谷歌发布Gemini 3.1 Flash Live,让语音AI更自然可靠
谷歌推出了Gemini 3.1 Flash Live,这是一个高质量的音频和语音模型,提升了搜索实时、Gemini实时等产品中的实时对话能力。

Conntour 获得 700 万美元融资,打造人工智能驱动的安全视频搜索引擎
视频监控初创公司 Conntour 已获得来自 General Catalyst、Y Combinator 等机构的 700 万美元种子轮融资,用于开发一款基于人工智能的视频搜索工具,支持通过自然语言查询安全录像。该公司强调伦理客户筛选,仅与其认为道德和合法的客户合作。

AI初创公司Manus迁至新加坡并以20亿美元被Meta收购
中国知名AI初创公司Manus悄然从北京迁至新加坡,并以20亿美元的价格被Meta收购。该公司在交易后切断了与中方投资者的联系,并关闭了在中国的所有业务。
中国AI模型在token消耗上领先
来自DeepSeek和MiniMax等公司的中国AI模型在token消耗量上超过了美国同类模型,这一指标反映了实际使用和部署情况。

谷歌TurboQuant算法将大语言模型内存减少6倍且不损失质量
谷歌研究团队推出了TurboQuant算法,该算法可将大语言模型的键值缓存大小最多压缩6倍,并提升推理速度8倍,同时保持输出准确性不变。

迪士尼取消与OpenAI的10亿美元合作,因Sora关停
迪士尼已取消其原计划对OpenAI的10亿美元股权投资,原因是OpenAI宣布关闭其Sora视频生成应用。该合作最初于2025年12月宣布,包括在Sora生成的视频中使用超过200个迪士尼角色。