Perplexity被诉隐私欺诈
用户在隐身模式下对话仍被传给谷歌和Meta,引发对AI搜索引擎隐私机制的根本性质疑。
AI 日报
今日焦点围绕AI伦理与技术突破展开:Perplexity因隐身模式数据泄露遭诉讼,引发对AI平台隐私机制的广泛质疑;与此同时,谷歌、微软和阿里巴巴等公司加速开放模型与工具,推动AI在本地部署、多模态生成和企业级应用中的普及。这些动态共同描绘出一个更透明、更具实用性的AI未来。
Overview
从 49 条资讯中筛选出 34 条
今日焦点围绕AI伦理与技术突破展开:Perplexity因隐身模式数据泄露遭诉讼,引发对AI平台隐私机制的广泛质疑;与此同时,谷歌、微软和阿里巴巴等公司加速开放模型与工具,推动AI在本地部署、多模态生成和企业级应用中的普及。这些动态共同描绘出一个更透明、更具实用性的AI未来。
用户在隐身模式下对话仍被传给谷歌和Meta,引发对AI搜索引擎隐私机制的根本性质疑。
新模型支持本地部署并采用Apache 2.0许可证,显著降低商业使用门槛,促进全球开发者创新。
开发者不再依赖传统IDE,而是通过自然语言指令引导AI完成编码任务,标志着开发范式的根本转变。
MAI-Transcribe-1速度比前代快2.5倍,支持25种语言,助力企业实时会议转录与客服自动化。
MIT研究显示AI将在2029年前逐步替代文本类任务,而非突发性失业,为再培训和政策调整提供时间窗口。
Stories
Ars Technica AI

一份诉状指控Perplexity AI在用户启用“隐身模式”时仍秘密共享其私人聊天记录,包括未订阅用户的对话内容,这些信息被传送给谷歌和Meta。
此案凸显了AI驱动搜索引擎中数据隐私的重大风险,尤其是当敏感个人信息在用户不知情的情况下被分享,即使是在标榜为私密功能的模式下。
一份拟议的集体诉讼指控Perplexity AI在用户登录或使用“隐身模式”时,仍秘密传输聊天记录至谷歌和Meta,无论用户是否订阅服务。诉状称,无论是付费还是非付费用户,其对话内容均被共享,其中非订阅用户的聊天记录可通过公开链接被第三方访问。即使是启用“隐身模式”的付费用户,其邮箱等身份信息也仍被发送给Meta和谷歌,使其能够识别用户身份。
原告将Perplexity使用的追踪脚本比作“基于浏览器的窃听技术”,称其运行不可检测。该诉讼认为这违反了联邦和州级隐私法,并要求三方公司承担责任。
诉状指出,非订阅用户的聊天记录可通过URL被第三方(如谷歌和Meta)访问,且即使付费用户启用了隐身模式,其个人身份信息(如邮箱地址)仍会被共享。
Ars Technica AI

·#ai
谷歌发布了Gemma 4系列开放权重AI模型,包含四种针对本地部署优化的尺寸,并从自定义许可证转向更宽松的Apache 2.0许可证。
转向Apache 2.0许可证消除了商业使用的技术法律障碍,推动了更广泛的应用;同时模型效率提升使高性能AI能在消费级硬件上运行,让全球更多开发者和企业更容易获得先进AI能力。
谷歌Gemma 4推出了四种新模型:有效参数2B(E2B)、有效参数4B(E4B)、26B混合专家(MoE)和31B密集型模型,每种都针对不同硬件环境设计。大模型表现出色,31B模型在Arena排行榜中位列第3,26B MoE模型性能优于其20倍大小的竞品。
所有模型均优化了低延迟和高效本地推理,适合桌面和移动设备使用。特别值得注意的是,谷歌将原本限制性较强的自定义许可证更换为Apache 2.0许可证,以增强开发者自由度并促进跨行业创新。
26B混合专家(MoE)和31B密集模型可在80GB H100显卡上无量化运行,所有版本均支持量化以适配低端设备;E2B和E4B版本专为手机和边缘设备如Pixel手机、Jetson Nano优化。
Simon Willison

谷歌DeepMind发布了四个新的开源视觉语言模型——2B、4B、31B以及一个26B-A4B混合专家模型,通过分层嵌入(PLE)技术提升了参数效率。较小的模型标注为E2B和E4B,表示其有效参数规模,从而实现更好的本地设备运行性能。
这些模型标志着高效AI开发的重大进步,使高性能推理模型能在边缘设备上运行而不牺牲质量。这种向每参数智能提升的趋势对于在移动和低资源环境中普及AI至关重要。
谷歌DeepMind推出了Gemma 4,包括四个从2B到31B参数的开源模型,其中包含一个26B-A4B混合专家版本。这些模型通过分层嵌入(PLE)等技术强调每参数智能提升,允许小型模型通过优化每层嵌入使用方式实现高性能。作者使用GGUF格式在本地测试了多个模型,发现2B、4B和26B-A4B版本运行良好,后者甚至能生成非常准确的“鹈鹕骑自行车”SVG图像。
然而,31B模型存在一个导致重复输出“---”的错误。用户可通过AI Studio API访问两个较大模型,例如生成上述SVG内容。此次发布凸显了研究重心转向适合实际部署的小型高效模型。
E2B和E4B模型使用分层嵌入(PLE)技术减少内存占用同时保持性能;31B模型存在bug导致无限循环输出,但26B-A4B混合专家版本在SVG图像生成任务中表现出色。
The Decoder

英伟达、加州大学伯克利分校、斯坦福大学和卡内基梅隆大学的一项研究引入了CaP-X框架,表明即使是最先进的AI模型在缺乏人类设计的抽象结构时也无法控制机器人。然而,如并行代码生成和视觉差异模块等代理支架技术可以显著提升性能。
这挑战了通用AI无需结构化引导即可自主控制机器人的假设,强调了将人类设计与代理式推理结合的必要性,可能塑造未来更安全、更可靠的具身AI系统。
英伟达、加州大学伯克利分校、斯坦福大学和卡内基梅隆大学的研究人员开发了CaP-X框架,用于评估AI代理编写机器人控制代码的能力。他们发现,如果没有人类设计的构建块(如预定义函数“抓取物体X”),即使是顶级模型(如GPT-5.2和Claude Opus 4.5)也会严重失败。
关键洞察是,添加代理支架——如并行代码生成、自动函数库和视觉差异模块——可以让一个无需训练的代理(CaP-Agent0)达到人类级别的可靠性。这种方法通过使用场景变化的结构化文本描述指导下一步动作,优于直接图像输入和控制台输出。
该研究测试了包括GPT-5.2和Gemini-3-Pro在内的12种模型,在7个操作任务上进行评估;直接输入原始摄像头图像会降低性能,而视觉差异模块通过每步后提供结构化的文本反馈来提升表现。
The Decoder

·#agi
OpenAI总裁格雷格·布罗克曼表示,GPT推理模型已经明确指向通用人工智能(AGI),并认为文本模型是实现AGI的主要路径,尽管其他研究人员对此持不同意见。
这一声明挑战了AI研究界的主流观点,可能影响未来对AGI的投资方向、研发重点和政策制定。它也凸显了AI领域内关于语言模型能否扩展到通用智能与必须依赖具身或世界模型方法之间的重大分歧。
OpenAI总裁格雷格·布罗克曼断言,GPT推理模型正朝着实现通用人工智能(AGI)的方向稳步前进,实际上在OpenAI内部关闭了这场争论。他将这类文本模型与Sora等多模态模型区分开来,称后者属于不同的技术分支。尽管OpenAI已缩减Sora的消费级产品开发,但仍致力于推进GPT架构。
这一立场直接反驳了尤恩·勒昆和德米斯·哈萨比斯等知名研究者的观点,他们认为真正的AGI需要通过具身学习或世界模型理解物理世界。该声明出现在OpenAI最新模型o3可能通过ARC-AGI测试的消息之后,表明向人类级推理迈出了重要一步。批评者警告,仅依赖文本模型可能会忽略现实认知的关键方面。
布罗克曼强调,由于资源限制,OpenAI优先发展GPT推理模型而非多模态系统如Sora,称其属于技术演化的不同分支而非竞争关系。他承认存在错失关键洞见的风险,但认为基于近期应用价值的决策是合理的。
The Verge AI

Granola这款AI笔记应用默认将笔记设为可通过链接访问,且会使用这些笔记来训练其内部AI模型,除非用户主动选择退出。用户可在应用的隐私设置中更改此选项。
这带来了严重的隐私风险,尤其是在敏感的商务会议中,链接意外泄露可能导致机密信息外泄。同时,它也引发了关于AI工具如何在未经明确同意的情况下使用用户数据的伦理争议。
Granola是一款专为连续会议设计的AI笔记应用,默认通过公共链接共享笔记,任何人都可以在不登录的情况下访问。即使不在登录状态下,也能看到自己的笔记和会议转录的部分内容。该应用还会使用用户生成的内容(包括笔记和转录)来改进内部AI模型,除非用户主动选择退出。
尽管Granola声称数据存储加密且传输安全,但它不保存原始音频文件,只保留处理后的笔记和转录文本。用户必须手动调整设置才能将链接设为私有或限制公司成员访问。一位LinkedIn用户曾警告称,这些链接虽未被搜索引擎索引,但一旦分享就会变成公开内容;一家大型公司因安全顾虑已禁止使用该工具。
任何人只要拥有链接就能查看笔记,甚至无需登录——包括在无痕浏览窗口中。用户可访问部分转录内容和AI生成的摘要。企业用户默认被排除在AI训练之外,但其他用户需手动关闭该功能。
Ars Technica AI

Google 已将最新的 Veo 3.1 模型和可操控的 AI 虚拟形象集成到 Vids 视频编辑工具中,用户可以生成派对传单或商业短视频。该更新采用分级订阅制,免费用户每月仅限生成 10 个视频,AI Ultra 订阅者每月最多可生成 1,000 个。
此举使 Vids 成为面向普通用户的 AI 视频创作工具,而不仅仅是专业影视制作人的选择,体现了谷歌在生成式 AI 内容领域扩大影响力的战略。这也反映了整个行业向更易用、实用的 AI 媒体工具发展的趋势。
谷歌对其 Vids 视频编辑平台进行了重大升级,集成了先进的 AI 模型如 Veo 3.1 和 Lyria 音乐生成系统。用户现在可以用可定制的虚拟形象创建短片,这些形象在不同场景中保持一致,非常适合制作动画派对传单、贺卡或商业短视频。免费用户每月可生成 10 个视频,AI Pro 和 AI Ultra 订阅用户分别可生成 50 和 1,000 个。
新增的 Chrome 扩展允许直接录制屏幕或摄像头内容,无需打开完整应用;且视频可直接发布到 YouTube,无需导出再上传。这些功能让 AI 视频创作更加便捷,融入日常使用流程。
Veo 3.1 生成 8 秒、720p 分辨率的视频,Lyria 音乐模型可通过描述情绪自动生成 30 秒或 3 分钟的音乐片段,无需输入歌词。虚拟形象可在不同场景中保持外观和行为一致,并能与视频中的物体互动。
Ars Technica AI

·#ai
Anthropic向GitHub发送了一份针对泄露的Claude Code源代码的DMCA删除请求,但意外移除了超过8000个官方公共仓库的合法分支。该公司随后撤回了通知,并要求GitHub恢复受影响仓库的访问权限。
这一事件突显了开源社区中知识产权执法过度的风险,并引发人们对自动化或目标不明确的法律行动可能伤害无辜贡献者的担忧。它还强调了代码一旦在网上扩散后,控制其传播的困难性。
Anthropic试图通过DMCA通知移除泄露的Claude Code客户端源代码,但由于沟通失误,GitHub错误地删除了8100个分支——包括那些仅用于报告漏洞的官方公共仓库镜像。许多开发者感到不满,因为他们的作品被错误标记。Anthropic迅速道歉并要求GitHub将删除范围限制在指定的96个仓库。
尽管如此,泄露代码仍在GitHub和Codeberg等平台上广泛存在。一些开发者甚至使用AI工具将代码重写为Python或Rust版本,可能创造出法律上独立的变体。这一案例说明了控制泄露AI代码多么困难,以及DMCA通知如何轻易在开源生态系统中造成附带损害。
原始泄露来自一个包含60MB源映射文件的npm包;Anthropic的删除请求基于一个仓库及其网络,GitHub将其广泛解读。即使在修正后,该代码的副本仍存在于GitHub和其他平台(如Codeberg)上。
Financial Times AI
·#ai
OpenAI收购了由前创始人约翰·库根和乔迪·海斯主持的热门每日科技访谈节目TBPN,这是其首次涉足媒体领域。这笔交易价值约数亿美元,标志着OpenAI正式进入广播和内容制作行业。
此次收购使OpenAI的影响从AI模型扩展到公众舆论领域,可能塑造社会对AI的理解与互动方式。这也体现了OpenAI向构建更广泛AI生态系统的战略转变。
OpenAI收购了知名科技访谈节目TBPN,该节目每天在YouTube和X平台上直播,聚焦科技、商业、人工智能和国防话题。由前科技创业者主持的TBPN在硅谷圈内拥有忠实观众,因其坦诚对话而备受推崇。节目将继续保持独立的编排和嘉宾选择权,但如今归属于OpenAI战略团队,向政治策略专家克里斯·莱恩汇报。
OpenAI希望借助TBPN推动全球关于AI的讨论,让这项技术更贴近日常生活。尽管有人担心所有权可能导致偏见,但CEO萨姆·阿尔特曼表示不认为这会影响TBPN对OpenAI本身的批评报道。这是OpenAI首次收购媒体公司,标志着其从AI模型向外拓展的重要一步。
TBPN将保留编辑独立性,并继续作为独立品牌运营,隶属于OpenAI的战略团队,向政治策略专家克里斯·莱恩报告。该节目将在OpenAI支持下进一步扩大影响力。
Financial Times AI
人工智能初创公司Poolside因与CoreWeave的合作破裂,正在与谷歌及其他云服务商洽谈,以重启其在德克萨斯州计划中的2吉瓦数据中心项目。
这一变动凸显了AI基础设施合作伙伴关系的不稳定性,也说明了可靠云计算能力对AI初创企业扩展的重要性。同时表明Poolside可能正转向谷歌等大型超大规模云服务商。
Poolside是一家专注于人工智能的初创公司,原计划与CoreWeave合作在德克萨斯州建设一个2吉瓦的数据中心。然而,该合作破裂后,Poolside开始接触谷歌及其他云服务商以重启项目。这一举动反映出云服务提供商之间为支持高需求AI工作负载而展开的激烈竞争。
该公司希望获得足够的计算能力来扩展其AI模型和服务。CoreWeave合作的失败可能意味着从专业AI云服务商获取长期基础设施承诺存在挑战。与此同时,谷歌的参与表明它正在积极加强在AI基础设施市场的地位。
此前与CoreWeave的协议旨在支持德克萨斯州一个大型AI数据中心,但该协议破裂迫使Poolside迅速寻找替代方案,可能包括使用谷歌云基础设施。
Google AI Blog

·#ai
谷歌在Gemini API中新增了Flex和Priority两种服务层级,开发者无需处理异步工作流即可平衡成本与可靠性。Flex为延迟容忍型任务提供50%的成本节省,Priority则确保关键应用的高可靠性。
此次更新通过统一接口简化了开发架构,使背景任务和交互式任务共用同一套API,降低了复杂度并提升了AI应用场景(如聊天机器人、数据增强和代理工作流)的成本效率。
谷歌在Gemini API中引入Flex和Priority推理层级,以解决不同AI任务在成本与可靠性之间平衡的问题。Flex专为背景任务(如CRM更新或大规模模拟)设计,提供50%的成本降低,虽然延迟可变但保持同步调用的简便性——无需管理批处理作业。Priority针对关键应用(如实时客服机器人),即使在高峰时段也保证最高可靠性,并在超出限额时自动降级到Standard层级而非失败。
两个层级均使用相同的接口,无需复杂的异步逻辑。开发者只需设置service_tier参数即可按需路由流量。这种做法简化了生产部署,优化了对成本敏感和性能关键任务的资源分配。
Flex层级适用于所有付费套餐,并支持GenerateContent和Interactions API请求;Priority层级需Tier 2或3项目,溢出流量会自动降级至Standard层级而非失败。
Simon Willison

西蒙·威尔森讨论了2025年11月的一个关键转折点,当时GPT-5.1和Claude Opus 4.5等模型达到了一个阈值,代码生成变得可靠可用,从而将瓶颈从编写转移到测试。他还引入了‘黑暗工厂’和‘鹈鹕基准’等概念作为评估AI代理能力的工具。
这一转变标志着AI不再只是辅助工具,而是成为开发者伙伴,迫使工程师重新思考工作流程、质量控制和团队结构——为其他面临类似自动化浪潮的知识工作者树立了先例。
在Lenny的播客访谈中,西蒙·威尔森强调了2025年底的一个重大转折点:GPT-5.1和Claude Opus 4.5等AI模型达到可靠性阈值,生成的代码几乎总是能按预期运行。这一变化将焦点从编码转向测试,使软件质量评估变得更加困难。他认为软件工程师现在是其他信息工作者的风向标,因为代码有明确的正确性标准——不像文章或法律文件那样模糊。
威尔森还探讨了‘黑暗工厂’等伦理问题,即AI代理无需人类审查即可编写、测试并发布代码;同时引入‘鹈鹕基准’作为衡量AI视觉推理能力的方法。他的见解反映了业界对负责任AI使用日益增长的关注,以及工程师在自动化未来中角色的演变。
'转折点'指的是AI生成的代码变得基本正确且无需人工监督的时刻,使代理能够仅凭简单提示构建像Mac应用这样的功能程序。鹈鹕基准测试通过要求模型以SVG格式绘制一只骑自行车的鹈鹕来检验视觉推理能力。
TechCrunch AI

·#ai
微软AI宣布推出三种新的基础模型:MAI-Transcribe-1用于语音转文字,MAI-Voice-1用于音频生成,MAI-Image-2用于图像生成。这些模型现已在微软Foundry和MAI Playground上线,其中语音转录的定价从每小时0.36美元起。
此举强化了微软脱离与OpenAI合作后的独立AI能力,并标志着其向构建完整多模态AI平台的战略转变。这可能重塑生成式AI的竞争格局,因为微软将其模型定位为比谷歌和OpenAI更经济实惠的选择。
微软AI推出了三种新的基础模型——MAI-Transcribe-1、MAI-Voice-1和MAI-Image-2,分别用于文本、语音和图像生成。这些模型现已在微软Foundry和MAI Playground上公开提供,定价具有竞争力。这一发布凸显了微软打造独立AI平台的雄心,尽管仍与OpenAI保持合作关系。
公司声称这些模型性能更优且成本低于谷歌和OpenAI等竞争对手。这些模型由Mustafa Suleyman领导的MAI超级智能团队开发,他强调以人类为中心的设计理念。微软还重申了对OpenAI的长期承诺,此前双方重新谈判了合作协议,使这项研究得以推进。
MAI-Transcribe-1支持25种语言,速度比Azure Fast快2.5倍;MAI-Voice-1可在一秒内生成60秒音频并支持自定义声音。这些模型由微软MAI超级智能团队开发,负责人是Mustafa Suleyman。
TechCrunch AI

谷歌更新了Vids应用,支持用户通过自然语言提示来操控虚拟形象,并引入Veo 3.1视频生成模型、YouTube直接导出功能以及Chrome屏幕录制扩展程序。
此次更新让AI视频创作更加直观易用,尤其适合希望无需复杂编辑工具即可生成个性化内容的创作者,使谷歌在生成式AI视频平台领域更具竞争力。
谷歌大幅升级了Vids应用,支持用户通过文本提示操控虚拟形象、自定义外观与背景,并使用Veo 3.1模型生成8秒短视频。应用还新增了直接导出到YouTube的功能(默认私密),并提供一个带音视频录制功能的Chrome扩展程序。这些改进基于此前添加的Lyria音乐模型和多语种语音支持,体现了谷歌通过多模态AI工具推动企业及消费者内容创作更便捷的战略。
普通用户每月可获得10次Veo 3.1视频生成额度,Google AI Ultra和Workspace AI Ultra账户每月最多可生成1000条视频。即使动态提示变化,虚拟形象也能保持一致性。
TechCrunch AI

·#ai
Anthropic在试图删除其Claude Code应用的泄露源代码时,意外触发了约8100个GitHub仓库的下架。该公司随后撤回了大部分下架通知,仅保留了包含意外发布代码的一个仓库及其96个分支。
这一事件突显了自动化版权执法工具的风险,引发了人们对AI公司在开源生态中管理知识产权方式的关注。它还强调了当法律下架操作缺乏精准定位时可能造成的附带损害。
Anthropic因误将Claude Code命令行工具的泄露源代码包含在一次公开版本中,导致GitHub删除了约8100个仓库。该代码被用户迅速分享到网上,促使Anthropic采取行动。然而,下架通知定位不准确,影响了许多合法的开源项目,包括Anthropic自身公共仓库的分支。
公司后来澄清这是无心之失,并撤回了大部分通知,仅保留原始泄露仓库及其直接分支的下架。这一失误引发开发者社区批评,并加剧了对自动化执行系统过度干预的担忧。
此次下架基于美国数字版权法的通知,影响了Anthropic自己公开仓库的合法分支以及恰好包含泄露代码的无关项目。Anthropic发言人承认错误源于配置不当的请求,导致影响范围超出预期目标。
The Decoder

日本AI初创公司Sakana AI推出了名为Sakana Marlin的自主AI系统,可在八小时内完成深度战略研究,并生成相当于人类团队数周工作量的专业报告和演示文稿。
这项技术大幅缩短了金融和咨询等行业高价值战略工作的耗时与成本,可能重塑企业进行市场分析和决策的方式。
日本AI初创公司Sakana AI发布了名为Sakana Marlin的自主AI系统,旨在自动化深度战略研究。用户输入一个主题后,系统可独立研究长达八小时,并生成详尽的报告和演示文稿。
它结合了公司自研的‘AI Scientist’方法(用于处理信息冲突)和‘AB-MCTS’方法(用于结构化目标导向搜索)。该工具面向金融、研究和商业咨询行业,目前提供免费测试版注册(仅限日语),但未提及潜在的AI幻觉或错误问题,这可能对专业应用构成风险。
该系统结合了两种专有方法:用于解决矛盾的“AI Scientist”和用于战略搜索的“AB-MCTS”,多个AI模型协同工作,在更长的思考时间内提升输出质量。
The Decoder

·#ai
微软推出了MAI-Transcribe-1语音转文字模型,其运行速度比前代快2.5倍,每小时音频成本为0.36美元。该模型支持25种语言,并在FLEURS基准测试中实现了最低的词错误率。
这一进步使开发者和企业使用微软Copilot Voice、Teams和AI平台进行实时语音转录更加经济高效。这也增强了微软在竞争激烈的AI语音转录市场中的地位。
微软发布了MAI-Transcribe-1语音转文字模型,支持25种语言,在FLEURS基准测试中词错误率最低,优于Whisper-large-V3和GPT-Transcribe等模型。它比微软之前的Azure Fast服务快2.5倍,每小时音频成本为0.36美元。该模型已集成到Copilot Voice和Microsoft Teams中,结合MAI-Voice-1和语言模型可实现更高质量的语音代理功能。
开发者可通过Microsoft Foundry和AI Playground试用。Cohere和Mistral也推出了性能相当的开源替代方案,显示出该领域的强劲发展势头。
该模型在背景噪音、低质量音频和多人重叠说话等复杂场景下表现优异。开发者可通过Microsoft Foundry和AI Playground以公共预览形式试用。
The Decoder

·#ai
英伟达在MLPerf推理v6.0测试中使用最多288张GPU创下新纪录,主要针对DeepSeek-R1和GPT-OSS-120B模型;而AMD和英特尔则提交了不同配置和基准下的结果。
这凸显了AI硬件性能的快速演进,英伟达展示了仅靠软件优化就能让相同硬件吞吐量翻倍——这对各行业实现高效、低成本的AI部署至关重要。
MLCommons于2026年4月1日发布了MLPerf推理v6.0的结果,新增了包括多模态模型Qwen3-VL和文本转视频模型WAN-2.2-T2V在内的五个测试项。英伟达提交了所有新模型的结果,使用288张GPU在多节点配置下实现了每秒约249万token的DeepSeek-R1性能表现。仅靠软件优化就在相同硬件上将吞吐量提升了2.7倍。
AMD使用最多94张GPU在Llama 2 70B上首次突破每秒百万token,英特尔则聚焦工作站级GPU市场。谷歌和Cerebras未参与,因配置差异导致直接比较困难。
英伟达的GB300-NVL72系统结合Blackwell Ultra GPU,在不更换硬件的情况下通过Dynamo、Wide Expert Parallel和Multi-Token Prediction等软件优化,使DeepSeek-R1性能提升2.7倍。
The Decoder

阿里巴巴在几天内发布了第三款自研AI模型Qwen3.6-Plus,该模型拥有百万token的上下文窗口,并显著提升了前端开发等代理编程任务的能力。
这标志着阿里巴巴从开源转向企业付费模式的战略转变,反映出其在字节跳动激烈竞争下通过云服务获取更多收入的意图。
阿里巴巴最近发布了Qwen3.6-Plus,这是它在短时间内推出的第三款自研AI模型,具备百万token的上下文窗口和更强的代理编程能力。该模型专为复杂的代码生成任务设计,尤其擅长前端开发。根据阿里巴巴内部测试数据,其性能优于旧版Anthropic模型Claude 4.5 Opus,但这些测试未经独立验证。
这一发布标志着阿里巴巴正从开源模式转向企业客户导向,此前发布的Qwen3.5-Omni也已不再开放源码。公司计划在未来五年内实现1000亿美元的AI收入目标,借助云基础设施和新的人工智能服务‘悟空’来推动增长。
该模型可通过阿里云Model Studio API使用,并将集成到通义千问聊天应用和新的企业级AI服务“悟空”中;基准测试结果由阿里巴巴自行完成,缺乏第三方验证。
The Decoder

据路透社引用的IDC报告,中国芯片制造商在2025年占据了中国AI加速服务器市场近41%的份额。
这标志着中国在半导体领域迈向自主可控的重要一步,可能减少对外国芯片的依赖,尤其在全球科技竞争和供应链中断背景下具有重要意义。
根据最新IDC报告,中国芯片制造商在2025年已占据中国AI加速服务器市场近41%的份额。这一增长表明中国在AI硬件开发方面的能力不断增强,得益于政府支持、本地计算需求上升以及构建稳健供应链的努力。尽管英伟达等国际巨头仍占主导地位,但中国企业的崛起预示着竞争格局正在变化。
该数据也凸显了中国在人工智能等关键技术领域实现自主可控的战略意图。配图强化了本土创新的主题。这一里程碑事件可能影响国内政策制定,并重塑国际社会对中国科技雄心的认知。
这一数字相比往年显著增长,反映出华为、寒武纪等企业在AI硬件上的战略投入,尽管国际厂商仍主导整体市场。
The Verge AI

专注于通过语音模式检测抑郁症的加州初创公司Kintsugi因未能获得FDA批准而关闭,并将大部分技术开源。
这一事件凸显了AI在医疗领域面临的重大监管和资金障碍,尤其是在试图用客观工具替代主观心理评估时。同时强调了将敏感临床AI模型公开发布所带来的伦理风险。
Kintsugi公司花了七年时间开发一种通过分析语音模式(如停顿和节奏)来检测抑郁和焦虑迹象的人工智能系统。它旨在提供一种比传统自评工具(如PHQ-9)更客观、可扩展的心理健康筛查方式。
尽管有同行评审结果支持其有效性,但由于FDA的‘新型’审批路径不适用于不断演化的AI系统,且受到政府关门等因素影响,最终未能获批。随着资金耗尽,公司决定关闭,并将大部分代码开源,希望他人能负责任地继续这项工作。
Kintsugi采用FDA的‘新型’路径申请审批,但因AI的动态特性与过时的监管框架冲突而遭遇延迟。团队选择开源而非接受掠夺性融资,以维护完整性并推动未来研究。
The Verge AI

微软新任AI首席执行官穆斯塔法·苏莱曼将重心转向追求超智能这一核心商业目标,此举源于公司重组和与OpenAI重新谈判的合作关系。微软还推出了MAI-Transcribe-1语音转录模型,该模型成本更低、支持25种语言,并能处理复杂音频环境。
这一举措标志着微软向为企业和开发者提供可衡量生产力提升的战略转型,与整个行业要求AI公司证明商业价值的趋势一致。同时反映出顶级AI团队正通过减少内部官僚主义被赋予更大创新空间。
微软新任AI首席执行官穆斯塔法·苏莱曼正将超智能追求作为一项业务使命,而非理论概念,重点在于提升企业生产力。这一转变源于微软重组AI部门并重新谈判与OpenAI的合作关系,他认为这使公司具备了实现该目标的能力。他强调,超智能意味着构建能为企业创造实际价值的模型。
为此,微软推出了MAI-Transcribe-1语音转录模型,该模型能够处理低质量音频并支持多种语言。该模型由一个精简、灵活的小团队开发,他们摆脱了官僚束缚——这是微软以及Meta和谷歌等科技巨头正在采用的加速创新策略。
MAI-Transcribe-1模型的GPU成本仅为同类模型的一半,可通过微软Foundry和AI游乐场面向商业用户使用。该模型训练数据包括人工标注内容、带噪音的真实场景录音及开放网络数据。
ZDNET AI

Android的无线紧急警报(WEA)现在增加了地图视图,显示受影响区域和用户的位置。这一更新在2026年3月系统更新日志中被披露,帮助用户判断警报是否与自己所在位置相关。
这项改进提升了紧急情况下的情境意识,比如风暴或寻人警报,减少了误报并提高了通知的相关性。它直接关系到用户安全,帮助人们判断是否需要采取行动。
谷歌悄悄为Android的无线紧急警报添加了地图视图,让用户能清楚看到警报影响范围与自身位置的关系。此前,用户可能收到标有‘你所在区域’的警告,却不知道是附近还是几十英里外。该变化出现在2026年3月系统更新的日志中,提升了准确性并减少混淆。
但并非所有警报都会突破勿扰模式——只有最关键的通知才会以最大音量播放。为了确保重要警报不被错过,尤其是在美国风暴季节,用户应进入设置 > 安全与紧急情况 > 无线紧急警报,并打开‘始终以最大音量提醒’选项。此功能对天气预警和走失人员警报特别有用。
并非所有警报都会突破勿扰模式,除非你在设置中开启“始终以最大音量提醒”。用户可以自定义哪些类型的警报触发最大音量提醒,例如可以选择关闭AMBER警报。
ZDNET AI

·#ai
MIT研究人员发现,AI将逐步影响文本类工作,大多数任务将在2029年前达到‘最低可接受’水平,而非引发立即冲击。该研究分析了美国劳工部O*NET数据库中的3000项任务,以评估AI在现实场景中的适用性。
这一更长的时间线为工人和政策制定者提供了更多准备时间,通过再培训和政策调整减少大规模失业风险。它挑战了恐慌叙事,并表明如果现在采取主动措施,适应是可能的。
MIT研究人员发布了一份新报告,指出人工智能对就业的影响将逐步显现——如同潮水上涨——而非突然崩溃。他们研究了美国劳工部O*NET数据库中的3000个文本类任务,发现大型语言模型已能以最低可接受标准完成其中60%的任务。到2029年,许多此类任务可能被自动化,但高质量稳定表现仍需数年。
报告强调,尽管AI能力快速提升,但采用速度允许工人适应。然而,这一进程取决于计算能力、算法和硬件效率的持续进步。研究建议,政策应聚焦于提前进行再培训和支持体系建设,以防自动化大规模普及。
大型语言模型可在无需人工干预的情况下完成60%的任务达到最低可接受标准,但仅26%能达到优质水平;由于计算资源限制和算法瓶颈,全面自动化仍需数年。
ZDNET AI

·#ai
树莓派板子的价格大幅上涨——两个 Raspberry Pi 5 板子现在和一台新笔记本电脑一样贵,这是由人工智能数据中心推动的内存价格上涨所致。用于 Raspberry Pi 4 和 5 的 LPDDR4 内存一年内价格上涨了七倍。
这反映了更广泛的供应链危机:人工智能基础设施的需求压倒了消费者可用性,影响了依赖廉价硬件的爱好者、教育者和开发者。它突显了人工智能对现实世界的影响不仅限于软件,还延伸到内存芯片等物理组件。
树莓派板子的价格大幅飙升,两个 Raspberry Pi 5 板子现在和一台新笔记本电脑一样贵。这主要是由于人工智能数据中心对内存的巨大需求导致内存价格暴涨。用于 Pi 4 和 Pi 5 的 LPDDR4 内存一年内价格上涨了七倍,每增加 4GB 内存就多出 25 美元成本。
因此,Raspberry Pi 5 的价格涨幅高达 150 美元,让许多爱好者难以负担。像美光这样的主要内存制造商已完全转向人工智能市场,消费者产品被抛在后面。这种连锁反应意味着即使是智能手机和汽车等日常设备也可能因零部件短缺而涨价。
美光公司关闭了其 Crucial 消费级业务,专注于向人工智能数据中心供货;G.Skill 等厂商明确指出人工智能行业需求前所未有。单个英伟达 GB300 机架使用的 LPDDR5X 内存足以支持 1000 台笔记本电脑。
Google AI Blog

Google Vids现在向所有Google账号用户提供免费的高级AI视频生成功能,包括Veo 3.1、Lyria 3/3 Pro定制音乐生成以及可定制的AI虚拟人物。
这一更新使专业级视频创作工具普及化,让普通用户和创作者无需付费或技术背景即可制作高质量视频,可能重塑个人和小型团队的内容创作方式。
Google已通过新增AI功能显著升级了Google Vids,这些功能对所有用户免费开放。包括使用最新Veo 3.1模型从文字提示或照片生成高质量视频、可定制的AI虚拟人物(能参与场景并互动)、以及由Lyria模型驱动的定制音乐生成。个人账户每月可获得10次免费视频生成额度,而Google AI Pro和Ultra订阅用户还能享受更高级功能,如对虚拟人物动作的完全控制和更长的原创配乐。
新增的浏览器录制功能和一键发布到YouTube进一步简化了整个创作流程。此举让强大的视频编辑和AI生成能力面向所有人开放,不再局限于企业用户。
个人账户每月可免费使用Veo 3.1生成10段视频;AI虚拟人物可在姿势、外貌和与物体互动方面完全控制;Chrome扩展支持浏览器内录制屏幕并直接发布到YouTube。
OpenAI News
·#ai
OpenAI现在在ChatGPT商业版和企业版中为Codex提供按用量付费的定价模式,使团队可以根据实际使用情况灵活扩展。
这一调整降低了团队采用Codex的门槛,尤其对需要灵活预算和按使用计费的企业环境而言,有助于控制成本并推动广泛部署。
OpenAI已通过引入按用量付费定价模式更新了面向企业和商业用户的Codex服务。此前,团队必须选择固定订阅套餐,这对使用量波动较大的组织来说可能成本高且不灵活。新方案下,用户仅需为实际使用的资源(如API调用次数或处理时间)付费,非常适合测试或逐步扩展AI功能的团队。这与当前SaaS和AI服务行业中普遍采用的按使用计费趋势一致。
该调整支持更敏捷的开发实践,并帮助企业在成本管理上更具灵活性。同时,也让初创企业和中小型企业更容易接入Codex,无需承担高额前期费用。总体而言,这项更新提升了团队级AI工具的可用性和经济性。
团队可以从小规模开始使用,并根据需求灵活扩展,无需预先承诺固定月度套餐,更容易将Codex集成到现有工作流或试点项目中。
Simon Willison
·#llm
西蒙·威尔逊宣布发布了三种新的语言模型:gemini-3.1-flash-lite-preview、gemma-4-26b-a4b-it 和 gemma-4-31b-it。这些模型是开源AI持续发展的成果,旨在供开发者和研究人员实际使用。
这些发布为从业者提供了更多在代理系统和本地推理等应用中部署高效高性能模型的选择。轻量级与强大版本的可用性有助于推动先进AI工具的普及。
2026年4月2日,西蒙·威尔逊宣布发布了三种新的LLM:gemini-3.1-flash-lite-preview、gemma-4-26b-a4b-it 和 gemma-4-31b-it。这些模型体现了让大型语言模型更易获取且更专业化的发展趋势——例如,专为实时任务优化的轻量级flash版本,以及用于复杂推理的更大Gemma变体。他的配套笔记提供了关于训练、部署和基准测试的技术见解。
这些模型属于更广泛的模块化、可定制LLM生态系统的一部分,旨在满足特定应用场景。此次发布对构建基于代理的系统或在消费级硬件上本地运行模型的开发者尤其重要。
gemini-3.1-flash-lite-preview 模型针对速度和低延迟进行了优化,而两个Gemma 4变体分别提供260亿和310亿参数,用于在性能和资源消耗之间权衡。所有模型均可通过西蒙的笔记及相关资源获取。
The Verge AI

谷歌发布了Home应用的新更新,提升了Gemini AI对自然语言命令的理解能力,使其能更精准地控制灯光、温控系统和家电等智能家居设备。用户现在可以使用如‘海洋的颜色’或‘将智能烤箱预热到350度’这样的描述性指令。
这项改进使语音控制的智能家居更加直观可靠,减少了用户的挫败感,并推动了AI助手在日常生活中的普及。这也体现了谷歌持续投入于让AI交互更人性化、更自然的努力。
谷歌正在推出Home应用的新版本,增强其Gemini AI助手的自然语言理解能力。用户现在可以发出更详细且对话式的指令,比如要求‘海洋的颜色’或设定智能烤箱的具体温度。系统现在能更好识别不同类型的设备并更快响应。
此外,拥有受监管账户的孩子也可以使用Gemini家居功能。这一更新还伴随着其他改进,如提升上下文感知能力和增强Gemini Live功能,可在智能音箱和显示屏上提供更深入、更具互动性的新闻摘要。
此次更新增强了设备识别能力(例如区分‘台灯’和‘灯’),并支持受监督的儿童账户。这些改进是更广泛发布的一部分,包括为智能显示器上的Gemini Live功能带来互动新闻摘要的升级。
ZDNET AI

·#ai
谷歌的Gemini AI现在新增了记忆导入功能,允许用户将来自其他AI助手(如ChatGPT或Claude)的聊天记录、偏好和个人背景信息导入。这使得Gemini能够基于你的过往互动进行个性化回应,而无需重新开始。
该功能在用户切换生成式AI平台时显著提升了体验,通过保留个性化设置减少了使用障碍。这也反映了整个行业趋势:AI服务的竞争不仅在于能力,更在于能否更好地理解和适应个人用户。
谷歌在Gemini中推出了新的记忆导入功能,让用户可以将来自其他AI服务(如ChatGPT或Claude)的聊天记录、偏好和个人背景信息导入。这有助于Gemini快速了解用户的兴趣、关系和习惯,而无需重新开始。使用方法是:用户需先将一个标准化提示粘贴到现有AI中,该AI会生成包含用户数据的分类摘要(如人口统计信息、兴趣、关系和指令)。
随后,用户将此摘要复制到Gemini完成导入。该功能对免费和付费用户均开放,但仅限个人账户使用。这是谷歌提升Gemini易用性、降低切换门槛的策略之一,也与Anthropic(Claude)等竞争对手的做法一致。
导入过程需要用户将特定提示粘贴到当前AI(如ChatGPT)中,然后由该AI生成用户信息的结构化摘要。此功能在全球范围内可用,但英国、瑞士和欧洲经济区除外,并且仅适用于个人Google账户。
ZDNET AI

作者仅用语音和鼠标就完成了两个复杂的苹果应用开发,不再依赖VS Code或Xcode等传统集成开发环境(IDE)。相反,他借助AI工具完成代码生成,使IDE仅保留构建和部署功能。
这一转变表明AI正在将软件开发流程从编辑和调试转变为指导模型,这可能会减少对完整IDE的需求,并重塑开发者的工作方式。
文章描述了作者如何仅用语音输入和鼠标构建了两个复杂的苹果应用——一个是用于管理3D打印机线材的工具,另一个是管理实体和数字缝纫图案的应用。传统IDE中的语法高亮、调试和文件导航等功能大多被AI驱动的代码生成所取代。
作者认为开发流程已从‘编辑→构建→测试→调试’转变为‘指令→引导→部署’,使现代IDE变得不那么必要。尽管这些应用结构复杂,但实际编码主要由AI完成,开发者更像是项目经理而非程序员。
作者的项目包括一个用于3D打印机线材追踪的应用和一个使用NFC标签与设备端AI自动提取元数据的缝纫图案管理器——这两个项目都因AI辅助而几乎无需手动编码即可完成。
The Verge AI

文章推测,由于美国证券交易委员会(SEC)的审查流程,SpaceX 的首次公开募股(IPO)可能推迟到六月;与此同时,埃隆·马斯克还需应对特斯拉多项重要事项,包括自动驾驶出租车、Optimus机器人和新款跑车的延期发布。
这条新闻很重要,因为它揭示了全球最具影响力的科技人物之一所面临的高强度创新节奏与监管审查压力;SpaceX 的 IPO 时间点可能重塑投资者对私营航天企业的信心,并影响特斯拉股价,尤其是在其内部项目频频延期的情况下。
埃隆·马斯克即将面临一个极其繁忙的时期,其中最引人关注的是SpaceX可能的首次公开募股(IPO)。文章指出,如果SpaceX在4月1日提交了S-1文件,最快也要到六月才会对外公布——前提是美国证券交易委员会能认真完成审核。与此同时,马斯克还必须处理特斯拉的一系列事件:包括没有方向盘和后窗的Cybercab项目延期、涉及萨姆·阿尔特曼和OpenAI的庭审,以及其自动驾驶系统安全性远低于人类驾驶员的问题。
特斯拉的Cybercab团队已有三位高级负责人离职,而下一代Roadster和Optimus机器人也一再推迟,引发对其执行力的质疑。尽管如此,特斯拉能源业务在英国和印度市场表现亮眼,显示出一定的增长潜力。
根据美国证券交易委员会(SEC)常规的S-1文件披露周期,SpaceX最早可能在六月上市,但也存在类似WeWork 2019年IPO延迟的风险;特斯拉的Cybercab项目已出现高管离职,且截至二月,人类驾驶比特斯拉自动驾驶更安全四倍。
The Verge AI

·#ai
OpenAI已收购由约翰·库根主持的热门科技访谈节目TBPN,该节目常邀请AI和科技行业的高管嘉宾。收购包括其团队,他们将加入OpenAI的战略部门,同时保留节目内容的编辑独立性。
此举表明OpenAI希望主导人工智能发展与政策的公共讨论,尤其是在其与政府机构合作引发争议、面临Anthropic等竞争对手压力之际。这也体现了CEO山姆·阿尔特曼与主持人之间长期的私人关系。
OpenAI收购了知名科技访谈节目TBPN,该节目每天下午2点直播,曾邀请山姆·阿尔特曼、Meta和微软高管等多位科技领袖。主持人约翰·库根曾与阿尔特曼共事多年,节目每期平均吸引7万名观众,预计到2026年收入将超3000万美元。OpenAI表示此举旨在推动全球对人工智能的建设性对话,而非单纯提升企业传播。
TBPN团队将并入OpenAI战略部门,向全球政策副总裁克里斯·莱汉汇报,但仍保有选题和嘉宾的完全自主权。这次收购发生在OpenAI因与国防部签约引发争议、计划今年上市的敏感时期。
TBPN平均每集有7万观众,预计到2026年收入将超3000万美元;节目将继续保持每周工作日直播,但获得OpenAI资源支持。OpenAI强调此次收购是为了加速全球AI对话,而不仅是营销目的。
ZDNET AI

微软发布了紧急更新(KB5086672)来替换导致安装失败的三月预览版更新(KB5079391)。新更新包含了原更新的所有功能和修复,同时解决了导致安装失败的错误代码(0x80073712)。
该更新对遭遇三月预览版安装问题的用户至关重要,可确保他们继续正常使用Windows 11。这也反映了微软在推出稳定更新方面持续面临的挑战,尤其是针对IT专业人员和高级用户的预览版本。
微软于2026年3月31日发布了紧急更新(KB5086672),以解决三月非安全预览版更新(KB5079391)引发的广泛安装错误。该早期更新本意面向测试人员和IT管理员,为Windows 11 25H2和24H2引入新功能,但触发了特定错误代码(0x80073712)。由于用户投诉,微软暂停了发布并迅速推出了修复程序。
新更新包含原更新的所有改进,同时增强了稳定性并修正了安装问题。启用Windows Insider计划或选择提前接收更新的用户将通过Windows更新自动获得此补丁。
替代更新KB5086672是累积型更新,取代了所有之前的版本,包括有缺陷的那个;对于启用“尽快获取最新更新”的用户,它会自动安装。