Topic

#ai-models

按主题聚合的新闻视图。

主题:ai-models

共 10 条

  1. Gemma 4 通过推测解码提速最高 3 倍

    Ars Technica AI·

    Gemma 4 通过推测解码提速最高 3 倍

    谷歌为 Gemma 4 发布了实验性的多标记预测(MTP)起草模型,它们利用推测解码来预测未来的标记,从而加速生成。谷歌表示,这种方法可以让本地模型输出最高快 3 倍。

  2. xAI发布Grok 4.3,价格大幅下调并新增创意代理模式

    The Decoder·

    xAI发布Grok 4.3,价格大幅下调并新增创意代理模式

    xAI发布了Grok 4.3,这是一个功能更强且价格更低的AI模型,支持自主执行网络搜索、代码运行和文档生成等任务。同时新增了‘Imagine代理模式’,用于管理如视频或漫画等长期创意项目。

  3. Mistral发布Medium 3.5,将聊天、推理和代码整合进单一模型

    The Decoder·

    Mistral发布Medium 3.5,将聊天、推理和代码整合进单一模型

    Mistral发布了Medium 3.5,这是一个拥有1280亿参数的密集型模型,将聊天、推理和代码功能整合到一个统一系统中,并引入异步云代理用于任务自动化,以及Le Chat中的新“工作模式”以支持多步骤流程。

  4. 深度求索发布低成本高性能开源模型

    The Decoder·

    深度求索发布低成本高性能开源模型

    深度求索发布了V4-Pro和V4-Flash两款开源权重模型,参数规模高达1.6万亿,上下文长度达一百万token,定价远低于OpenAI和谷歌等竞争对手。

  5. 阿里巴巴Qwen3.6在代理编程基准测试中超越谷歌Gemma 4

    The Decoder·

    阿里巴巴Qwen3.6在代理编程基准测试中超越谷歌Gemma 4

    阿里巴巴发布了Qwen3.6-35B-A3B开源模型,在代理编程基准测试中表现优于谷歌的Gemma 4。该模型采用专家混合架构,每次仅激活350亿参数中的三个,从而提升效率。

  6. Anthropic发布Claude Opus 4.7,同时限制更高级的Mythos预览版

    The Verge AI·

    Anthropic发布Claude Opus 4.7,同时限制更高级的Mythos预览版

    Anthropic发布了目前功能最强的通用模型Claude Opus 4.7,该版本在编程、指令理解和创造力方面均有提升。公司仍对更先进的Mythos预览版进行限制,用于安全测试。

  7. Anthropic的Claude Opus 4.7提升编码与视觉能力,同时降低网络安全风险

    The Decoder·

    Anthropic的Claude Opus 4.7提升编码与视觉能力,同时降低网络安全风险

    Claude Opus 4.7 引入了三倍图像分辨率(最高达2576像素),并通过训练调整和自动阻止高风险请求,有意识地降低了网络安全能力。

  8. Gemini Pro在真实测试中胜过ChatGPT Plus

    ZDNET AI·

    Gemini Pro在真实测试中胜过ChatGPT Plus

    ZDNET进行的实测显示,Gemini Pro在写作和生态系统整合方面优于ChatGPT Plus,而ChatGPT在代理AI任务上胜出。两者月费均为19.99美元。

  9. 谷歌首次以Apache 2.0许可证发布Gemma 4模型

    The Decoder·

    谷歌首次以Apache 2.0许可证发布Gemma 4模型

    谷歌发布了Gemma 4,这是一个包含四个开放AI模型(2B–31B参数)的系列,并首次采用宽松的Apache 2.0许可证。这标志着从早期限制性许可的重大转变,使商业用途更加广泛。

  10. 阿里巴巴发布Qwen3.6-Plus,具备百万token上下文和代理编码能力

    The Decoder·

    阿里巴巴发布Qwen3.6-Plus,具备百万token上下文和代理编码能力

    阿里巴巴在几天内发布了第三款自研AI模型Qwen3.6-Plus,该模型拥有百万token的上下文窗口,并显著提升了前端开发等代理编程任务的能力。