Topic

#llm

按主题聚合的新闻视图。

主题:llm

共 11 条

  1. 在 shebang 行中使用 LLM

    Simon Willison·

    在 shebang 行中使用 LLM

    Simon Willison 展示了如何通过他的 `llm` 命令行工具,直接在脚本的 shebang 行中调用 LLM。他还演示了使用 LLM fragments、工具调用以及包含 Python 函数定义的 YAML 模板的变体。

  2. IBM Granite 4.1 大模型:以数据为中心的训练与强化学习

    Hugging Face Blog·

    IBM Granite 4.1 大模型:以数据为中心的训练与强化学习

    IBM 的 Granite 4.1 大模型采用五阶段训练流程,逐步提升数据质量,结合 GQA 等先进架构特性,并通过多阶段强化学习增强数学、编程、指令遵循和长上下文理解能力。

  3. Simon Willison·

    llm 0.31 新增 GPT-5.5 支持与异步模型注册功能

    llm 工具第 0.31 版新增了对 GPT-5+ 模型(包括 GPT-5.5)的文本冗余度和图像细节控制选项,并支持在 extra-openai-models.yaml 中列出的自定义模型进行异步注册。

  4. Cloudflare推出Unweight,无损压缩LLM权重达22%

    Cloudflare AI·

    Cloudflare推出Unweight,无损压缩LLM权重达22%

    Cloudflare推出了Unweight,一种无损张量压缩系统,可在不牺牲输出质量或依赖特殊硬件的情况下将LLM模型权重减少最多22%。它通过在高速片上内存中解压缩权重并直接送入H100 GPU的张量核心来实现这一目标。

  5. Simon Willison·

    Anthropic 发布 llm-anthropic 0.25,更新 Claude Opus 4.7 模型功能

    Anthropic 发布了 llm-anthropic 0.25 版本,引入了新的 claude-opus-4.7 模型,具备增强的思考能力,包括新的 'xhigh' 思考力度选项以及两个新布尔参数:thinking_display 和 thinking_adaptive。默认设置也得到优化,例如将 max_tokens 提高到模型允许的最大值。

  6. Qwen3.6-35B-A3B在画鹈鹕自行车图中击败Claude Opus 4.7

    Simon Willison·

    Qwen3.6-35B-A3B在画鹈鹕自行车图中击败Claude Opus 4.7

    西蒙·威尔森测试了两款新大型语言模型——阿里巴巴的Qwen3.6-35B-A3B和Anthropic的Claude Opus 4.7——通过让它们生成一只鹈鹕骑自行车的图像,发现Qwen的结果更准确、细节更丰富。

  7. Simon Willison·

    西蒙·威尔森发布research-llm-apis 2026-04-04,增强对LLM新功能的支持

    西蒙·威尔森发布了research-llm-apis的2026-04-04版本,改进了对服务器端工具执行等新兴LLM功能的抽象层支持。该更新基于Claude Code分析Anthropic、OpenAI、Gemini和Mistral的客户端库,并生成用于测试原始JSON API的curl命令。

  8. Simon Willison·

    西蒙·威尔逊发布新LLM模型,包括Gemini-3.1和Gemma 4变体

    西蒙·威尔逊宣布发布了三种新的语言模型:gemini-3.1-flash-lite-preview、gemma-4-26b-a4b-it 和 gemma-4-31b-it。这些模型是开源AI持续发展的成果,旨在供开发者和研究人员实际使用。

  9. Simon Willison·

    datasette-enrichments-llm 0.2a0 发布,支持LLM模型管理

    datasette-enrichments-llm 的新版本 0.2a0 现在使用 datasette-llm 来管理用于数据增强的模型,用户可以通过 'enrichments' 目的指定哪些模型可用。

  10. Simon Willison·

    datasette-llm 0.1a4 发布,支持按用途配置独立API密钥

    Simon Willison 发布了 datasette-llm 0.1a4,新增功能可为不同模型用途配置独立的 API 密钥——例如为 gpt-5.4-mini 的增强任务分配专用密钥。该版本还附带了用于测试 API 密钥的 llm-echo 0.3 工具。

  11. Simon Willison·

    datasette-llm 0.1a3 新增按插件配置LLM功能

    datasette-llm 0.1a3 版本新增了为特定插件配置可用大语言模型(LLM)的功能,从而实现按任务对模型使用的精细化控制。