Topic
#llm
按主题聚合的新闻视图。
Topic Feed
主题:llm
共 11 条

在 shebang 行中使用 LLM
Simon Willison 展示了如何通过他的 `llm` 命令行工具,直接在脚本的 shebang 行中调用 LLM。他还演示了使用 LLM fragments、工具调用以及包含 Python 函数定义的 YAML 模板的变体。

IBM Granite 4.1 大模型:以数据为中心的训练与强化学习
IBM 的 Granite 4.1 大模型采用五阶段训练流程,逐步提升数据质量,结合 GQA 等先进架构特性,并通过多阶段强化学习增强数学、编程、指令遵循和长上下文理解能力。
llm 0.31 新增 GPT-5.5 支持与异步模型注册功能
llm 工具第 0.31 版新增了对 GPT-5+ 模型(包括 GPT-5.5)的文本冗余度和图像细节控制选项,并支持在 extra-openai-models.yaml 中列出的自定义模型进行异步注册。

Cloudflare推出Unweight,无损压缩LLM权重达22%
Cloudflare推出了Unweight,一种无损张量压缩系统,可在不牺牲输出质量或依赖特殊硬件的情况下将LLM模型权重减少最多22%。它通过在高速片上内存中解压缩权重并直接送入H100 GPU的张量核心来实现这一目标。
Anthropic 发布 llm-anthropic 0.25,更新 Claude Opus 4.7 模型功能
Anthropic 发布了 llm-anthropic 0.25 版本,引入了新的 claude-opus-4.7 模型,具备增强的思考能力,包括新的 'xhigh' 思考力度选项以及两个新布尔参数:thinking_display 和 thinking_adaptive。默认设置也得到优化,例如将 max_tokens 提高到模型允许的最大值。

Qwen3.6-35B-A3B在画鹈鹕自行车图中击败Claude Opus 4.7
西蒙·威尔森测试了两款新大型语言模型——阿里巴巴的Qwen3.6-35B-A3B和Anthropic的Claude Opus 4.7——通过让它们生成一只鹈鹕骑自行车的图像,发现Qwen的结果更准确、细节更丰富。
西蒙·威尔森发布research-llm-apis 2026-04-04,增强对LLM新功能的支持
西蒙·威尔森发布了research-llm-apis的2026-04-04版本,改进了对服务器端工具执行等新兴LLM功能的抽象层支持。该更新基于Claude Code分析Anthropic、OpenAI、Gemini和Mistral的客户端库,并生成用于测试原始JSON API的curl命令。
西蒙·威尔逊发布新LLM模型,包括Gemini-3.1和Gemma 4变体
西蒙·威尔逊宣布发布了三种新的语言模型:gemini-3.1-flash-lite-preview、gemma-4-26b-a4b-it 和 gemma-4-31b-it。这些模型是开源AI持续发展的成果,旨在供开发者和研究人员实际使用。
datasette-enrichments-llm 0.2a0 发布,支持LLM模型管理
datasette-enrichments-llm 的新版本 0.2a0 现在使用 datasette-llm 来管理用于数据增强的模型,用户可以通过 'enrichments' 目的指定哪些模型可用。
datasette-llm 0.1a4 发布,支持按用途配置独立API密钥
Simon Willison 发布了 datasette-llm 0.1a4,新增功能可为不同模型用途配置独立的 API 密钥——例如为 gpt-5.4-mini 的增强任务分配专用密钥。该版本还附带了用于测试 API 密钥的 llm-echo 0.3 工具。
datasette-llm 0.1a3 新增按插件配置LLM功能
datasette-llm 0.1a3 版本新增了为特定插件配置可用大语言模型(LLM)的功能,从而实现按任务对模型使用的精细化控制。