Thousand Token Wood v2 打造多模型金融博弈

Hugging Face Blog·6月7日 03:02 UTC·作者 Hugging Face Blog

关键信息

作者指出，最大的工程教训是摩擦主要来自服务层而不是建模层：vLLM 0.22.1 需要 CUDA 工具链支持，最初因为镜像里没有 nvcc 而全部失败，后来改成 CUDA devel 基础镜像才解决。模拟还依赖一个宽容的 JSON 解析与修复层，避免不同模型输出格式不规范时把游戏弄崩；此外，秘密提示的真伪标记完全不放进 prompt，并通过测试防止泄漏。

资讯摘要

Thousand Token Wood 的第一版是一个小型沙盒：五只林中生物在一个微调过的 0.5B 模型上交换商品，用户可以通过外部冲击来观察泡沫和崩盘如何出现。第二版把这个想法变成了一个真正可以操作的游戏，用户扮演“森林赞助人”，也就是一个暗中的金融掮客。玩家可以放贷、提供可能为真也可能是诱饵的提示、做空市场、贿赂角色，以及撮合联盟。与此同时，林中的角色会记住你之前如何对待它们，并据此回敬你；一个治安官则会追查你是否利用了不该知道的信息。最重要的架构变化是，每个角色现在都由不同实验室的不同小模型驱动，而不再共享一个模型。

系统中使用了 OpenAI 的 gpt-oss-20b、OpenBMB 的 MiniCPM3-4B、NVIDIA 的 Nemotron-Mini-4B，以及作者自己微调的 Qwen 0.5B。作者认为，这种多样性很重要，因为市场模拟之所以有趣，正是因为参与者彼此真正不同，而不是同一个模型换几段 prompt。把四个异构模型放到同一平台后，作者发现真正的难点主要在服务和集成层，而不是模型本身。比如，vLLM 0.22.1 需要 nvcc，因此必须使用带 CUDA 开发工具的镜像；gpt-oss-20b 在 L4 GPU 上以原生 MXFP4 量化运行；MiniCPM3 需要 trust_remote_code；而整个 prompt 与输出管线都必须能容忍各模型不同的格式习惯，才能让模拟稳定运行。

来源与参考

收录于 2026-06-07