Thousand Token Wood v2 打造多模型金融博弈
Hugging Face Blog··作者 Hugging Face Blog
关键信息
作者指出,最大的工程教训是摩擦主要来自服务层而不是建模层:vLLM 0.22.1 需要 CUDA 工具链支持,最初因为镜像里没有 nvcc 而全部失败,后来改成 CUDA devel 基础镜像才解决。模拟还依赖一个宽容的 JSON 解析与修复层,避免不同模型输出格式不规范时把游戏弄崩;此外,秘密提示的真伪标记完全不放进 prompt,并通过测试防止泄漏。
资讯摘要
Thousand Token Wood 的第一版是一个小型沙盒:五只林中生物在一个微调过的 0.5B 模型上交换商品,用户可以通过外部冲击来观察泡沫和崩盘如何出现。第二版把这个想法变成了一个真正可以操作的游戏,用户扮演“森林赞助人”,也就是一个暗中的金融掮客。玩家可以放贷、提供可能为真也可能是诱饵的提示、做空市场、贿赂角色,以及撮合联盟。与此同时,林中的角色会记住你之前如何对待它们,并据此回敬你;一个治安官则会追查你是否利用了不该知道的信息。最重要的架构变化是,每个角色现在都由不同实验室的不同小模型驱动,而不再共享一个模型。
系统中使用了 OpenAI 的 gpt-oss-20b、OpenBMB 的 MiniCPM3-4B、NVIDIA 的 Nemotron-Mini-4B,以及作者自己微调的 Qwen 0.5B。作者认为,这种多样性很重要,因为市场模拟之所以有趣,正是因为参与者彼此真正不同,而不是同一个模型换几段 prompt。把四个异构模型放到同一平台后,作者发现真正的难点主要在服务和集成层,而不是模型本身。比如,vLLM 0.22.1 需要 nvcc,因此必须使用带 CUDA 开发工具的镜像;gpt-oss-20b 在 L4 GPU 上以原生 MXFP4 量化运行;MiniCPM3 需要 trust_remote_code;而整个 prompt 与输出管线都必须能容忍各模型不同的格式习惯,才能让模拟稳定运行。
来源与参考
收录于 2026-06-07