Skip to content

annotate_all.py

作用

批量调用 LLM 将章节文本标注为严格 JSONL event 流。

调用示例

bash
uv run memory_bench/scripts/annotate_all.py --workers 6
uv run memory_bench/scripts/annotate_all.py --only ch05,ch06
uv run memory_bench/scripts/annotate_all.py --only ch01 --workers 1 --force

参数

参数说明
--workers并发章节数
--force覆盖重跑
--only仅处理指定 conv_id(逗号分隔)
--scene-idscene_id
--character-idcharacter_id
--modelLLM model
--source章节来源:auto / raw / norm

环境变量(memory_bench/.env.benchmark

  • BENCHMARK_LLM_API_KEY(必须)
  • BENCHMARK_LLM_MODEL(可选)
  • BENCHMARK_LLM_BASE_URL(可选)
  • BENCHMARK_LLM_RATE_LIMIT(可选,每分钟最大 LLM 调用次数,0 = 不限制)

优先级:CLI > BENCHMARK_ 环境变量 > 脚本默认值。

输出

  • 正式产物memory_bench/data/events/by_chapter/{conv_id}.jsonl
  • 调试日志logs/annotate_prompt/logs/annotate_raw/logs/annotate_meta/

返回码

  • 0:全部 ok 或 skipped
  • 1:任意章节 failed

魔女の实验室