原型 · 判官 AI

① 评分标准（rubric）—— 你认为什么算"好" ② 候选回答（要被打分的内容） ③ 参考样例（可选，如果你已有"标杆"）

判官 AI 怎么用？ 你写一份"什么是好"的标准，AI 用这个标准去给一堆样本打分。你和判官打分不一样的地方 —— 就是你的审美没说清楚的地方。这是把"我觉得好"变成"AI 也能照着判"的工程方法。详见概念地基 · 评估框架。