原型 · 判官 AI(LLM-as-judge)

给候选回答 + 你的评分标准,AI 自动打分 + 解释。中阶项目 07/08 + 进阶项目 11 同款。

⚖️ 判官 AI 试跑

判官 AI 怎么用? 你写一份"什么是好"的标准,AI 用这个标准去给一堆样本打分。 你和判官打分不一样的地方 —— 就是你的审美没说清楚的地方。 这是把"我觉得好"变成"AI 也能照着判"的工程方法。详见 概念地基 · 评估框架