用語解説

Constitutional AIとは?

ひとことで言うと

Anthropic 独自のAI訓練手法。AI に行動原則(憲法)を与えて自己評価・修正させる。

Constitutional AI は、AI に「守るべき行動原則(憲法のような指針)」をあらかじめ与え、それに照らして自分の回答を自己評価し、修正させながら学習させる Anthropic の訓練手法です。人間が一つひとつ「良い・悪い」を判定する作業を減らしつつ、AIの振る舞いを望ましい方向へそろえられます。

この仕組みのおかげで、Claude は有害な依頼を断ったり、より誠実に答えたりしやすくなっています。設計の目標は HHH(役立つ・無害・正直)であり、Constitutional AI はその目標を実現するための具体的な訓練アプローチという位置づけです。AIを人の意図に沿わせる「アライメント」研究の代表例とされています。

「Constitutional AI」が登場する記事・レッスン

← AI用語集一覧へ