ひとことで言うと
Helpful(役立つ)/ Harmless(無害)/ Honest(正直)の3原則。Anthropic の AI 設計指針。
HHH は Helpful(役立つ)・Harmless(無害)・Honest(正直)の頭文字をとった3原則で、Anthropic が AI を設計するうえでの基本指針としています。ユーザーの役に立ちつつ、害を与えず、事実に誠実であること——この3つのバランスを取ることを目指しています。
たとえば危険な依頼には応じない(無害)一方で、過度に断りすぎてユーザーの正当な要望に応えられないのも問題(役立つ)であり、知らないことを知ったように答えない(正直)姿勢も求められます。Claude の振る舞いはこの理念に基づき、Constitutional AI などの手法を通じて実装されています。