AI NEWS

【速報】Claude Fable 5 一般公開 — SWE-bench 95%の史上最強モデルが誰でも使える時代に(2026年6月)

2026年6月9日、Anthropicが一般提供モデルとして史上最高性能の「Claude Fable 5」を公開。SWE-bench Verified 95.0%、Terminal-Bench 2.1 88.0% という驚異的なベンチマーク。Mythos級の能力に独自のセーフガード機構を組み合わせた、新時代のフロンティアモデルを徹底解説。

2026年6月9日、Anthropic「一般提供モデルとして史上最高性能」 と位置づける新モデル Claude Fable 5 を公開しました。非公開の最強モデル「Mythos」級の能力を持ちながら、独自のセーフガード機構で一般公開を実現。本記事ではその全貌を解説します。

📌 結論を先に:3行サマリ

  1. SWE-bench Verified 95.0%:実プロジェクトのバグ修正でほぼ人間トップ級。GPT-5.5(SWE-bench Pro 58.6%)を Fable 5 は 80.3% で大きく上回る。
  2. Mythos級の能力 + セーフガード分類器:危険領域のリクエストは自動的に Opus 4.8 にフォールバックする独自の安全機構。
  3. 料金は Opus 4.8 の2倍:入力 $10 / 出力 $50(100万トークンあたり)。「1セッションに収まらない規模のタスク」向け。

🚀 圧倒的なベンチマーク性能

Fable 5 のベンチマークは、これまでの常識を覆す水準です。

ベンチマーク Fable 5 意味
SWE-bench Verified 95.0% 実プロジェクトのバグ修正でほぼ完璧
SWE-bench Pro 80.3% GPT-5.5 の 58.6% を大幅に超える
Terminal-Bench 2.1 88.0% CLI 操作で前世代を圧倒
OSWorld-Verified 85.0% OS 操作タスクで高精度

特に注目すべきは SWE-bench Verified 95.0%。これは「実際のオープンソースプロジェクトのバグを、AIが自律的に修正する」ベンチマークで、95%という数字は 熟練エンジニアのトップ層に匹敵する水準です。

🧠 仕様の詳細

項目 仕様
モデルID claude-fable-5
コンテキストウィンドウ 100万トークン
最大出力 12.8万トークン
思考モード adaptive thinking が常時有効
データ保持 30日間の保持が必須

adaptive thinking が常時有効というのが重要なポイント。タスクの難易度に応じて、Fable 5 が自動的に「どれだけ深く考えるか」を調整します。簡単な質問には素早く、複雑な問題にはじっくり考える、という挙動が標準になりました。

🛡️ 核心:セーフガード分類器システム

Fable 5 の最大の特徴は、本体とは別に動く AI 分類器(classifier)システムです。これがあるからこそ Mythos 級の能力を一般公開できました。

検知対象の3領域

  • サイバーセキュリティ:脆弱性の悪用など
  • 生物学・化学:危険物質の合成など
  • 蒸留(distillation):他モデル学習への無断転用

動作メカニズム

これらの領域に関わるリクエストを検知すると、Fable 5 ではなく Claude Opus 4.8 が自動的に応答します。ユーザーから見れば、セッションはそのまま継続されるため、ほとんどのケースで気づきません。

初期データによると、95%以上のセッションでフォールバックなしに完結。つまり通常の開発作業ではセーフガードはほぼ発動せず、Fable 5 の全力を使えます。

セキュリティ評価の結果

自動レッドチーミング評価では、効果が数字で証明されています。

  • 分類器あり Fable 5:攻撃タスク完了率 5.4%
  • 分類器なし Opus 4.6〜4.8:攻撃タスク完了率 56〜83%

分類器によって、危険な使われ方が 10分の1以下に抑えられているのが分かります。

💰 料金体系

項目 Fable 5 Opus 4.8(参考)
入力(100万トークン) $10 $5
出力(100万トークン) $50 $25

Fable 5 は Opus 4.8 の 正確に2倍の単価設定。Claude アプリの有料プランでは 6月22日まで追加費用なしで使え、その後は usage credits ベースに移行予定です。

🎯 どんな用途に向いているか

公式ドキュメントは Fable 5 を 「1回の作業セッションに収まらない規模のタスク向け」と位置づけています。

Fable 5 が真価を発揮するケース

  • 根本原因調査:複雑なバグの「なぜ起きるのか」の深堀り
  • 障害デバッグ:本番障害の原因特定と修正
  • アーキテクチャ判断:大規模システムの設計選定
  • 大規模リファクタリング:100万トークン文脈を活かした全体最適化

逆に Opus 4.8 で十分なケース

  • 日常的なコード補完・小さな修正
  • ドキュメント生成・要約
  • 単純な質問応答

料金が2倍なので、「複雑で重要なタスクは Fable 5、日常作業は Opus 4.8」という使い分けが現実的です。

💻 Claude Code での使い方

Claude Code v2.1.170 以降で利用可能です。

# Fable 5 に切り替え
/model fable

# best エイリアスを使う場合
/model best
# → アクセス権があれば Fable 5、なければ最新 Opus が選ばれる

セーフガード分類器が反応したリクエストは、自動的に Opus 4.8 で再実行され、セッションはそのまま継続されます。

🌐 サードパーティでも同日提供開始

Fable 5 は Anthropic 公式だけでなく、複数のプラットフォームで同日に一般提供が始まりました。

  • GitHub Copilot
  • Databricks Unity AI Gateway
  • その他主要 AI プラットフォーム

📊 これが業界に与えるインパクト

Fable 5 の登場で、AIコーディングの勢力図が再び動きます。

観点 変化
性能 Fable 5 が SWE-bench で圧倒的トップに
安全性 分類器システムが「能力と安全の両立」の新標準に
Codex との競争 GPT-5.5 を大きく引き離す(SWE-bench Pro で +21.7%)
料金 高性能ゆえ高価格。使い分けが鍵に

2026年4〜5月は「Codex 急伸」が話題でしたが(Codex vs Claude Code 完全比較参照)、Fable 5 の登場で Anthropic が再び主導権を握った形です。

📚 Fable 5 を使いこなしたい方へ

引用元:Anthropic 公式発表(2026年6月9日)、Cryptul Insights、Cryptopolitan

よくある質問

この記事に関連する質問と答えをまとめました。

Q.Claude Fable 5 はどのくらい強いですか?
A.
SWE-bench Verified 95.0%、SWE-bench Pro 80.3% という史上最強クラスの性能です。実プロジェクトのバグ修正でほぼ人間トップ級、GPT-5.5(58.6%)を大きく上回ります。
Q.Fable 5 の料金はいくらですか?
A.
入力 $10 / 出力 $50(100万トークンあたり)で、Opus 4.8 の正確に2倍です。Claude アプリの有料プランでは6月22日まで追加費用なしで使えます。
Q.セーフガード分類器とは何ですか?
A.
Fable 5 本体とは別に動く AI 分類器で、サイバーセキュリティ・生物化学・蒸留の3領域を検知すると自動的に Opus 4.8 にフォールバックします。95%以上のセッションでは発動せず、通常作業に影響しません。
Q.Mythos との違いは?
A.
能力は同等(Mythos級)ですが、Fable 5 には分類器があり一般公開されている点が違います。Mythos は分類器なしで、Project Glasswing 承認顧客のみが使えます。