Claude Mythos Previewが正式に発表されました。Anthropicが「これまでに構築した中で最も高性能なモデル」と位置づける次世代AIで、SWE-bench ProでOpus 4.6の53.4%に対し77.8%(+24.4ポイント)、SWE-bench Verifiedで93.9%、サイバーセキュリティベンチマークCyberGymで83.1%を記録しています。現時点ではAWS・Apple・Microsoft等12社連合に限定提供されており、1億ドルの利用枠が設けられています。一般APIの提供時期は未定です。
Claude Mythos Preview——公式発表の要点
1. SWE-bench Pro 77.8%(Opus 4.6は53.4%。+24.4ポイントの圧勝)
2. SWE-bench Verified 93.9%/CyberGym 83.1%(いずれも自社計測)
3. 12社連合(AWS・Apple・Microsoft等)に限定提供中
4. 全主要OS・ブラウザでゼロデイ脆弱性を数千件発見
5. 27年前のOpenBSD欠陥、500万回テスト素通りのFFmpegバグを自律検出
6. $100M(約150億円)の利用枠を提供。一般APIは現時点で未定
💡 この記事のポイント
Claude Mythosは、Anthropicが開発中の次世代AIモデルです。2026年3月末にCMSの設定ミスで情報が流出し、Anthropic自身が「これまでに構築した中で最も高性能なモデル」と確認しました。現行最上位のOpus 4.6を超える性能を持ち、特にプログラミングとサイバーセキュリティの脆弱性検出で「劇的な」向上が確認されています。CrowdStrikeやPalo Alto …
ベンチマーク比較——Opus 4.6を全指標で圧倒
要点
SWE-bench Pro(実際のソフトウェア開発タスク)でOpus 4.6を24.4ポイント上回る77.8%。提示されたバグの約8割を自律修正できるレベルに到達しました。
77.8%
Mythos Preview
SWE-bench Pro
53.4%
Opus 4.6
SWE-bench Pro
衝撃の脆弱性検出——人間が27年間見落としたバグを発見
27年前のOpenBSD欠陥を自律検出
OpenBSDは「世界で最もセキュアなOS」として知られ、27年間にわたり世界中の専門家がコードレビューを実施。その中で見落とされていた欠陥をClaude Mythosが自律的に発見しました。
500万回のテストに素通りしたFFmpegバグ
動画処理の標準ライブラリFFmpegで、500万回の自動テストを全てパスしていたバグを検出。従来のテスト手法では発見不可能な「論理的矛盾」をAIの推論で特定しました。
全主要OS・ブラウザでゼロデイ脆弱性を数千件発見
Windows、macOS、Linux、Chrome、Firefox等の主要OS・ブラウザを対象に、未公開の脆弱性(ゼロデイ)を数千件検出(Anthropic自社計測)。
12社連合「Project Glasswing」と$100M+$4Mの資金投入
Claude Mythos Previewは一般公開されず、AWS・Apple・Microsoft等の12社連合に限定提供されています。Anthropicは$100M(約150億円)の利用枠に加え、$4M(約6億円)をオープンソースセキュリティ組織への直接寄付として提供。合計$104Mの資金を投じ、まず大手テック企業に自社製品の脆弱性を修正する時間を与えています。
⚠ 一般APIの提供時期は未定
一般のClaude Pro/Maxユーザーや通常のAPI利用者がMythosを使える時期は発表されていません。限定提供でセキュリティリスクを評価した後に段階的に拡大すると見られますが、2026年内の一般公開は不確実です。
この取り組みは「Project Glasswing」と名付けられ、Anthropicの公式サイト(anthropic.com/glasswing)で詳細が公開されています。Glasswingの目的は「敵対者が同じAI能力を悪用する前に、世界の重要なソフトウェアの脆弱性を見つけて修正する」ことです。
VentureBeatの独占インタビューで、AnthropicのFrontier Red Team Cyber Leadである Newton Cheng氏は「AI進歩の速度を考えると、このような能力が拡散するのは時間の問題。防御側が先に動かなければ、経済・公共安全・国家安全保障への被害は深刻になりうる」と述べています。
注目すべきは、CrowdStrikeとPalo Alto Networksがリーク時に株価が5%以上下落したにもかかわらず、Project Glasswingのパートナーに名を連ねている点です。「AIに仕事を奪われる」のではなく「AIの能力を取り込む」戦略に切り替えたと解釈できます。
何が起きたのか——リーク経緯と公式確認
2026年3月末、AnthropicのCMS(コンテンツ管理システム)の設定ミスにより、3,000件以上のアセットが一般公開される事態が発生しました。その中にClaude Mythosのローンチブログ記事のドラフト版が含まれていたことを、Fortuneが最初に報じました。
Anthropicは翌日にClaude Mythosの存在を公式に認め、「トレーニングは完了しており、早期顧客によるパイロットテストを実施中」と発表しています。
Capybaraティアとは何か——Claudeの製品体系が変わる
現在のClaudeはHaiku(軽量・高速)→ Sonnet(バランス型)→ Opus(最高性能)の3ティア構成です。Claude Mythosでは、Opusの上に「Capybara」という第4ティアが追加されます。
リークされたブログ記事によると、Capybaraは現行のOpus 4.6よりも高い料金設定になる予定です。つまり、Anthropicは「最高性能には追加のプレミアム料金を設定する」方向に舵を切ったことになります。現行の料金プラン比較も参照してください。
サイバーセキュリティへの衝撃——なぜ株価が下落したか
CapybaraがCrowdStrikeやPalo Alto Networksの株価を5%以上押し下げた理由は、リークされたブログ記事の以下の記述です。
Capybaraは「防御側の努力をはるかに凌ぐ速度で脆弱性を発見できるモデルの波の先駆け」であり、Anthropicは「早期アクセスを提供することで、AIによる攻撃の波に備えてコードベースの堅牢性を高める時間を与える」としている。
Anthropicは2026年2月にClaude Code Securityをリリースし、すでにClaude Opus 4.6を使ってオープンソースプロジェクトで500件以上の高深刻度の脆弱性を発見しています。あるケースでは、PDFツールの変更履歴にある開発者コメントの分析だけで脆弱性の存在を推測したとされています。
Mythosの脆弱性検出能力がOpus 4.6をさらに上回るとなれば、従来のセキュリティスキャナーのビジネスモデルが根本から覆される可能性があります。従来型のスキャナーは既知のパターンをマッチングする方式で、誤検出率が30〜60%でした。Claude Code Securityはコードの意味を理解して追跡する方式で、誤検出率は5%未満です。
齊藤の見解:中小企業にとっての意味
Claude Mythosの直接的な影響は大企業やセキュリティ業界に集中しますが、中小企業にとっても重要なシグナルがあります。AIモデルの性能向上が「週単位」で進んでいるという事実です。
Anthropicのエンジニアは現在、業務の約60%をClaude自身に任せており、1日に60〜100のリリースを出しています。AIが自身の開発を加速させる——この「再帰的改善」のスピードは今後も上がり続けます。
中小企業がすべきことは「Claude Mythosを待つ」ことではなく、今のClaude 4.6を使い倒して業務にAIを組み込むことです。モデルが進化すれば、同じワークフローの品質が自動的に上がります。Claudeの使い方入門から始めてみてください。
Claude Mythos vs GPT-5.4 vs Gemini 3.1——次世代モデル競争の構図
Claude Mythosの登場は、2026年のAIモデル競争を一段と激化させます。各社の次世代モデルの状況を整理します。
注目すべきは、Anthropicのリリース速度です。Anthropicのエンジニアは業務の約60%をClaude自身に任せており、1日に60〜100の内部リリースを出しています。AIが自身の次世代モデルを作る「再帰的改善」が始まっているため、各社のリリース間隔は月単位から週単位に縮まっています。
Claude Code Securityの実績——Mythosで何が変わるか
Mythosの脆弱性検出能力を理解するには、現行のClaude Code Security(Opus 4.6ベース)の実績を知る必要があります。
発見した脆弱性:オープンソースプロジェクトで500件以上の高深刻度の脆弱性を検出
検出方法:コードの「意味」を理解して追跡。従来のパターンマッチ方式とは根本的に異なる
誤検出率:5%未満(従来型スキャナーの30〜60%と比較して圧倒的に低い)
特異事例:PDFツールの変更履歴にある開発者コメントの分析だけで脆弱性の存在を推測した
Mythosはこの能力を「劇的に」上回るとされています。リークされたブログ記事では「防御側の努力を凌駕する速度で脆弱性を発見できる」と記述されており、サイバーセキュリティの攻防バランスそのものを変えるモデルとして位置づけられています。Claude Code Securityの詳細も参照してください。
Anthropicの「AIでAIを作る」加速サイクル
Claude Mythosの開発スピードを理解する上で最も重要なのは、Anthropicが自社のAIを使って自社のAIを開発しているという事実です。
・エンジニアの業務の約60%をClaudeが実行(1年前は28%)
・社内で1日あたり60〜100のリリースを出荷
・Claude CoworkはClaude Codeが10日で構築した
・「1年前に数か月かかったことが数週間に、今は数日で」(Anthropic社内コメント)
これはAI開発の「複利効果」です。モデルが賢くなる→開発が速くなる→次のモデルがさらに速く完成する→さらに賢くなる。このサイクルが回り始めた以上、2026年後半はさらに急激なモデル進化が予想されます。
<
よくある質問
Claude Mythosはいつリリースされますか
公式な発表はまだありません。2026年3月末時点で「早期顧客によるパイロットテスト中」とされています。過去のリリースパターンから推測すると、2026年第2四半期(4〜6月)の一般公開が有力です。
Claude Mythosは現行のProプラン(月額20ドル)で使えますか
Capybaraティアは現行のOpusより高い価格設定になる予定です。少なくとも最初はMax(月額100〜200ドル)以上のプラン限定になる可能性が高いです。現行の料金プランを確認しておいてください。
Claude Mythosに備えて今から何をすべきですか
特別な準備は不要です。現在のClaude 4.6で業務フローにAIを組み込んでおけば、Mythosがリリースされた際にモデルを切り替えるだけで性能が向上します。Claudeの使い方入門から始めてみてください。
まとめ
Claude MythosはAnthropicの次世代フラグシップモデルであり、Opus超えの「Capybara」ティアとして登場します。特にサイバーセキュリティの脆弱性検出能力はセキュリティ業界を揺るがすレベルです。Anthropicの開発チームはAI自身を使って1日60〜100のリリースを出す「再帰的改善」サイクルに入っており、2026年後半はさらに急激なモデル進化が予想されます。中小企業にとって重要なのは「待つ」ことではなく、今のClaude 4.6で業務にAIを組み込み、モデル進化の恩恵を自動的に受け取れる体制を作ることです。