Claude Mythos Preview正式発表｜SWE-bench Pro 77.8%でOpus 4.6を圧倒【2026年版】

Claude Mythos Preview正式発表——SWE-bench Pro 77.8%でOpus 4.6を24ポイント上回る衝撃

仁頼 Digital Marketing Company

この記事を書いた人齊藤一樹代表取締役/Webマーケター

Claude Mythos Previewが正式に発表されました。Anthropicが「これまでに構築した中で最も高性能なモデル」と位置づける次世代AIで、SWE-bench ProでOpus 4.6の53.4%に対し77.8%（+24.4ポイント）、SWE-bench Verifiedで93.9%、サイバーセキュリティベンチマークCyberGymで83.1%を記録しています。現時点ではAWS・Apple・Microsoft等12社連合に限定提供されており、1億ドルの利用枠が設けられています。一般APIの提供時期は未定です。

Claude Mythos Preview——公式発表の要点

1. SWE-bench Pro 77.8%（Opus 4.6は53.4%。+24.4ポイントの圧勝）

2. SWE-bench Verified 93.9%／CyberGym 83.1%（いずれも自社計測）

3. 12社連合（AWS・Apple・Microsoft等）に限定提供中

4. 全主要OS・ブラウザでゼロデイ脆弱性を数千件発見

5. 27年前のOpenBSD欠陥、500万回テスト素通りのFFmpegバグを自律検出

6. $100M（約150億円）の利用枠を提供。一般APIは現時点で未定

💡 この記事のポイント

Claude Mythosは、Anthropicが開発中の次世代AIモデルです。2026年3月末にCMSの設定ミスで情報が流出し、Anthropic自身が「これまでに構築した中で最も高性能なモデル」と確認しました。現行最上位のOpus 4.6を超える性能を持ち、特にプログラミングとサイバーセキュリティの脆弱性検出で「劇的な」向上が確認されています。CrowdStrikeやPalo Alto …

ベンチマーク比較——Opus 4.6を全指標で圧倒

要点

SWE-bench Pro（実際のソフトウェア開発タスク）でOpus 4.6を24.4ポイント上回る77.8%。提示されたバグの約8割を自律修正できるレベルに到達しました。

ベンチマーク	Mythos Preview	Opus 4.6	差分
SWE-bench Pro	77.8%	53.4%	+24.4pt
SWE-bench Verified	93.9%	—	自社計測
CyberGym	83.1%	—	自社計測

77.8%

Mythos Preview
SWE-bench Pro

53.4%

Opus 4.6
SWE-bench Pro

衝撃の脆弱性検出——人間が27年間見落としたバグを発見

27年前のOpenBSD欠陥を自律検出

OpenBSDは「世界で最もセキュアなOS」として知られ、27年間にわたり世界中の専門家がコードレビューを実施。その中で見落とされていた欠陥をClaude Mythosが自律的に発見しました。

500万回のテストに素通りしたFFmpegバグ

動画処理の標準ライブラリFFmpegで、500万回の自動テストを全てパスしていたバグを検出。従来のテスト手法では発見不可能な「論理的矛盾」をAIの推論で特定しました。

全主要OS・ブラウザでゼロデイ脆弱性を数千件発見

Windows、macOS、Linux、Chrome、Firefox等の主要OS・ブラウザを対象に、未公開の脆弱性（ゼロデイ）を数千件検出（Anthropic自社計測）。

12社連合「Project Glasswing」と$100M＋$4Mの資金投入

Claude Mythos Previewは一般公開されず、AWS・Apple・Microsoft等の12社連合に限定提供されています。Anthropicは$100M（約150億円）の利用枠に加え、$4M（約6億円）をオープンソースセキュリティ組織への直接寄付として提供。合計$104Mの資金を投じ、まず大手テック企業に自社製品の脆弱性を修正する時間を与えています。

⚠ 一般APIの提供時期は未定

一般のClaude Pro/Maxユーザーや通常のAPI利用者がMythosを使える時期は発表されていません。限定提供でセキュリティリスクを評価した後に段階的に拡大すると見られますが、2026年内の一般公開は不確実です。

この取り組みは「Project Glasswing」と名付けられ、Anthropicの公式サイト（anthropic.com/glasswing）で詳細が公開されています。Glasswingの目的は「敵対者が同じAI能力を悪用する前に、世界の重要なソフトウェアの脆弱性を見つけて修正する」ことです。

VentureBeatの独占インタビューで、AnthropicのFrontier Red Team Cyber Leadである Newton Cheng氏は「AI進歩の速度を考えると、このような能力が拡散するのは時間の問題。防御側が先に動かなければ、経済・公共安全・国家安全保障への被害は深刻になりうる」と述べています。

注目すべきは、CrowdStrikeとPalo Alto Networksがリーク時に株価が5%以上下落したにもかかわらず、Project Glasswingのパートナーに名を連ねている点です。「AIに仕事を奪われる」のではなく「AIの能力を取り込む」戦略に切り替えたと解釈できます。

何が起きたのか——リーク経緯と公式確認

2026年3月末、AnthropicのCMS（コンテンツ管理システム）の設定ミスにより、3,000件以上のアセットが一般公開される事態が発生しました。その中にClaude Mythosのローンチブログ記事のドラフト版が含まれていたことを、Fortuneが最初に報じました。

Anthropicは翌日にClaude Mythosの存在を公式に認め、「トレーニングは完了しており、早期顧客によるパイロットテストを実施中」と発表しています。

Capybaraティアとは何か——Claudeの製品体系が変わる

現在のClaudeはHaiku（軽量・高速）→ Sonnet（バランス型）→ Opus（最高性能）の3ティア構成です。Claude Mythosでは、Opusの上に「Capybara」という第4ティアが追加されます。

ティア	位置づけ	想定ユースケース
Haiku	軽量・高速・最安	チャットボット、分類、大量処理
Sonnet	バランス型	日常業務、記事作成、コード補助
Opus	最高品質	複雑な推論、長時間タスク、研究
Capybara（新）	Opus超え・最高価格	セキュリティ監査、高度なコーディング、エンタープライズ

リークされたブログ記事によると、Capybaraは現行のOpus 4.6よりも高い料金設定になる予定です。つまり、Anthropicは「最高性能には追加のプレミアム料金を設定する」方向に舵を切ったことになります。現行の料金プラン比較も参照してください。

サイバーセキュリティへの衝撃——なぜ株価が下落したか

CapybaraがCrowdStrikeやPalo Alto Networksの株価を5%以上押し下げた理由は、リークされたブログ記事の以下の記述です。

Capybaraは「防御側の努力をはるかに凌ぐ速度で脆弱性を発見できるモデルの波の先駆け」であり、Anthropicは「早期アクセスを提供することで、AIによる攻撃の波に備えてコードベースの堅牢性を高める時間を与える」としている。

Anthropicは2026年2月にClaude Code Securityをリリースし、すでにClaude Opus 4.6を使ってオープンソースプロジェクトで500件以上の高深刻度の脆弱性を発見しています。あるケースでは、PDFツールの変更履歴にある開発者コメントの分析だけで脆弱性の存在を推測したとされています。

Mythosの脆弱性検出能力がOpus 4.6をさらに上回るとなれば、従来のセキュリティスキャナーのビジネスモデルが根本から覆される可能性があります。従来型のスキャナーは既知のパターンをマッチングする方式で、誤検出率が30〜60%でした。Claude Code Securityはコードの意味を理解して追跡する方式で、誤検出率は5%未満です。

齊藤の見解：中小企業にとっての意味

Claude Mythosの直接的な影響は大企業やセキュリティ業界に集中しますが、中小企業にとっても重要なシグナルがあります。AIモデルの性能向上が「週単位」で進んでいるという事実です。

Anthropicのエンジニアは現在、業務の約60%をClaude自身に任せており、1日に60〜100のリリースを出しています。AIが自身の開発を加速させる——この「再帰的改善」のスピードは今後も上がり続けます。

中小企業がすべきことは「Claude Mythosを待つ」ことではなく、今のClaude 4.6を使い倒して業務にAIを組み込むことです。モデルが進化すれば、同じワークフローの品質が自動的に上がります。Claudeの使い方入門から始めてみてください。

Claude Mythos vs GPT-5.4 vs Gemini 3.1——次世代モデル競争の構図

Claude Mythosの登場は、2026年のAIモデル競争を一段と激化させます。各社の次世代モデルの状況を整理します。

モデル	状況	特徴
Claude Mythos	パイロットテスト中	Opus超え。サイバーセキュリティ脆弱性検出で突出
GPT-5.4 Pro	リリース済み（3月）	GDPval 83%。computer-use対応。詳細記事
Gemini 3.1 Pro	リリース済み（2〜3月）	GPQA Diamond 94.3%。推論ベンチマーク首位
OpenAI次世代（事前学習完了）	事前学習完了の報道	詳細不明。Claude Mythosリーク直後に報道

注目すべきは、Anthropicのリリース速度です。Anthropicのエンジニアは業務の約60%をClaude自身に任せており、1日に60〜100の内部リリースを出しています。AIが自身の次世代モデルを作る「再帰的改善」が始まっているため、各社のリリース間隔は月単位から週単位に縮まっています。

Claude Code Securityの実績——Mythosで何が変わるか

Mythosの脆弱性検出能力を理解するには、現行のClaude Code Security（Opus 4.6ベース）の実績を知る必要があります。

発見した脆弱性：オープンソースプロジェクトで500件以上の高深刻度の脆弱性を検出

検出方法：コードの「意味」を理解して追跡。従来のパターンマッチ方式とは根本的に異なる

誤検出率：5%未満（従来型スキャナーの30〜60%と比較して圧倒的に低い）

特異事例：PDFツールの変更履歴にある開発者コメントの分析だけで脆弱性の存在を推測した

Mythosはこの能力を「劇的に」上回るとされています。リークされたブログ記事では「防御側の努力を凌駕する速度で脆弱性を発見できる」と記述されており、サイバーセキュリティの攻防バランスそのものを変えるモデルとして位置づけられています。Claude Code Securityの詳細も参照してください。

Anthropicの「AIでAIを作る」加速サイクル

Claude Mythosの開発スピードを理解する上で最も重要なのは、Anthropicが自社のAIを使って自社のAIを開発しているという事実です。

・エンジニアの業務の約60%をClaudeが実行（1年前は28%）

・社内で1日あたり60〜100のリリースを出荷

・Claude CoworkはClaude Codeが10日で構築した

・「1年前に数か月かかったことが数週間に、今は数日で」（Anthropic社内コメント）

これはAI開発の「複利効果」です。モデルが賢くなる→開発が速くなる→次のモデルがさらに速く完成する→さらに賢くなる。このサイクルが回り始めた以上、2026年後半はさらに急激なモデル進化が予想されます。

よくある質問

Claude Mythosはいつリリースされますか

公式な発表はまだありません。2026年3月末時点で「早期顧客によるパイロットテスト中」とされています。過去のリリースパターンから推測すると、2026年第2四半期（4〜6月）の一般公開が有力です。

Claude Mythosは現行のProプラン（月額20ドル）で使えますか

Capybaraティアは現行のOpusより高い価格設定になる予定です。少なくとも最初はMax（月額100〜200ドル）以上のプラン限定になる可能性が高いです。現行の料金プランを確認しておいてください。

Claude Mythosに備えて今から何をすべきですか

特別な準備は不要です。現在のClaude 4.6で業務フローにAIを組み込んでおけば、Mythosがリリースされた際にモデルを切り替えるだけで性能が向上します。Claudeの使い方入門から始めてみてください。

まとめ

Claude MythosはAnthropicの次世代フラグシップモデルであり、Opus超えの「Capybara」ティアとして登場します。特にサイバーセキュリティの脆弱性検出能力はセキュリティ業界を揺るがすレベルです。Anthropicの開発チームはAI自身を使って1日60〜100のリリースを出す「再帰的改善」サイクルに入っており、2026年後半はさらに急激なモデル進化が予想されます。中小企業にとって重要なのは「待つ」ことではなく、今のClaude 4.6で業務にAIを組み込み、モデル進化の恩恵を自動的に受け取れる体制を作ることです。

→ Claude 4.6の新機能まとめ

→ Claude料金プラン比較

→ Claude Code Security

→ Claude vs ChatGPT比較

→ 生成AI業界ニュース総まとめ【2026年4月】

Claude活用・AI導入のプロに相談する

Claudeの最新機能を業務にどう活かすか、具体的なアドバイスが欲しい方はお気軽にどうぞ。

無料で相談する →
プロンプト集50選（無料）→

この記事を書いた人

齊藤一樹代表取締役/Webマーケター

株式会社仁頼代表取締役。横浜市在住。 2018年からデジタルマーケティング業界に携わり、Google広告・SEO・コンテンツマーケティングを中心に8年以上の実務経験を持つ。これまでに制作した記事は9,000本以上、70名を超える専門ライターとのチーム体制で、幅広い業界のWebマーケティングを支援してきた。 2022年9月に株式会社仁頼を設立。「受けた御恩を忘れず、信頼を得られるよう迅速かつ最適な対応をする」という信念のもと、SEO・広告運用・サイト制作などのマーケティング支援を行っている。近年は、ChatGPTやPerplexityなどのAI検索でサイトが引用される「GEO（生成エンジン最適化）」の分野にいち早く注力。自社サービス「GEO Hack」を通じて、AI時代の新しい集客手法を企業に提供している。「難しいことをわかりやすく、小さな会社にも大きな成果を」をモットーに、日々クライアントと伴走中。

Claude Mythos Preview正式発表——SWE-bench Pro 77.8%でOpus 4.6を24ポイント上回る衝撃

Claude Mythos Preview正式発表——SWE-bench Pro 77.8%でOpus 4.6を24ポイント上回る衝撃

ベンチマーク比較——Opus 4.6を全指標で圧倒

衝撃の脆弱性検出——人間が27年間見落としたバグを発見

12社連合「Project Glasswing」と$100M＋$4Mの資金投入

何が起きたのか——リーク経緯と公式確認

Capybaraティアとは何か——Claudeの製品体系が変わる

サイバーセキュリティへの衝撃——なぜ株価が下落したか

齊藤の見解：中小企業にとっての意味

Claude Mythos vs GPT-5.4 vs Gemini 3.1——次世代モデル競争の構図

Claude Code Securityの実績——Mythosで何が変わるか

Anthropicの「AIでAIを作る」加速サイクル

よくある質問

Claude Mythosはいつリリースされますか

Claude Mythosは現行のProプラン（月額20ドル）で使えますか

Claude Mythosに備えて今から何をすべきですか

まとめ

関連記事

お気軽にお問い合わせください