この記事の結論
2026年4月16日、AnthropicがClaude Opus 4.7を正式リリース。料金据え置き($5/$25 per M tokens)でSWE-bench Verifiedが80.8%→87.6%に向上し、GPT-5.4・Gemini 3.1 Proを多くのベンチマークで上回りました。/ultrareviewコマンド、Cyber Verification Program、xhighエフォートレベル、ビジョン3倍強化が主な新機能。Opus 4.6からの移行は基本的に推奨ですが、トークナイザー変更と指示追従の精密化に注意が必要です。
2026年4月16日、Anthropicの公式Xアカウントが「Introducing Claude Opus 4.7, our most capable Opus model yet.」と投稿し、最新フラグシップモデルの正式リリースが発表されました。
注目すべきは「You can hand off your hardest work with less supervision.」という一文。つまり「監督を減らしても最も困難な仕事を任せられる」という方向性の明示です。Opus 4.6で「長時間タスクの信頼性」が大きく前進しましたが、4.7はそれをさらに一歩推し進め、AIに任せきりにできる領域を広げました。
本記事では、Opus 4.6との具体的な違い、ベンチマーク改善、新機能の実務インパクト、移行時の落とし穴を整理します。
Opus 4.6から何が変わったのか——3つの進化軸
Opus 4.7の変更点は、大きく3つの軸に整理できます。
軸1: 長時間タスクの安定性
複雑な多段階タスクを、途中で破綻せず最後まで遂行する能力が向上。「出力を自分で検証してから報告する」セルフチェック機構が強化されました。
軸2: 指示追従の精密化
ユーザーの指示をより正確に、字義通りに解釈するようになりました。「察して動く」場面が減り、明示的な指示に忠実に動きます。
軸3: ビジョン処理の飛躍
最大2,576ピクセル(約3.75メガピクセル)の画像を処理可能に。従来モデルの3倍以上の解像度で、高精細な図表・設計図の読み取り精度が大幅に上がりました。
ベンチマーク比較——Opus 4.6・GPT-5.4・Mythosとの差
Anthropic公式発表のベンチマーク値を1つの表にまとめました。太字がそのカテゴリの最高値です。
| ベンチマーク | 4.7 | 4.6 | GPT-5.4 | Gemini 3.1 | Mythos |
| SWE-bench Pro | 64.3% | 53.4% | 57.7% | 54.2% | 77.8% |
| SWE-bench Verified | 87.6% | 80.8% | — | 80.6% | 93.9% |
| Terminal-Bench 2.0 | 69.4% | 65.4% | 75.1% | 68.5% | 82.0% |
| HLE(ツール有り) | 54.7% | 53.3% | 58.7% | 51.4% | 64.7% |
| MCP-Atlas(ツール使用) | 77.3% | 75.8% | 68.1% | 73.9% | — |
| OSWorld(PC操作) | 78.0% | 72.9% | 75.0% | — | 79.6% |
| Finance Agent v1.1 | 64.4% | 60.1% | 61.5% | 59.7% | — |
| CyberGym | 73.1% | 73.8% | 66.3% | — | 83.1% |
| GPQA Diamond | 94.2% | 91.3% | 94.4% | 94.3% | 94.6% |
コーディング(SWE-bench Pro +10.9pt、Verified +6.8pt)、PC操作(OSWorld +5.1pt)、金融分析(Finance Agent +4.3pt)で大幅向上。実務で最もインパクトが大きいのは、コーディングの質的飛躍です。「AIが書いたコードを人間が直す時間」が減り、Claude CodeのRoutines機能との組み合わせで自動開発の品質が安定します。
一方、Terminal-Bench 2.0ではGPT-5.4が上回り、CyberGymではMythos Previewの83.1%に対してOpus 4.7は73.1%に留まります。サイバー能力は意図的に抑制されている結果です。
Mythosとの関係——なぜ同時に2つのモデルが存在するのか
4月7日に発表されたClaude Mythos Preview(SWE-bench Verified 93.9%)は、サイバー能力が高すぎて一般公開されないモデルです。Opus 4.7は、Mythosの技術を元に「危険な能力」を抑制し、一般公開できる最高性能に仕上げた商用版と位置付けられます。
| Mythos Preview | Opus 4.7 | |
| 利用 | 招待制(Project Glasswing 40+組織) | 全ユーザー |
| 料金 | $25/$125 per M | $5/$25 per M(据え置き) |
| サイバー能力 | 最高水準(ゼロデイ数千件発見) | 安全化・セーフガード内蔵 |
Mythosの詳細はMythos完全ベンチマーク記事と244ページSystem Card分析で解説しています。Mythosを待つ必要はありません——一般開発者にとって、Opus 4.7が現行最強のClaudeモデルです。
4つの新機能——Opus 4.7でできるようになったこと
機能1: /ultrareviewコマンド
Claude Codeに追加された新コマンドです。通常のコードレビューとは別に、専用のレビューセッションを起動し、注意深い人間レビュアーが発見するようなバグ・設計上の問題点を洗い出します。
今年初頭にリリースされたAI駆動Code Review機能を補完する位置付けで、本番デプロイ前の最終チェックに最適です。セキュリティ脆弱性・パフォーマンスボトルネック・可読性の問題を高い精度で検出します。エンジニア監修でのClaude Code活用では、このultrareviewを品質担保の一環として組み込むことを推奨します。
機能2: Cyber Verification Program
Opus 4.7には、Mythosから継承したサイバーセーフガードが組み込まれています。悪意あるサイバー利用を示唆するリクエストは自動ブロックされます。
ただし、セキュリティ研究者・ペネトレーションテスター・企業のセキュリティチームなど正当な業務で利用する場合は、新設された「Cyber Verification Program」経由でフル機能へのアクセスが可能です。これは将来的にMythos-classモデルを段階的に一般公開するためのテスト運用と見られています。
機能3: xhighエフォートレベル
思考の深さを制御するエフォートパラメータに、従来の「high」と「max」の間にxhighが追加されました。
実務での使い分け目安:low(単純タスク)→ high(標準的な推論)→ xhigh(複雑な分析・コード生成)→ max(重要な意思決定・最終レビュー)。xhighは「maxほど遅くならないが、highより精度が高い」という実務上の最適解になるケースが多いはずです。
機能4: タスク予算(Public Beta)
API利用者向けに、1タスクあたりのトークン消費量に上限を設定できる機能です。中小企業のAI導入で最大の懸念である「コストの予見不可能性」に対する直接的な解決策。Managed Agentsと組み合わせれば、エージェントの暴走的なトークン消費を防ぎながら長時間タスクを実行できます。
ビジョン処理が3倍以上に強化——何が変わるか
Opus 4.7は最大2,576ピクセル(約3.75メガピクセル)の画像を処理可能です。従来Claudeモデルの3倍以上の解像度で、この改善は見落とされがちですが実務インパクトは大きいです。
具体的な変化として、設計図・回路図・医療画像など高解像度が必要な業務分野への対応、スクリーンショットからのテキスト抽出精度の大幅向上、商品写真の細部分析(従来は粗いと判定ミスが多かった)の改善が挙げられます。Microsoft 365コネクタ経由でSharePointのPDFや図表を分析する場合も、解像度向上の恩恵を直接受けられます。
料金は完全据え置き——事実上の無料アップグレード
| Opus 4.7 | Opus 4.6 | |
| 入力 | $5/M tokens | $5/M tokens |
| 出力 | $25/M tokens | $25/M tokens |
| コンテキスト | 1M tokens | 1M tokens |
| 最大出力 | 128K tokens | 128K tokens |
Claude API・Amazon Bedrock・Google Cloud Vertex AI・Microsoft Foundryすべてで利用可能。プロンプトキャッシングで最大90%、バッチ処理で50%のコスト削減も引き続き適用されます。Fortune 10のうち8社がClaude顧客という急成長(Anthropic収益$30B/年)を背景に、価格引き上げではなく「同コストで性能向上」を選んだ判断は、中小企業にとって安心材料です。
移行時の3つの落とし穴
「モデル名を変えるだけ」と楽観するのは危険です。以下の3点は必ず確認してください。
落とし穴1: 新トークナイザーでトークン数が最大1.35倍に
Opus 4.7は新しいトークナイザーを採用しており、同じ入力でもトークン数が1.0〜1.35倍に増加します。コンテンツの種類(日本語・英語・コード)で変動幅が異なります。料金は据え置きでも、実質月額コストが最大35%増える可能性があるため、移行前にサンプルデータで試算することを推奨します。
落とし穴2: 指示追従が「字義通り」になった
指示追従能力の向上は、裏を返すと「察して動いてくれなくなる」ことを意味します。Opus 4.6では曖昧な指示でも「いい感じに」処理していたものが、4.7では指示通りにしか動かないケースが増えます。
Anthropicが公式に「既存プロンプトの調整が必要な場合がある」と言及しており、通常のモデル更新では出さない公式移行ガイドを今回は用意しています。本番投入前に必ず既存プロンプトの出力を再確認してください。
落とし穴3: サイバー関連タスクの自動ブロック
脆弱性テスト・ペネトレーションテストなどの正当なセキュリティ業務でも、プロンプトの書き方によっては自動ブロックされるケースが報告されています。該当業務を行う場合はCyber Verification Program経由のアクセスを検討してください。
Opus 4.7と組み合わせると効果が倍増する最新機能
Opus 4.7は単体でも強力ですが、2026年4月に同時期にリリースされた以下の機能と組み合わせることで真価を発揮します。
Claude Code Routines × Opus 4.7
Routines機能(4月14日発表)はPCを閉じても自動実行が継続するクラウド機能です。Opus 4.7のコーディング性能向上(SWE-bench Pro +10.9pt)と組み合わせれば、「夜間に50本の記事を生成→朝には品質レビュー済みの下書きが完成」といった運用が現実的になります。並列エージェント対応のデスクトップ版刷新と合わせて、開発効率は4.6比で2〜3倍に達する可能性があります。
Claude Cowork × Opus 4.7
Claude Cowork(4月9日GA)は非エンジニア向けのAIエージェント機能です。Opus 4.7のビジョン処理3倍強化により、会議資料PDF・Excelグラフ・プレゼンスライドの読み取り精度が向上。営業部門の商談準備自動化や経理部門の請求書処理など、非エンジニア業務でのAI活用精度がOpus 4.6時代より安定します。
Managed Agents × Opus 4.7
Managed Agents(4月8日Public Beta)はエージェントの長時間稼働基盤です。Opus 4.7のタスク予算機能と組み合わせれば、「セッション時間$0.08 × トークン上限設定」という二重のコスト制御が実現し、エージェントの暴走リスクを最小化できます。
Microsoft 365コネクタ × Opus 4.7
Microsoft 365コネクタ(4月全プラン開放)経由でSharePoint・OneDriveのPDF・図表を分析する際、Opus 4.7のビジョン処理強化が直接効きます。高解像度の設計図やグラフを含む社内資料も、従来より正確に読み取れるようになりました。
よくある質問
Opus 4.7は無料プランで使えますか?
Claude.aiの無料プランでは利用できません。Pro・Max・Team・Enterpriseプランで利用可能です。API経由ではトークン課金で誰でも利用できます。
Opus 4.6から移行すべきですか?
ほとんどのケースで推奨します。料金据え置きで全ベンチマークが向上しています。ただし、精密にプロンプト調整されている本番システムは、テスト環境で出力を確認してから移行してください。
Mythosを待つべきですか?
いいえ。Mythos Previewは一般公開しない方針が明言されています。一般開発者にとってはOpus 4.7が現行最強です。
xhighとmaxの使い分けは?
maxは「最大限まで考える」、xhighは「高度だが適度に切り上げる」です。多くの実務ケースでxhighが応答時間とコストの最適解となります。maxは最終的な意思決定やコードレビューの仕上げに限定するのが効率的です。
自社への導入支援はありますか?
株式会社仁頼では、Opus 4.7への移行、プロンプト最適化、RoutinesやManaged Agentsとの統合設計を含むClaude導入コンサルティングを提供しています。Claude Code導入支援ページをご覧ください。
まとめ
Claude Opus 4.7は、「同じ価格で、AIにもっと任せられるようになった」アップデートです。コーディング・金融分析・PC操作・ビジョン処理のすべてが向上し、GPT-5.4を多くの領域で上回りました。
ただし、モデルを変えるだけでは成果は出ません。Routines・Cowork・Managed Agents・Microsoft 365連携と組み合わせた総合的な活用設計が、Opus 4.7の性能を最大限引き出す鍵です。
関連記事
- Claude Mythos Preview完全ベンチマーク|SWE-bench 93.9%・Project Glasswingの全貌
- Claude 4.6で何が変わった?100万トークン標準化・300K出力の実務活用
- Claude Code Routinesとは?寝ている間にバグ修正・コードレビューを実現
- Claude Coworkが全有料プランで提供開始|新機能と活用事例
- Claude Managed Agents登場|AIエージェント基盤Public Beta
- Claude+Microsoft 365連携|無料プランでもSharePoint/Outlookと接続
- Claude Haiku 3廃止|4.5移行手順と料金変更
- Claude Mythos 244ページSystem Card完全分析
- エンジニア監修 Claude Code導入支援