GPT-5.4は、OpenAIが2026年3月5日にリリースした最新フロンティアモデルです。最大の特徴はネイティブcomputer-use機能の搭載で、AIがPCを直接操作してワークフローを自律的に実行できるようになりました。GDPvalベンチマークでは83.0%を記録し、44職種の知識労働で人間専門家を上回る水準に達しています。
📖 この記事の位置づけ
本記事ではGPT-5.4のcomputer-use機能を深掘りします。Claudeのcomputer-useについてはClaude Computer Useガイドをご覧ください。ニュースの全体像は生成AI業界ニュース総まとめで確認できます。
GPT-5.4の3つのバリエーション
GPT-5.4
標準版。APIで利用可能
コスパ重視
GPT-5.4 Thinking
推論特化版
ChatGPT Plus/Team/Pro
GPT-5.4 Pro
最高性能版
Pro/Enterprise限定
computer-useとは何か——AIが「人間のPC」を操作する
computer-useは、AIがスクリーンショットを取得し、マウスクリックやキーボード入力を実行することで、人間と同じようにアプリケーションを操作する機能です。GPT-5.4はこの機能をネイティブで搭載した初のOpenAIモデルです。
OSWorld-Verified(デスクトップ操作ベンチマーク)とWebArena Verified(Web操作ベンチマーク)の両方でスコア記録を更新しています。100万トークンのコンテキストウィンドウと組み合わせることで、長時間にわたる複雑なワークフローの自律実行が可能です。
齊藤の見解:GDPval 83%の「正しい読み方」
GDPvalは「44職種の知識労働で人間専門家と同等以上」という衝撃的な数字を出しましたが、これは「明確に定義されたタスクの実行精度」を測定したものです。「SEO記事を1本書いて」ではなく「この仕様書通りにコードを書いて」のような、要件が明確なタスクでの話です。
私の実務感覚では、AIが本当に強いのは「80%の定型作業を高速化する部分」であり、残り20%の戦略判断・クライアントの文脈理解・ブランドの一貫性管理は依然として人間の仕事です。ただし、この80%を自動化するだけで、中小企業の1人あたり生産性は劇的に向上します。
Claude Computer Use vs GPT-5.4 computer-use
Tool Search——大量のツールを持つ企業のための新機能
GPT-5.4で見過ごされがちですが、実務インパクトが大きいのがTool Search機能です。従来のAPI利用では、システムプロンプトに全てのツール定義を事前に記述する必要がありました。ツールが10個なら問題ありませんが、100個を超えるとプロンプトだけで膨大なトークンを消費します。
Tool Searchでは、モデルが必要に応じてツール定義を検索するため、大量のツールを持つ環境でもトークンコストが一定に保たれます。これは社内にSlack、Googleドライブ、CRM、請求書システム、在庫管理など多数のツールを持つ企業にとって大きなコスト削減です。
トークン効率の改善——同じ仕事を少ないコストで
GPT-5.4は前モデル(GPT-5.2)と同じ問題を解くのに、大幅に少ないトークンで済むよう改善されています。これは単純にAPI利用料金の削減を意味します。
またハルシネーション(AIの事実誤認)もGPT-5.2比で個別主張のエラー率33%減少、回答全体のエラー含有率18%減少しています。ビジネス文書やレポート生成で「もっともらしい嘘」が混入するリスクが大幅に下がりました。
実務での活用パターン
パターン1:定型業務の自動化
computer-useの最も現実的な活用は、毎日の定型的なPC作業の自動化です。「指定フォルダの請求書PDFを開いてExcelに転記する」「特定のWebページからデータを取得してスプレッドシートに記録する」といったタスクをAIに任せられます。従来のRPA(AIエージェント導入ガイドで違いを解説)と異なり、画面のレイアウトが変わっても対応できる柔軟性があります。
パターン2:テスト・QAの自動化
Webサービスやアプリの品質テストで、AIがブラウザを操作しながら画面の表示確認やフォームの入力テストを自動実行します。Claude Code活用事例15選でも紹介している「テスト自動化」と同じ方向性ですが、GPT-5.4ではGUIレベルでの操作が可能です。
パターン3:複数アプリ横断のワークフロー
100万トークンのコンテキストウィンドウと組み合わせることで、「メールを読む→内容を要約→CRMに記録→返信文を作成→カレンダーに予定を登録」といった複数アプリを横断する長時間ワークフローを自律的に実行できます。
齊藤の見解:computer-useは「諸刃の剣」——監視と制限が必須
AIにPCの操作権限を渡すということは、誤操作のリスクも引き受けるということです。ファイルの誤削除、メールの誤送信、機密データの意図しない外部送信——これらは技術的に起こり得ます。
当社の推奨は「サンドボックス環境(テスト用のPC・アカウント)で十分に検証してから本番投入」です。また、操作ログの記録は必須です。AI導入で失敗する7つの落とし穴でも解説している通り、ガバナンスなき導入は必ず事故を生みます。
よくある質問
GPT-5.4は無料で使えますか
GPT-5.4 miniは無料ユーザーにも「Thinking」機能として提供されています。フル性能のGPT-5.4 ThinkingはPlus(月額20ドル)以上、GPT-5.4 ProはPro/Enterprise限定です。
computer-use機能は安全ですか
OpenAIは新しい安全性評価を導入し、思考過程(Chain-of-Thought)の監視により「AIが意図を隠して行動する(欺瞞)」リスクが低いことを確認しています。ただし、業務利用では操作内容のログ記録と人間による監視を推奨します。
GPT-5.4のcomputer-useを業務で使う際に最も注意すべきことは何ですか
「操作範囲の制限」です。メール送信やファイル削除など不可逆な操作は、必ず人間の承認を挟む設計にしてください。OpenAIはCoT(思考過程)の監視で欺瞞リスクが低いと発表していますが、業務上のガバナンスは別問題です。AI導入で失敗する7つの落とし穴を事前に確認しておくことを推奨します。
まとめ
GPT-5.4のcomputer-use機能は、AIが「回答を生成する」段階から「PC上で作業を実行する」段階へ進化したことを示しています。GDPval 83%という数字はインパクトがありますが、重要なのはこの技術を自社業務のどこに適用するかという設計力です。まずは定型的な繰り返し作業から試してみることを推奨します。