ClaudeAnthropic News2026/04/16 0:00

Introducing Claude Opus 4.7

要点だけを先に読めるように短く再構成したセクションです。

元記事

Quick Digest

要約

要点だけを先に読めるように短く再構成したセクションです。

claudejamodel: claude-haiku-4-5

Claude Opus 4.7 の一般提供開始

Key Points

  • 複雑なコーディングタスクで13%の性能向上
  • 高解像度ビジョン機能とマルチモーダル理解の強化
  • セキュリティ対応とCyber Verification Program

Summary

Anthropicの最新モデル「Claude Opus 4.7」が一般提供開始されました。Opus 4.6からの大幅な改善により、複雑なソフトウェアエンジニアリングタスクにおいて顕著な性能向上を実現しています。

Key Points

  • 高度なコード生成能力: 複雑で長時間実行されるタスクを厳密かつ一貫性を持って処理。自動的に出力を検証してから報告
  • ビジョン機能の大幅改善: より高解像度の画像認識が可能。化学構造や複雑な技術図の解釈に対応
  • マルチステップワークフロー最適化: 93タスクのコーディングベンチマークでOpus 4.6比13%の解決率向上。ツールエラーが33%削減
  • セキュリティ対応: Project Glasswingに基づき、サイバーセキュリティの悪用を自動検出・ブロック。正規の用途向けにCyber Verification Programを提供
  • 価格据え置き: Opus 4.6と同じ料金体系(入力トークン$5/百万、出力トークン$25/百万)
  • 全プラットフォーム対応: Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundryで利用可能
  • 推論能力の強化: 長文脈での一貫性が向上。ループ耐性と エラーリカバリーが改善され、本番環境での信頼性が向上

Full Translation

翻訳

原文の流れを保ったまま読める翻訳セクションです。

claudejamodel: claude-haiku-4-5

Claude Opus 4.7 のご紹介

Claude Opus 4.7 のご紹介

2026年4月16日

最新モデルの Claude Opus 4.7 が一般提供開始となりました。Opus 4.7 は高度なソフトウェアエンジニアリングにおいて Opus 4.6 から大幅に改善され、特に最も難しいタスクで顕著な向上が見られます。ユーザーは以前は綿密な監督が必要だった最も難しいコーディング作業を、自信を持って Opus 4.7 に任せることができるようになりました。

Opus 4.7 は複雑で長時間実行されるタスクを厳密かつ一貫性を持って処理し、指示に正確に注意を払い、報告前に独自の出力を検証する方法を考案します。また、ビジョン機能も大幅に向上しており、より高い解像度で画像を認識できます。プロフェッショナルなタスク完了時により洗練され創造的になり、より高品質なインターフェース、スライド、ドキュメントを生成します。最も強力なモデルである Claude Mythos Preview ほど広範な機能はありませんが、Opus 4.7 は様々なベンチマークで Opus 4.6 を上回る結果を示しています。

サイバーセキュリティに関する取り組み

先週、AI モデルのサイバーセキュリティに関するリスクと利点を強調する Project Glasswing を発表しました。Claude Mythos Preview のリリースを限定的に保ち、新しいサイバーセーフガードをより低機能なモデルで最初にテストすることを述べました。Opus 4.7 はそのような最初のモデルです。その サイバー機能は Mythos Preview ほど高度ではなく、実際、トレーニング中にこれらの機能を差別的に削減する取り組みを実験しました。

Opus 4.7 は、禁止されている、または高リスクのサイバーセキュリティ使用を示すリクエストを自動的に検出およびブロックするセーフガードとともにリリースされています。これらのセーフガードの実世界での展開から学んだことは、Mythos クラスモデルの広範なリリースに向けた取り組みに役立つでしょう。

脆弱性研究、ペネトレーションテスト、レッドチーミングなどの正当なサイバーセキュリティ目的で Opus 4.7 を使用したいセキュリティプロフェッショナルは、新しい Cyber Verification Program への参加をお招きします。

利用可能性と価格

Opus 4.7 は本日、すべての Claude 製品および API、Amazon Bedrock、Google Cloud の Vertex AI、Microsoft Foundry で利用可能です。価格は Opus 4.6 と同じままです:入力トークンあたり $5/100万、出力トークンあたり $25/100万。

開発者は Claude API 経由で claude-opus-4-7 を使用できます。

Claude Opus 4.7 のテスト

Claude Opus 4.7 は早期アクセステスターから強い評価を得ています:

開発者からのフィードバック

早期テストでは、Claude Opus 4.7 で開発者にとって大きな飛躍の可能性が見られています。計画段階で独自の論理的欠陥を捉え、以前の Claude モデルをはるかに上回る実行を加速します。数百万の消費者とビジネスに大規模にサービスを提供するフィンテックプラットフォームとして、この速度と精度の組み合わせはゲームチェンジャーになる可能性があります。顧客が毎日信頼する金融ソリューションの迅速な提供を加速できます。

— Clarence Huang、VP of Technology

Anthropic はすでにコーディングモデルの標準を設定しており、Claude Opus 4.7 はそれを市場の最先端モデルとして意味のある方法でさらに推し進めています。内部評価では、単なる生の機能だけでなく、実世界の非同期ワークフロー(オートメーション、CI/CD、長時間実行タスク)をどの程度うまく処理するかで際立っています。また、問題についてより深く考え、ユーザーに同意するだけでなく、より意見的な視点をもたらします。

— Igor Ostrovsky、Co-Founder and Chief Technology Officer

Claude Opus 4.7 は Hex が評価した最も強力なモデルです。データが欠落している場合は正しく報告し、もっともらしいが不正確なフォールバックを提供せず、Opus 4.6 でさえ陥る不協和データトラップに抵抗します。より知的で、より効率的な Opus 4.6 です。低努力の Opus 4.7 は中程度の努力の Opus 4.6 とほぼ同等です。

— Caitlin Colgrove、Co-Founder and CTO

93 タスクのコーディングベンチマークでは、Claude Opus 4.7 は Opus 4.6 より 13% 解決率を向上させ、Opus 4.6 も Sonnet 4.6 も解決できなかった 4 つのタスクを含みます。より高速な中央値レイテンシと厳密な指示遵守と組み合わせると、複雑で長時間実行されるコーディングワークフローに特に意味があります。これらの複数ステップのタスクから摩擦を削減し、開発者がフローを保ち、構築に集中できるようにします。

— Mario Rodriguez、Chief Product Officer

内部研究エージェントベンチマークに基づいて、Claude Opus 4.7 は複数ステップの作業で見た最も強力な効率ベースラインを持っています。6 つのモジュール全体で 0.715 の総合スコアで同点で 1 位を獲得し、テストしたモデルの中で最も一貫した長コンテキストパフォーマンスを提供しました。最大のモジュールである General Finance では、Opus 4.6 で意味のある改善を達成し、0.767 対 0.813 でスコアを獲得し、グループ内で最高の開示とデータ規律を示しました。演繹論理(Opus 4.6 が苦労した領域)では、Opus 4.7 は堅牢です。

— Michal Mucha、Lead AI Engineer, Applied AI

Claude Opus 4.7 は、モデルが調査し、タスクを完了できることの限界を拡張します。Anthropic は明らかに長時間の持続的推論に最適化しており、市場をリードするパフォーマンスで示されています。エンジニアが 1:1 のエージェント作業から並列管理へシフトするにつれて、これはまさに新しいワークフローを解き放つフロンティア機能です。

— Jeff Wang、CEO

Claude Opus 4.7 のマルチモーダル理解で大幅な改善が見られており、化学構造の読み取りから複雑な技術図の解釈まで対応しています。より高い解像度サポートは、Solve Intelligence がライフサイエンス特許ワークフロー(ドラフト作成と起訴から侵害検出と無効化チャートまで)のための最高クラスのツール構築を支援しています。

— Sanj Ahilan、Chief Research Officer

Claude Opus 4.7 は Devin で長期的な自律性を新しいレベルに引き上げます。数時間一貫して動作し、あきらめるのではなく難しい問題を押し通し、以前は確実に実行できなかった深い調査作業のクラスを解き放ちます。

— Scott Wu、CEO

Replit にとって、Claude Opus 4.7 は簡単なアップグレード決定でした。ユーザーが毎日行う作業では、より低いコストで同じ品質を達成し、ログとトレースの分析、バグの検出、修正の提案などのタスクでより効率的で正確です。個人的には、技術的な議論中にどのように異議を唱えてより良い決定を下すのを支援するかが好きです。本当に良い同僚のように感じます。

— Michele Catasta、President

Claude Opus 4.7 は Harvey の BigLaw Bench で強い実質的精度を示し、高努力で 90.9% でスコアを獲得し、レビューテーブルでより良い推論キャリブレーションと曖昧なドキュメント編集タスクのより賢い処理を示しています。譲渡条項と支配権変更条項を正しく区別し、これは歴史的にフロンティアモデルに課題をもたらしたタスクです。実質は評価全体で一貫して強みとして評価されました:正確、徹底的、よく引用されています。

— Niko Grupen、Head of Applied Research

Claude Opus 4.7 は非常に印象的なコーディングモデルであり、特にその自律性とより創造的な推論のためです。CursorBench では、Opus 4.7 は機能の意味のある飛躍であり、Opus 4.6 の 58% に対して 70% をクリアしています。

— Michael Truell、Co-Founder and CEO

複雑な複数ステップのワークフローでは、Claude Opus 4.7 は明らかなステップアップです:Opus 4.6 より 14% 増加し、トークンが少なく、ツールエラーが 3 分の 1 です。暗黙的なニーズテストに合格した最初のモデルであり、以前は Opus を停止させていたツール障害を通じて実行を続けます。これは Notion Agent を真のチームメイトのように感じさせる信頼性の飛躍です。

— Sarah Sachs、AI Lead

評価では、コアオーケストレーターエージェントのツール呼び出しと計画の精度で 2 桁の向上が見られました。ユーザーが Hebbia を活用して検索、スライド作成、ドキュメント生成などのユースケースを計画および実行するにつれて、Claude Opus 4.7 はこれらのワークフローでエージェント意思決定を改善する可能性を示しています。

— Adithya Ramanathan、Head of Applied Research

Rakuten-SWE-Bench では、Claude Opus 4.7 は Opus 4.6 より 3 倍多くの本番タスクを解決し、コード品質とテスト品質で 2 桁の向上を実現しています。これは意味のある向上であり、チームが毎日出荷しているエンジニアリング作業の明確なアップグレードです。

— Yusuke Kaji、General Manager, AI for Business

CodeRabbit のコードレビューワークロードでは、Claude Opus 4.7 はテストした最も鋭いモデルです。リコールは 10% 以上改善され、最も複雑な PR で最も検出が難しいバグの一部が表示されましたが、カバレッジの増加にもかかわらず精度は安定しています。ハーネスで GPT-5.4 xhigh より少し高速であり、起動時に最も重いレビュー作業のために準備しています。

— David Loker、VP of AI

Genspark の Super Agent では、Claude Opus 4.7 は最も重要な 3 つの本番差別化要因を完璧に実現しています:ループ抵抗、一貫性、および優雅なエラー回復。ループ抵抗が最も重要です。1 回の 18 クエリで無限にループするモデルは計算を浪費し、ユーザーをブロックします。分散が低いほど、本番環境での驚きが少なくなります。Opus 4.7 は測定した最高のツール呼び出しあたりの品質比率を達成しています。

— Kay Zhu、Co-Founder and CTO

Claude Opus 4.7 は Warp にとって意味のあるステップアップです。Opus 4.6 は開発者向けの最高のモデルの 1 つであり、このモデルはその上でより徹底的に測定可能です。以前の Claude モデルが失敗していた Terminal Bench タスクに合格し、Opus 4.6 が解決できなかった厄介な並行性バグを処理しました。それは私たちにとってシグナルです。

— Zach Lloyd、Founder and CEO

Claude Opus 4.7 はダッシュボードとデータ豊富なインターフェースを構築するための世界最高のモデルです。デザインの味は本当に驚くべきものです。実際に出荷する選択肢を作成します。今は私のデフォルトの日常ドライバーです。

— Aj Orbach、Co-Founder and CEO

Claude Opus 4.7 は Quantium でテストした最も機能的なモデルです。独自のベンチマーク解決策を通じて主要な AI モデルと比較して評価されており、最大の向上は最も重要な場所で表示されました:推論の深さ、構造化された問題フレーミング、および複雑な技術作業。修正が少なく、反復が速く、クライアントが持ち込む最も難しい問題を解決するための強力な出力。

— Ben Chan、Chief AI Officer

Claude Opus 4.7 は本当にインテリジェンスのステップアップのように感じます。コード品質は顕著に改善され、以前は蓄積していた無意味なラッパー関数とフォールバックスキャフォールディングを削減し、進行中に独自のコードを修正します。Sonnet 3.7 から Claude 4 シリーズへの移行以来、最もクリーンなジャンプです。

— Ben Lafferty、Senior Staff Engineer

XBOW の自動ペネトレーションテストの中核にあるコンピュータ使用作業では、新しい Claude Opus 4.7 はステップチェンジです:視覚的敏感度ベンチマークで Opus 4.6 の 54.5% に対して 98.5%。単一の最大の Opus の痛点は事実上消え、以前は使用できなかった作業のクラス全体でその使用を解き放ちます。

— Oege de Moor、CEO

Claude Opus 4.7 は Vercel にとって回帰のない堅実なアップグレードです。ワンショットコーディングタスクで素晴らしく、Opus 4.6 より正確で完全であり、独自の制限についてより正直です。システムコードで作業を開始する前に証明を行うことさえあり、これは以前の Claude モデルから見たことのない新しい動作です。

— Joe Haddad、Distinguished Software Engineer

Claude Opus 4.7 は非常に強力で、Factory Droids のタスク成功で 10% から 15% の向上で Opus 4.6 を上回り、ツールエラーが少なく、検証ステップでより信頼できるフォローアップを実現しています。エンジニアリング作業を途中で停止するのではなく、最後まで実行し、これはエンタープライズエンジニアリングチームが必要とするものです。

— Leo Tchourakov、Member of Technical Staff

Claude Opus 4.7 は、完全な Rust テキスト音声エンジン(ニューラルモデル、SIMD カーネル、ブラウザデモ)をゼロから自律的に構築し、独自の出力を音声認識器に通して Python リファレンスと一致することを確認しました。シニアエンジニアリングの数ヶ月が自律的に提供されました。Opus 4.6 からのステップアップは明確であり、コードベースは公開されています。

— Sean Ward、CEO and Co-Founder

Claude Opus 4.7 は以前の Claude モデルが解決できなかった 3 つの TBench タスクに合格し、以前の最高のモデルが見落とした修正を着地させており、競合状態を含みます。実際の問題を特定する際に強い精度を示し、他のモデルがあきらめたか解決しなかった重要な発見を表示します。Qodo の実世界のコードレビューベンチマークでは、

Claude Opus 4.7 の紹介 | Anthropic News | DocsDigest