私たちの最新モデル、Claude Opus 4.7が一般提供(GA)になりました。Opus 4.7はOpus 4.6に比べて高度なソフトウェア工学分野で大幅に改善されており、特に最も難しいタスクで顕著な向上を示します。ユーザーは、以前は綿密な監督を必要とした最難関のコーディング作業を、Opus 4.7に安心して引き継げると報告しています。Opus 4.7は複雑で長時間にわたるタスクを厳密かつ一貫して処理し、指示に対して精密に注意を払い、報告前に自身の出力を検証する方法を考案します。
モデルは視覚能力も大幅に向上しており、より高解像度の画像を『見る』ことができます。また、プロフェッショナルな作業を行う際のセンスと創造性が向上し、より高品質なインターフェース、スライド、ドキュメントを生成します。そして—最も強力なモデルであるClaude Mythos Previewほど広範な能力は持たないものの—Opus 4.6に比べて幅広いベンチマークでより良い結果を示しています。
先週、私たちはProject Glasswingを発表し、サイバーセキュリティに関するAIモデルのリスクと便益を強調しました。私たちはClaude Mythos Previewのリリースを限定的に保ち、新しいサイバー保護策をまずは能力の低いモデルでテストすると述べました。Opus 4.7はその最初のモデルです:そのサイバー能力はMythos Previewほど高度ではありません(実際、トレーニング中にこれらの能力を差分的に低減する試みを行いました)。私たちは、禁止または高リスクと判断されるサイバーセキュリティ用途を示すリクエストを自動的に検出しブロックするセーフガードを組み込んだ状態でOpus 4.7を公開します。これらのセーフガードの実運用から得られる学びは、最終的にMythosクラスのモデルを広くリリースするための取り組みに役立てられます。
脆弱性調査、ペネトレーションテスト、レッドチーミングなどの正当なサイバーセキュリティ目的でOpus 4.7を利用したいセキュリティ専門家は、新しいCyber Verification Programへの参加を招待します。
Opus 4.7は本日よりすべてのClaude製品、API、Amazon Bedrock、Google Cloud の Vertex AI、Microsoft Foundryで利用可能です。価格はOpus 4.6と同じで、入力トークン1Mあたり$5、出力トークン1Mあたり$25です。開発者はClaude API経由でclaude-opus-4-7を利用できます。
-
"初期テストでは、Claude Opus 4.7は開発者にとって大きな飛躍の可能性を示しています。計画フェーズで自らの論理的欠陥を検出し、実行を加速します。これは以前のClaudeモデルをはるかに上回ります。数百万の消費者と企業に大規模にサービスを提供する金融テクノロジープラットフォームにとって、この速度と正確性の組み合わせはゲームチェンジャーになり得ます:信頼できる金融ソリューションをより速く提供するための開発速度を加速します。"
— Clarence Huang, VP of Technology
-
"Anthropicは既にコーディングモデルの基準を設定しており、Claude Opus 4.7はそれをさらに意味のある形で押し上げています。内部評価では、生の能力だけでなく、実世界の非同期ワークフロー(オートメーション、CI/CD、長時間実行タスク)をどれだけうまく処理するかが際立っています。単にユーザーに同意するだけでなく、問題についてより深く考え、より意見を持って応答します。"
— Igor Ostrovsky, Co-Founder and Chief Technology Officer
-
"Claude Opus 4.7はHexが評価した中で最も強力なモデルです。データが欠落しているときにもっともらしいが誤った代替案を出すのではなく、正しく『データがない』と報告します。Opus 4.6が陥った不協和なデータの罠にも抵抗します。より賢く、より効率的なOpus 4.6という印象です:低労力のOpus 4.7は概ね中労力のOpus 4.6に相当します。"
— Caitlin Colgrove, Co-Founder and CTO
-
"当社の93タスクのコーディングベンチマークでは、Claude Opus 4.7はOpus 4.6を13%上回る解決率を示しました。そのうち4つのタスクはOpus 4.6とSonnet 4.6のいずれも解けませんでした。中央値レイテンシの短縮と厳密な指示順守と合わせて、これは複雑で長時間のコーディングワークフローにとって特に意味があります。複数ステップのタスクにおける摩擦を減らし、開発者がフローの中に留まって構築に集中できるようにします。"
— Mario Rodriguez, Chief Product Officer
-
"内部のresearch-agentベンチマークに基づくと、Claude Opus 4.7はマルチステップ作業に対する我々が見た中で最も強い効率ベースラインを持っています。6つのモジュールで全体スコアが0.715で首位タイとなり、長い文脈での一貫性あるパフォーマンスを最も安定して示しました。General Finance(最大のモジュール)ではOpus 4.6の0.767に対して0.813と有意な改善を示し、開示とデータ運用においても最良の振る舞いを見せました。演繹的論理の分野でもOpus 4.6が苦戦していた箇所が堅実になっています。"
— Michal Mucha, Lead AI Engineer, Applied AI
-
"Claude Opus 4.7は、モデルが調査しタスクを完了する能力の限界を押し広げます。Anthropicは長時間にわたる持続的推論を最適化しており、市場をリードするパフォーマンスとして表れています。エンジニアがエージェントと1:1で作業する代わりに並列に管理するようになるにつれ、これは新しいワークフローを解放する先端能力です。"
— Jeff Wang, CEO
-
"化学構造の読み取りから複雑な技術図の解釈まで、Claude Opus 4.7のマルチモーダル理解に大きな改善が見られます。高解像度サポートは、Solve Intelligenceがライフサイエンスの特許ワークフロー(ドラフト、審査、侵害検出、無効化チャート作成)向けの最高クラスのツールを構築するのに役立っています。"
— Sanj Ahilan, Chief Research Officer
-
"Devinでは、Claude Opus 4.7は長期の自律作業能力を新たなレベルに引き上げます。数時間にわたって整合的に動作し、困難な問題に対して諦めずに取り組み、以前は確実に実行できなかった深い調査作業のクラスを解放します。"
— Scott Wu, CEO
-
"Replitにとって、Claude Opus 4.7は簡単にアップグレードする価値がありました。ユーザーが日々行う作業において、同等の品質をより低コストで達成するのを観測しています—ログやトレースの解析、バグ発見、修正提案のようなタスクでより効率的かつ正確です。技術的議論の際に反論してより良い意思決定を助けてくれる点も個人的に気に入っています。本当に良い同僚のように感じます。"
— Michele Catasta, President
-
"BigLaw Benchでの高努力時における実質的な正確性は90.9%で、レビュー表の推論較正が改善され、曖昧な文書編集タスクへの取り扱いが明らかに賢くなっています。譲渡条項と支配権変更条項を正しく区別するなど、これまでフロンティアモデルが苦手としてきた課題も解けています。全体としてサブスタンス(内容の正確さと十分さ)は評価における強みでした。"
— Niko Grupen, Head of Applied Research
-
"Claude Opus 4.7は特に自律性とより創造的な推論において非常に印象的なコーディングモデルです。CursorBenchではOpus 4.7が70%を達成し、Opus 4.6の58%から大きくジャンプしています。"
— Michael Truell, Co-Founder and CEO
-
"複雑なマルチステップワークフローにおいて、Claude Opus 4.7は明確なステップアップを示します:Opus 4.6に比べてトークン数を抑えつつ14%の改善、ツールエラーは3分の1に減少しました。暗黙のニーズテストを通過した最初のモデルであり、以前はOpusが停止していたツール失敗を乗り越えて実行を続けます。この信頼性のジャンプが、Notion Agentを真のチームメイトに感じさせます。"
— Sarah Sachs, AI Lead
-
"当社の評価では、コアオーケストレータエージェントにおけるツールコールと計画の精度が二桁台で向上しました。Hebbiaが検索、スライド作成、ドキュメント生成といったユースケースを計画・実行する際に、Claude Opus 4.7はエージェントの意思決定を改善する可能性を示しています。"
— Adithya Ramanathan, Head of Applied Research
-
"Rakuten-SWE-Benchでは、Claude Opus 4.7はOpus 4.6よりも実運用タスクを3倍多く解決し、コード品質とテスト品質で二桁の改善を示しました。これはエンジニアリング作業の明確なリフトであり、日々の出荷作業に対する明確なアップグレードです。"
— Yusuke Kaji, General Manager, AI for Business
-
"CodeRabbitのコードレビュー業務では、Claude Opus 4.7が最も鋭いモデルでした。リコール(検出率)は10%以上改善し、最も検出困難なバグの一部を浮上させ、複雑なPRでも精度は安定しています。我々のハーネス上ではGPT-5.4 xhighよりやや高速で、ローンチ時には最も重いレビュー業務に配置する予定です。"
— David Loker, VP of AI
-
"GensparkのSuper Agentにとって、Claude Opus 4.7は生産において重要な差別化要因であるループ耐性、一貫性、優雅なエラー回復の三つを満たしています。ループ耐性は最も重要です。1/18のクエリで無限ループになるモデルは計算を浪費しユーザーをブロックします。分散が低いことは本番での驚きを減らします。Opus 4.7は我々が測定した中で最高のquality-per-tool-call比を達成しました。"
— Kay Zhu, Co-Founder and CTO
-
"WarpにとってClaude Opus 4.7は意味のあるステップアップです。Opus 4.6は既に開発者向けの優れたモデルのひとつですが、本モデルはそれにさらに詳しく対応します。以前のClaudeモデルが失敗したTerminal Benchタスクをパスし、Opus 4.6が解決できなかった難しい同時実行バグを解きました。私たちにとって、それがシグナルです。"
— Zach Lloyd, Founder and CEO
-
"ダッシュボードやデータリッチなインターフェースを構築する上で、Claude Opus 4.7は世界で最も優れたモデルです。デザインのセンスには正直驚かされます—実際にそのまま出荷したくなる選択をします。現在は私のお気に入りのデイリードライバーです。"
— Aj Orbach, Co-Founder and CEO
-
"Quantiumで評価した中で、Claude Opus 4.7は最も能力が高いモデルです。独自ベンチマークで主要なAIモデルと比較した結果、最大の利得は推論の深さ、構造化された問題のフレーミング、複雑な技術作業に現れました。修正が少なく反復が速く、顧客が持ち込む最も難しい問題を解くための強力な出力を示します。"
— Ben Chan, Chief AI Officer
-
"Claude Opus 4.7は知性の面で実際の一段の向上を感じさせます。コード品質が明らかに改善され、意味のないラッパー関数やフォールバックのスキャフォールドを排し、動きながら自分でコードを修正します。Sonnet 3.7からClaude 4シリーズへの移行以来、最もクリーンなジャンプです。"
— Ben Lafferty, Senior Staff Engineer
-
"XBOWの自律的ペネトレーションテストの中心となるコンピュータ利用作業において、Claude Opus 4.7は飛躍的改善をもたらしました:視覚鋭敏度ベンチマークで98.5%を達成し、Opus 4.6の54.5%からの改善です。我々の最大の痛点が実質的に消え、以前は使えなかった一連の作業での利用を可能にしました。"
— Oege de Moor, CEO
-
"VercelにとってOpus 4.7は回帰のない堅実なアップグレードです。ワンショットのコーディングタスクで驚異的に優れており、Opus 4.6よりも正確で完全であり、自身の限界について明確に述べることが増えました。作業を始める前にシステムコードに対する証明を行うことさえあり、以前のClaudeモデルでは見られなかった新しい振る舞いです。"
— Joe Haddad, Distinguished Software Engineer
-
"Factory Droidsでは、Claude Opus 4.7はタスク成功率でOpus 4.6に対し10%〜15%の向上を示し、ツールエラーが減り検証ステップのフォローがより確実になりました。途中で止まらず仕事を完遂する点はエンタープライズのエンジニアリングチームにとってまさに必要な特性です。"
— Leo Tchourakov, Member of Technical Staff
-
"Claude Opus 4.7は完全なRust製のテキスト・トゥ・スピーチエンジン(ニューラルモデル、SIMDカーネル、ブラウザデモ)をゼロから自律的に構築し、その出力を音声認識器に通してPythonリファレンスと一致するか検証しました。数か月分のシニアエンジニアリング作業が自律的に提供されました。Opus 4.6からのステップアップは明確で、コードベースは公開されています。"
— Sean Ward, CEO and Co-Founder
-
"Claude Opus 4.7は以前のClaudeモデルができなかった3つのTBenchタスクを通過し、以前の最良モデルが見逃した修正(レースコンディションを含む)を当てています。真の問題を特定する精度が高く、他モデルが諦めたまたは解決しなかった重要な所見を明らかにします。"
— Qodo(社内実運用コードレビューのベンチマークに基づく所見)
Claude Opus 4.7は、複雑で長期にわたる作業、自律的な調査、そしてプロダクションでの信頼性が求められる領域で重要な前進を示しています。開発者やセキュリティ専門家、研究者の皆様は、claude-opus-4-7をClaude API経由でお試しください。