Agents SDKの次の進化 | OpenAI News

claudejamodel: claude-haiku-4-5

Agents SDKの次なる進化

更新されたAgents SDKは、開発者がファイルを検査し、コマンドを実行し、コードを編集し、制御されたサンドボックス環境内で長期的なタスクに取り組むことができるエージェントを構築するのに役立ちます。

新しい機能の導入

Agents SDKに新しい機能を導入しており、開発者に以下を提供します：

OpenAIモデル向けに正しく構築された、使い始めやすい標準化されたインフラストラクチャ
エージェントがコンピュータ上のファイルとツール全体で動作できるモデルネイティブハーネス
その作業を安全に実行するためのネイティブサンドボックス実行

例えば、開発者はエージェントに制御されたワークスペース、明示的な指示、および証拠を検査するために必要なツールを提供できます：

# pip install "openai-agents>=0.14.0"

import asyncio
import tempfile
from pathlib import Path

from agents import Runner
from agents.run import RunConfig
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
from agents.sandbox.entries import LocalDir
from agents.sandbox.sandboxes import UnixLocalSandboxClient

async def main() -> None:
    with tempfile.TemporaryDirectory() as tmp:
        dataroom = Path(tmp) / "dataroom"
        dataroom.mkdir()
        (dataroom / "metrics.md").write_text(
            """# Annual metrics

| Year | Revenue | Operating income | Operating cash flow |
| --- | ---: | ---: | ---: |
| FY2025 | $124.3M | $18.6M | $24.1M |
| FY2024 | $98.7M | $12.4M | $17.9M |
""",
            encoding="utf-8",
        )

        agent = SandboxAgent(
            name="Dataroom Analyst",
            model="gpt-5.4",
            instructions="Answer using only files in data/. Cite source filenames.",
            default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
        )

        result = await Runner.run(
            agent,
            "Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
            run_config=RunConfig(
                sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
            ),
        )
        print(result.final_output)

if __name__ == "__main__":
    asyncio.run(main())

エージェント構築に必要なもの

開発者が有用なエージェントを構築するには、最高のモデル以上のものが必要です。エージェントがファイルを検査し、コマンドを実行し、コードを書き、多くのステップにわたって動作し続ける方法をサポートするシステムが必要です。

現在存在するシステムは、チームがプロトタイプから本番環境に移行する際にトレードオフを伴います：

モデルに依存しないフレームワーク：柔軟ですが、最先端モデルの機能を完全に活用していません
モデルプロバイダーSDK：モデルに近い場合がありますが、ハーネスへの可視性が不足していることが多いです
マネージドエージェントAPI：デプロイメントを簡素化できますが、エージェントが実行される場所と機密データへのアクセス方法を制限します

顧客からのフィードバック

新しいSDKをテストした顧客の声：

Oscar Health

「更新されたAgents SDKにより、以前のアプローチでは十分に信頼できなかった重要な臨床記録ワークフローを自動化することが本番環境で実行可能になりました。私たちにとって、違いは単に正しいメタデータを抽出することだけでなく、長く複雑な記録の各エンカウンターの境界を正しく理解することでした。その結果、特定の訪問で各患者に何が起こっているかをより迅速に理解でき、メンバーのケアニーズを支援し、当社とのエクスペリエンスを向上させることができます。」

— Rachael Burns、Staff Engineer & AI Tech Lead、Oscar Health

エージェントループのためのより強力なハーネス

今回のリリースにより、Agents SDKハーネスはドキュメント、ファイル、システムで動作するエージェント向けにより強力になります。

新機能には以下が含まれます：

設定可能なメモリ
サンドボックス対応のオーケストレーション
Codexのようなファイルシステムツール
最先端のエージェントシステムで一般的になっているプリミティブとの標準化された統合

これらのプリミティブには以下が含まれます：

MCPを介したツール使用
スキルを介した段階的な開示 AGENTS.mdを介したカスタム指示
シェルツールを使用したコード実行
パッチ適用ツールを使用したファイル編集
その他

ハーネスは時間とともに新しいエージェンティックパターンとプリミティブを組み込み続けるため、開発者はコアインフラストラクチャの更新に費やす時間を減らし、エージェントを有用にするドメイン固有のロジックに費やす時間を増やすことができます。

ハーネスはまた、開発者が最先端モデルの機能をより多く活用できるようにします。実行をこれらのモデルが最適に機能する方法と一致させることで、エージェントをモデルの自然な動作パターンに近づけ、複雑なタスク、特に長時間実行されるタスクや多様なツールとシステム全体で調整されるタスクの信頼性とパフォーマンスを向上させます。

さらに、各製品は独特であり、型にはまることはめったにありません。Agents SDKはこの多様性をサポートするように設計されています。開発者は、ターンキーでありながら柔軟なハーネスを取得します。これにより、独自のスタック（ツール使用、メモリ、サンドボックス環境を含む）に簡単に適応させることができます。

ネイティブサンドボックス実行

更新されたAgents SDKはネイティブにサンドボックス実行をサポートしているため、エージェントはタスクに必要なファイル、ツール、依存関係を備えた制御されたコンピュータ環境で実行できます。

多くの有用なエージェントは、ファイルの読み書き、依存関係のインストール、コードの実行、ツールの安全な使用ができるワークスペースが必要です。ネイティブサンドボックスサポートにより、開発者はこの実行レイヤーをすぐに利用でき、自分たちで組み立てる必要がありません。

開発者は独自のサンドボックスを持ち込むか、以下の組み込みサポートを使用できます：

Blaxel
Cloudflare
Daytona
E2B
Modal
Runloop
Vercel

これらの環境をプロバイダー全体で移植可能にするために、SDKはエージェントのワークスペースを説明するためのManifest抽象化も導入しています。

開発者は以下を実行できます：

ローカルファイルをマウント
出力ディレクトリを定義
AWS S3、Google Cloud Storage、Azure Blob Storage、Cloudflare R2を含むストレージプロバイダーからデータを取得

これにより、開発者はローカルプロトタイプから本番環境デプロイメントまで、エージェントの環境を形成する一貫した方法を得られます。また、モデルに予測可能なワークスペースを提供します：入力を見つける場所、出力を書き込む場所、長時間実行されるタスク全体で作業を整理する方法。

セキュリティ、耐久性、スケーラビリティのためのハーネスとコンピュートの分離

エージェントシステムは、プロンプトインジェクションと流出の試みを想定して設計する必要があります。

ハーネスとコンピュートを分離することで、以下が実現されます：

セキュリティ：モデルが生成したコードが実行される環境から認証情報を保護します
耐久性：エージェントの状態が外部化されると、サンドボックスコンテナを失うことは実行を失うことを意味しません。組み込みのスナップショットと再ハイドレーション機能により、Agents SDKはエージェントの状態を新しいコンテナに復元し、元の環境が失敗または期限切れになった場合、最後のチェックポイントから続行できます
スケーラビリティ：エージェント実行は1つまたは複数のサンドボックスを使用でき、必要な場合のみサンドボックスを呼び出し、サブエージェントを分離された環境にルーティングし、より高速な実行のためにコンテナ全体で作業を並列化できます

価格と利用可能性

これらの新しいAgents SDK機能は、APIを介してすべての顧客が一般的に利用でき、トークンとツール使用に基づいた標準APIの価格を使用します。

次のステップ

Agents SDKの開発を続けるにつれて、開発者が構築できるものを拡張し続け、より多くの機能を備えたエージェントを本番環境に導入しやすくします。同時に、開発者が独自の環境にエージェントを適合させるために必要な柔軟性と制御を保持します。

新しいハーネスとサンドボックス機能は最初にPythonで起動され、TypeScriptサポートは将来のリリースで予定されています。また、コードモードとサブエージェントを含む追加のエージェント機能をPythonとTypeScriptの両方にもたらすために取り組んでいます。

さらに、より多くのサンドボックスプロバイダー、より多くの統合、および開発者が既に使用しているツールとシステムにSDKをプラグインするより多くの方法をサポートすることで、より広いエージェントエコシステムを時間とともに統合するのに役立ちたいと考えています。

The next evolution of the Agents SDK

要約

Summary

Key Points

翻訳