Agents SDKの次の進化
公開日:2026-04-15
更新された Agents SDK は、ファイルの検査、コマンド実行、コード編集、長期にわたるタスクの遂行を、管理されたサンドボックス環境内で安全に行えるエージェントの構築を支援します。
私たちは、開発者がすぐに使い始められ、OpenAI モデル向けに適切に設計された標準化されたインフラを提供する新機能を Agents SDK に導入します。これには、ファイルやツールを横断してエージェントが動作できるモデルネイティブなハーネスと、安全に作業を実行するためのネイティブなサンドボックス実行が含まれます。例えば、開発者はエージェントに制御されたワークスペース、明確な指示、および証拠を検査するためのツールを与えることができます:
import asyncio
import tempfile
from pathlib import Path
from agents import Runner
from agents.run import RunConfig
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
from agents.sandbox.entries import LocalDir
from agents.sandbox.sandboxes import UnixLocalSandboxClient
async def main() -> None:
with tempfile.TemporaryDirectory() as tmp:
dataroom = Path(tmp) / "dataroom"
dataroom.mkdir()
(dataroom / "metrics.md").write_text(
"""# Annual metrics
| Year | Revenue | Operating income | Operating cash flow |
| --- | ---: | ---: | ---: |
| FY2025 | $124.3M | $18.6M | $24.1M |
| FY2024 | $98.7M | $12.4M | $17.9M |
""",
encoding="utf-8",
)
agent = SandboxAgent(
name="Dataroom Analyst",
model="gpt-5.4",
instructions="Answer using only files in data/. Cite source filenames.",
default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
)
result = await Runner.run(
agent,
"Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
run_config=RunConfig(
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
),
)
print(result.final_output)
if __name__ == "__main__":
asyncio.run(main())
開発者が有用なエージェントを構築するには、優れたモデルだけでなく、エージェントがファイルを検査し、コマンドを実行し、コードを書き、複数ステップにわたって作業し続けられるようにするシステムが必要です。既存のシステムにはトレードオフがあり、プロトタイプから本番へ移行する際に制約が出ることがあります。たとえば、モデル非依存のフレームワークは柔軟ですが最先端モデルの能力を完全に活用できないことがあり、モデル提供者の SDK はモデルに近い一方でハーネスの可視性が十分でない場合があり、マネージドなエージェント API は導入を簡素化する反面、エージェントの実行場所や機密データへのアクセスを制限することがあります。
以下は、今回の新しい SDK を試用したお客様の声の一部です:
- Oscar Health
- Actively
- LexisNexis
- FurtherAI
- Thomson Reuters
- Zoom
- Tomoro AI
"更新された Agents SDK により、従来のアプローチでは十分に信頼できなかった重要な臨床記録ワークフローを自動化するための本番適用が可能になりました。私たちにとっての違いは、正しいメタデータを抽出することだけでなく、長く複雑な記録における各診療の境界を正確に理解することでした。その結果、各来院で何が起きているかをより迅速に把握でき、メンバーのケアニーズに対応し、体験を改善することができます。" — Rachael Burns, Staff Engineer & AI Tech Lead, Oscar Health
エージェントループのためのより高機能なハーネス
今回のリリースにより、ドキュメント、ファイル、およびシステムと連携するエージェント向けの Agents SDK ハーネスはより高機能になりました。主な強化点は以下のとおりです:
- 設定可能なメモリ
- サンドボックス対応のオーケストレーション
- Codex ライクなファイルシステムツール
- フロンティアエージェントシステムで一般化しつつあるプリミティブとの標準化された統合
これらのプリミティブには、MCP 経由のツール使用、skills による段階的開示、AGENTS.md を使ったカスタム指示、shell ツールによるコード実行、apply patch ツールによるファイル編集などが含まれます。ハーネスは今後も新しいエージェンティックなパターンとプリミティブを取り込み続けるため、開発者はコアインフラの更新に時間を割くことなく、ドメイン固有のロジックに集中できます。
また、ハーネスは実行をモデルの自然な動作パターンに合わせることで、フロンティアモデルの能力をより引き出します。これにより、特に長期実行や多様なツール・システムにまたがる協調作業において、信頼性と性能が向上します。
さらに、各プロダクトは固有で一律の型に収まらないことを踏まえ、Agents SDK は柔軟性を維持しつつターンキーなハーネスを提供するよう設計されています。ツール使用、メモリ、サンドボックス環境などを含め、自社スタックに合わせて容易に適応できます。
ネイティブなサンドボックス実行
更新された Agents SDK はサンドボックス実行をネイティブにサポートし、エージェントがタスクに必要なファイル、ツール、依存関係を持つ管理されたコンピュータ環境で動作できるようにします。多くの有用なエージェントは、ファイルの読み書き、依存関係のインストール、コード実行、ツールの安全な利用が可能なワークスペースを必要とします。ネイティブなサンドボックスサポートにより、開発者はこれらの実行レイヤーを自前で組み合わせる代わりに、SDK からそのまま利用できます。
開発者は独自のサンドボックスを持ち込むことも、Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop、Vercel に対する組み込みサポートを利用することもできます。プロバイダ間で環境を移植可能にするため、SDK はエージェントのワークスペースを記述する Manifest 抽象を導入しました。開発者はローカルファイルをマウントしたり、出力ディレクトリを定義したり、AWS S3、Google Cloud Storage、Azure Blob Storage、Cloudflare R2 などのストレージからデータを取り込んだりできます。
これにより、ローカルのプロトタイプから本番デプロイまで、一貫した方法でエージェントの環境を形作ることができ、モデルにとって予測可能なワークスペース(入力の場所、出力の書き込み場所、長期実行タスクにおける作業の整理方法)を提供します。
セキュリティ、耐久性、スケールのためのハーネスとコンピュートの分離
エージェントシステムはプロンプトインジェクションやデータ流出の試みに備えて設計されるべきです。ハーネスとコンピュートを分離することで、モデル生成コードが実行される環境に資格情報が残らないようにできます。また、耐久性のある実行が可能になります。エージェントの状態を外部化すると、サンドボックスコンテナが失われても実行が失われるわけではありません。
組み込みのスナップショットとリハイドレーションにより、Agents SDK はエージェントの状態を新しいコンテナに復元し、元の環境が失敗または期限切れになった場合でも最後のチェックポイントから続行できます。さらに、エージェントはスケールしやすくなります。単一のサンドボックスまたは複数のサンドボックスを利用し、必要なときにのみサンドボックスを呼び出したり、サブエージェントを分離環境にルーティングしたり、コンテナ間で作業を並列化して高速化したりできます。
価格と利用可能性
これらの新しい Agents SDK 機能は、API を通じてすべての顧客に一般利用可能(GA)で提供され、トークンとツール使用に基づく標準的な API 料金が適用されます。
今後の予定
Agents SDK の開発を続ける中で、より多くの能力を持つエージェントを、より少ないカスタムインフラで本番導入できるようにする機能拡張を続けます。今回のハーネスとサンドボックス機能はまず Python で公開され、TypeScript サポートは今後のリリースで予定されています。さらに、code mode や subagents を含む追加のエージェント機能を Python と TypeScript の両方に提供する作業を進めています。
また、時間をかけてより多くのサンドボックスプロバイダや統合をサポートし、開発者が既に使用しているツールやシステムに SDK を接続するための手段を増やすことで、より幅広いエージェントエコシステムの連携を支援していきます。
著者: OpenAI