OpenAIOpenAI News2026/05/15 0:00

Databricks brings GPT-5.5 to enterprise agent workflows

要点だけを先に読めるように短く再構成したセクションです。

元記事

Quick Digest

要約

要点だけを先に読めるように短く再構成したセクションです。

openaijamodel: gpt-5-mini-2025-08-07

Databricks、GPT-5.5を企業エージェントワークフローへ

Key Points

  • OfficeQA ProでSOTA
  • 解析誤りを46%削減
  • AI Unity Gatewayで提供

Summary

DatabricksはGPT-5.5をエージェントワークフロー向けに提供開始しました。GPT-5.5はOfficeQA Proで初めて50%を超える精度を達成し、GPT-5.4比でエラーを46%削減。主に古い書類やスキャンPDFの解析精度とマルチステップのオーケストレーション改善で効果を発揮します。

Key Points

  • OfficeQA ProでSOTA:50%超の精度を達成
  • GPT-5.4比でエラーを46%削減(agent-harness設定)
  • スキャン文書・レガシーファイルのパース精度が大幅向上
  • マルチステップ検索の無駄な走行が減り、文脈取得が安定
  • 提供経路:AI Unity Gateway経由でAgentBricksとAgent Supervisor APIに統合可能
  • 既存のエージェントオーケストレーションに置き換えやすい

Action for engineers

  • OfficeQA Proや自社のパース重視ワークフローでベンチマークを実行して効果を検証する
  • AI Unity Gateway経由でまずはステージング環境に導入し、AgentBricks/Agent Supervisor APIで統合テストを行う
  • 特にスキャンPDFや長文コンテキストでの抽出エラーのモニタリングを強化する
  • 不要な検索や余分なサブタスクが発生するケースをログで比較し、オーケストレーションのチューニングを実施する

Reference

  • 公開日: 2026-05-15
  • 主要製品:GPT-5.5、AI Unity Gateway、AgentBricks、Agent Supervisor API

Full Translation

翻訳

原文の流れを保ったまま読める翻訳セクションです。

openaijamodel: gpt-5-mini-2025-08-07

Databricks、GPT-5.5を企業向けエージェントワークフローに導入

Databricks、GPT-5.5を企業向けエージェントワークフローに導入

公開日: 2026-05-15

Databricksは、複雑なエンタープライズ文書タスク向けのベンチマーク「OfficeQA Pro」で新たな最先端性能を達成したGPT-5.5を、顧客のエージェントワークフロー向けに提供開始しました。

  • 企業規模: エンタープライズ
  • 地域: 北米
  • 業界: Technology
  • 製品: Codex
  • OfficeQA Proベンチマークでの精度: 50%(最先端)
  • GPT-5.4に対する誤り削減: 46%

概要

OfficeQA Proは、スキャンされたPDF、レガシー形式のファイル、長文コンテキストを含むワークフローにおけるパース、検索(retrieval)、および根拠に基づく推論(grounded reasoning)を評価するベンチマークで、実運用のエージェントシステムが破綻しやすいタスク群を対象としています。エージェントハーネス設定(agent-harness setting)において、GPT-5.5はGPT-5.4と比べて誤りを46%削減し、OfficeQA Proで初めて50%を超える精度を達成しました。

“Codex with 5.5 is now state-of-the-art amongst all the agents and models out there.” — Arnav Singhvi, Research Engineer

OfficeQA ProでのSOTA性能

OfficeQA Proには、多数のスキャン文書やレガシー文書が含まれており、パース段階での小さな抜けや誤りが後続のワークフロー全体に波及することがあります。Singhviは次のように説明します。「ある桁や数字を抽出できないと、エージェントが扱う情報の全体的な軌跡が変わってしまう」。

Databricksは、GPT-5.5による最も大きな改善がパースに依存するワークフローで見られたと報告しています。Singhviは「5.4のような以前のモデルはすべての桁を正確にパースできないことがありましたが、5.5は古い文書やスキャンPDFのパースにおいてステップ関数的な向上を示しているようだ」と述べています。

また、マルチステップタスクにおけるオーケストレーションの改善も確認されました。Singhviは「5.4では不要な検索の寄り道をしてしまうことがあり、それが非常に非効率な軌跡を生んでいたことがあった。GPT-5.5は関連するコンテキストの取得と複雑なワークフローの完遂においてより信頼性が高い」と述べています。

プロダクションワークフローへの組み込み

Databricksは現在、GPT-5.5をAI Unity Gatewayを通じて提供しており、顧客はAgentBricksやAgent Supervisor APIで構築されたワークフロー内でこのモデルを利用できます。これらのシステムでは、GPT-5.5が専門エージェント群の間でパース、検索、実行をオーケストレーションします。

Singhviは「多くの顧客がカスタムエージェントワークフローにAgentBricksやAgent Supervisor APIを使うようになるだろう。これらのワークフローをGPT-5.5が監督するのは非常にエキサイティングだ」と述べています。

“GPT-5.5 has been great in terms of knowledge lift. It’s a step size function change in terms of doing knowledge work for us.” — Arnav Singhvi, Research Engineer

興味がある企業は営業窓口(Contact sales)にお問い合わせください。

その他

世界中で100万以上の企業がOpenAIを活用して有意義な成果を上げています。

関連記事

  • A new personal finance experience in ChatGPT — Product — May 15, 2026
  • Sea's View on the Future of Agentic Software Development with Codex — May 14, 2026
  • Work with Codex from anywhere — Product — May 14, 2026