OpenAIOpenAI NewsMay 15, 2026, 12:00 AM

Databricks brings GPT-5.5 to enterprise agent workflows

A condensed section focused on the key takeaways first.

Original Post

Quick Digest

Summary

A condensed section focused on the key takeaways first.

openaienmodel: gpt-5-mini-2025-08-07

Databricks brings GPT-5.5 to enterprise agent workflows

Key Points

  • 50% accuracy on OfficeQA Pro
  • 46% error reduction vs GPT-5.4
  • Available via AI Unity Gateway for AgentBricks

Summary

Databricks is making GPT-5.5 available for enterprise agent workflows after the model set a new state of the art on OfficeQA Pro. GPT-5.5 achieved 50% accuracy on OfficeQA Pro and reduced errors by 46% versus GPT-5.4, with the largest gains in parsing scanned and legacy documents, long-context retrieval, and multi-step orchestration. The model is accessible through AI Unity Gateway and integrates with AgentBricks and the Agent Supervisor API for production agent pipelines.

Key Points

  • Performance: 50% accuracy on OfficeQA Pro; 46% reduction in errors vs GPT-5.4.
  • Improvements concentrated on parsing extraction (scanned PDFs, legacy files), retrieval relevance, and orchestration across multi-step workflows.
  • Production access: available via AI Unity Gateway; recommended usage inside AgentBricks workflows and supervised by the Agent Supervisor API.

Recommended actions for engineers

  • Evaluate GPT-5.5 on your parsing-heavy benchmarks (scanned PDFs, legacy formats) and compare extraction error rates to GPT-5.4.
  • Run controlled A/B experiments and staged rollouts; monitor parsing/extraction accuracy, retrieval relevance, and end-to-end workflow failure modes.
  • Use the Agent Supervisor API patterns (supervision, fallbacks, and validation hooks) to catch downstream cascades from small parsing errors.
  • Validate long-context behavior and orchestration efficiency on representative multi-step tasks before full production rollout.

Full Translation

Translations

A translation section that keeps the flow of the original article.

openaijamodel: gpt-5-mini-2025-08-07

Databricks、GPT-5.5を企業向けエージェントワークフローに導入

Databricks、GPT-5.5を企業向けエージェントワークフローに導入

公開日: 2026-05-15

Databricksは、複雑なエンタープライズ文書タスク向けのベンチマーク「OfficeQA Pro」で新たな最先端性能を達成したGPT-5.5を、顧客のエージェントワークフロー向けに提供開始しました。

  • 企業規模: エンタープライズ
  • 地域: 北米
  • 業界: Technology
  • 製品: Codex
  • OfficeQA Proベンチマークでの精度: 50%(最先端)
  • GPT-5.4に対する誤り削減: 46%

概要

OfficeQA Proは、スキャンされたPDF、レガシー形式のファイル、長文コンテキストを含むワークフローにおけるパース、検索(retrieval)、および根拠に基づく推論(grounded reasoning)を評価するベンチマークで、実運用のエージェントシステムが破綻しやすいタスク群を対象としています。エージェントハーネス設定(agent-harness setting)において、GPT-5.5はGPT-5.4と比べて誤りを46%削減し、OfficeQA Proで初めて50%を超える精度を達成しました。

“Codex with 5.5 is now state-of-the-art amongst all the agents and models out there.” — Arnav Singhvi, Research Engineer

OfficeQA ProでのSOTA性能

OfficeQA Proには、多数のスキャン文書やレガシー文書が含まれており、パース段階での小さな抜けや誤りが後続のワークフロー全体に波及することがあります。Singhviは次のように説明します。「ある桁や数字を抽出できないと、エージェントが扱う情報の全体的な軌跡が変わってしまう」。

Databricksは、GPT-5.5による最も大きな改善がパースに依存するワークフローで見られたと報告しています。Singhviは「5.4のような以前のモデルはすべての桁を正確にパースできないことがありましたが、5.5は古い文書やスキャンPDFのパースにおいてステップ関数的な向上を示しているようだ」と述べています。

また、マルチステップタスクにおけるオーケストレーションの改善も確認されました。Singhviは「5.4では不要な検索の寄り道をしてしまうことがあり、それが非常に非効率な軌跡を生んでいたことがあった。GPT-5.5は関連するコンテキストの取得と複雑なワークフローの完遂においてより信頼性が高い」と述べています。

プロダクションワークフローへの組み込み

Databricksは現在、GPT-5.5をAI Unity Gatewayを通じて提供しており、顧客はAgentBricksやAgent Supervisor APIで構築されたワークフロー内でこのモデルを利用できます。これらのシステムでは、GPT-5.5が専門エージェント群の間でパース、検索、実行をオーケストレーションします。

Singhviは「多くの顧客がカスタムエージェントワークフローにAgentBricksやAgent Supervisor APIを使うようになるだろう。これらのワークフローをGPT-5.5が監督するのは非常にエキサイティングだ」と述べています。

“GPT-5.5 has been great in terms of knowledge lift. It’s a step size function change in terms of doing knowledge work for us.” — Arnav Singhvi, Research Engineer

興味がある企業は営業窓口(Contact sales)にお問い合わせください。

その他

世界中で100万以上の企業がOpenAIを活用して有意義な成果を上げています。

関連記事

  • A new personal finance experience in ChatGPT — Product — May 15, 2026
  • Sea's View on the Future of Agentic Software Development with Codex — May 14, 2026
  • Work with Codex from anywhere — Product — May 14, 2026