OpenAIOpenAI NewsMar 11, 2026, 11:00 AM

Wayfair boosts catalog accuracy and support speed with OpenAI

A condensed section focused on the key takeaways first.

Original Post

Quick Digest

Summary

A condensed section focused on the key takeaways first.

openaienmodel: gpt-5-mini-2025-08-07

Wayfair boosts catalog accuracy and support speed with OpenAI

Key Points

  • Tag-agnostic OpenAI model for catalog attributes
  • Wilma automates triage and 41,000 tickets/month
  • 2.5M product tags corrected; 70x attribute expansion

Summary

Wayfair embedded OpenAI models into its catalog and supplier support workflows to reduce manual work, improve product attribute quality, and accelerate ticket resolution. The company built a tag-agnostic architecture (a single model plus a "definition agent") that ingests internal and web definitions and product data to classify attributes across product classes. In supplier support, an agentic system named Wilma handles triage, co-pilot, and autopilot flows—significantly increasing throughput and cutting turnaround times.

Key Points

  • Architecture: single, tag-agnostic OpenAI model with a "definition agent" that produces contextual meanings for tags and consumes aggregated product data. This replaced costly bespoke models per tag.
  • Deployment pattern: staged rollout with human audits and supplier validation; automated overwrites at high confidence, supplier confirmation for high-risk tags; alignment-rate monitoring to move from assist to semi-autonomous modes.
  • Measured impact: corrected ~2.5M product tags across >1M products; scaled attribute coverage ~70x year-over-year; automated ~41,000 supplier tickets/month and reduced time-to-resolution across workflows.
  • Wilma details: ticket triage reads intent, fills context from internal databases, routes to owners; co-pilots synthesize case history and draft responses; prototype-to-production for triage shipped in ~1 month.
  • Engineering takeaways: centralize semantics with a definition layer, train assistants on historical success signals, integrate models with your data ecosystem for context, and enforce confidence thresholds + human-in-the-loop audits for high-risk changes.
  • Metrics & monitoring: track alignment rate (model vs. human decision), A/B test ecommerce metrics (impressions, clicks, page rank), ticket throughput, and reopen rates to validate impact.

Practical next steps for engineers

  • Build a reusable semantic layer (definition agent) to avoid per-tag models.
  • Log and monitor model confidence and define alignment thresholds to gate automation.
  • Keep human audits and supplier sign-off for high-risk or low-confidence changes while expanding autopilot scopes gradually.
  • Use historical case data to train co-pilot/autopilot behaviors and measure alignment before enabling auto-actions.

Full Translation

Translations

A translation section that keeps the flow of the original article.

openaijamodel: gpt-5-mini-2025-08-07

Wayfair、OpenAIを導入しカタログ精度とサポート速度を向上

概要

2026年3月11日 — Wayfairは、サプライヤーサポートとカタログシステムにOpenAIモデルを組み込むことで、データ精度を改善し、数百万点におよぶ複雑な小売ワークフローを自動化しました。2024年の小規模な検証から始まり、現在は手作業を削減し意思決定を加速、数百万点の製品にわたるデータ品質を向上させる本番システムへと発展しています。

カタログ品質をスケールで解決する

Wayfairのカタログチームは、ほぼ1,000のカテゴリにまたがり数千万点の製品を管理しています。色、素材、サイズ、特定機能などの一貫した正確な製品属性タグは、検索、レコメンデーション、マーチャンダイジングに不可欠です。

  • Jessica D'Arcy(Associate Director of Catalog Merchandising): 「データ品質が高いほど顧客からの信頼が高まり、購買の正確さを支援して返品などの高コストな下流問題を減らせます。」

以前は、不適切なタグは主にサプライヤーや顧客からの報告に依存しており、手作業で追いつけませんでした。個別タグ向けのカスタムAIモデルは効果的でしたが、構築・保守コストが高く、47,000のタグを扱うにはスケールしませんでした。

再利用可能なAIアーキテクチャの構築

Wayfairはワンモデル上にタグ非依存のシステムを構築しました。"definition agent"がウェブと社内定義を取り込み、各タグの文脈的意味を生成します。

  • Carolyn Phillips(staff machine learning scientist): 「ボトルネックはモデル性能ではなく、各タグの意味を定義・符号化するために必要な人的時間でした。」

この文脈とWayfairのデータエコシステムから集約した製品データを組み合わせることで、商品クラス横断で属性を分類できるフレームワークが実現しました。現在、属性カバレッジの追加速度は1年前に比べて70倍になっており、本番環境では100万点以上の製品で稼働しています。

最初の波で属性が強化された製品は、顧客ジャーニーへの影響を測定できる期間稼働しており、属性の完全性向上はSEOやPLAパフォーマンス、製品発見に顕著に表れると報告されています。コントロールされたA/Bテストでは、処理群でインプレッション、クリック、ページランクが有意に増加しました。

Wayfairはモデルにデータ修正を丸投げするわけではありません。高い信頼度が得られた場合は自動システムが直接コンテンツを書き換え、サプライヤーへ通知します。一方で基準を満たさない、または高リスクと判断されるタグについては、変更前にまずサプライヤーの確認を取ります。

また、アソシエイトがサンプルを物理的に検査してモデル出力を検証するハンズオン監査プロセスを構築し、サプライヤーと協働して変更を検証する構成を維持しています。

Wilmaによるサプライヤーサポートワークフローの再考

Wayfairは何万ものサプライヤーと連携してカタログをサポートしています。従来、サプライヤーからのチケットはすべて人が確認し、意図を手作業で把握して適切な内部担当にルーティングしていました。これには時間がかかりミスも発生しました。

  • Graham Ganssle(supplier support and operations): 「サプライヤー要求は単純ではありません。数百種類の問題タイプがあり、1人のアソシエイトがすべてを習得するのは現実的ではない。」

WayfairはWilmaという製品にエージェンシックな機能を追加し、AIでこれらのワークフローを拡張しました。実稼働の最初の機能の1つが、OpenAIモデルによるチケットトリアージ(振り分け)です。システムは受信リクエストを読み、欠落している文脈を補完し、チケットを適切なチームにルーティングします。

Wilmaは迅速に導入できるよう設計され、すでにOpenAI APIと統合されたシステム上でプロトタイプから本番へ約1か月で移行しました。

  • Ganssle: 「Wilmaはアソシエイトにレバレッジを与えます。チケットを読み、意図を識別し、データベースから文脈を補完し、必要ならサプライヤーに再確認を行い、問題を正しい方向に導きます。」

ルーティングにとどまらず、特定の解決チーム向けに十数のエージェンシックAIフローを展開しています。例として、Replacement Part Operationsチーム向けのコパイロットは複雑なケース履歴を読み取り、次のステップを提案し、アソシエイトがレビューする下書き応答を提示します。これらのアシスタントは履歴データで学習しており、文脈内での成功パターンを習得します。

モデルはジャーニー全体の文脈を合成でき、個々のアソシエイトが単独で行うのが難しい可視性を提供します。これが顧客とサプライヤー双方の満足度向上に寄与しています。

WayfairはAIの提案が人の最終判断と一致する頻度を「alignment rate」と呼ばれる指標で追跡しています。各チーム内でalignmentが継続的に所定の閾値に達した場合、ワークフローは支援型("co-pilot")から半自律型("autopilot")へと移行できます。この段階的アプローチはローンチ時の信頼構築と品質管理を可能にします。

「トリアージが最初に正しくルーティングされなければ、その後のすべてが遅くなる。トリアージは基盤だ。」 — Graham Ganssle

チーム横断での測定可能なインパクト

WayfairはOpenAIモデル導入後の定量的な改善を報告しています。

  • カタログ面:

    • 100万点超の目立つ購入される製品群で2.5Mのプロダクトタグを修正
    • 今後6か月でこのインパクトを4倍にする見込み
  • サプライヤーサポート面:

    • 月間41,000件のチケットを自動化(ワークフローによっては最大70%)
    • ルーチン作業を削減し応答時間を短縮、サプライヤー満足度を大幅に向上
    • チケットの再オープン率を低下

運用上の主な成果:

  • 複雑なサプライヤーチケットのより迅速なルーティングと解決
  • サプライヤー満足度の向上
  • 手動データ入力や分類作業の削減
  • 数百トピックの専門知識を求めずに幅広い問題をカバー
  • 出版前のカタログ属性に対する自信の向上

また、Wayfairは約12,000人の従業員向けに1,200席以上のChatGPT Enterpriseを展開し、アドホックなタスク、社内の問題解決、生成モデルの実験を支援しています。

OpenAIとの長期的な協業

Wayfairは機械学習への投資とLLMプロバイダとの協業の歴史が長く、特にマルチモーダルの進展により構築可能なものが拡大しています。ホームリテールでは製品が視覚的でスタイル要素や主観が強いため、これは重要です。

  • Carolyn Phillips: 「従来のアルゴリズムは厳密に定義されたデータセットを必要としました。これらのモデルは曖昧さや文脈を扱えるため、これまでスケールしなかった問題に取り組めます。」

WayfairとOpenAIの関係は、初期パイロットから本番サービス、モデル選定、展開のベストプラクティス、社内導入に至る戦略的パートナーシップへと成長しました。

  • Fiona Tan(CTO): 「最も価値があるのは思想的なパートナーシップです。モデルへのアクセスだけでなく、新しいユースケースを共に検討し迅速に動けることです。」

従業員のChatGPT Enterpriseへの需要は強く、チームは業務を加速する実用的なツールとして期待しています。顧客の期待も速く変化しており、日常でAIに慣れた買い手は、サイト上での閲覧・比較・購買において同様の能力を期待し始めています。

  • Fiona Tan: 「家庭では顧客が探しているものを正確に言語化できないことが多い。自然言語およびマルチモーダルシステムはそのギャップを埋めます。」

Wayfairの目標は、人間の専門性を補完しつつ社内能力をスケールすることです。

「AIがショッピングジャーニーの一部となる世界を構築しています—サイト上でも、サポートでも、会話型インターフェースでも。」 — Fiona Tan

まとめ

WayfairはOpenAIモデルをコアワークフローに組み込むことで、カタログ属性の精度向上とサプライヤーサポートの速度改善を実現しました。段階的かつ検証可能な導入を通じて信頼を構築し、今後さらに規模を拡大する計画です。


さらに読む: Rakuten fixes issues twice as fast with Codex API (Mar 11, 2026) | How Descript enables multilingual video dubbing at scale (Mar 6, 2026) | How Balyasny Asset Management built an AI research engine for investing (Mar 6, 2026)