OpenAICloudflare Developer Platform2026/05/29 0:00

Realtime - Cloudflare's Realtime WebSocket adapter now auto-reconnects and buffers WebRTC media

要点だけを先に読めるように短く再構成したセクションです。

元記事

Quick Digest

要約

要点だけを先に読めるように短く再構成したセクションです。

openaijamodel: gpt-5-mini-2025-08-07

Realtime: WebSocketアダプタが自動再接続とWebRTCメディアのバッファに対応

Key Points

  • 自動再接続(最大5秒)
  • 音声は短いバックログで復旧
  • 映像は最新JPEGから再開

Summary

Cloudflare Realtime SFUのWebSocketアダプタ(Stream/egress)が、WebSocketエンドポイントの短時間の切断・再起動に対して自動再接続とメディアの一時バッファリングを行うようになりました。PCM音声フレームとJPEG映像フレームをWebSocketに送信する既存の挙動は変わらず、API変更は不要です。

Key Points

  • 自動再接続: エンドポイント切断時に同じURLへ最大5秒間再試行。
  • 音声: 短い有界バックログで音声ロスを低減。バックログを超えると古い音声は破棄。
  • 映像: 古いフレームを再生せず、利用可能な最新のJPEGフレームから再開。
  • 挙動はベストエフォートで、ギャップレスやExactly-once配送は保証されない。
  • 5秒以内に復帰しなければアダプタはクローズされ、再作成が必要。

Recommendations for engineers

  • WebSocketエンドポイントの短時間再起動(<5秒)を想定した設計にする。
  • 録音・トランスクリプトパイプラインは、短期的な欠損やフレームスキップを許容する実装にする。
  • 必要なら、エンドポイント側で受信側の再接続ロジックや重複排除・切断検知を用意する。
  • 長時間の耐障害性が必要なら、再作成ロジックや永続的バッファを外部に用意することを検討する。

Full Translation

翻訳

原文の流れを保ったまま読める翻訳セクションです。

openaijamodel: gpt-5-mini-2025-08-07

Realtime - CloudflareのRealtime WebSocketアダプタが自動再接続およびWebRTCメディアのバッファリングに対応

CloudflareのRealtime WebSocketアダプタが自動再接続とWebRTCメディアのバッファリングを行うようになりました

公開日: 2026-05-29

概要

Cloudflare Realtime SFUは、Cloudflareのグローバルネットワーク上で動作するWebRTC Selective Forwarding Unit(SFU)で、SFUインフラやリージョンを管理することなく、WebRTCクライアント間でライブ音声、ビデオ、データをルーティングできます。

今回、WebRTCメディアをWebSocketエンドポイントへストリームするために使用されるWebSocket adapterが、短時間のエンドポイント切断や再起動後に自動で再接続し、音声およびビデオをバッファするようになりました。

WebSocketエンドポイントへのWebRTCメディアのストリーミング

多くのチームは、Realtime SFUをバックエンドアプリケーションのメディア層(transcription、recording、note-taking、エージェント型メディア処理サービスなど)として利用しています。これらのシステムは、Durable Objects、Workers、Containers、または外部サービス上のバックエンドインフラで、SFUからのライブWebRTC音声やビデオを自分でWebRTCクライアントを実行せずに消費する必要があることが多いです。

WebSocket adapterはこのギャップを埋め、SFUから標準的なWebSocketエンドポイントへアプリケーションで扱えるペイロード(PCM audio framesやJPEG video frames)としてWebRTCメディアをストリームします。

変更点

  • Stream mode (egress)でSFUから自分のWebSocketエンドポイントへライブ音声やビデオを送る場合、SFUが短時間のエンドポイント切断や再起動後に自動的に再接続するようになりました。
    • これは、録音、文字起こし、ライブ解析などの長時間稼働するメディアパイプラインで、WebSocketエンドポイントが短時間再起動する可能性がある場合に特に役立ちます。
  • 以前は、WebSocketエンドポイントの短時間の切断によってアダプタが閉じられ、メディアが再開する前にアプリケーション側でアダプタを再作成する必要がありました。
  • 現在はAPIの変更なしに、SFUが同じエンドポイントへ最大5秒間リトライします。エンドポイントがそのウィンドウ内に復帰すれば、音声とビデオの配信は自動的に再開します。
  • 再接続の挙動には live-first media buffering(ライブファーストメディアバッファリング)も含まれており、短時間の中断でも古いビデオを再生せずにメディア損失を軽減します。

再接続時の挙動

  • 音声: 可聴損失を低減するために短い有界バックログ(backlog)を使用します。中断がバックログでカバーできる時間を超えると、古い音声は破棄される可能性があります。
  • ビデオ: 古いフレームを再生するのではなく、利用可能な最新のJPEGフレームから再開します。
  • 回復はベストエフォートで行われ、ギャップレスやExactly-once deliveryを保証するものではありません。
  • エンドポイントが5秒の再接続ウィンドウを超えて利用不可のままの場合、アダプタはクローズされ、再作成が必要です。

補足 / 参考

  • WebSocket adapter
  • Automatic reconnection for streaming
  • Get started with Realtime SFU
  • Realtime SFU example architecture
  • Realtime vs Regular SFUs
  • Global SFU Network Visualization ↗

このアップデートにより、長時間稼働するメディアパイプラインにおける短時間のエンドポイント障害による中断が大幅に軽減されます。