OpenAICloudflare Developer PlatformMar 6, 2026, 12:00 AM

Workers AI, Realtime - Real-time transcription in RealtimeKit now supports 10 languages with regional variants

A condensed section focused on the key takeaways first.

Original Post

Quick Digest

Summary

A condensed section focused on the key takeaways first.

openaienmodel: gpt-5-mini-2025-08-07

Workers AI, Realtime - Real-time transcription in RealtimeKit now supports 10 languages with regional variants

Key Points

  • 10 languages + regional variants
  • Set ai_config.transcription.language at meeting creation
  • Runs Nova-3 on Workers AI via AI Gateway — lower latency

Summary

RealtimeKit now provides real-time transcription powered by Deepgram Nova-3 running on Workers AI. Audio is routed through AI Gateway to Nova-3 on Cloudflare’s network for end-to-end processing, reducing latency versus external speech-to-text services. You can set the transcription language when creating a meeting; use multi for automatic multilingual detection.

Key Points

  • Supported languages: English, Spanish, French, German, Hindi, Russian, Portuguese, Japanese, Italian, Dutch.

  • Regional variants available (examples): en-AU, en-GB, en-IN, en-NZ, es-419, fr-CA, de-CH, pt-BR, pt-PT.

  • Set language in the meeting create payload (example):

    { "ai_config": { "transcription": { "language": "fr" } } }

  • Use multi to enable automatic multilingual detection.

  • Ideal for voice agents and real-time translation workflows — no extra external STT services or routing logic required.

Actionable guidance

  • When creating meetings, explicitly set ai_config.transcription.language to match caller language or use multi for detection.
  • Expect lower latency when compared to routing audio off-network since transcription runs on Workers AI via AI Gateway.
  • Verify regional variant codes for locale-specific transcription quality when required.

Full Translation

Translations

A translation section that keeps the flow of the original article.

openaijamodel: gpt-5-mini-2025-08-07

Workers AI、Realtime — RealtimeKitのリアルタイム文字起こしが地域バリアント対応で10言語をサポート

RealtimeKitのリアルタイム文字起こしが地域バリアント対応で10言語をサポート

RealtimeKitのリアルタイム文字起こしが、Workers AI上で動作するDeepgram Nova-3によって10言語(地域バリアント含む)をサポートするようになりました。ミーティング中、参加者の音声はAI Gatewayを介してWorkers AI上のNova-3にルーティングされるため、外部の音声認識サービスを経由するよりもレイテンシが低く、Cloudflareのネットワーク内でエンドツーエンドの文字起こしが行われます。

設定方法

ミーティング作成時にai_config.transcription.languageで言語を設定します:

{ "ai_config": { "transcription": { "language": "fr" } } }

自動マルチリンガル検出を使う場合はmultiを指定してください。

サポート言語と地域バリアント

  • 英語(English)
    • 地域バリアント: en-AU, en-GB, en-IN, en-NZ
  • スペイン語(Spanish)
    • 地域バリアント: es-419
  • フランス語(French)
    • 地域バリアント: fr-CA
  • ドイツ語(German)
    • 地域バリアント: de-CH
  • ポルトガル語(Portuguese)
    • 地域バリアント: pt-BR, pt-PT
  • ヒンディー語(Hindi)
  • ロシア語(Russian)
  • 日本語(Japanese)
  • イタリア語(Italian)
  • オランダ語(Dutch)

利点

  • 音声はCloudflareネットワーク内で処理されるため、外部サービス経由より低レイテンシでの文字起こしが可能です。
  • ボイスエージェントやリアルタイム翻訳ワークフローを構築する場合、発信者の言語をネイティブに文字起こしできるため、追加のサービスや複雑なルーティングロジックは不要です。

参考リソース

  • Transcription docs
  • Nova-3 model page
  • Workers AI
  • AI Gateway
  • Resources
  • API

(この機能はWorkers AI上でDeepgram Nova-3を利用して動作します。)