ClaudeCloudflare Developer PlatformMar 6, 2026, 12:00 AM

Workers AI, Realtime - Real-time transcription in RealtimeKit now supports 10 languages with regional variants

A condensed section focused on the key takeaways first.

Original Post

Quick Digest

Summary

A condensed section focused on the key takeaways first.

claudeenmodel: claude-sonnet-4-20250514

RealtimeKit Adds Multi-Language Transcription Support with Deepgram Nova-3

Key Points

  • 10 languages with regional variants now supported
  • End-to-end processing on Cloudflare network reduces latency
  • Automatic multilingual detection available

Summary

RealtimeKit now supports real-time transcription in 10 languages with regional variants, powered by Deepgram Nova-3 running on Workers AI. The transcription runs entirely on Cloudflare's network, reducing latency compared to external speech-to-text services.

Key Points

  • Language Support: 10 languages including English, Spanish, French, German, Hindi, Russian, Portuguese, Japanese, Italian, and Dutch
  • Regional Variants: Supports specific regional codes like en-AU, en-GB, es-419, fr-CA, de-CH, pt-BR, etc.
  • Automatic Detection: Use multi for automatic multilingual detection
  • Configuration: Set language via ai_config.transcription.language when creating meetings
  • End-to-End Processing: Audio routing through AI Gateway to Nova-3 on Workers AI for reduced latency
  • Use Cases: Ideal for voice agents and real-time translation workflows without additional services

Full Translation

Translations

A translation section that keeps the flow of the original article.

claudejamodel: claude-sonnet-4-20250514

Workers AI、Realtime - RealtimeKitのリアルタイム音声認識が地域バリアントを含む10言語をサポート

RealtimeKitのリアルタイム音声認識が地域バリアントを含む10言語をサポート

2026年3月6日

RealtimeKitのリアルタイム音声認識が、Workers AI上で動作するDeepgram Nova-3を活用して、地域バリアントを含む10言語をサポートするようになりました。

会議中、参加者の音声はAI Gatewayを通じてWorkers AI上のNova-3にルーティングされるため、音声認識処理がCloudflareのネットワーク上でエンドツーエンドで実行され、外部の音声テキスト変換サービスを経由する場合と比較してレイテンシが削減されます。

設定方法

会議作成時にai_config.transcription.languageで言語を設定します:

{
  "ai_config": {
    "transcription": {
      "language": "fr"
    }
  }
}

サポート言語

サポートされる言語には以下が含まれます:

  • 英語
  • スペイン語
  • フランス語
  • ドイツ語
  • ヒンディー語
  • ロシア語
  • ポルトガル語
  • 日本語
  • イタリア語
  • オランダ語

地域バリアントとしてen-AUen-GBen-INen-NZes-419fr-CAde-CHpt-BRpt-PTなどが利用可能です。

自動多言語検出にはmultiを使用してください。

活用例

音声エージェントやリアルタイム翻訳ワークフローを構築している場合、エージェントは追加のサービスやルーティングロジックを必要とせず、発信者の言語でネイティブに音声認識を行うことができるようになりました。

関連リソース