RealtimeKitのリアルタイム音声転写が10言語と地域バリアントに対応
Key Points
- RealtimeKitが10言語の音声転写に対応
- Deepgram Nova-3をWorkers AIで実行
- エンドツーエンドでレイテンシを削減
Summary
RealtimeKitのリアルタイム音声転写機能が、Workers AI上で動作するDeepgram Nova-3により10言語と地域バリアントに対応しました。会議中の参加者音声はAI Gateway経由でWorkers AI上のNova-3に送信され、Cloudflareネットワーク内でエンドツーエンドの転写処理が行われるため、外部音声認識サービスと比較してレイテンシが削減されます。
Key Points
- 対応言語: 英語、スペイン語、フランス語、ドイツ語、ヒンディー語、ロシア語、ポルトガル語、日本語、イタリア語、オランダ語
- 地域バリアント:
en-AU、en-GB、en-IN、es-419、fr-CA、pt-BRなど多数対応 - 自動多言語検出:
multi設定で自動的に言語を検出可能 - 設定方法: 会議作成時に
ai_config.transcription.languageで言語を指定 - 用途: 音声エージェントやリアルタイム翻訳ワークフローで、発話者の言語でネイティブに転写可能