TerraformでPipelinesとR2 Data Catalogが利用可能に
Key Points
- TerraformでPipelines管理可能
- 4つの新リソースを追加
- provider v5.19.0でサポート
Summary
Cloudflare Terraformプロバイダ v5.19.0で、PipelinesとR2 Data Catalogの管理が可能になりました。これにより、ストリーム(HTTP/Worker)、SQLパイプライン、R2へのシンク、R2のData Catalog設定をインフラとしてコードで定義できます。エンドツーエンドの例やR2バケット作成、スコープ付きAPIトークンの発行手順はPipelines Terraformドキュメントを参照してください。
Key Points
- 追加されたリソース:
cloudflare_r2_data_catalog— R2バケットでData Catalogを有効化cloudflare_pipeline_stream— HTTP/Workerでイベントを受け取るストリームcloudflare_pipeline_sink— R2またはR2 Data Catalogへ書き込むシンクcloudflare_pipeline— ストリームとシンクをSQLで接続するパイプライン
- 主な機能: Apache Icebergテーブル出力、コンパクション管理、R2 SQL/Spark/DuckDBとの互換性
- 実務上の手順(推奨):
- Terraformプロバイダを
v5.19.0以上に更新 - 必要な権限を持つスコープ付きAPIトークンとR2バケットを準備
terraform plan→terraform applyでリソースを作成- 出力先のIcebergテーブルやクエリエンジンでデータの整合性を検証
- Terraformプロバイダを
- 注意点: パイプライン定義はSQLで行うため、スキーマ整備とフォーマット(例: parquet/json)を事前に決定すること
Short example
公式の最小構成例では、cloudflare_pipeline_stream、cloudflare_pipeline_sink(type = "r2_data_catalog")、cloudflare_pipelineを組み合わせてデータをR2のIcebergテーブルへ挿入します。詳しい手順はドキュメントのエンドツーエンド例を参照してください。