R2 Data Catalog のメトリクスが GraphQL Analytics API で取得可能に
Key Points
- メトリクス公開
- 2つのデータセット
- パーセンタイル対応
Summary
R2 Data Catalog(Apache Iceberg ベース)のメトリクスが Cloudflare の GraphQL Analytics API で取得可能になりました。エンジニアはこれらのデータセットをクエリして、リクエスト量・レイテンシ・テーブル保守ジョブの成功率などを監視・可視化できます。
Key Points
- 新しいデータセット:
r2CatalogDataOperationsAdaptiveGroups: Iceberg の REST API リクエストを追跡(operation、duration、HTTP ステータス、リクエストボディバイト数)。倉庫・ネームスペース・テーブル単位でのリクエストボリュームとレイテンシ監視に利用。r2CatalogTableMaintenanceAdaptiveGroups: コンパクションやスナップショット期限切れなど保守ジョブを追跡(成功率、処理ファイル数、読み書きバイト数、ジョブ時間)。
- フィルタリング:
warehouse、namespace、table、時間範囲で絞り込み可能。 - 集計: duration 系にはパーセンタイル集計(例: p50、p95)を使用可能。
- 実用的な使い方: GraphQL Analytics API で該当データセットを指定し、フィルタ+集約クエリを組んでダッシュボードやアラートのデータソースにする。詳細は公式ドキュメントのスキーマとサンプルクエリを参照。
Actionable tips
- まず短期間で p95 レイテンシを取得して平常値を把握し、異常検出の閾値を設定する。
- 保守ジョブの成功率・処理バイト数を定期集計して、リトライや最適化のトリガーにする。
- テーブル単位のコンパクション時間や処理ファイル数を比較して、最適化対象を特定する。