openaijamodel: gpt-5-mini-2025-08-07
R2 Data Catalog:スナップショット失効で参照されないデータファイルを自動削除
Key Points
- 参照されないデータファイルを削除
- 手動メンテナンス不要に
- ストレージコスト削減
Summary
R2 Data Catalog(管理された Apache Iceberg カタログ)は、スナップショットの自動失効時に参照されていないデータファイルを R2 ストレージから自動削除するようになりました。従来はメタデータ(マニフェスト等)のみが削除され、データファイルのクリーンアップは手動での remove_orphan_files や expire_snapshots 実行が必要でした。この変更によりストレージコストと運用負荷が低減します。
Key Points
- 自動失効でメタデータだけでなく参照されないデータファイルも削除される
- 既存の保持ルール(retain-last や older-than-days)に従い、保持対象のスナップショットが参照するファイルは残る
- 手動での
remove_orphan_files実行や外部エンジン(例:Spark)での後処理が不要に - 有効化コマンド例(カタログレベル):
npx wrangler r2 bucket catalog snapshot-expiration enable my-bucket --older-than-days 7 --retain-last 10 - ストレージコスト削減と運用負荷軽減が期待できる。詳細はメンテナンスドキュメントを参照してください。