ClaudeCloudflare2026/03/23 13:00

Inside Gen 13: how we built our most powerful server yet

要点だけを先に読めるように短く再構成したセクションです。

元記事

Quick Digest

要約

要点だけを先に読めるように短く再構成したセクションです。

claudejamodel: claude-sonnet-4-20250514

Cloudflare Gen 13サーバー:192コアAMD EPYC Turin搭載の次世代ハードウェア

Key Points

  • 192コアAMD EPYC Turin搭載で最大2倍のスループット向上
  • 768GB DDR5-6400メモリと24TB PCIe 5.0ストレージ
  • 50%の電力効率改善とデュアル100GbEネットワーク

Summary

CloudflareがFL2(Rust製リクエスト処理層)への移行に合わせて設計したGen 13サーバーの技術詳細。AMD EPYC Turin 9965(192コア)、768GB DDR5-6400メモリ、24TB PCIe 5.0 NVMeストレージ、デュアル100GbEネットワークを搭載し、Gen 12と比較して最大2倍のスループットと50%の電力効率向上を実現。

Key Points

プロセッサー

  • **AMD EPYC 9965 Turin(192コア/384スレッド)**を採用
  • Gen 12の96コアから2倍に増加、最大100%のスループット向上
  • FL2ワークロードはL3キャッシュ依存度が低く、コア数でリニアにスケール
  • L3キャッシュは2MB/コア(Gen 12の12MB/コアから削減)だが性能向上

メモリ

  • 768GB DDR5-6400(12チャネル × 64GB DIMM)
  • 4GB/コア比率を維持しつつ総容量を2倍に拡張
  • 614GB/sのピーク帯域幅(33.3%向上)
  • 2Rx4デュアルランク構成で最適な性能とレイテンシを実現

ストレージ・ネットワーク

  • 24TB NVMe PCIe 5.0(3×8TB E1.S)+ 最大10×U.2拡張スロット
  • デュアル100GbEネットワーク(Gen 12の25GbEから4倍向上)
  • CDN、Durable Objects、Containersサービスの成長に対応

Full Translation

翻訳

原文の流れを保ったまま読める翻訳セクションです。

claudejamodel: claude-sonnet-4-20250514

Gen 13の内部:これまでで最も強力なサーバーの構築方法

Gen 13の内部:これまでで最も強力なサーバーの構築方法

2026年3月23日 | Syona Sarma、JQ Lau、Ma Xiong、Victor Hwang | 13分で読める

数ヶ月前、CloudflareはCloudflareのコアリクエスト処理レイヤーをRustで完全に書き直したFL2への移行を発表しました。この移行により、すべての人にとってより良いインターネットの構築を支援する能力が加速されます。ソフトウェアスタックの移行に伴い、Cloudflareはネットワークとソフトウェアスタックの進化する要求に対応するため、改良されたハードウェア機能とより良い効率性を持つサーバーハードウェア設計を刷新しました。

Gen 13は以下の仕様で設計されています:

  • 192コアAMD EPYC™ Turin 9965プロセッサー
  • 768 GBのDDR5-6400メモリ
  • 24 TBのPCIe 5.0 NVMeストレージ
  • デュアル100 GbEポートネットワークインターフェースカード

Gen 13の性能向上

  • レイテンシSLA内でGen 12と比較して最大2倍のスループット
  • 最大50%のパフォーマンス/ワット効率の改善により、データセンター拡張コストを削減
  • ラック電力予算を一定に保ちながらラックあたり最大60%高いスループット
  • 2倍のメモリ容量、1.5倍のストレージ容量、4倍のネットワーク帯域幅
  • メモリ暗号化に加えてPCIe暗号化ハードウェアサポートを導入
  • 熱的に要求の厳しい強力なドロップインPCIeアクセラレーターのサポートを改善

このブログ投稿では、各主要コンポーネント選択の背後にあるエンジニアリング根拠について説明します:何を評価し、何を選択し、その理由について。

仕様比較

項目Gen 13Gen 12
フォームファクター2U1N、シングルソケット2U1N、シングルソケット
プロセッサーAMD EPYC™ 9965 Turin 192コアAMD EPYC™ 9684X Genoa-X 96コア
メモリ768GB DDR5-6400 x12メモリチャネル384GB DDR5-4800 x12メモリチャネル
ストレージx3 E1.S NVMe Samsung PM9D3a 7.68TB / Micron 7600 Pro 7.68TBx2 E1.S NVMe Samsung PM9A3 7.68TB / Micron 7450 Pro 7.68TB
ネットワークデュアル100 GbE OCP 3.0 Intel Ethernet Network Adapter E830-CDA2 / NVIDIA Mellanox ConnectX-6 Dxデュアル25 GbE OCP 3.0 Intel Ethernet Network Adapter E810-XXVDA2 / NVIDIA Mellanox ConnectX-6 Lx
システム管理DC-SCM 2.0 ASPEED AST2600 (BMC) + AST1060 (HRoT)DC-SCM 2.0 ASPEED AST2600 (BMC) + AST1060 (HRoT)
電源1300W、Titaniumグレード800W、Titaniumグレード

CPU選択:AMD Turin 9965を選んだ理由

設計段階で、Cloudflareのハードウェアラボで第5世代AMD EPYC™プロセッサー(コードネーム:Turin)を複数評価しました:AMD Turin 9755、AMD Turin 9845、AMD Turin 9965。

CPU候補の比較

CPUモデルAMD Genoa-X 9684XAMD Turin 9755AMD Turin 9845AMD Turin 9965
サーバープラットフォームGen 12Gen 13候補Gen 13候補Gen 13候補
CPUコア数96128160192
スレッド数192256320384
ベースクロック2.4 GHz2.7 GHz2.1 GHz2.25 GHz
最大ブーストクロック3.7 GHz4.1 GHz3.7 GHz3.7 GHz
全コアブーストクロック3.42 GHz4.1 GHz3.25 GHz3.35 GHz
総L3キャッシュ1152 MB512 MB320 MB384 MB
コアあたりL3キャッシュ12 MB/コア4 MB/コア2 MB/コア2 MB/コア
最大設定可能TDP400W500W390W500W

AMD Turin 9965を選択した理由

1. FL2がL3キャッシュ不足を解決

9965はコアあたり2 MBのL3キャッシュしか持たず、Gen 12のGenoa-X 9684Xのコアあたり12 MBから83.3%の削減となります。しかし、CloudflareがFL1からFL2に移行したことで、リクエスト処理パイプラインは大容量L3キャッシュへの依存度が大幅に低下しました。FL2ワークロードはコア数とほぼ線形にスケールし、9965の192コアはGen 12の2倍のハードウェアスレッドを提供します。

2. 総所有コスト(TCO)あたりの性能

本番環境での評価において、9965の192コアは3つの候補の中で最高の秒間リクエスト数を実現し、500W TDPでのパフォーマンス/ワットが良好にスケールし、優れたラックレベルTCOを実現しました。

項目Gen 12Gen 13
プロセッサーAMD EPYC™ 4th Gen Genoa-X 9684XAMD EPYC™ 5th Gen Turin 9965
コア数96C/192T192C/384T
FLスループットベースライン最大+100%
パフォーマンス/ワットベースライン最大+50%

3. 運用の簡素化

運用チームは、より少ない高密度サーバーを強く好みます。192コアマシンのフリートを管理することで、計算単位あたりのプロビジョニング、パッチ適用、監視するノード数が減り、グローバルネットワーク全体の運用オーバーヘッドが直接削減されます。

4. 将来互換性

AMDプロセッサーアーキテクチャは、すべてのSKUでDDR5-6400、PCIe Gen 5.0、CXL 2.0 Type 3メモリをサポートしています。AMD Turin 9965は業界最高のソケットあたり高性能コア数を持ち、ソケットあたりの計算密度を最大化し、今後数年間プラットフォームの競争力と関連性を維持します。

メモリ設計

  • Gen 12: 12x 32GB DDR5-4800 2Rx8(総384 GB、4 GB/コア)
  • Gen 13: 12x 64GB DDR5-6400 2Rx4(総768 GB、4 GB/コア)

12チャネルで帯域幅を最大化

選択されたAMD EPYC™ 9965 CPUは12のメモリチャネルをサポートし、Gen 13ではそのすべてを使用しています。「チャネルあたり1 DIMM」(1DPC)構成で64 GB DDR5-6400 ECC RDIMMを選択しました。この設定により、ソケットあたり614 GB/sのピークメモリ帯域幅を提供し、Gen 12サーバープラットフォームと比較して33.3%の増加となります。

コアあたり4 GBの「スイートスポット」

初期要件では、コアあたり4 GBから6 GBのメモリ対コア比を検討しました。AMD Turin 9965の192コアでは、768 GBから1152 GBの範囲になります。

  • 12x 48GB = 576 GB(1.5 GB/スレッド):メモリ容量が低すぎる
  • 12x 96GB = 1152 GB(3.0 GB/スレッド):コストが大幅に増加
  • 12x 64GB = 768 GB(2.0 GB/スレッド、4 GB/コア):Gen 12のメモリ対コア比と一致

決定: 12x 64GBで総768 GB。これにより実績のある4 GB/コア比を維持し、Gen 12の2倍の総容量増加を提供し、DIMMコストカーブのスイートスポット内に収まります。

デュアルランクによる効率性

Gen 12では、デュアルランクDIMMがシングルランクモジュールよりも測定可能に高いメモリスループットを提供し、1:1読み書き比で最大17.8%の利点があることを実証しました。2Rx4 DDR5 RDIMMを最大サポート6400MT/sで選択することで、Gen 13プラットフォームメモリ構成から最低レイテンシと最高性能を確保します。

ストレージアーキテクチャ

  • Gen 12: x2 E1.S NVMe PCIe 4.0、総16 TB
  • Gen 13: x3 E1.S NVMe PCIe 5.0、総24 TB + 最大10x U.2 NVMe PCIe 5.0オプション

PCIe 5.0への移行

Gen 13はPCIe Gen 5.0 NVMeドライブで構成されています。Gen 4.0は十分に機能しましたが、Gen 5.0への移行により、ストレージサブシステムが改善されたレイテンシでデータを提供し、新しいプロセッサーからの増加したストレージ帯域幅需要に対応できることを保証します。

16 TBから24 TBへ

速度向上に加えて、NVMeドライブのアレイを2台から3台に物理的に拡張しています。これにより、サーバーあたりのストレージ容量が16TBから24TBに増加し、CDNキャッシュ性能を維持・改善するためのグローバルストレージ容量を拡張しています。

追加ドライブをサポートするフロントドライブベイ

Gen 13では、シャーシは最大10台のU.2 PCIe Gen 5.0 NVMeドライブをサポートできるフロントドライブベイで設計されています。

Inside Gen 13:私たちがこれまでで最も強力なサーバーを構築した方法 | Cloudflare | DocsDigest