Gen 13の内部:これまでで最も強力なサーバーの構築方法
2026年3月23日 | Syona Sarma、JQ Lau、Ma Xiong、Victor Hwang | 13分で読める
数ヶ月前、CloudflareはCloudflareのコアリクエスト処理レイヤーをRustで完全に書き直したFL2への移行を発表しました。この移行により、すべての人にとってより良いインターネットの構築を支援する能力が加速されます。ソフトウェアスタックの移行に伴い、Cloudflareはネットワークとソフトウェアスタックの進化する要求に対応するため、改良されたハードウェア機能とより良い効率性を持つサーバーハードウェア設計を刷新しました。
Gen 13は以下の仕様で設計されています:
- 192コアAMD EPYC™ Turin 9965プロセッサー
- 768 GBのDDR5-6400メモリ
- 24 TBのPCIe 5.0 NVMeストレージ
- デュアル100 GbEポートネットワークインターフェースカード
Gen 13の性能向上
- レイテンシSLA内でGen 12と比較して最大2倍のスループット
- 最大50%のパフォーマンス/ワット効率の改善により、データセンター拡張コストを削減
- ラック電力予算を一定に保ちながらラックあたり最大60%高いスループット
- 2倍のメモリ容量、1.5倍のストレージ容量、4倍のネットワーク帯域幅
- メモリ暗号化に加えてPCIe暗号化ハードウェアサポートを導入
- 熱的に要求の厳しい強力なドロップインPCIeアクセラレーターのサポートを改善
このブログ投稿では、各主要コンポーネント選択の背後にあるエンジニアリング根拠について説明します:何を評価し、何を選択し、その理由について。
仕様比較
| 項目 | Gen 13 | Gen 12 |
|---|
| フォームファクター | 2U1N、シングルソケット | 2U1N、シングルソケット |
| プロセッサー | AMD EPYC™ 9965 Turin 192コア | AMD EPYC™ 9684X Genoa-X 96コア |
| メモリ | 768GB DDR5-6400 x12メモリチャネル | 384GB DDR5-4800 x12メモリチャネル |
| ストレージ | x3 E1.S NVMe Samsung PM9D3a 7.68TB / Micron 7600 Pro 7.68TB | x2 E1.S NVMe Samsung PM9A3 7.68TB / Micron 7450 Pro 7.68TB |
| ネットワーク | デュアル100 GbE OCP 3.0 Intel Ethernet Network Adapter E830-CDA2 / NVIDIA Mellanox ConnectX-6 Dx | デュアル25 GbE OCP 3.0 Intel Ethernet Network Adapter E810-XXVDA2 / NVIDIA Mellanox ConnectX-6 Lx |
| システム管理 | DC-SCM 2.0 ASPEED AST2600 (BMC) + AST1060 (HRoT) | DC-SCM 2.0 ASPEED AST2600 (BMC) + AST1060 (HRoT) |
| 電源 | 1300W、Titaniumグレード | 800W、Titaniumグレード |
CPU選択:AMD Turin 9965を選んだ理由
設計段階で、Cloudflareのハードウェアラボで第5世代AMD EPYC™プロセッサー(コードネーム:Turin)を複数評価しました:AMD Turin 9755、AMD Turin 9845、AMD Turin 9965。
CPU候補の比較
| CPUモデル | AMD Genoa-X 9684X | AMD Turin 9755 | AMD Turin 9845 | AMD Turin 9965 |
|---|
| サーバープラットフォーム | Gen 12 | Gen 13候補 | Gen 13候補 | Gen 13候補 |
| CPUコア数 | 96 | 128 | 160 | 192 |
| スレッド数 | 192 | 256 | 320 | 384 |
| ベースクロック | 2.4 GHz | 2.7 GHz | 2.1 GHz | 2.25 GHz |
| 最大ブーストクロック | 3.7 GHz | 4.1 GHz | 3.7 GHz | 3.7 GHz |
| 全コアブーストクロック | 3.42 GHz | 4.1 GHz | 3.25 GHz | 3.35 GHz |
| 総L3キャッシュ | 1152 MB | 512 MB | 320 MB | 384 MB |
| コアあたりL3キャッシュ | 12 MB/コア | 4 MB/コア | 2 MB/コア | 2 MB/コア |
| 最大設定可能TDP | 400W | 500W | 390W | 500W |
AMD Turin 9965を選択した理由
1. FL2がL3キャッシュ不足を解決
9965はコアあたり2 MBのL3キャッシュしか持たず、Gen 12のGenoa-X 9684Xのコアあたり12 MBから83.3%の削減となります。しかし、CloudflareがFL1からFL2に移行したことで、リクエスト処理パイプラインは大容量L3キャッシュへの依存度が大幅に低下しました。FL2ワークロードはコア数とほぼ線形にスケールし、9965の192コアはGen 12の2倍のハードウェアスレッドを提供します。
2. 総所有コスト(TCO)あたりの性能
本番環境での評価において、9965の192コアは3つの候補の中で最高の秒間リクエスト数を実現し、500W TDPでのパフォーマンス/ワットが良好にスケールし、優れたラックレベルTCOを実現しました。
| 項目 | Gen 12 | Gen 13 |
|---|
| プロセッサー | AMD EPYC™ 4th Gen Genoa-X 9684X | AMD EPYC™ 5th Gen Turin 9965 |
| コア数 | 96C/192T | 192C/384T |
| FLスループット | ベースライン | 最大+100% |
| パフォーマンス/ワット | ベースライン | 最大+50% |
3. 運用の簡素化
運用チームは、より少ない高密度サーバーを強く好みます。192コアマシンのフリートを管理することで、計算単位あたりのプロビジョニング、パッチ適用、監視するノード数が減り、グローバルネットワーク全体の運用オーバーヘッドが直接削減されます。
4. 将来互換性
AMDプロセッサーアーキテクチャは、すべてのSKUでDDR5-6400、PCIe Gen 5.0、CXL 2.0 Type 3メモリをサポートしています。AMD Turin 9965は業界最高のソケットあたり高性能コア数を持ち、ソケットあたりの計算密度を最大化し、今後数年間プラットフォームの競争力と関連性を維持します。
メモリ設計
- Gen 12: 12x 32GB DDR5-4800 2Rx8(総384 GB、4 GB/コア)
- Gen 13: 12x 64GB DDR5-6400 2Rx4(総768 GB、4 GB/コア)
12チャネルで帯域幅を最大化
選択されたAMD EPYC™ 9965 CPUは12のメモリチャネルをサポートし、Gen 13ではそのすべてを使用しています。「チャネルあたり1 DIMM」(1DPC)構成で64 GB DDR5-6400 ECC RDIMMを選択しました。この設定により、ソケットあたり614 GB/sのピークメモリ帯域幅を提供し、Gen 12サーバープラットフォームと比較して33.3%の増加となります。
コアあたり4 GBの「スイートスポット」
初期要件では、コアあたり4 GBから6 GBのメモリ対コア比を検討しました。AMD Turin 9965の192コアでは、768 GBから1152 GBの範囲になります。
- 12x 48GB = 576 GB(1.5 GB/スレッド):メモリ容量が低すぎる
- 12x 96GB = 1152 GB(3.0 GB/スレッド):コストが大幅に増加
- 12x 64GB = 768 GB(2.0 GB/スレッド、4 GB/コア):Gen 12のメモリ対コア比と一致
決定: 12x 64GBで総768 GB。これにより実績のある4 GB/コア比を維持し、Gen 12の2倍の総容量増加を提供し、DIMMコストカーブのスイートスポット内に収まります。
デュアルランクによる効率性
Gen 12では、デュアルランクDIMMがシングルランクモジュールよりも測定可能に高いメモリスループットを提供し、1:1読み書き比で最大17.8%の利点があることを実証しました。2Rx4 DDR5 RDIMMを最大サポート6400MT/sで選択することで、Gen 13プラットフォームメモリ構成から最低レイテンシと最高性能を確保します。
ストレージアーキテクチャ
- Gen 12: x2 E1.S NVMe PCIe 4.0、総16 TB
- Gen 13: x3 E1.S NVMe PCIe 5.0、総24 TB + 最大10x U.2 NVMe PCIe 5.0オプション
PCIe 5.0への移行
Gen 13はPCIe Gen 5.0 NVMeドライブで構成されています。Gen 4.0は十分に機能しましたが、Gen 5.0への移行により、ストレージサブシステムが改善されたレイテンシでデータを提供し、新しいプロセッサーからの増加したストレージ帯域幅需要に対応できることを保証します。
16 TBから24 TBへ
速度向上に加えて、NVMeドライブのアレイを2台から3台に物理的に拡張しています。これにより、サーバーあたりのストレージ容量が16TBから24TBに増加し、CDNキャッシュ性能を維持・改善するためのグローバルストレージ容量を拡張しています。
追加ドライブをサポートするフロントドライブベイ
Gen 13では、シャーシは最大10台のU.2 PCIe Gen 5.0 NVMeドライブをサポートできるフロントドライブベイで設計されています。