DapuStor J5060 仕様
| J5060 | |
|---|---|
| 容量 (TB) | 61.44 |
| フォームファクター | U.2 15mm |
| インターフェイス | PCIe 4.0 x4, NVMe 1.4a, デュアルポート対応 |
| 読み取り/書き込み帯域幅 (128K) MB/s | 7400 / 3000 |
| ランダム読み取り/書き込み (4KB) K IOPS | 1500 / 30 (16KB) |
| 4K ランダムレイテンシ (標準) R/W µs | 105 (4KB) / 33 (16KB) |
| 4K シーケンシャルレイテンシ (標準) R/W µs | 7 (4KB) / 12 (16KB) |
| 標準消費電力 (W) | 23 |
| アイドル時消費電力 (W) | 5 |
| フラッシュタイプ | 3D Enterprise QLC NAND Flash |
| 耐久性 | 0.5 DWPD |
| MTBF | 200万時間 |
| UBER | 1セクター/10^17ビット読み取り |
| 保証 | 5年 |
DapuStor J5060 パフォーマンス
チェックポインティング
AIトレーニング環境におけるDapustor J5060 SSDの実際のパフォーマンスを評価するために、Data and Learning Input/Output(DLIO)ベンチマークツールを使用しました。Argonne National Laboratoryによって開発されたDLIOは、ディープラーニングワークロードにおけるI/Oパターンをテストするために特別に設計されています。ストレージシステムがチェックポインティング、データ取り込み、モデルトレーニングなどの課題をどのように処理するかについての洞察を提供します。以下のグラフは、両方のドライブが99回のチェックポイント全体でプロセスをどのように処理するかを示しています。機械学習モデルをトレーニングする際、チェックポイントはモデルの状態を定期的に保存するために不可欠であり、中断中または停電中の進捗の損失を防ぎます。このストレージ需要は、特に持続的または集中的なワークロードの下で、堅牢なパフォーマンスを必要とします。
この作業のために選択されたプラットフォームは、Ubuntu 22.04.02 LTSを実行するDell PowerEdge R760でした。DLIOベンチマークバージョン2.0(2024年8月13日リリース)を使用しました。システム構成を以下に示します。
- 2 x Intel Xeon Gold 6430 (32コア, 2.1GHz)
- 16 x 64GB DDR5-4400
- 480GB Dell BOSS SSD
- Serial Cables Gen5 JBOF
- 61.44TB Dapustor J5060
- 61.44TB Solidigm D5-P5336
ベンチマークが実際のシナリオを反映するように、LLAMA 3.1 405Bモデルアーキテクチャに基づいたテストを実施しました。torch.save()を使用してモデルパラメータ、オプティマイザ状態、レイヤー状態をキャプチャするためにチェックポインティングを実装しました。セットアップは8GPUシステムをシミュレートし、8つのGPUに分散された4ウェイテンソル並列および2ウェイパイプライン並列処理によるハイブリッド並列戦略を実装しました。この構成により、チェックポイントサイズは1,636GBとなり、最新の大規模言語モデルトレーニング要件を代表するものです。
全体として、Dapustor J5060はテストの初期段階で堅調な一貫性を示し、最初の33回のチェックポイントで約575.66秒の時間を維持しました。5060Jは、ドライブが初めて満杯になる前に、より高いパフォーマンスを維持することができました。一方、Solidigm P5336は、当初J5060よりも遅かったものの、テストが続くにつれて一貫したパフォーマンスを示しました。
全体平均を考慮すると、Dapustor J5060は769.44秒のタイムを記録し、Solidigm P5336は640.17秒で終了しました。これにより、Solidigm P5336はチェックポイントの保存速度において先行しています。全体として、Dapustor J5060は短い操作にはうまく対応しますが、30分を超える持続的な書き込みには苦労します。一方、Solidigm P5336は、長時間のタスク全体で一貫したパフォーマンスを発揮する優れたドライブです。Dapustor J5060のこの弱い書き込みパフォーマンスは、テストが続くにつれてチェックポインティング速度が低下することから明らかです。GPU Direct StorageGPU Direct Storageは、CPUとシステムメモリをバイパスして、ストレージデバイスとGPU間の直接データ転送を可能にするテクノロジーです。従来のデータ転送では、データはストレージからCPUのメモリに読み込まれ、その後GPUのメモリにコピーされます。このプロセスには複数のデータコピーが含まれ、レイテンシの増加とパフォーマンスの低下につながります。CPUは、ストレージとGPU間のデータ転送を処理する必要があるため、ボトルネックとなります。GDSは、ストレージデバイスがGPUのメモリとの間で直接データを転送できるようにすることで、このボトルネックを排除します。 以下のパラメータのすべての組み合わせを、読み取りおよび書き込みワークロードで体系的にテストしました。ブロックサイズ: 1M, 128K, 16K
IO深度: 128, 64, 32, 16, 8, 4, 1
GDSIOの結果を確認する際に、61.44TBのDapustor J5060とSolidigm P5336の読み取りおよび書き込みパフォーマンスを調べます。
GDSIO シーケンシャル読み取りパフォーマンス
Dapustor J5060は、1MブロックサイズでIO深度が64および128の場合、最大読み取りスループット4.2 GiB/sを達成します。最小ブロックサイズ(16K)では、IO深度が増加するにつれてパフォーマンスは0.1 GiB/sから0.8 GiB/sの範囲になります。これは、最適なスループットのために大きなブロックサイズと高いIO深度を明確に好むことを示しています。ピークパフォーマンスは大きなブロックサイズで達成され、ドライブがバルクデータ転送を効率的に処理できることを示しています。
- 比較すると、Solidigm P5336は同じブロックサイズ(1M)で同様の最大スループット4.3 GiB/sに達しましたが、IO深度32でより早くそのパフォーマンスを達成し、より高いIO深度で一貫して維持しました。これは、Solidigm P5336がより広い範囲のIO深度で大きなブロックサイズを処理する効率がわずかに優れていることを示唆しています。
- より良い比較ビューを提供するために、両方のドライブを比較する差分チャートを用意しました。より緑色のブロックはDapustor SSDの利点を示し、スペクトルの赤色側に移動するブロックは弱点を示します。ここでは、J5060は、4から8のIO深度を除く128KブロックサイズでP5336を上回っています。しかし、16Kおよび1Mのブロックサイズでは、IO深度が高くなるとスループットの低下が認められ、これらのシナリオでの効率が低いことを示しています。
シーケンシャル読み取りレイテンシの比較では、Solidigm P5336は、ほぼすべてのブロックサイズとIO深度でDapustor J5060よりも一貫して低いレイテンシを維持しています。16Kブロックサイズでは、キュー深度が増加するにつれてギャップがより顕著になります。J5060は深度128で2,329 μsにピークしますが、P5336は1,365 μsと低く抑えられています。128Kでは、Solidigmはほとんどの深度で再びリードしていますが、高負荷時(J5060で4,080 μs、P5336で5539 μs)の深度128では例外です。1Mブロックサイズでは、両方のドライブは予想どおりレイテンシの増加を経験しますが、P5336は最も高いキュー深度で29,138 μs対29,512 μsと、わずかに良好に制御されています。
GDSIO シーケンシャル書き込みパフォーマンス
Dapustor J5060は、すべてのIO深度(128K、1 IO深度サイズを除く、2.2GiB/sを記録)で、128Kおよび1Mブロックサイズで2.7~2.8 GiB/sの一貫した書き込みスループットを示します。16Kブロックサイズでは、パフォーマンスはIO深度に応じて0.5 GiB/sから1.4 GiB/sの範囲になり、高いIO深度で1.4 GiB/sにピークします。
比較すると、Solidigm P5336は128Kおよび1Mブロックサイズでより優れたパフォーマンスを発揮し、3.2GiB/sにピークします。より小さなブロックサイズ(16K)では、Solidigm P5336もより高いパフォーマンスを示し、IO深度16~64でピーク1.4 GiB/sに達します。これは、Solidigm P5336が書き込み操作中に小さなブロックサイズを処理する効率がわずかに優れていることを示しています。
差分ビューに移行すると、Dapustor J5060とSolidigm P5336の書き込みパフォーマンスとの間に大きなギャップが開いていることがわかります。スループット比較では、J5060はほとんどの領域、特にすべてのIO深度で大きなブロックサイズ(1M)でP5336に遅れをとっています。スループットの低下は、4 IO深度で-0.5 GiB/sに達します。128KブロックサイズでIO深度が高くなるとパフォーマンスが向上する領域もありますが、広範なパフォーマンス不足を相殺するには十分ではありません。
Dapustor J5060とSolidigm P5336のシーケンシャル書き込みレイテンシを比較すると、両方のドライブは16Kのような小さなブロックサイズで同様の動作を示し、Solidigmは低いIO深度でわずかに優位に立ちますが、Dapustorは高い深度(64および128)でギャップを縮めます。128Kブロックサイズでは、Solidigmは浅いキュー深度で再びリードしますが、DapustorはIO深度が増加するにつれて一貫して低いレイテンシを提供し、負荷下でのスケーリングが優れていることを示しています。しかし、1Mブロックサイズでは、SolidigmはすべてのIO深度で明確なレイテンシ優位性を維持し、重いシーケンシャル書き込みワークロード下で大幅に高速な応答時間を示します。全体として、Solidigmはより一貫したパフォーマンスを発揮しますが、Dapustorの強みは中程度のサイズのブロックと深いキューでより顕著です。
FIOワークロード概要
Flexible I/O Tester(FIO)は、さまざまなワークロードシナリオ下でのストレージデバイスのパフォーマンスを測定するために使用される業界標準のベンチマークツールです。その汎用性と信頼性で信頼されているFIOは、実際の条件をシミュレートし、SSDの機能とパフォーマンスの限界についての洞察を提供します。StorageReviewはFIOを活用して、ワークロードパターン、ブロックサイズ、キュー深度全体のスループット、レイテンシ、IOPSを測定する包括的な分析を提供します。
適用されたワークロード:
128K シーケンシャル読み取りおよび書き込み
64K ランダム読み取りおよび書き込み
16K ランダム読み取りおよび書き込み
4K ランダム読み取りおよび書き込み
これらのワークロードは、大規模なシーケンシャル転送、データベースに典型的な集中的なランダムI/O、仮想化環境で一般的に見られる小ブロックランダムアクセスなど、幅広いエンタープライズユースケースを表しています。
- このパフォーマンスセクションでは、Dapustor J5060のパフォーマンスを、さまざまなブロックサイズとキュー深度でのシーケンシャルおよびランダムな読み取り/書き込み操作を含む主要な合成ワークロード全体で要約します。メトリックは、解析されたfio出力から直接抽出され、帯域幅(MB/s)、IOPS、および最大99.9999%までのレイテンシパーセンタイルが含まれ、負荷下でのスループットとテールビヘイビアの両方についての洞察を提供します。
- 128K シーケンシャル読み取りおよび書き込みパフォーマンス
- ドライブ
- スレッド/IO深度
BW (MB/s)
IOPS
99.0%
| 99.9% | 99.99% | Dapustor J5060 読み取り | 8T/32Q | 7,430 | 453,461 | 5.28 ms |
|---|---|---|---|---|---|---|
| 6.39 ms | 1.81 ms | Solidigm P5336 読み取り | 1T/64Q | 23,063 | 57,057 | 1.51 ms |
| 5.21 ms | 1.81 ms | Dapustor J5060 書き込み | 1T/16Q | 3,023 | 23,063 | 0.69 ms |
| 149.94 ms | 4.42 ms | Solidigm P5336 書き込み | 1T/16Q | 25,669 | 25,669 | 2.67 ms |
| 65.8 ms | 4.42 ms | Dapustor J5060は、128Kで印象的なシーケンシャル読み取りパフォーマンスを発揮し、高いパーセンタイルでもタイトなレイテンシ制御で7.48GB/sに達します。Solidigm P5336と比較して、J5060のスループットは実質的に同じです(7.48GB/s対7.47GB/s)。しかし、Solidigmはレイテンシの一貫性でわずかに優位性を保ち、わずかに低いテールレイテンシを示しています。 | 128Kシーケンシャル書き込み(QD16)では、J5060は非常に低いレイテンシで3,023MB/sの堅調なパフォーマンスを達成します。しかし、Solidigm P5336はこれを適度なマージンで上回り、3,364MB/sに達しますが、特に99.99%パーセンタイル(4.42ms対Dapustorの驚くほど低い0.70ms)では、著しく高いレイテンシを伴います。これは、J5060がレイテンシに敏感なシーケンシャル書き込みシナリオに適していることを示しています。 | 64K ランダム読み取りおよび書き込みパフォーマンス | ドライブ | IO深度 |
BW (MB/s)
IOPS
99.0%
| 99.9% | 99.99% | Dapustor J5060 読み取り | 8T/32Q | 7,430 | 453,461 | 5.28 ms |
|---|---|---|---|---|---|---|
| 6.39 ms | 71.8 ms | Solidigm P5336 読み取り | 8T/32Q | 7,472 | 8,151 | 21.36 ms |
| 5.21 ms | 71.8 ms | Dapustor J5060 書き込み | 8T/32Q | 534 | 8,151 | 574.6 ms |
| 149.94 ms | 71.8 ms | Solidigm P5336 書き込み | 8T/32Q | 857 | 13,070 | 196.1 ms |
| 65.8 ms | 71.8 ms | 64Kランダム読み取り(QD256)では、Dapustor J5060は7.4GB/sに近いスループットと良好に制御されたレイテンシで優れています。Solidigmの結果は(7.47GB/s)わずかに近いですが、最大パーセンタイルレイテンシがわずかに優れています。両方のドライブはここで例外的なパフォーマンスを発揮し、実質的な違いは最小限です。 | 64Kランダム書き込みパフォーマンスでは、J5060は著しく苦戦し、スループットは534MB/sに急落し、レイテンシは大幅に上昇します(99.99%で742.39ms)。比較すると、Solidigm P5336はJ5060を大幅に上回り、857MB/sと劇的に低いレイテンシ(同じパーセンタイルで221.24ms)を提供し、レイテンシと持続的な書き込みスループットに敏感なアプリケーションにより適しています。 | 16K ランダム読み取りおよび書き込みパフォーマンス | ドライブ | IO深度 |
BW (MB/s)
IOPS
99.0%
| 99.9% | 99.99% | Dapustor J5060 読み取り | 8T/32Q | 7,430 | 453,461 | 5.28 ms |
|---|---|---|---|---|---|---|
| 6.39 ms | 71.8 ms | Solidigm P5336 読み取り | 8T/32Q | 7,431 | 453,527 | 5.01 ms |
| 5.21 ms | 71.8 ms | Dapustor J5060 書き込み | 8T/32Q | 531 | 32,404 | 143.65 ms |
| 149.94 ms | 71.8 ms | Solidigm P5336 書き込み | 8T/32Q | 847 | 51,724 | 57.9 ms |
| 65.8 ms | 71.8 ms | 16Kランダム読み取りワークロード(QD256)では、Dapustorは453K IOPSと制御されたレイテンシで優れた結果を達成します。Solidigm P5336は実質的にこのパフォーマンスを反映しており、レイテンシでDapustorをわずかに上回っています(99.99%で5.47ms対8.16ms)。これは、重いランダム読み取りシナリオでのSolidigmのレイテンシの一貫性がわずかに優れていることを示唆しています。 | Dapustor SSDの16Kランダム書き込みパフォーマンスは32K IOPSに大幅に低下し、レイテンシは181.4ms(99.99%)に増加します。ここでも、SolidigmはDapustorドライブを大幅に上回り、51.7K IOPSと劇的に改善されたレイテンシプロファイル(99.99%で71.8ms)を提供し、レイテンシに敏感なランダム書き込みワークロードにおけるSolidigmの優位性を強調しています。 | 北京千星捷通科技有限公司 | Sandy Yang/グローバル戦略ディレクター | WhatsApp / WeChat: +86 13426366826 |
Email: yangyd@qianxingdata.com
ウェブサイト: www.qianxingdata.com/www.storagesserver.com
事業内容:
ICT製品流通/システムインテグレーション&サービス/インフラストラクチャソリューション
20年以上のIT流通経験を持ち、主要グローバルブランドと提携して信頼性の高い製品とプロフェッショナルサービスを提供しています。
「テクノロジーでインテリジェントな世界を構築する」信頼できるICT製品サービスプロバイダー!



