ホームニュース

会社のニュースビッグ・ブルー・スレッドブックストレージスケールKVキャッシュ管理

すべての製品

棚貯蔵サーバー
(179)

華為技術の融合サーバー
(31)

Dell Poweredgeサーバー
(59)

H3Cサーバー
(31)

データ通信スイッチ
(96)

WLAN装置
(21)

スマートな無線ルーター
(17)

ハード・ドライブHDD
(78)

内部ハード・ドライブSSD
(16)

Geforceのグラフィックス・カード
(27)

INTEL CPUプロセッサ
(20)

サーバー記憶RAM
(6)

改装された貯蔵サーバー
(6)

SFPのトランシーバーモジュール
(4)

繊維のチャネルスイッチ
(125)

認証

顧客の検討

北京Qianxing Jietongの技術Co.、株式会社の販売スタッフは非常に専門および忍耐強い。それらは引用語句をすぐに提供してもいい。プロダクトの質そして包装はまた非常によい。私達の協同は非常に滑らかである。

—— 《のFestfing DVの》 LLC

私がIntel CPUおよび東芝SSDを緊急に捜していたときに、北京Qianxing Jietongの技術Co.、株式会社からのサンディは私に多くの助けを与え、私に私がすぐに必要としたプロダクトを得た。私は実際に彼女を認める。

—— キティ円

北京Qianxing Jietongの技術Co.、株式会社のサンディは私がサーバーを買う時間の構成間違いを私に思い出させることができる非常に注意深いセールスマンである。エンジニアはまた非常に専門で、すぐにテストプロセスを完了できる。

—— Strelkin Mikhail Vladimirovich

北京千星捷通との仕事は大変満足しています。製品の品質は素晴らしく、納期も常に守られています。営業チームはプロフェッショナルで、忍耐強く、私たちの質問にすべて丁寧に対応してくれます。彼らのサポートに心から感謝しており、長期的なパートナーシップを期待しています。強くお勧めします！

—— アフマド・ナビド

品質: 提供者との素晴らしい経験. MikroTik RB3011は既に使用されていましたが,非常に良い状態で,すべてが完璧に動作しています. コミュニケーションは迅速でスムーズでした.そして私の懸念はすぐに解決されました信頼性の高いサプライヤーです強くお勧めします

—— ゲラン・コレシオ

オンラインです

会社ニュース

ビッグ・ブルー・スレッドブックストレージスケールKVキャッシュ管理

IBM Storage Scale 並列ファイルシステムは、NVIDIA Dynamo と組み合わせた分散 KV キャッシュ管理をサポートし、大規模なコンテキストワークロードを伴う大規模な AI 推論シナリオに対応します。

IBM は、次のタイトルの公式 Redbook をリリースしました。制限のないコンテキスト: 大規模な AI 推論のための高性能 KV キャッシュプラットフォーム、この共同ソリューションの完全に検証されたリファレンスアーキテクチャを提供します。統合スタックは、Supermicro Petascale ストレージサーバー、NVIDIA Spectrum-X イーサネットネットワーキング、IBM Storage Scale Erasurecoding Edition (ECE) を組み合わせて、AI 推論用の高性能共有ストレージ層を構築します。 IBM ITSO (国際技術サポート組織) によって発行された信頼できる技術文書として、IBM Redbooks は、エンタープライズグレードの IBM インフラストラクチャー製品の実践的で詳細な導入ガイダンスを提供します。

IBM、Supermicro、NVIDIA のエンジニアリングチームが共同執筆したこの Redbook は、ロングコンテキスト AI ワークロードの中核的な問題点に対処しています。マルチターン対話アシスタント、RAG 取得アプリケーション、自律エージェントパイプラインなどのユースケースは、GPU HBM 内に大量の KV キャッシュデータを生成します。キャッシュされたデータが限られた HBM リソースから削除されると、再計算が繰り返されるとレイテンシが大幅に上昇するため、永続的なクロスリクエスト KV キャッシュストレージが不可欠になります。

このソリューションは、さまざまなレイテンシと容量の需要に対応する 5 層の階層 KV キャッシュアーキテクチャを採用しています。

G1層: GPU ノードのローカル HBM
G2層: CPUノードシステムDRAM
G3層: 直接接続ローカル SSD
G3.5層: GPU サーバー DPU への直接相互接続を備えた NVIDIA BlueField DPU が前面に配置されたポッドレベルの共有フラッシュストレージ
G4層: すべての GPU コンピューティングサーバーに接続された外部クロスイーサネット共有ストレージプール

エンドツーエンドのメモリとストレージ階層をカバーするこの多層セットアップは、継続的なレイテンシと容量の勾配を実現します。これにより、NVIDIA Dynamo は、ストレージスタック全体にわたってインテリジェントなキャッシュの配置、自動エビクション、動的なデータの再ロードを実行し、さまざまなワークロードのアクセスパターンとインフラストラクチャの総コスト予算に柔軟に適応できます。

Supermicro Petascale ストレージサーバーに導入された Storage Scale ECE は、G4 コールドキャッシュ層として機能します。これは、非アクティブなマルチターン会話状態、共有エージェントコンテキストデータ、即時応答を必要としない履歴クエリレコードなど、遅延に敏感でない KV キャッシュデータ用に最適化されています。

レッドブックに記録されたテスト結果によると、この実稼働対応リファレンスアーキテクチャは、生成 AI およびエージェント AI 推論サービスを効果的に高速化します。外部ストレージスケール KV キャッシュを使用しないスタンドアロン GPU サーバーと比較した単一リクエスト TTFT (Time To First Token) テストでは、統合システムはプロンプトの長さの変更に関係なく安定した TTFT を維持します。それは、56 倍のスピードアップ130k トークンの入力シーケンス未満で、プロンプトの長さの延長によって生じる推論レイテンシの変動を完全に排除します。

同時マルチユーザー推論のプレッシャーの下で、このソリューションは劇的なパフォーマンスの向上を達成します。リクエストのスループットは 0.19 RPS から 4.26 RPS に急増し、スループットが 22 倍向上。一方、200 件の推論リクエストの合計処理時間は 95% 減少し、GPU の使用効率と全体的な推論クラスターのスケーラビリティが大幅に向上しました。

このスタックは、過酷なノイズの多い近隣ストレステスト下でも堅牢なパフォーマンスを維持します。 4 つのクライアントエンドが継続的に 200 GB/秒の競合ネットワーク I/O トラフィックを生成している場合でも、統合システムは依然として 3.6 RPS で安定して動作し、200 の推論リクエストすべてを 55.56 秒以内に完了します。スループットは維持されます18倍高いベースラインの GPU のみの再計算アーキテクチャよりも優れています。

研究チームはレッドブックで次のように結論付けています。「高価な GPU ハードウェアへの投資で ROI の最大化を目指す企業にとって、この検証済みの統合アーキテクチャは、推論スループットの向上、エンドツーエンドのレイテンシーの削減、より高いサービスの同時実行性のサポート、よりコスト効率の高い大規模 AI 推論インフラストラクチャの構築に対する、直接的な実稼働対応のアプローチを提供します。」

キーワード: SUPERMICRO、IBM Storage Scale、NVIDIA Dynamo

北京乾興解放科技有限公司
サンディ・ヤン/グローバル戦略ディレクター
WhatsApp / WeChat: +86 13426366826
電子メール: yangyd@qianxingdata.com
ウェブサイト: www.qianxingdata.com/www.storagesserver.com
ビジネスの焦点:
ICTプロダクト流通/システムインテグレーション＆サービス/インフラソリューション
20 年以上の IT 流通経験を持つ当社は、主要な世界的ブランドと提携して、信頼性の高い製品とプロフェッショナルなサービスを提供しています。
「テクノロジーを活用してインテリジェントな世界を構築する」信頼できる ICT 製品サービスプロバイダー!

パブの時間 : 2026-06-12 11:09:46 >> ニュースのリスト

連絡先の詳細

Beijing Qianxing Jietong Technology Co., Ltd.

コンタクトパーソン: Ms. Sandy Yang

電話番号: 13426366826

会社のニュースビッグ・ブルー・スレッドブックストレージスケールKVキャッシュ管理

棚貯蔵サーバー

華為技術の融合サーバー

Dell Poweredgeサーバー

H3Cサーバー

データ通信スイッチ

WLAN装置

スマートな無線ルーター

ハード・ドライブHDD

内部ハード・ドライブSSD

Geforceのグラフィックス・カード

INTEL CPUプロセッサ

サーバー記憶RAM

改装された貯蔵サーバー

SFPのトランシーバーモジュール

繊維のチャネルスイッチ

棚貯蔵サーバー

12湾1Uラックマウント式サーバーLenovo ThinkSystem SR630の棚サーバー

ThinkSystem SR250 V2 4SFFの棚貯蔵サーバーIntel Xeon E-2378Gプロセッサ

Intel C621Aの棚貯蔵サーバーInspur NF5180M6 1Uのラックマウントサーバー

華為技術の融合サーバー

FusionServer 5288 V6 4Uの棚サーバー32 DDR4 DIMMs 44の3.5インチのハードディスク

超高密度華為技術の融合サーバー1Uネットワークの貯蔵サーバー1288H V5

新しいGEN OceanStor 5310華為技術の棚サーバー雑種の抜け目がない貯蔵

会社のニュース ビッグ・ブルー・スレッドブック ストレージスケールKVキャッシュ管理

会社のニュースビッグ・ブルー・スレッドブックストレージスケールKVキャッシュ管理