HPC Depolama Mimarisi: BeeGFS ve Lustre Kurulum Rehberi

Yüksek başarımlı hesaplama (HPC) kümelerinde işlemci ve GPU kullanım oranları, yalnızca hesaplama donanımının kalitesiyle belirlenmez. Depolama altyapısının sağladığı bant genişliği ve gecikme süresi, hesaplama düğümlerinin gerçekte ne kadar verimli çalışacağını doğrudan etkiler. Bu rehberde katmanlı HPC depolama mimarisinin temel bileşenlerini, yazılım seçeneklerini ve karşılaşılan yaygın sorunları ele alıyoruz.

Katmanlı HPC Depolama Mimarisi

Modern HPC depolama tasarımının temeli, verinin erişim sıklığı ve performans gereksinimlerine göre farklı katmanlara yerleştirilmesi ilkesine dayanır. Üç temel katman şöyle tanımlanabilir:

Katman 1 — NVMe Scratch: Aktif hesaplama sırasında oluşturulan geçici veriler, checkpoint dosyaları ve model ağırlıkları için kullanılır. 100 µs altı gecikme ve düğümler arasında 10–50 GB/s toplam bant genişliği hedeflenir. Bu katman düğüm başına yerel NVMe disk ya da merkezi bir NVMe-oF kümesi olarak konuşlandırılabilir.

Katman 2 — Paralel Dosya Sistemi: Hesaplama süresince birden fazla düğümün paylaştığı kalıcı veri kümeleri burada tutulur. BeeGFS veya Lustre yazılım yığınlarıyla yüzlerce GB/s bant genişliğine ulaşmak mümkündür. Ölçeklendirme, meta veri ve depolama sunucularının bağımsız olarak genişletilmesiyle sağlanır.

Katman 3 — Kapasite ve Arşiv: Ham veri arşivleri, uzun vadeli sonuçlar ve sezon dışı iş yükleri için büyük kapasiteli, düşük maliyetli çözümler kullanılır. HDD tabanlı Ceph kümeleri, NFS sunucuları veya bant kütüphaneleri bu katmanda tercih edilen teknolojilerdir.

BeeGFS mi, Lustre mi?

Bu iki paralel dosya sistemi arasındaki seçim, büyük ölçüde operasyonel uzmanlık, küme büyüklüğü ve bütçeye bağlıdır.

BeeGFS kurulum kolaylığı ve düşük yönetim yüküyle öne çıkar. Meta veri (MDS) ve depolama (OSD) servislerini bağımsız olarak ölçeklendirme imkanı, değişen iş yüklerine hızlı uyum sağlamayı kolaylaştırır. Açık kaynak sürümü üretim ortamlarında herhangi bir kurumsal lisans gerektirmeden kullanılabilir. Orta ölçekli akademik kümeler ve kurumsal araştırma ortamları için ideal başlangıç noktasıdır.

Lustre ise on yıllardır dünyanın en büyük süperbilgisayar kurulumlarında kullanılan endüstri standardıdır. Milyonlarca dosya içeren veri kümelerinde ve binlerce eş zamanlı istemcide kanıtlanmış ölçeklenebilirlik sunar. Ancak konfigürasyon karmaşıklığı, BeeGFS’e kıyasla daha derin Linux çekirdeği ve depolama sistemi bilgisi gerektirir. Petabayt üzerindeki kurulumlar ve en zorlu iş yükleri için Lustre tercih edilmelidir.

# BeeGFS küme durumu kontrolü
beegfs-ctl --listnodes --nodetype=meta
beegfs-ctl --listnodes --nodetype=storage

# Anlık throughput izleme (1 saniyelik aralıklarla)
beegfs-iostat -s 1

Ağ Altyapısı: Göz Ardı Edilmemesi Gereken Bileşen

Paralel dosya sistemi ne kadar iyi konfigüre edilirse edilsin, ağ bant genişliği yetersizse gerçek performans ortaya çıkmaz. HPC depolama ağları için standart seçenekler şunlardır:

HDR InfiniBand (200 Gb/s): Düşük gecikme, yüksek mesaj oranı ve RDMA desteğiyle en yaygın tercih
NDR InfiniBand (400 Gb/s): Yeni nesil kurulumlar ve gelecek iş yükleri için
25/100 GbE: Kapasite katmanı veya daha düşük bütçeli ortamlarda kabul edilebilir

Ağ topolojisi de en az teknoloji seçimi kadar kritiktir. Fat-tree veya dragonfly topolojileri, hesap düğümleri ile depolama sunucuları arasında yüksek ve tutarlı bisection bandwidth sağlar; bu da paralel okuma/yazma performansını doğrudan etkiler.

Yaygın Sorunlar ve Çözümleri

Meta veri darboğazı: Küçük dosya erişiminin yoğun olduğu genomik analiz gibi iş yüklerinde meta veri sunucusu (MDS) darboğaz noktası haline gelebilir. Çözüm: birden fazla MDS konuşlandırmak ve meta veri sunucularını NVMe disklerle donatmak.

NUMA uyumsuzluğu: Depolama sunucularında NIC ve disk denetleyicilerinin farklı NUMA düğümlerinde olması gecikmeyi artırır. IRQ pinning ve NUMA-aware bellek tahsisi ile bu sorun giderilebilir.

Ağ sıkışıklığı: Büyük all-to-all iletişim kalıplarında ağ anahtarlarında sıkışıklık oluşabilir. Ağ topolojisi tasarımı ve QoS politikaları bu durumu önler.

Hatalı stripe konfigürasyonu: Dosya stripe boyutunun iş yüküne uygun ayarlanmaması performansı önemli ölçüde düşürür. BeeGFS ve Lustre’de büyük sıralı I/O için stripe boyutunun 1–4 MB aralığında tutulması önerilir.

Performans Doğrulama: IOR ve mdtest

Kurulum tamamlandığında hedef performans değerlerinin karşılanıp karşılanmadığını ölçmek için standart araçlar kullanılır:

# IOR ile sıralı yazma testi (64 işlemci, 1 GB dosya başı)
mpirun -np 64 ior -w -r -o /mnt/beegfs/testfile \
  -b 1g -t 1m -F -C

# mdtest ile meta veri performansı
mpirun -np 32 mdtest -C -T -r -n 10000 \
  -d /mnt/beegfs/mdtest

Gerçek iş yükü testleri de doğrulama sürecinin ayrılmaz parçasıdır; sentetik testlerde elde edilen değerlerin üretim iş yüklerinde her zaman korunmayabileceği göz önünde bulundurulmalıdır.

En İyi Pratikler

Scratch katmanını hesaplama katmanından farklı bir ağ segmentine yerleştirin
Depolama sunucularında işletim sistemi diski ile veri diskleri için ayrı denetleyiciler kullanın
Paralel dosya sistemi için ayrı bir yönetim ağı (out-of-band) tasarlayın
İzleme için Prometheus ve Grafana entegrasyonu kurun; BeeGFS exporter bu amaçla kullanılabilir
Düzenli sağlık kontrolleri ve kapasite planlaması için otomasyon altyapısı oluşturun

Sonuç

Katmanlı HPC depolama mimarisi, hesaplama kaynaklarının gerçek potansiyelini ortaya çıkarmanın temel ön koşuludur. NVMe scratch, BeeGFS veya Lustre tabanlı paralel dosya sistemi ve arşiv katmanının doğru boyutlandırılması, hem performans hem de maliyet etkinliği açısından en dengeli sonucu sağlar.

HPC depolama altyapınızı sıfırdan kurmayı veya mevcut sisteminizi optimize etmeyi planlıyorsanız Mevasis HPC Depolama çözümleri sayfasını inceleyebilir, projenize özel teknik değerlendirme için iletişim formundan bize ulaşabilirsiniz.

HPC Depolama Mimarisi: BeeGFS, Lustre ve Katmanlı Depolama Teknik Rehberi