HPC Migration — Mevcut Altyapıyı Modern Sisteme Taşıma
Eski HPC sistemini modernize edin. CentOS 7'den Rocky Linux'a geçiş, SGE/PBS'den SLURM'a migrasyon, buluttan yerinde sisteme veya tersi.
HPC altyapısı zamanla eskir: işletim sistemi desteği sona erer, scheduler teknolojisi gelişir, donanım kapasitesi yetersiz kalır. Migrasyon projesi, üretim iş yüklerini kesintisiz sürdürürken sistemi modernize etmek için uzman planlama gerektirir.
Tipik Migrasyon Senaryoları
CentOS 7 → Rocky Linux 9 / AlmaLinux 9
CentOS 7, Haziran 2024’te EOL (End of Life) statüsüne girdi. EOL sistemde güvenlik yamaları yayınlanmaz, bu da kurumsal altyapı için ciddi risk oluşturur.
Mevasis migrasyon süreci:
- Mevcut paket ve bağımlılık envanteri
- Rocky Linux 9 test ortamı kurulumu
- Uygulama uyumluluk testi
- Aşamalı üretim geçişi (node node)
- Doğrulama ve izleme
SGE / PBS → SLURM
SLURM, endüstri standardı haline gelmiştir. SGE (Son Grid Engine) ve eski PBS sürümlerinden geçiş, job script uyumluluk çalışması gerektirir.
# SGE job script örneği → SLURM karşılığı
# SGE: #$ -pe mpi 32
# SLURM: #SBATCH --ntasks=32
# SGE: qsub my_job.sh
# SLURM: sbatch my_job.sh
Bulut → On-Premises (Repatriation)
Yüksek bulut faturası veya veri güvenliği endişesi ile yerinde sisteme geçiş. Mevasis, iş yükü profilini analiz ederek doğru on-premises boyutlandırmasını belirler.
Nesil Güncelleme (Hardware Refresh)
Mevcut cluster’ı yeni donanımla değiştirirken iş yükü sürekliliğini sağlama. Paralel ortam kurulumu, veri taşıma ve kademeli kullanıcı geçişi.
Migrasyon Metodolojisi
Keşif: Mevcut sistem envanteri, bağımlılık haritası, kullanıcı analizleri
Test Ortamı: Üretim ortamını yansıtan test cluster kurulumu
Pilot: Seçili iş yükleri ile yeni sistemde test çalışması
Paralel Çalışma: Her iki sistem aktif, kullanıcılar kademeli geçiş
Kesim: Eski sistem devre dışı, yeni sistem tam üretim
İzleme: 2-4 hafta yakın takip, rollback hazır
Migrasyon projeniz için değerlendirme görüşmesi ayarlayın.
Sıkça Sorulan Sorular
Migrasyon sırasında mevcut iş yükleri çalışmaya devam eder mi?
Çift-çalışma (parallel run) stratejisi uygulanır. Eski sistem kademeli olarak devre dışı bırakılırken yeni sistem paralelde aktif tutulur.
SGE'den SLURM'a geçiş ne kadar sürer?
Mevcut iş yükü sayısına bağlı olarak 2-8 hafta arasında değişir. Job script dönüştürme, test ve kullanıcı eğitimi bu süreye dahildir.