Sunucularda Cold Start ve Ram Modül Hatası
Sunucularda ilk çalıştırma ve Cold Start çalıştırma yöntemi, ram kontrolü.
Sunucularda Cold Start ve Ram Modül Hatası
Fiziksel sunucuların ömürleri boyunca en az bir defa upgrade işlemi gördükleri muhtemeldir. Bu nedenle sunucularda cold start yapılması da aynı derecede ihtimal dahilindedir. Kişisel bilgisayarlara oranla upgrade işlemi daha zor ve bir o kadar da riskli olduğu için sıklıkla yapılabilecek bir şey değildir. Hele hele üzerinde sanal sunucularınız ve bağlı uygulamalar koşturuluyorsa işimiz bir hayli zor olacaktır.
Geçtiğimiz günlerde VmWare Esxi sunucularımdan birine Memory artırımı için upgrade etme kararı aldık. Çalışan tüm servisleri durdurdum ve uygulamaları da cluster üzerine gönderdim, ancak RAM takviyesi hiç kolay bir işlem değil. Bu nedenle karşılaştığım sorunları sizlerle paylaşmak istedim.
Öncelikle sunucuların kişisel bilgisayarlardan farklı olarak çalıştığını söylemeliyim. 2 – 4 – 8 veya 16 adet fiziksel İşlemci barındırabilir. Her işlemci ise kendi Ram modülü ile birlikte çalışır. Kullanmakta olduğum sunucu HP DL380 G6 modeldir. Bu modelde çift işlemci soketi olmasına rağmen üzerinde tek işlemci bulunmakta.
Aşağıda sunucu board ın açık hali üzerinde 1 ve 2 numara ile gösterdiğimiz Ram Slotları ile İşlemci Soketleri birlikte çalışır. Yani 1 nolu ram modül 1 nolu işlemci ile çalışır.
Ram modülünde takılan memory lerde kendi içlerinde replike çalışır. Yani tamamı aynı model ve hızda olmalıdır. Ram etiketinde yazılı model numaraları bire bir aynı olmalıdır. Bir tanesi bile farklı olsa alacağınız uyarı aşağıdaki videomuzda kayda alınmıştır. Cold Start işleminden yaklaşık 6 saniye sonra tek ve uzun şekilde verilen sesli sinyal Ram modülünde dizilim hatası ya da arızalı Ram’ i işaret etmektedir.
Tek işlemci ve tek ram modülündeki 9 adet memory ile yaptığımız test işlemine ait 4 farklı açıdan çekilmiş videoyu izlediniz. HP sunucularda tek sıkıntı hangi slottaki Ram’ in uyumsuz olduğunu görememektir. Videonun ilk saniylerinde de görüleceği üzere ön panelde bulunan tüm modül ledleri yanmaktadır. Sizin göreviniz göz yordamıyla ramleri tek tek kontrol etmek ve yuvasına oturmayan, arızalı veya uyumsuz modeli tespit etmektir.
Cold Start
Hazır sunucunun içini açmışken “cold start” yani “ilk çalıştırma” olayınıda kaydettik. Sunucularda Cold Start yapabilmek için power kablolarını tamamen çıkardıktan birkaç saniye sonra power kabloları takmak ve power tuşuna basmaktır. Eğer sunucu normal seyrinde çalışıyor ise bunu ILO Management üzerinden de gerçekleştirebilirsiniz. Cold start’ ın önemi ise fanların 3-4 saniye tam güç ile çalışması ve böylelikle hem fanların zorlama testi yapılmış olur hemde sunucu içindeki tozlanmanın önüne geçilmiş olunur.
ILO manager üzerinde Cold Restart seçeneğide bulunmaktadır. Bu seçeneğin işlevi ise kabloları fiziksel olarak çekmek ile eş değerdir. Bu nedeni sadece işletim sistemindeki donma veya çökme durumlarında kullanılmalıdır. Aksi takdirde platform çökebilir.