طبق آمارهای جهانی، 5 درصد از سرورها در سال اول دچار مشکلات سخت افزاری میشوند. این عدد با افزایش سن سرورها افزایش مییابد به طوری که پس از هفت سال، 18 درصد سرورها دچار این مشکلات خواهند شد. بنابراین شناخت ارورهای سرور hp به عنوان پرفروش ترین سرورهای بازار ایران، میتواند به کاهش ریسک خرابی سرور کمک کند. در ادامه مهمترین خطاهای سرور اچ پی و دلایل آن را بررسی میکنیم.
خطاهای سرور (Server errors) به مجموعه اشتباهات در محاسبات منطقی یا فیزیکی اشاره دارند که در فرایند اجرای سرویسها و برنامهها رخ میدهند. این خطاها ممکن است به دلایل مختلفی از جمله مشکلات سختافزاری، نرمافزاری، پیکربندی اشتباه، بار کاری زیاد، خطاهای شبکه و… رخ دهند و تعداد آنها بسیار زیاد است. در این مطلب برخی از رایجترین خطاهای سرور hp را بررسی میکنیم.
این خطا از رایجترین خطاهای سرور hp است که ممکن است پس از روشن کردن سرور، در مرحله POST (سرنام Power-On Self-Test) آن را مشاهده کنید. POST Error معمولا با شمارههای خطا و پیامهای خطا نمایش داده میشوند و میتواند به دلیل مشکلات سختافزاری مانند خرابی رم، کارت گرافیک، پاور و… رخ دهد.
این خطا معمولا به دلیل مشکلات سختافزاری یا پیکربندی اشتباه حافظه رخ میدهد. از مهمترین دلایل بروز خطاهای حافظه میتوان به موارد زیر اشاره کرد:
معمولاً خطاهای حافظه با پیامهای خطایی همراه هستند که اطلاعات اولیهای را جهت رفع مشکل ارائه میکنند.
خطای Unexpected Shutdown یعنی سرور بدون اطلاع قبلی و بدون اجرای فرآیندهای مربوطه، به صورت ناگهانی خاموش شده است. این خطا ممکن است به دلیل مشکلات سختافزاری یا نرمافزاری رخ دهد. از دلایل بروز این خطا در سرور HP باید به موارد زیر اشاره کرد:
خطای Critical Error بیانگر مشکلات جدی و اساسی است که توانایی سرور را در انجام عملیات مختلف محدود میکند. این خطا ممکن است به دلایل مختلفی مثل موارد زیر رخ دهد:
خطای Fan Solution به مشکلات مربوط به سیستم خنککننده (فنها) اشاره دارد. این خطا بیانگر این موضوع است که درجه حرارت سرور بالاست. دلیل اصلی بروز این مشکل فنهای خراب یا ناکارآمد، گرد و خاک درون فنها، عدم چرخش صحیح فنها یا عدم دفع درست حرارت توسط فنهاست. این مشکل میتواند به افزایش دمای سرور و آسیبدیدگی قطعات داخلی منجر شود.
خطای Fatal DMA به مشکلات مربوط به DMA سرنام (Direct Memory Access) اشاره دارد. DMA فناوری است که به قطعاتی مثل کارتهای گرافیک، کارتهای صدا و دیگر دستگاههای ورودی/خروجی اجازه میدهد بدون نیاز به مداخله مستقیم از سوی پردازشگر مرکزی به حافظه دسترسی داشته باشند. یکی از دلایل بروز این مشکل، خرابی DMA است.
خطای Fatal Express Port در سرورها به مشکلات مربوط به اسلاتها و پورتهای PCI Express اشاره دارد. Express یک رابط ارتباطی است که برای اتصال تجهیزات جانبی مانند کارتهای گرافیک، کارتهای شبکه و دیگر مولفهها به سرور استفاده میشود.
خطای iLo Generated NMI به مشکلات NMI (سرنام Non-Maskable Interrupt) اشاره دارد که توسط iLO به وجود آمده است. iLO فناوری مدیریت از راه دور سرورهای اچپی است که اجازه کنترل و مانیتورینگ سرور را از راه دور فراهم میکند. NMI یک نوع از سیگنالهای وقفه است که نشان میدهد یک مشکل بحرانی در سرور به وجود آمده است. خطای iLo Generated NMI نشان میدهد که iLO درخواست ارسال NMI به سیستم را داشته است.
خطای “Fatal ROM” به مشکلات ROM سرور اشاره دارد. ROM یک حافظه غیرقابل نوشتن است که شامل دادهها و برنامههای ضروری برای راهاندازی سیستم میشود. این حافظه فقط خواندنی است و اطلاعات آن را نمیتوان تغییر داد. خطای Fatal ROM بیانگر خرابی یا عدم توانایی در دسترسی به ROM است. این خطا ممکن است به دلیل خرابی فیزیکی ROM یا عدم توانایی سیستم در دسترسی به اطلاعات موجود در ROM رخ دهد.
خطای Invalid Memory به مشکلات حافظه اشاره دارد. این خطا نشان میدهد که سرور نمیتواند به درستی با حافظه ارتباط برقرار کند یا از حافظه اشتباهی در سرور استفاده کردهاید. یکی از دلایل نمایش این پیغام، مشکلات فیزیکی در حافظه است. دلیل دوم، ناسازگاری است. در برخی موارد، حافظه ممکن است با سرور ناسازگار باشد یا از حافظههای مختلفی روی سرور استفاده کرده باشید.
درجه حرارت بالای سرور که با پیغام “High Temperature Condition detected by Processor X” نشان داده میشود بیانگر این موضوع است که پردازنده بیش از اندازه داغ شده و به دمای فراتر از حد مجاز رسیده است. از دلایل اصلی بروز این مشکل خرابی فن و هیتسینک پردازنده است که مانع از آن میشود تا گرمای تولید شده از طریق لولههای مسی به هیتسینک منتقل شده و توسط فنها دفع شود. دومین دلیل بروز این مشکل، دمای محیطی است. اگر دمای محیط زیاد باشد یا تهویه به درستی انجام نشود، درجه حرارت پردازنده به سرعت افزایش پیدا میکند. سومین دلیل بروز این مشکل اجرای پردازشهای سنگین مثل بازیهای گرافیکی یا نرمافزارهای محاسبات علمی است که باعث افزایش دمای پردازنده شود.