مرکز داده
اکثر تأسیسات ایده خوبی از دلایل قطع شدن مرکز داده دارند ، اما ممکن است سیستمها و رویههای مناسب برای مقابله با آنها را نداشته باشند. با ارزیابی صحیح خطرات خرابی مرکز داده و انجام اقدامات فعال پیشگیرانه ، تأسیسات هممکان میتوانند خطرات ناشی از خرابی مرکز داده را به میزان قابلتوجهی کاهش دهند. در ادامه درباره 5 دلیل اصلی قطعی مرکز داده و جلوگیری از آن را بررسی خواهیم کرد:
کاهش خطای انسانی
با وجود تأکید بر چالشهای فنی در نگهداری از سرور در زمان فعال بودن آن، تحقیقات قابلتوجهی وجود دارد که خطای انسانی را بهعنوان یکی از علل اصلی خرابی مرکز داده ذکر میکند. در حقیقت ، برخی از مهمترین قطعیهای مرکز داده که توسط شرکتهای بزرگ در چند سال گذشته تجربهشده است ، به یک حادثه یا سهلانگاری بازمیگردد.
خوشبختانه برای کاهش خطر خطای انسانی روشهای بیشتری نسبت به گذشته وجود دارد. سیستمهای خودکار که توسط هوش مصنوعی هدایت میشوند در حال حاضر به بهبود جواب دهی و کارایی در عملیات مرکز داده کمک میکنند و بسیاری از کارهای تکراری را که بهاحتمالزیاد منجر به خطا یا نادیده گرفتن میشوند را حذف میکند. پیشرفت هوش مصنوعی، برنامه دقیق و منظم SOP و MOP همراه با آموزش مناسب پشتیبانی به تکنیسینها و سرپرستها میتواند تأثیر به سزایی داشته باشد. حتی سیستمهای هوش مصنوعی نیز میتوانند تحت تأثیر نیرو یا شرایط محیطی قرار گیرند. بسیار مهم است که دانش و مهارتها از طریق سروکار داشتن فعال با سیستم ، خاموشیهای ساختگی و روشهای نگهداری و تعمیر “dry run” تقویت شوند. این خدمات برای ایجاد اعتمادبهنفس و دانش است. پیادهسازی فرایندهای رسمی و مقیاسپذیر برای هدایت پرسنل دورکار نیز بسیار مهم است زیرا به حذف عدم قطعیت و سردرگمی از عملیات مرکز داده کمک میکند.
محافظت در برابر حملات سایبری
حمله سایبری نسبت به رویدادهای خرابی مرکز داده اثرات مخرب کمتری به بار میآورد. چه بهصورت سرویس حمله توزیعشده (DDoS) چه بهصورت وضعیت باج افزار، تهدیدات سایبری میتوانند اشکال مختلفی داشته باشند و برای مقابله با آخرین اقدامات امنیتی همیشه در حال تکامل هستند. با افزایش استفاده از سرویسهای ابری عمومی و گسترش دستگاههای اینترنت اشیا (IoT) ، شرکتها باید بهطور مداوم آمادگی خود را برای مقابله با حمله احتمالی از مکانهای غیرمنتظره ارزیابی کنند.

مرکز داده
گزینههای اتصال در دسترس برای یک مرکز داده، آنها را بهطور منحصربهفردی برای مقابله با تهدید حمله DDoS مناسب میکند. اتصالات ترکیبی ISP مانند vX \ defe میتواند افزونگی موردنیاز برای دور زدن این حملات را بدون نیاز به خطر انداختن عملکرد شبکه ، فراهم کند. تجزیهوتحلیل دادههای پیشرفته که بر عملکرد مراکز داده نظارت میکند همچنین میتواند الگوهای مشکوک در ترافیک یا فعالیتهای غیرمعمول شبکه را که ممکن است با حمله سایبری مرتبط باشد ، شناسایی کند. با استفاده از فناوری ، تأسیسات هممکان میتوانند قبل از اینکه فرصتی برای خرابی مرکز داده ایجاد شود ، تهدیدها را تشخیص داده و به آنها واکنش نشان دهند.
از خرابی تجهیزات یکقدم جلوتر باشید
درحالیکه صحبتهای زیادی در مورد زیرساختها و شبکههای مجازی وجود دارد ، سختافزاری که منابع محاسباتی قدرتمند را ممکن میسازد هنوز فیزیکی است و مانند سایر تجهیزات ، درنهایت فرسوده میشود. چه یک سرور به پایان عمر 5 ساله خود برسد یا باتری پشتیبان UPS قبل از موعد از بین رود ، خرابی تجهیزات یکی از شایعترین دلایل خاموش شدن مرکز داده است.
بار دیگر ، تجزیهوتحلیل پیشرفته و سیستمهای نظارت خودکار که توسط یادگیری ماشین هدایت میشوند میتوانند نجاتدهنده باشند. با ابزارهای قدرتمند مدیریت زیرساخت مرکز داده (DCIM) امروزه ، تأسیسات میتوانند بر سلامت کلی تجهیزات خود و همچنین داراییهای هممکان نظارت کنند. درحالیکه ممکن است پیشبینی هر خطا ممکن نباشد ، الگوریتمهای پیچیده میتوانند عملکرد تجهیزات را بهطور مداوم کنترل کنند تا پایان عمر سختافزار یا مستعد خراب بودن آن را پیشبینی کنند. هنگامیکه این مشکلات مشخص میشود ، پرسنل مرکز داده میتوانند برنامهای برای خاموش کردن تجهیزات معیوب یا قدیمی بدون نیاز به آفلاین کردن سیستمهای مهم داشته باشند. با افزونگیهای مناسب و پشتیبان گیری و لوازمیدکی اضطراری ، میتوان حتی یک خطای غیرمنتظره را بدون به خطر انداختن عملکرد شبکه مدیریت کرد.
آمادگی برای خطای نرمافزار
مشکلات مربوط به نرمافزار اگرچه بهاندازه خرابیهای سختافزاری رایج نیست اما میتوانند بهراحتی باعث خرابی مرکز داده در شرایط درست (یا اشتباه) شوند. بهعنوانمثال ، نرمافزارهای قدیمی میتوانند شکافهایی در امنیت ایجاد کنند ، یا پچ کردن سیستمعامل ضعیف آزمایششده ممکن است برنامههای کاربردی مهم را خراب کند. باگها همیشه یک تهدید مهم محسوب میشوند و در صورت عدم رسیدگی فوری ، پایهای برای خطاهای بعدی ایجاد میکنند. در شرایطی که بسیاری از شرکتها شبکههای خود را بر روی سرورهای مجازی اجرا میکنند ، پیامدهای احتمالی خرابی نرمافزار حتی بیشتر است.
نظارت و بهروزرسانی منظم دستگاههای حیاتی برای حفظ عملکرد نرمال نرمافزار ضروری است. آزمایش خودکار که سیستمهای نرمافزاری را در طیف گستردهای از شبیهسازیها برای ارزیابی آمادگی و صداقت قرار میدهد ، میتواند مشکلات را آشکار کرده و پرسنل مرکز داده را برای برخورد با آنها آماده کند. اگر در سازگاری و عملکرد نرمافزار در لحظه حساس خطایی رخ دهد مراکز داده برای جواب دهی در لحظههای بحرانی آماده خواهند بود.
پیشبینی حوادث طبیعی
آمادگی برای خرابی مرکز داده مربوط به انسان و تجهیزات ، یکچیز است. آمادگی برای مقابله با اثرات بلایای طبیعی چیز دیگری است. اگرچه اکثر مراکز داده دارای پشتیبانهایی باقدرت کافی و افزونگی اتصالات برای مقابله با هر اتفاقی هستند که باعث آنها مادر طبیعت است ، اما یک برنامه خوب برای مقابله با فاجعه نیز باید تأثیر گستردهتری از رویداد را در نظر بگیرد. چند مدت طول میکشد تا شبکه برق محلی دوباره فعال شود؟
بهترین استراتژی برای جلوگیری از خاموشی مرکز داده به علت بلایای طبیعی ، قرار دادن تأسیسات در منطقهای نسبتاً امن است. مناطق ساحلی و دشتهای سیلآسا مانند مناطق مستعد گردباد و آتشسوزی خطر جدی را به همراه دارد. هنگامیکه تأسیساتی در معرض این تهدیدها قرار میگیرد ، مهم است که هم برنامه آمادهسازی برای بلایا و هم برنامه بازیابی حوادث را داشته باشید. آمادگی برای یک رویداد بالقوه شامل آزمایش تمام سیستمهای اضطراری ازنظر عملکرد و نظارت/هشدار است. تمام کارکنان باید توسط سازمان بازیابی حوادث محلی آموزش ببینند و دارای گواهینامه باشند. محل اقامت ، غذا و سایر ملزومات موجود همه عملکردهای افزونگی باید اعمالشده و تأیید عملیاتی شوند. همه اقدامات ایمنی باید قبل از وقوع یک حادثه انجام شود. اگر حوادث غیرقابلپیشبینی مانند گردباد یا زلزله در منطقه وجود دارد ، برنامهای تهاجمی برای آزمایش آمادگی داشته باشید. همه موارد یا دادههایی که میتوانند در مکان ذخیره شوند باید طبق همان استاندارد نگهداری شوند. این امر تضمین میکند که حتی اگر قطعی مرکز داده رخ دهد ، دادههای مشتری در دسترس خواهد بود تا تأثیر احتمالی خرابی مرکز داده را کاهش دهد.
برداشتن گامهایی برای جلوگیری از قطع مرکز داده برای مدیران مرکز داده چه از یک مرکز خصوصی استفاده کنند چه از تأسیسات هممکان باید مهمترین اولویت باشد. خوشبختانه مراکز داده امروزی بیش از هر زمان دیگری ابزارهایی دارند که به آنها کمک میکند تا زیرساختهای خود را تقویت کرده و سیستمهای خود را برای ارائه سطوح برتر بهروزرسانی سرور به کار اندازند.
بخوانید : کاربرد UPS در مراکز داده
بدون دیدگاه