يظهر فشل Facebook لماذا لا يجب أن نعتمد عليه في كل شيء

جدول المحتويات:

يظهر فشل Facebook لماذا لا يجب أن نعتمد عليه في كل شيء
يظهر فشل Facebook لماذا لا يجب أن نعتمد عليه في كل شيء
Anonim

الوجبات الجاهزة الرئيسية

  • مشاكل Facebook الفنية كانت مؤسفة ، ولكن من المحتمل أن يتم حل المشكلة بشكل أسرع إذا لم تعتمد على العديد من الأنظمة المترابطة.
  • لا توجد طريقة لمنع فشل النظام تمامًا ، ولكن هناك طرق لتقليل احتمالية حدوثها.
  • وجود خطط احتياطية لوقت (وليس إذا ، متى) يفشل النظام يمكن أن يحدث فرقًا بين "المزعج" و "الكارثي".
Image
Image

كارثة Facebook الأخيرة توضح كيف لا بد أن تفشل الأنظمة المترابطة ولماذا لا نستخدمها في كل شيء.

كان فقدان Facebook و WhatsApp و Instagram لعدة ساعات يوم الاثنين أمرًا غير مريح ، وأضر بالأعمال التجارية ، وفي بعض الحالات ، كان كارثيًا تقريبًا. وفقًا لـ Facebook ، كان كل ذلك بسبب تغييرات التكوين في أجهزة توجيه تنسيق الشبكة.

إنه تفسير معقول ، لكن حقيقة أن خطأ واحدًا كهذا قد يؤدي ليس فقط إلى توقف Facebook ولكن أيضًا في توقف الأنظمة الأخرى المملوكة لـ Facebook أمر مقلق بعض الشيء.

تسبب تغيير واحد خاطئ في تكوين جهاز التوجيه في توقف خدمات متعددة ، وحتى سماعات رأس VR ، عن العمل تمامًا. علاوة على ذلك ، من خلال قبول Facebook الخاص ، كان له أيضًا تأثير متتالي على كيفية تواصل مراكز بيانات الشركة ، مما أدى إلى توقف جميع خدماتها.

قال فرانشيسكو ألتوماري ، كبير مهندسي المبيعات الفنية في GlobalDots ، في مقابلة عبر البريد الإلكتروني مع Lifewire ،"الاعتماد على الأنظمة المترابطة يحمل معه مخاطر متأصلة في النظام أو حتى فشل الخدمة".

"لمواجهة هذه المخاطر الرهيبة ، تستخدم الشركات مبدأ SRE (هندسة موثوقية النظام) ، بالإضافة إلى الأدوات الأخرى ، التي تتعامل جميعها مع مستويات مختلفة من التكرار المدمج في كل طبقة من طبقات البنية التحتية للنظام."

Image
Image

ما يمكن أن يكون خطأ

تجدر الإشارة إلى أنه عندما يفشل نظام كهذا ، فإنه عادة ما يتطلب عاصفة كاملة من الأشياء التي تسير بشكل خاطئ. إنه أقل شبهاً بمنزل من البطاقات ينتظر السقوط بل إنه أشبه بمنفذ عادم حراري مكشوف على محطة فضائية بحجم قمر صغير.

تتخذ معظم الشركات خطوات لمحاولة التأكد من أن الشيء الوحيد الذي يمكن أن يلقي بكل شيء في حالة من الفوضى لا يحدث أبدًا - ولكن بغض النظر ، يمكن أن يحدث.

قالت سالي ستيفنز ، الشريك المؤسس لشركة FastPeopleSearch ، في مقابلة عبر البريد الإلكتروني.

. على الرغم من وجود جيش من الخزائن الفاشلة ، لا يزال من الممكن أن يفشل العمود الفقري.

إذا فشل النظام الذي يتحكم في أشياء مثل الأشكال الأساسية للاتصال والأجهزة والأبواب وما إلى ذلك ، فقد تكون النتائج مهمة. من الإزعاج البسيط إلى الكارثة الكاملة ، اعتمادًا على مقدار اعتماد الأفراد والشركات على كل شيء.

Image
Image

"هناك أيضًا خطر دخول المتسللين إلى النظام من أي من الأجهزة الأقل حماية ، مثل الثلاجات ومحمصات الفرن" ، أضاف ستيفنز ، "مما قد يؤدي إلى سرقة البيانات وبرامج الفدية."

كيف يمكننا التحضير

لا توجد طريقة لضمان أن النظام لن يفشل أبدًا ، ولكن هناك خطوات يمكن اتخاذها إما لتقليل احتمال الفشل أو لمعالجة الفشل بشكل أكثر سلاسة.سيكون الجمع بين النهجين اللذين يزاوجان بين إجراءات الأمان من الفشل والإجراءات المضادة مع خطط الطوارئ وأنظمة النسخ الاحتياطي مثاليًا.

"للقضاء على هذه المخاطر الناتجة عن منتجات وخدمات الجهات الخارجية التي يتم التعامل معها بشكل فعال ، يجب تحديد الأدوار والواجبات المتعلقة بإدارة مخاطر الطرف الثالث بدقة" ، هذا ما قالته دانييلا سوير ، المؤسس ورئيس قسم التكنولوجيا في FindPeopleFast ، في مقابلة عبر البريد الإلكتروني ، "للازدهار في هذه البيئة الجديدة ، يجب على مديري المخاطر استيعاب الأجزاء الأساسية لمثل هذا النظام البيئي المعقد."

ما حدث مع Facebook و WhatsApp و Instagram كان مؤسفًا ، ولكن نأمل أيضًا أن يفتح العين. يجب على الأشخاص الذين يعتمدون على الأنظمة المترابطة أن يفهموا أن الخطأ الصحيح يمكن أن يعطل كل شيء. ويجب وضع تدابير (أو تمحيصها وصقلها) لتقليل احتمالية حدوث مثل هذه الاضطرابات وأقل تأثيرًا.

في حالة Facebook ، لم تكن مشكلته هي مشاكل جهاز التوجيه ، بل كان نظامه الإيكولوجي بالكامل متصلاً بكل شيء آخر.وبالتالي ، مع تعطل Facebook (الخدمة) ، كان على Facebook (الشركة) قضاء المزيد من الوقت والجهد في تنظيم المشكلة ومعالجتها. إذا لم يستخدم نظامًا متجذرًا ومترابطًا كهذا أو كان لديه خطط احتياطية للتعامل مع انقطاع مثل هذا ، فمن المحتمل أن يستغرق وقتًا أقل بكثير لإصلاحه.

موصى به: