تقنية

CrowdStrike تكشف أسباب انقطاع الإنترنت في جميع أنحاء العالم

ألقت CrowdStrike باللوم على برنامج الاختبار الخاطئ في التحديث الخاطئ الذي أدى إلى تعطل 8.5 مليون جهاز يعمل بنظام Windows في جميع أنحاء العالم، حسبما كتبت الشركة في مراجعة ما بعد الحادث (PIR). وقالت الشركة: “بسبب خطأ في أداة التحقق من المحتوى، اجتاز أحد [أحد التحديثين] عملية التحقق على الرغم من احتوائه على بيانات بها مشكلات”. ووعدت بسلسلة من الإجراءات الجديدة لمنع تكرار المشكلة.

أثرت شاشة الموت الزرقاء الهائلة لانقطاع الخدمة على العديد من الشركات حول العالم، بما في ذلك شركات الطيران والمذيعين وبورصة لندن وغيرها الكثير.

أجبرت المشكلة أجهزة Windows على الدخول في حلقة تمهيد، حيث طلب الفنيون الوصول المحلي إلى الأجهزة لاستعادتها (لم تتأثر أجهزة Apple وLinux). لا تزال العديد من الشركات مثل شركة دلتا إيرلاينز في مرحلة التعافي.

لمنع DDoS وأنواع أخرى من الهجمات، لدى CrowdStrike أداة تسمى Falcon Sensor. ويحتوي على محتوى على مستوى النواة (يسمى محتوى المستشعر) يستخدم “نوع القالب” لتحديد كيفية معالجة التهديدات. عندما يظهر شيء جديد، فإنه يرسل محتوى QR في شكل مثيلات القالب.

تم إصدار نوع الشريحة الخاصة بالمستشعر الجديد في 5 مارس 2024 وكان أداؤه كما هو متوقع. ومع ذلك، تم إصدار نسختين جديدتين من النموذج في 19 يوليو، واجتازت واحدة (حجمها 40 كيلو بايت فقط) التحقق من الصحة على الرغم من “البيانات الإشكالية”، حسبما قالت CrowdStrike. “عند استلامه بواسطة المستشعر وتحميله في مترجم المحتوى، [هذا] أدى إلى قراءة ذاكرة خارج الحدود، مما أدى إلى حدوث استثناء. لا يمكن معالجة هذا الاستثناء غير المتوقع بأمان، مما يؤدي إلى تعطل نظام التشغيل Windows (BSOD). “.

ولمنع تكرار الحادث مرة أخرى، وعدت CrowdStrike باتخاذ عدة إجراءات. الأول هو إجراء اختبار أكثر شمولاً لمحتوى QR، بما في ذلك اختبار المطورين المحليين، وتحديثات المحتوى، واختبار الانحدار، واختبار الضغط، واختبار الاستقرار، والمزيد. تتم أيضًا إضافة عمليات التحقق من الصحة وتحسين معالجة الأخطاء.

بالإضافة إلى ذلك، ستبدأ الشركة في استخدام استراتيجية التسليم المتدرجة لمحتوى الاستجابة السريعة لتجنب تكرار الانقطاع العالمي. بالإضافة إلى ذلك، يحصل العملاء على تحكم أكبر في تسليم هذا المحتوى ويمكنهم تلقي ملاحظات الإصدار للحصول على التحديثات.

ومع ذلك، يعتقد بعض المحللين والمهندسين أنه كان ينبغي على الشركة اتخاذ مثل هذه الإجراءات منذ البداية. وكتب المهندس فلوريان روث: “لا بد أن CrowdStrike كانت تعلم أن هذه التحديثات يمكن أن يفسرها السائقون وتتسبب في حدوث مشكلات”.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى