نبذة مختصرة و 1. مقدمة
الدافع وأهداف التصميم
الأعمال ذات الصلة
التنبؤ المطابق
4.1. التنبؤ المطابق موندريان (MCP)
4.2. مقاييس التقييم
التنبؤ المطابق موندريان لتنظيف القرص: نهجنا
5.1. إحصائيات النظام والتخزين
5.2. أي قرص يجب تنظيفه: متنبئ صحة محرك الأقراص
5.3. متى يتم التنظيف: متنبئ عبء العمل
الإعداد التجريبي و 6.1. مجموعة بيانات بايدو مفتوحة المصدر
6.2. النتائج التجريبية
مناقشة
7.1. جانب الجدولة الأمثل
7.2. مقاييس الأداء و 7.3. توفير الطاقة من التنظيف الانتقائي
الخاتمة والمراجع
في مراكز البيانات، يظل عدد كبير من محركات الأقراص غير الصحية غير مكتشف بسبب سمات الفشل الكامنة، مما يؤدي إلى سيناريوهات توقف الفشل. أحد النهج الشائعة للتخفيف من هذه السيناريوهات هو تنظيف القرص، والذي يتكون من التحقق من بيانات القرص من خلال عملية فحص في الخلفية لتحديد القطاعات السيئة. ومع ذلك، يمكن أن تستهلك هذه العملية الطاقة وتسبب تدهور الأداء اعتمادًا على جدول التشغيل. يثير هذا السيناريو مخاوف في الصناعة، خاصة مع زيادة سعات القرص. نلاحظ وجود حلقة مفقودة في معالجة "أي قرص يجب تنظيفه"، "متى يتم التنظيف"، بناءً على تكرار دورة التنظيف مع تقليل تأثير أداء مصفوفة التخزين وأيضًا زيادة الموثوقية. في هذه الورقة، نأخذ في الاعتبار الأهداف التالية ونهج التصميم لمعالجة هذا التحدي:
\ • أي قرص يجب تنظيفه؟ اعتمادًا على عملية التنظيف المحددة، يمكن أن تؤدي مؤقتًا إلى تدهور أداء محرك الأقراص. لضمان بقاء محرك الأقراص سريعًا ومستجيبًا، يعد تقليل تكرار التنظيف أمرًا بالغ الأهمية. بدلاً من إجراء التنظيف لجميع الأقراص في مصفوفة التخزين، يركز نهجنا على تنظيف الأقراص التي تتطلب ذلك بشكل انتقائي، مما يقلل من الوقت الإجمالي المطلوب لإكمال العملية.
\ • متى يتم التنظيف؟ يمكننا تحسين جدول تنظيف محرك الأقراص من خلال مراعاة عوامل مثل عبء عمل النظام، وأهمية البيانات على محرك الأقراص، وتوافر الموارد. يضمن هذا النهج إجراء التنظيف في الأوقات الأكثر ملاءمة، مما يقلل من التأثير على أداء النظام بشكل عام.
\
لطالما كانت موثوقية جهاز التخزين مصدر قلق بالغ في الصناعة، وغالبًا ما تعتمد الحلول الحالية على تحليل فشل أنظمة التخزين. ومع ذلك، لم تثبت الطرق التقليدية مثل اختبارات الحياة المتسارعة (Cho et al.، 2015) أنها مؤشرات موثوقة لمعدلات الفشل الفعلية في بيئات الإنتاج. ركزت النهج الحديثة القائمة على التعلم الآلي، مثل السلاسل الزمنية متعددة المتغيرات (Yu، 2019) وتصنيف السلاسل الزمنية (Ircio et al.، 2022)، على تحسين دقة النموذج، ولكنها غالبًا ما تفتقر إلى التكامل العميق للمعرفة المجالية. علاوة على ذلك، فإن النهج متعدد الوسائط من قبل (Lu et al.، 2020) باستخدام مقاييس الأداء (على مستوى القرص ومستوى الخادم) والموقع المكاني للقرص يركز فقط على سيناريوهات توقف الفشل، والتي قد لا تكون مفيدة في اكتشاف الأعطال الكامنة. تناولت دراسة حديثة جدًا (Lu et al.، 2023) هذه المشكلة من خلال التحقيق في حالات الفشل الرمادية (محركات الأقراص البطيئة الفاشلة) باستخدام نموذج انحدار لتحديد وتحليل حالات الفشل البطيء على مستوى محركات الأقراص الفردية.
\ عامل مهم آخر لتنظيف القرص هو تكلفة التنفيذ واستهلاك الطاقة. يتناول (Mi et al.، 2008) و (Jiang et al.، 2019) تدهور الأداء بسبب التنظيف ويقترحان تعيين أولوية أقل للعملية الخلفية أثناء وقت الخمول، أي عندما لا يكون محرك الأقراص مشغولاً بشكل نشط في معالجة البيانات أو أداء أي مهام أخرى. يقترح (Liu et al.، 2010) و (Oprea and Juels، 2010) طريقة للتخفيف من استهلاك الطاقة وتحديد وقت التنظيف في الأنظمة ذات البيانات غير المكلفة ولكنها تتطلب تصميم طريقة أخرى لتحديد البيانات الأقل أهمية. تمت مناقشة إدارة مساحة محرك الأقراص في حالة استبدال القرص الفاشل في (Pˆaris et al.، 2010)، إلى جانب تقليل الحاجة إلى التنظيف المتكرر. تم اقتراح تنظيف متعدد المستويات في (Zhang et al.، 2020) باستخدام نموذج الذاكرة طويلة المدى قصيرة المدى (LSTM) للكشف عن أخطاء القطاع الكامنة في إعداد تصنيف ثنائي. ومع ذلك، قد يؤدي استخدام النماذج القائمة على التعلم الآلي إلى معاملة الأقراص الصحية والأقراص الأقل صحة بنفس الطريقة، مما يؤدي إلى تنظيف غير ضروري للأقراص الصحية.
\ على حد علمنا، عملنا هو الأول الذي يتبنى التنبؤ المطابق موندريان لتعيين درجة صحية لكل محرك أقراص فردي واستخدام المقاييس لتصميم دورة تنظيف متوافقة مع وقت خمول النظام.
\
:::info هذه الورقة متاحة على arxiv تحت رخصة CC BY-NC-ND 4.0 Deed (نسب المصنف - غير تجاري - منع الاشتقاق 4.0 دولي).
:::
:::info المؤلفون:
(1) راهول فيشواكارما، جامعة ولاية كاليفورنيا لونج بيتش، 1250 بيلفلاور بوليفارد، لونج بيتش، كاليفورنيا 90840، الولايات المتحدة (rahuldeo.vishwakarma01@student.csullb.edu)؛
(2) جينها هوانج، جامعة ولاية كاليفورنيا لونج بيتش، 1250 بيلفلاور بوليفارد، لونج بيتش، كاليفورنيا 90840، الولايات المتحدة (jinha.hwang01@student.csulb.edu)؛
(3) سندس مسعودي، HEUDIASYC - UMR CNRS 7253، جامعة تكنولوجيا كومبيين، 57 شارع لاندشوت، 60203 كومبيين سيديكس - فرنسا (soundouss.messoudi@hds.utc.fr)؛
(4) آفا هدايتي بور، جامعة ولاية كاليفورنيا لونج بيتش، 1250 بيلفلاور بوليفارد، لونج بيتش، كاليفورنيا 90840، الولايات المتحدة (ava.hedayatipour@csulb.edu).
:::
\