تحسن عملية تنظيف الأقراص التقليدية سلامة البيانات ولكنها تستنزف الأداء والطاقة. تقدم هذه الورقة طريقة تنظيف انتقائية وذكية مدعومة بتنبؤ موندريان المطابق، حيث تخصص درجات صحية للأقراص الفردية لتحديد الأقراص التي يجب تنظيفها ومتى يتم ذلك. من خلال مواءمة دورات الصيانة مع فترات الخمول واستخدام نماذج تنبؤية للكشف عن المشكلات الكامنة أو مشكلات "الفشل البطيء"، يعزز هذا النهج الموثوقية مع تقليل هدر الموارد—مما يوفر مساراً قائماً على البيانات نحو مراكز بيانات أكثر ذكاءً وصداقة للبيئة.تحسن عملية تنظيف الأقراص التقليدية سلامة البيانات ولكنها تستنزف الأداء والطاقة. تقدم هذه الورقة طريقة تنظيف انتقائية وذكية مدعومة بتنبؤ موندريان المطابق، حيث تخصص درجات صحية للأقراص الفردية لتحديد الأقراص التي يجب تنظيفها ومتى يتم ذلك. من خلال مواءمة دورات الصيانة مع فترات الخمول واستخدام نماذج تنبؤية للكشف عن المشكلات الكامنة أو مشكلات "الفشل البطيء"، يعزز هذا النهج الموثوقية مع تقليل هدر الموارد—مما يوفر مساراً قائماً على البيانات نحو مراكز بيانات أكثر ذكاءً وصداقة للبيئة.

التنبؤ المطابق موندريان لتقييم صحة القرص وتحسين التنظيف

2025/10/07 02:09

نبذة مختصرة و 1. مقدمة

  1. الدافع وأهداف التصميم

  2. الأعمال ذات الصلة

  3. التنبؤ المطابق

    4.1. التنبؤ المطابق موندريان (MCP)

    4.2. مقاييس التقييم

  4. التنبؤ المطابق موندريان لتنظيف القرص: نهجنا

    5.1. إحصائيات النظام والتخزين

    5.2. أي قرص يجب تنظيفه: متنبئ صحة محرك الأقراص

    5.3. متى يتم التنظيف: متنبئ عبء العمل

  5. الإعداد التجريبي و 6.1. مجموعة بيانات بايدو مفتوحة المصدر

    6.2. النتائج التجريبية

  6. مناقشة

    7.1. جانب الجدولة الأمثل

    7.2. مقاييس الأداء و 7.3. توفير الطاقة من التنظيف الانتقائي

  7. الخاتمة والمراجع

2. الدافع وأهداف التصميم

في مراكز البيانات، يظل عدد كبير من محركات الأقراص غير الصحية غير مكتشف بسبب سمات الفشل الكامنة، مما يؤدي إلى سيناريوهات توقف الفشل. أحد النهج الشائعة للتخفيف من هذه السيناريوهات هو تنظيف القرص، والذي يتكون من التحقق من بيانات القرص من خلال عملية فحص في الخلفية لتحديد القطاعات السيئة. ومع ذلك، يمكن أن تستهلك هذه العملية الطاقة وتسبب تدهور الأداء اعتمادًا على جدول التشغيل. يثير هذا السيناريو مخاوف في الصناعة، خاصة مع زيادة سعات القرص. نلاحظ وجود حلقة مفقودة في معالجة "أي قرص يجب تنظيفه"، "متى يتم التنظيف"، بناءً على تكرار دورة التنظيف مع تقليل تأثير أداء مصفوفة التخزين وأيضًا زيادة الموثوقية. في هذه الورقة، نأخذ في الاعتبار الأهداف التالية ونهج التصميم لمعالجة هذا التحدي:

\ • أي قرص يجب تنظيفه؟ اعتمادًا على عملية التنظيف المحددة، يمكن أن تؤدي مؤقتًا إلى تدهور أداء محرك الأقراص. لضمان بقاء محرك الأقراص سريعًا ومستجيبًا، يعد تقليل تكرار التنظيف أمرًا بالغ الأهمية. بدلاً من إجراء التنظيف لجميع الأقراص في مصفوفة التخزين، يركز نهجنا على تنظيف الأقراص التي تتطلب ذلك بشكل انتقائي، مما يقلل من الوقت الإجمالي المطلوب لإكمال العملية.

\ • متى يتم التنظيف؟ يمكننا تحسين جدول تنظيف محرك الأقراص من خلال مراعاة عوامل مثل عبء عمل النظام، وأهمية البيانات على محرك الأقراص، وتوافر الموارد. يضمن هذا النهج إجراء التنظيف في الأوقات الأكثر ملاءمة، مما يقلل من التأثير على أداء النظام بشكل عام.

\

3. الأعمال ذات الصلة

لطالما كانت موثوقية جهاز التخزين مصدر قلق بالغ في الصناعة، وغالبًا ما تعتمد الحلول الحالية على تحليل فشل أنظمة التخزين. ومع ذلك، لم تثبت الطرق التقليدية مثل اختبارات الحياة المتسارعة (Cho et al.، 2015) أنها مؤشرات موثوقة لمعدلات الفشل الفعلية في بيئات الإنتاج. ركزت النهج الحديثة القائمة على التعلم الآلي، مثل السلاسل الزمنية متعددة المتغيرات (Yu، 2019) وتصنيف السلاسل الزمنية (Ircio et al.، 2022)، على تحسين دقة النموذج، ولكنها غالبًا ما تفتقر إلى التكامل العميق للمعرفة المجالية. علاوة على ذلك، فإن النهج متعدد الوسائط من قبل (Lu et al.، 2020) باستخدام مقاييس الأداء (على مستوى القرص ومستوى الخادم) والموقع المكاني للقرص يركز فقط على سيناريوهات توقف الفشل، والتي قد لا تكون مفيدة في اكتشاف الأعطال الكامنة. تناولت دراسة حديثة جدًا (Lu et al.، 2023) هذه المشكلة من خلال التحقيق في حالات الفشل الرمادية (محركات الأقراص البطيئة الفاشلة) باستخدام نموذج انحدار لتحديد وتحليل حالات الفشل البطيء على مستوى محركات الأقراص الفردية.

\ عامل مهم آخر لتنظيف القرص هو تكلفة التنفيذ واستهلاك الطاقة. يتناول (Mi et al.، 2008) و (Jiang et al.، 2019) تدهور الأداء بسبب التنظيف ويقترحان تعيين أولوية أقل للعملية الخلفية أثناء وقت الخمول، أي عندما لا يكون محرك الأقراص مشغولاً بشكل نشط في معالجة البيانات أو أداء أي مهام أخرى. يقترح (Liu et al.، 2010) و (Oprea and Juels، 2010) طريقة للتخفيف من استهلاك الطاقة وتحديد وقت التنظيف في الأنظمة ذات البيانات غير المكلفة ولكنها تتطلب تصميم طريقة أخرى لتحديد البيانات الأقل أهمية. تمت مناقشة إدارة مساحة محرك الأقراص في حالة استبدال القرص الفاشل في (Pˆaris et al.، 2010)، إلى جانب تقليل الحاجة إلى التنظيف المتكرر. تم اقتراح تنظيف متعدد المستويات في (Zhang et al.، 2020) باستخدام نموذج الذاكرة طويلة المدى قصيرة المدى (LSTM) للكشف عن أخطاء القطاع الكامنة في إعداد تصنيف ثنائي. ومع ذلك، قد يؤدي استخدام النماذج القائمة على التعلم الآلي إلى معاملة الأقراص الصحية والأقراص الأقل صحة بنفس الطريقة، مما يؤدي إلى تنظيف غير ضروري للأقراص الصحية.

\ على حد علمنا، عملنا هو الأول الذي يتبنى التنبؤ المطابق موندريان لتعيين درجة صحية لكل محرك أقراص فردي واستخدام المقاييس لتصميم دورة تنظيف متوافقة مع وقت خمول النظام.

\

:::info هذه الورقة متاحة على arxiv تحت رخصة CC BY-NC-ND 4.0 Deed (نسب المصنف - غير تجاري - منع الاشتقاق 4.0 دولي).

:::


:::info المؤلفون:

(1) راهول فيشواكارما، جامعة ولاية كاليفورنيا لونج بيتش، 1250 بيلفلاور بوليفارد، لونج بيتش، كاليفورنيا 90840، الولايات المتحدة (rahuldeo.vishwakarma01@student.csullb.edu)؛

(2) جينها هوانج، جامعة ولاية كاليفورنيا لونج بيتش، 1250 بيلفلاور بوليفارد، لونج بيتش، كاليفورنيا 90840، الولايات المتحدة (jinha.hwang01@student.csulb.edu)؛

(3) سندس مسعودي، HEUDIASYC - UMR CNRS 7253، جامعة تكنولوجيا كومبيين، 57 شارع لاندشوت، 60203 كومبيين سيديكس - فرنسا (soundouss.messoudi@hds.utc.fr)؛

(4) آفا هدايتي بور، جامعة ولاية كاليفورنيا لونج بيتش، 1250 بيلفلاور بوليفارد، لونج بيتش، كاليفورنيا 90840، الولايات المتحدة (ava.hedayatipour@csulb.edu).

:::

\

إخلاء مسؤولية: المقالات المُعاد نشرها على هذا الموقع مستقاة من منصات عامة، وهي مُقدمة لأغراض إعلامية فقط. لا تُظهِر بالضرورة آراء MEXC. جميع الحقوق محفوظة لمؤلفيها الأصليين. إذا كنت تعتقد أن أي محتوى ينتهك حقوق جهات خارجية، يُرجى التواصل عبر البريد الإلكتروني service@support.mexc.com لإزالته. لا تقدم MEXC أي ضمانات بشأن دقة المحتوى أو اكتماله أو حداثته، وليست مسؤولة عن أي إجراءات تُتخذ بناءً على المعلومات المُقدمة. لا يُمثل المحتوى نصيحة مالية أو قانونية أو مهنية أخرى، ولا يُعتبر توصية أو تأييدًا من MEXC.
مشاركة الرؤى

قد يعجبك أيضاً