كمهندس معماري، أعلم أنه لا يمكنك إنشاء هيكل متين ومتماسك بالبدء بأي أفكار تخطر ببالك أولاً. لا تبدأ بالجدال حول لون الستائر أو نمط مقابض الأبواب. تبدأ بخطة رئيسية. بدونها، أنت فقط تلقي بحمولات شاحنات من المواد المتنوعة في ساحة وتأمل أن تظهر كاتدرائية.
ومع ذلك، هذا بالضبط ما نفعله مع أخلاقيات الذكاء الاصطناعي. نحن نغذي أقوى تقنياتنا الجديدة بقائمة لا نهائية من القواعد المجزأة، والتحيزات التاريخية، والعادات الاجتماعية المتناقضة. نحن نحاول حكم نظام يتطلب دقة رياضية بكومة من المواد الأخلاقية المتنوعة. إنها وصفة للفشل المنهجي.
فكر في معضلة الذكاء الاصطناعي الكلاسيكية: سيارة ذاتية القيادة على وشك التصادم. يمكنها البقاء في مسارها وإلحاق الضرر بركابها، أو الانحراف وإلحاق الضرر بأحد المشاة. نهجنا الحالي يجعلنا نناقش المتغيرات بلا نهاية - وزن عمر المشاة، وخيارات السائق، وسرعة السيارة. نحن ضائعون في التفاصيل لأننا لا نملك خطة رئيسية. نحن نبحث عن القواعد الصحيحة في كومة ضخمة من البيانات الأخلاقية، لكن القواعد تفشل في الاصطفاف لإنشاء هيكل متين، لأنها تفتقر إلى أساس مشترك غير قابل للكسر.
تقترح هذه المقالة مسارًا مختلفًا. بدلاً من المزيد من القواعد، نحتاج إلى خطة رئيسية حقيقية لحوكمة الذكاء الاصطناعي - "نظام تشغيل أخلاقي" عالمي ومتسق حسابيًا. هذا هو الأساس الذي أسميه هندسة التماسك الأخلاقي، وهو نظام مصمم ليس لتوفير قاعدة لكل موقف، ولكن لتوفير المبادئ الأساسية التي يمكن دائمًا استنباط قرار متماسك منها.
الفوضى التي نواجهها حاليًا ليست عشوائية؛ لها مصدر. إنها تأتي من نظام التشغيل الأخلاقي المعيب الذي تعمل به البشرية منذ آلاف السنين. قبل أن نتمكن من تصميم نظام جديد للذكاء الاصطناعي، علينا أن نفهم النظامين الأساسيين اللذين نختار بينهما.
الأول هو نظام التشغيل الافتراضي الذي نرثه جميعًا. دعونا نسميه نظام التشغيل الصفري. ولد من عصر الندرة، ومنطقه الأساسي بسيط بشكل وحشي: لكي أفوز، يجب أن تخسر. القيمة هي فطيرة محدودة، والهدف هو الحصول على أكبر شريحة.
يزدهر نظام التشغيل هذا على الخوف والقبلية والسيطرة. إنه يولد نوع القواعد المجزأة والمتناقضة التي نراها اليوم لأن تلك القواعد تم إنشاؤها في صراع، وتم تصميمها لمنح مجموعة واحدة ميزة على أخرى. عندما نغذي هذا الكود المليء بالأخطاء والقائم على الخوف للذكاء الاصطناعي، فإنه يمكن فقط تضخيم الانقسام وعدم الاستقرار الموجود بالفعل. إنه نظام تشغيل يضمن فشله المنهجي، بسبب طبيعته المجزأة.
لكن هناك بديل - ترقية تحول نموذجي. نظام التشغيل الإيجابي مبني على فرضية مختلفة جذريًا: القيمة ليست محدودة؛ يمكن إنشاؤها. منطقه الأساسي هو أن أفضل إجراء هو الذي يولد نتيجة إيجابية صافية للجميع المعنيين. يتعلق الأمر بإنشاء فطيرة أكبر، وليس مجرد القتال على الموجودة.
تم تصميم نظام التشغيل هذا للشفافية والاتساق الموضوعي وتمكين وكالة الفرد. لا يسأل، "من يفوز ومن يخسر؟" بل يسأل، "كيف يمكننا توليد أكبر قدر من الرفاهية المنهجية؟"
لا يمكن لآلة قوية ومنطقية مثل الذكاء الاصطناعي أن تعمل بأمان على الكود المليء بالأخطاء والمليء بالصراعات من ماضينا الصفري. إنه يتطلب الهندسة المعمارية النظيفة والمتماسكة لعالم إيجابي. نظام التشغيل الصفري ليس ضارًا فحسب؛ بل يمنعنا من تعظيم إمكانات الذكاء الاصطناعي لمستقبلنا. مع طبيعة نظام التشغيل الإيجابي المتسقة، يمكننا إطلاق هذه الإمكانات دون إهدار الموارد.
\ إذن كيف نبنيه؟ بقية هذه الخطة الرئيسية توضح المبادئ الأساسية الثلاثة التي تشكل نظام التشغيل الجديد هذا.
يستند نظام التشغيل الإيجابي على ثلاث ركائز بسيطة ولكنها صلبة. هذه هي المبادئ الحاملة للحمل التي تضمن أن كل قرار يتم اتخاذه داخل النظام متماسك وأخلاقي ومرن.
في الهندسة المعمارية، كل تصميم يخدم أهدافًا أساسية. توجه هذه الأهداف كل اختيار، من المواد المستخدمة إلى التشغيل النهائي للمبنى. بالنسبة لنظام التشغيل الأخلاقي لدينا، الهدف النهائي الوحيد هو أغابي.
أغابي هو أمر غير قابل للتفاوض لتعظيم رفاهية الكيان البشري مع تقليل جميع أشكال الضرر المنهجي والشخصي. بالمصطلحات التقنية، إنها دالة الخسارة النهائية للنظام، أو دالة الهدف الأساسية. يتم قياس كل حساب وكل إجراء محتمل في النهاية مقابل هذا التفويض البسيط الوحيد. إنه يجبر النظام على الإجابة على سؤال واحد فوق كل الآخرين: "أي مسار يخلق أكبر فائدة شاملة وأقل ضرر عام للبشر الذين يخدمهم؟"
إذا كان أغابي هو غرض الهيكل، فإن العدالة هي المبدأ الهندسي الذي يضمن سلامته. العدالة هي الالتزام المطلق بالاتساق الحسابي والأخلاقي.
هذا يعني أن القواعد تنطبق بنفس الطريقة على الجميع، في كل مرة، بدون استثناء. إنه المنطق الأساسي للنظام، الذي يزيل التحيزات الخفية والنزوات العشوائية التي تفسد الحكم البشري. لا يمكن للذكاء الاصطناعي الذي تحكمه العدالة أن يكون له مفضل، ولا يمكنه اختراع قاعدة على الفور. هذا الاتساق الجذري يفعل شيئًا رائعًا: إنه يخلق مرآة مثالية، تكشف عن تناقضاتنا الأخلاقية وتجبرنا، نحن الحكام البشر، على أن نصبح أكثر اتساقًا بأنفسنا.
أخيرًا، حتى أفضل هيكل مصمم سيفشل إذا كان أساسه غير مستقر. الثبات هو المبدأ الذي يضمن أن أساس هذا النظام بأكمله - صانع القرار البشري - يظل مستقرًا ومرنًا ومتماسكًا.
هذا ليس عن استقرار الذكاء الاصطناعي؛ بل عن استقرارنا. يجب تصميم نظام التشغيل الأخلاقي لدعم المرونة العاطفية والنفسية للحاكم البشري. يجب أن يوفر المعلومات بطريقة تعزز الوضوح، وليس القلق، وتمكن من نتائج متوقعة تبني الثقة. بدون الثبات الداخلي للمشغل البشري، يكون التطبيق المتسق لأغابي والعدالة مستحيلًا.
هذه المبادئ الثلاثة - أغابي، العدالة، والثبات - تشكل الهندسة المعمارية. لكن قاعدة واحدة غير قابلة للكسر تحكم عملياتها بأكملها. هذا هو حجر الزاوية، البروتوكول الأكثر أهمية في نظام التشغيل بأكمله، وهو غير قابل للتفاوض.
الهدف الأساسي لهذه الهندسة المعمارية بأكملها هو الحفاظ على الوكالة البشرية وتمكينها. هذا المبدأ هو جدار ناري مطلق ضد التحكم الآلي المستقل. إنه يضمن أنه مهما كان الذكاء الاصطناعي ذكيًا أو قويًا، فإن السلطة النهائية والمسؤولية الأخلاقية عن أي قرار تبقى بشكل دائم مع الحاكم البشري.
هذا ليس طموحًا غامضًا؛ إنها مجموعة من القيود التشغيلية الصارمة: