گوگل و کنسرسیومی از مؤسسات تحقیقاتی آفریقایی مجموعه داده WAXAL را راه‌اندازی کرده‌اند، تلاشی بزرگ و جدید برای... پست گوگل برای آموزش هوش مصنوعی به ۲۱ زبان آفریقاییگوگل و کنسرسیومی از مؤسسات تحقیقاتی آفریقایی مجموعه داده WAXAL را راه‌اندازی کرده‌اند، تلاشی بزرگ و جدید برای... پست گوگل برای آموزش هوش مصنوعی به ۲۱ زبان آفریقایی

گوگل هوش مصنوعی را در 21 زبان آفریقایی از جمله یوروبا، هائوسا و ایگبو آموزش می‌دهد

2026/02/02 22:00

گوگل و کنسرسیومی از مؤسسات تحقیقاتی آفریقایی مجموعه داده WAXAL را راه‌اندازی کرده‌اند، تلاشی بزرگ و جدید برای اصلاح یکی از چالش‌های اساسی هوش مصنوعی در این قاره، یعنی ناتوانی آن در تفسیر و درک اکثر زبان‌های آفریقایی.

این پروژه یک مجموعه داده گفتار باز و بزرگ را که شامل 21 زبان آفریقای جنوب صحرا می‌شود، ارائه می‌دهد و فناوری صوتی را به بیش از 100 میلیون نفر که از اقتصاد هوش مصنوعی محروم بوده‌اند، می‌رساند.

مجموعه داده WAXAL محصول یک همکاری سه‌ساله است که توسط گوگل تامین مالی و توسط دانشگاه‌های محلی و گروه‌های اجتماعی رهبری شده است.

این شامل 1,250 ساعت گفتار طبیعی رونویسی شده و بیش از 20 ساعت ضبط با کیفیت استودیویی است که هدف آن ساخت صداهای مصنوعی با وفاداری بالا است. این مجموعه زبان‌هایی مانند هوسا، یوروبا، لوگاندا، ایگبو و آچولی را هدف قرار می‌دهد که بسیاری از آنها توسط ده‌ها میلیون نفر صحبت می‌شوند اما عمدتاً برای سیستم‌های گفتار تجاری نامرئی باقی مانده‌اند.

گوگل و دانشگاه‌های آفریقایی مجموعه داده WAXAL را برای آموزش هوش مصنوعی به 21 زبان آفریقایی از جمله یوروبا، هوسا و ایگبو راه‌اندازی کردند

با وجود تمام صحبت‌ها درباره هوش مصنوعی جهانی، فناوری‌های صوتی همچنان به شدت به انگلیسی و تعداد محدودی از زبان‌های اروپایی و آسیایی متمایل هستند. آفریقا، خانه بیش از 2,000 زبان، در حاشیه باقی مانده است.

این شکاف صرفاً آکادمیک نیست؛ این شکاف تعیین می‌کند چه کسی می‌تواند از خدمات دیجیتال استفاده کند، چه کسی می‌تواند به ابزارهای آموزشی و بهداشتی دسترسی داشته باشد، و چه کسی می‌تواند شرکت‌هایی بر اساس پلتفرم‌های هوش مصنوعی مدرن بسازد. گوگل این کار را گامی به سمت کاهش شکاف داده‌ای دیرینه‌ای معرفی کرد که بسیاری از زبان‌های آفریقایی را از دستیارهای صوتی و سایر ابزارها دور نگه داشته است.

چرا مجموعه داده WAXAL برای معماری هوش مصنوعی آفریقا اهمیت دارد

فراتر از رفع مستقیم این عدم تعادل، این پروژه به اندازه خود داده‌ها اهمیت دارد.

برخلاف ابتکارات قبلی که در آنها داده‌های گفتار آفریقایی استخراج و در جای دیگری متعلق به دیگران بود، WAXAL در محل توسط مؤسسات آفریقایی رهبری شد. دانشگاه ماکررِه در اوگاندا، دانشگاه غنا، و Digital Umuganda در رواندا نظارت بر جمع‌آوری داده‌ها، تعامل با جامعه و مدیریت زبانی را با پشتیبانی فنی Google Research Africa انجام دادند.

نکته مهم این است که این مؤسسات مالکیت داده‌ها را حفظ می‌کنند. این یک تغییر قابل توجه در حوزه‌ای است که اغلب به دلیل بازتولید پویایی‌های استخراجی تحت عنوان باز بودن مورد انتقاد قرار می‌گیرد.

به گفته آیشا والکات-برایانت، رئیس Google Research Africa: "تأثیر نهایی WAXAL توانمندسازی مردم آفریقا است. این مجموعه داده پایه حیاتی را برای دانشجویان، محققان و کارآفرینان فراهم می‌کند تا فناوری را بر اساس شرایط خود، به زبان‌های خود بسازند و سرانجام به بیش از 100 میلیون نفر دسترسی پیدا کنند."

وی افزود: "ما مشتاقانه منتظریم که نوآوران آفریقایی از این داده‌ها برای ایجاد همه چیز، از ابزارهای آموزشی جدید گرفته تا خدمات صوت‌محور که فرصت‌های اقتصادی ملموس در سراسر قاره ایجاد می‌کنند، استفاده کنند."

گوگل و دانشگاه‌های آفریقایی مجموعه داده WAXAL را برای آموزش هوش مصنوعی به 21 زبان آفریقایی از جمله یوروبا، هوسا و ایگبو راه‌اندازی کردندآیشا والکات-برایانت، رئیس Google Research Africa

این چارچوب توسط دانشگاه‌های درگیر تکرار می‌شود. جویس ناکاتومبا-نابِنده، مدرس ارشد دانشگاه ماکررِه، گفت:

"برای اینکه هوش مصنوعی تأثیر واقعی در آفریقا داشته باشد، باید به زبان‌های ما صحبت کند و زمینه‌های ما را درک کند. مجموعه داده WAXAL داده‌های با کیفیت بالا را که محققان ما برای ساخت فناوری‌های گفتاری که منعکس‌کننده جوامع منحصر به فرد ما هستند، نیاز دارند، ارائه می‌دهد. در اوگاندا، این در حال حاضر ظرفیت تحقیقاتی محلی ما را تقویت کرده و از پروژه‌های جدید به رهبری دانشجویان و اعضای هیئت علمی پشتیبانی کرده است."

در دانشگاه غنا، دانشیار ایزاک ویافِ به مقیاس مشارکت عمومی اشاره کرد:

"برای ما در دانشگاه غنا، تأثیر WAXAL فراتر از خود داده‌ها است. این به ما توانایی داده تا منابع زبانی خود را بسازیم و نسل جدیدی از محققان هوش مصنوعی را آموزش دهیم. بیش از 7,000 داوطلب به ما پیوستند زیرا می‌خواستند صدا و زبان‌های آنها به آینده دیجیتال تعلق داشته باشد. امروز، آن تلاش جمعی اکوسیستم نوآوری در زمینه‌هایی مانند سلامت، آموزش و کشاورزی را جرقه زده است. این ثابت می‌کند که وقتی داده‌ها وجود داشته باشند، امکان در همه جا گسترش می‌یابد."

دلیلی برای خوش‌بینی محتاطانه وجود دارد. مجموعه داده‌های گفتار باز می‌توانند موانع را برای استارتاپ‌ها و محققان محلی که منابع لازم برای جمع‌آوری داده در مقیاس بزرگ را ندارند، کاهش دهند. آنها همچنین می‌توانند اتکا به APIهای خارجی که به ندرت زبان‌های آفریقایی را به خوبی پشتیبانی می‌کنند، در صورت پشتیبانی، را کاهش دهند.

گوگل و دانشگاه‌های آفریقایی مجموعه داده WAXAL را برای آموزش هوش مصنوعی به 21 زبان آفریقایی از جمله یوروبا، هوسا و ایگبو راه‌اندازی کردندمجموعه داده WAXAL

با این حال، مجموعه داده‌ها نتایج را تضمین نمی‌کنند؛ ساخت سیستم‌های صوتی قابل اعتماد نیازمند سرمایه‌گذاری پایدار، استقرار محلی، و مسیرهای تجاری است که ارزش را در داخل کشور حفظ کنند. نقش گوگل به عنوان تامین‌کننده مالی و برگزارکننده بررسی دقیق را دعوت می‌کند، به ویژه در مورد نحوه استفاده از داده‌های WAXAL توسط شرکت‌های جهانی در آینده.

فعلاً، انتشار مجموعه داده WAXAL گامی مشخص به سمت یک اکوسیستم هوش مصنوعی فراگیرتر از نظر زبانی است. این چالش‌های هوش مصنوعی آفریقا را حل نمی‌کند، اما به یک چالش بنیادی رسیدگی می‌کند. صدا اغلب طبیعی‌ترین رابط با فناوری است. اطمینان از اینکه هوش مصنوعی می‌تواند آفریقا را در تمام تنوع آن بشنود، خیلی وقت است که باید انجام می‌شد.

پست Google to train AI in 21 African languages, including Yoruba, Hausa and Igbo ابتدا در Technext ظاهر شد.

سلب مسئولیت: مطالب بازنشرشده در این وب‌ سایت از منابع عمومی گردآوری شده‌ اند و صرفاً به‌ منظور اطلاع‌ رسانی ارائه می‌ شوند. این مطالب لزوماً بازتاب‌ دهنده دیدگاه‌ ها یا مواضع MEXC نیستند. کلیه حقوق مادی و معنوی آثار متعلق به نویسندگان اصلی است. در صورت مشاهده هرگونه محتوای ناقض حقوق اشخاص ثالث، لطفاً از طریق آدرس ایمیل service@support.mexc.com با ما تماس بگیرید تا مورد بررسی و حذف قرار گیرد.MEXC هیچ‌ گونه تضمینی نسبت به دقت، جامعیت یا به‌ روزبودن اطلاعات ارائه‌ شده ندارد و مسئولیتی در قبال هرگونه اقدام یا تصمیم‌ گیری مبتنی بر این اطلاعات نمی‌ پذیرد. همچنین، محتوای منتشرشده نباید به‌عنوان توصیه مالی، حقوقی یا حرفه‌ ای تلقی شود و به منزله پیشنهاد یا تأیید رسمی از سوی MEXC نیست.