Intron, một startup AI có trụ sở tại Lagos đã chính thức ra mắt Sahara-v2, mô hình AI giọng nói thế hệ thứ hai hàng đầu của mình, nâng cao hiệu quả… Bài viết Intron ra mắtIntron, một startup AI có trụ sở tại Lagos đã chính thức ra mắt Sahara-v2, mô hình AI giọng nói thế hệ thứ hai hàng đầu của mình, nâng cao hiệu quả… Bài viết Intron ra mắt

Intron ra mắt Sahara-v2, mô hình AI giọng nói hỗ trợ 24 ngôn ngữ châu Phi mới

2026/03/05 20:11
Đọc trong 7 phút
Đối với phản hồi hoặc thắc mắc liên quan đến nội dung này, vui lòng liên hệ với chúng tôi qua crypto.news@mexc.com

Intron, một startup AI có trụ sở tại Lagos đã chính thức ra mắt Sahara-v2, mô hình AI giọng nói thế hệ thứ hai hàng đầu của mình, nâng cao hiệu quả tiêu chuẩn nhận dạng giọng nói toàn cầu. Mô hình này hỗ trợ 24 ngôn ngữ châu Phi mới và làm chủ hơn 500 giọng tiếng Anh châu Phi khác biệt, đưa tổng số ngôn ngữ mà công ty hỗ trợ lên mức chưa từng có là 57. 

Trong nhiều năm qua, việc tương tác với các trợ lý giọng nói toàn cầu như Siri, Alexa hoặc các công cụ chuyển văn bản thành giọng nói tiêu chuẩn giống như đang nói chuyện với một bức tường mà về cơ bản không nói ngôn ngữ của bạn. Tất cả chúng ta đều từng trải qua điều đó, cố gắng sử dụng lệnh giọng nói chỉ để thấy một cụm từ địa phương như "No worry, e go better" được phiên âm thành cụm vô nghĩa "No war eagle butter". Lúc đầu thì buồn cười, nhưng khi "Wanjiru" được số hóa thành "One zero" và "Chukwuebuka" không hiểu sao lại trở thành "Check wheelchair baker", thì trò đùa nhanh chóng mất đi sức hấp dẫn.

Những lỗi phiên âm lặp đi lặp lại này không chỉ là những sai sót kỹ thuật đơn thuần; chúng là một hình thức loại trừ kỹ thuật số tích cực. Được xây dựng chủ yếu dựa trên các bộ dữ liệu phương Tây, các mô hình AI toàn cầu hàng đầu hoàn toàn không đạt được mục tiêu ở đây. Chúng không được thiết kế cho sự phong phú về âm điệu trong lời nói của chúng ta, nơi mà một từ đơn có thể có sáu nghĩa khác nhau tùy thuộc vào cách phát âm. Chúng vấp phải việc chuyển đổi mã tự nhiên có nhịp điệu của chúng ta và không thể hiểu rằng một văn phòng có thể tuyển dụng nhân viên với mười giọng hoàn toàn khác nhau. Khi trợ lý giọng nói hiểu nhầm các từ và tên cơ bản, chúng khóa hàng triệu người dùng khỏi các phím tắt kỹ thuật số giúp cuộc sống hiện đại dễ dàng hơn.

Intron giới thiệu Sahara-v2, hỗ trợ 24 ngôn ngữ châu Phi mới để thiết lập tiêu chuẩn toàn cầu mới cho AI giọng nói châu PhiIntron

Sahara-v2 thu hẹp khoảng cách quan trọng này vì nó không được xây dựng dựa trên các giả định hoặc được huấn luyện trong một studio yên tĩnh, vô trùng. Intron đã xây dựng mô hình này bằng cách ra đường và lắng nghe. Bộ dữ liệu rất lớn và được địa phương hóa cực kỳ cao: hơn 14 triệu đoạn âm thanh, tổng cộng hơn 50,000 giờ lời nói, có nguồn gốc từ hơn 40,000 người nói. Những giọng nói này đại diện cho 64 ngôn ngữ châu Phi và cộng đồng người di cư trên hơn 30 quốc gia. Quan trọng là, chúng được ghi âm ở những nơi AI thực sự cần hoạt động, trong các phòng khám đông đúc, chợ ồn ào, trung tâm cuộc gọi nhộn nhịp và phòng xử án.

Sahara-v2 của Intron đánh bại các nhà lãnh đạo trong ngành

Cách tiếp cận từ cơ sở, thực tế này đã cho phép Sahara-v2 vượt trội so với những cái tên lớn nhất trong công nghệ toàn cầu. Khi được so sánh với các ông lớn trong ngành như Gemini-3, GPT-4, Whisper, ElevenLabs, AWS và Azure, mô hình của Intron mang lại sự dẫn đầu áp đảo. 

Nó đạt tỷ lệ chính xác cao hơn 68,6% về tên người châu Phi, tổ chức và địa điểm, và sắc bén hơn 55,6% trong việc phiên âm số, phân số và tiền tệ. Hơn nữa, nó có khả năng chống lại tốt hơn 36,5% các ảo giác AI do tiếng ồn nền và người nói chồng lấn gây ra, cùng với hiệu suất tăng 46,7% trên các lĩnh vực chuyên môn như y tế, luật pháp, viễn thông và tài chính.

Ngoài những tiêu chuẩn ấn tượng, Sahara-v2 là một công cụ năng suất nghiêm túc được thiết kế cho triển khai doanh nghiệp trong thực tế. Được hỗ trợ bởi các API mạnh mẽ có thể được triển khai chỉ trong năm phút, cơ sở hạ tầng này đang tích cực hỗ trợ ngân hàng bằng giọng nói, quy trình Xác minh KYC tự động và hệ thống tự động điền cho mọi thứ từ dữ liệu sức khỏe đến mẫu mở tài khoản. Những người sử dụng doanh nghiệp sớm báo cáo rằng công nghệ này đang cắt giảm thời gian xử lý hành chính lên đến 4,4 lần.

Để giải quyết các thực tế ngôn ngữ độc đáo của châu lục, Intron đã triển khai các tính năng khu vực có tính chuyên môn cao. Hợp tác với Penda Health của Kenya, họ đã giới thiệu mô hình Nhận dạng giọng nói tự động (ASR) song ngữ Swahili-Tiếng Anh đầu tiên trên thế giới, nắm bắt hoàn hảo cách mọi người tự nhiên chuyển đổi giữa các ngôn ngữ giữa câu. 

Đối với thị trường ở đây, họ đã ra mắt mô hình chuyển văn bản thành giọng nói (TTS) Hausa bản địa, cho phép các bot giọng nói 24/7 với độ trễ thấp. Và đối với các chính phủ và doanh nghiệp điều hướng các mối quan tâm về quyền riêng tư dữ liệu, việc triển khai Sahara-v2 bao gồm hỗ trợ ngoại tuyến mới, cho phép dữ liệu vẫn được bảo mật và địa phương để tuân thủ AI có chủ quyền.

Intron giới thiệu Sahara-v2, hỗ trợ 24 ngôn ngữ châu Phi mới để thiết lập tiêu chuẩn toàn cầu mới cho AI giọng nói châu PhiSahara-v2 của Intron

Các doanh nghiệp và khách hàng chính phủ trên sáu quốc gia đã sử dụng hệ thống này. Ayo Oluleye, Trưởng phòng Dữ liệu & Thông tin chi tiết tại ARM Investments, nhận xét: "Sử dụng các mô hình Intron AI, chúng tôi đã thấy cải thiện đáng kể trong phiên âm và tóm tắt so với các mô hình chúng tôi đã khám phá trước đây. Hệ thống của họ nắm bắt ngữ cảnh và sắc thái tốt hơn, dẫn đến kết quả chính xác hơn." Sarah Morris, CPO tại Audere, đồng tình với điều này, báo cáo tỷ lệ thành công API 99% + và độ chính xác tuyệt vời đối với giọng Nam Phi.

Cùng với việc ra mắt Sahara-v2, Intron cũng phát hành Báo cáo AI giọng nói châu Phi 2026 đầu tiên của mình. Ấn phẩm này cung cấp cái nhìn toàn diện, đầu tiên về loại hình này về hệ sinh thái, nêu chi tiết các bài học kinh nghiệm từ việc triển khai AI giọng nói trong các môi trường phức tạp để hướng dẫn các startup, nhà đầu tư và các nhà hoạch định chính sách.

Đọc thêm: Google đào tạo AI bằng 21 ngôn ngữ châu Phi, bao gồm Yoruba, Hausa và Igbo

Các ngôn ngữ mới nhất bao gồm Tiếng Pháp châu Phi, Afrikaans, Akan, Amharic, Tiếng Ả Rập, Bemba, Fulani, Ga, Hausa, Igbo, Kinyarwanda, Luganda, Oromo, Pedi và Pidgin. Những ngôn ngữ khác là Sesotho, Shona, Swahili, Tswana, Twi, Wolof, Xhosa, Yoruba và Zulu. Với những bổ sung này, cánh cửa đến thế giới kỹ thuật số cuối cùng đang mở rộng. 

Như CEO Intron Tobi Olatunji đã nói: "Sahara-v2 chứng minh rằng khi công nghệ được xây dựng với sự hiểu biết sâu sắc về văn hóa và ngôn ngữ, những điều tuyệt vời có thể xảy ra, và chúng tôi mới chỉ bắt đầu."

Bài viết Intron ra mắt Sahara-v2, mô hình AI giọng nói hỗ trợ 24 ngôn ngữ châu Phi mới lần đầu tiên xuất hiện trên Technext.

Cơ hội thị trường
Logo SaharaAI
Giá SaharaAI(SAHARA)
$0.02694
$0.02694$0.02694
-6.87%
USD
Biểu đồ giá SaharaAI (SAHARA) theo thời gian thực
Tuyên bố miễn trừ trách nhiệm: Các bài viết được đăng lại trên trang này được lấy từ các nền tảng công khai và chỉ nhằm mục đích tham khảo. Các bài viết này không nhất thiết phản ánh quan điểm của MEXC. Mọi quyền sở hữu thuộc về tác giả gốc. Nếu bạn cho rằng bất kỳ nội dung nào vi phạm quyền của bên thứ ba, vui lòng liên hệ crypto.news@mexc.com để được gỡ bỏ. MEXC không đảm bảo về tính chính xác, đầy đủ hoặc kịp thời của các nội dung và không chịu trách nhiệm cho các hành động được thực hiện dựa trên thông tin cung cấp. Nội dung này không cấu thành lời khuyên tài chính, pháp lý hoặc chuyên môn khác, và cũng không được xem là khuyến nghị hoặc xác nhận từ MEXC.