Intron, ein in Lagos ansässiges KI-gestütztes Startup, hat offiziell Sahara-v2 eingeführt, sein Flaggschiff-Sprachmodell der zweiten Generation, das die Messlatte für die globale Spracherkennung deutlich höher legt. Das Modell unterstützt 24 neue afrikanische Sprachen und beherrscht über 500 unterschiedliche afrikanische englische Akzente, wodurch die Gesamtsprachabdeckung des Unternehmens auf beispiellose 57 ansteigt.
Seit Jahren fühlte sich die Interaktion mit globalen Sprachassistenten wie Siri, Alexa oder Standard-Text-to-Speech-Engines an, als würde man mit einer Wand sprechen, die grundsätzlich nicht Ihre Sprache spricht. Wir alle kennen das: Man versucht, einen Sprachbefehl zu verwenden, nur um dann zu erleben, dass ein lokalisierter Ausdruck wie „No worry, e go better" in das unsinnige „No war eagle butter" transkribiert wird. Am Anfang ist es lustig, aber wenn „Wanjiru" zu „One zero" digitalisiert wird und „Chukwuebuka" unerklärlich zu „Check wheelchair baker" wird, vergeht einem der Spaß schnell.
Diese wiederholten Transkriptionsfehler sind mehr als bloße technische Pannen; sie sind eine aktive Form der digitalen Ausgrenzung. Die führenden globalen KI-Modelle, die überwiegend auf westlichen Datensätzen aufgebaut sind, verfehlen hier völlig das Ziel. Sie sind nicht auf den tonalen Reichtum unserer Sprache ausgelegt, bei der ein einzelnes Wort je nach Aussprache sechs verschiedene Bedeutungen haben kann. Sie stolpern über unser natürliches rhythmisches Code-Switching und können nicht verstehen, dass ein einzelnes Büro Mitarbeiter mit zehn völlig unterschiedlichen Akzenten beschäftigen könnte. Wenn Sprachassistenten grundlegende Wörter und Namen missverstehen, schließen sie Millionen von Nutzern von den digitalen Abkürzungen aus, die das moderne Leben erleichtern.
Intron
Sahara-v2 schließt diese kritische Lücke, weil es nicht auf Annahmen aufgebaut oder in einem ruhigen, sterilen Studio trainiert wurde. Intron hat dieses Modell entwickelt, indem es auf die Straße ging und zuhörte. Der Datensatz ist massiv und hyperlokalisiert: über 14 Millionen Audioclips mit insgesamt mehr als 50.000 Stunden Sprache, die von über 40.000 Sprechern stammen. Diese Stimmen repräsentieren 64 afrikanische und Diaspora-Sprachen aus mehr als 30 Ländern. Entscheidend ist, dass sie dort aufgenommen wurden, wo KI tatsächlich funktionieren muss: in überfüllten Kliniken, lauten Märkten, geschäftigen Callcentern und Gerichtssälen.
Dieser von Grund auf realitätsbezogene Ansatz hat es Sahara-v2 ermöglicht, die größten Namen der globalen Technologiebranche in den Schatten zu stellen. Im Vergleich mit Branchenschwergewichten wie Gemini-3, GPT-4, Whisper, ElevenLabs, AWS und Azure liefert Introns Modell überzeugende Vorsprünge.
Es erzielt eine um 68,6 % bessere Genauigkeitsrate bei afrikanischen Namen, Organisationen und Orten und ist um 55,6 % präziser bei der Transkription von Zahlen, Brüchen und Währungen. Darüber hinaus weist es eine um 36,5 % höhere Resistenz gegen KI-Halluzinationen auf, die durch Hintergrundgeräusche und sich überschneidende Sprecher verursacht werden, sowie eine Leistungssteigerung von 46,7 % in spezialisierten Bereichen wie Gesundheitswesen, Recht, Telekommunikation und Finanzwesen.
Über die beeindruckenden Benchmarks hinaus ist Sahara-v2 ein ernsthafter Produktivitätsmotor, der für den realen Unternehmenseinsatz konzipiert ist. Gestützt auf robuste APIs, die in nur fünf Minuten implementiert werden können, treibt die Infrastruktur bereits aktiv Voice-Banking, automatisierte KYC-Verifizierung und Autofill-Systeme für alles von Gesundheitsdaten bis zu Kontoeröffnungsformularen an. Frühe Unternehmensanwender berichten, dass die Technologie die administrativen Bearbeitungszeiten um das bis zu 4,4-fache verkürzt.
Um den einzigartigen sprachlichen Realitäten des Kontinents gerecht zu werden, hat Intron hochspezialisierte regionale Funktionen eingeführt. In Zusammenarbeit mit Kenias Penda Health haben sie das weltweit erste zweisprachige Swahili-Englisch-Automatic Speech Recognition (ASR)-Modell vorgestellt, das perfekt erfasst, wie Menschen natürlich mitten im Satz zwischen Sprachen wechseln.
Für den hiesigen Markt haben sie ein natives Hausa-Text-to-Speech (TTS)-Modell eingeführt, das Voicebots mit niedriger Latenz rund um die Uhr ermöglicht. Und für Regierungen und Unternehmen, die sich mit Datenschutzbedenken auseinandersetzen, umfasst die Einführung von Sahara-v2 eine neue Offline-Unterstützung, die es ermöglicht, dass Daten für die Einhaltung souveräner KI-Vorschriften sicher und lokal bleiben.
Introns Sahara-v2
Unternehmens- und Regierungskunden in sechs Ländern nutzen das System bereits. Ayo Oluleye, Head of Data & Insights bei ARM Investments, bemerkte: „Mit den Intron-KI-Modellen haben wir im Vergleich zu zuvor untersuchten Modellen eine deutliche Verbesserung bei Transkriptionen und Zusammenfassungen festgestellt. Ihre Systeme erfassen Kontext und Nuancen besser, was zu genaueren Ergebnissen führt." Sarah Morris, CPO bei Audere, bestätigte dies und berichtete von API-Erfolgsraten von über 99 % und hervorragender Genauigkeit bei südafrikanischen Akzenten.
Parallel zur Einführung von Sahara-v2 veröffentlichte Intron auch seinen ersten Africa Voice AI Report 2026. Die Publikation bietet einen umfassenden, erstmaligen Blick auf das Ökosystem und beschreibt detailliert die Lektionen, die aus dem Einsatz von Sprach-KI in komplexen Umgebungen gelernt wurden, um Startups, Investoren und politische Entscheidungsträger zu leiten.
Lesen Sie auch: Google wird KI in 21 afrikanischen Sprachen trainieren, darunter Yoruba, Hausa und Igbo
Die neuesten Sprachen umfassen afrikanisches Französisch, Afrikaans, Akan, Amharisch, Arabisch, Bemba, Fulani, Ga, Hausa, Igbo, Kinyarwanda, Luganda, Oromo, Pedi und Pidgin. Weitere sind Sesotho, Shona, Swahili, Tswana, Twi, Wolof, Xhosa, Yoruba und Zulu. Mit diesen Ergänzungen öffnet sich die Tür zur digitalen Welt endlich weit.
Wie Intron-CEO Tobi Olatunji es ausdrückte: „Sahara-v2 beweist, dass erstaunliche Dinge geschehen können, wenn Technologie mit tiefem kulturellem und sprachlichem Verständnis entwickelt wird, und wir haben gerade erst begonnen."
Der Beitrag Intron startet Sahara-v2, ein Sprach-KI-Modell, das 24 neue afrikanische Sprachen unterstützt, erschien zuerst auf Technext.


