Tantangan AI Multibahasa untuk Kesenjangan Digital Afrika


Ilustrasi Artificial Intelligence

Ilustrasi Artificial Intelligence

Para ahli teknologi di Afrika tengah memimpin inisiatif untuk mengembangkan alat Artificial Intelligence (AI) yang mendukung bahasa lokal, dengan tujuan mengatasi kesenjangan digital yang semakin lebar di benua ini. Upaya ini, meskipun sangat penting, dihadapkan pada tantangan besar, seperti keterbatasan data dan isu etika yang kompleks.

Pada April 2024, pemerintah Nigeria mengumumkan rencana ambisius untuk mengembangkan alat AI multibahasa guna meningkatkan inklusi digital. Rencana ini disambut baik oleh banyak pihak, termasuk Lwasinam Lenham Dilli, seorang mahasiswa ilmu komputer yang sedang menyelesaikan proyek akhir di universitasnya. Dilli, yang berusia 28 tahun, berupaya keras mengumpulkan data dari internet untuk mengembangkan Large Language Models (LLM) dalam bahasa Hausa. Model ini dimaksudkan untuk digunakan dalam chatbot AI, tetapi Dilli menghadapi kesulitan besar dalam mendapatkan data yang bersih dan relevan.

Dilli menyadari pentingnya pengembangan LLM dalam bahasa lokal untuk menjaga keberlanjutan bahasa dan dialek asli agar tidak tersingkir dari ekosistem AI global. Kekhawatirannya bukan tanpa dasar, karena saat ini banyak alat AI canggih seperti ChatGPT dari OpenAI, Llama 2 dari Meta, dan Mistral AI belum mampu menangani bahasa-bahasa Afrika dengan baik. Ketika bahasa seperti Hausa, Amharik, atau Kinyarwanda digunakan, respons yang dihasilkan sering tidak akurat.

Ketiadaan LLM dalam bahasa Afrika ini dapat menimbulkan dampak serius, yaitu mengisolasi jutaan orang di benua tersebut dan memperlebar kesenjangan digital dan ekonomi. Untuk mengatasi masalah ini, pemerintah Nigeria meluncurkan inisiatif pengembangan LLM multibahasa yang akan dilatih dalam lima bahasa dengan sumber daya rendah, termasuk Yoruba, Hausa, Igbo, Ibibio, dan Pidgin Afrika Barat. Inisiatif ini didukung oleh kolaborasi dengan perusahaan rintisan AI Nigeria serta lebih dari 7.000 individu yang terlibat dalam program pelatihan bakat teknologi pemerintah.

Meski demikian, tantangan yang dihadapi sangatlah besar. Silas Adekunle, salah satu pendiri Awarri, sebuah perusahaan rintisan AI yang terlibat dalam proyek ini, mengungkapkan bahwa mengembangkan alat AI yang memahami nuansa bahasa dan budaya Nigeria bukanlah tugas yang mudah. Keberagaman aksen dan bahasa di Nigeria menambah kompleksitas dalam pengembangan model AI yang efektif. Dengan sumber daya yang terbatas, diperlukan kreativitas dalam pengumpulan data, pelabelan, dan pelatihan model.

Masalah pengembangan AI di Afrika tidak hanya terbatas pada Nigeria. Benua ini adalah rumah bagi lebih dari 2.000 bahasa, tetapi sebagian besar bahasa tersebut kurang terwakili di internet. Bahasa Inggris mendominasi ruang digital, dengan sekitar 50% dari semua situs web ditulis dalam bahasa ini, sementara bahasa Afrika hanya memiliki sedikit representasi.

Selain inisiatif dari pemerintah Nigeria, beberapa perusahaan rintisan Afrika juga mulai mengembangkan alat AI dalam bahasa lokal. Di Kenya, misalnya, Jacaranda Health telah menciptakan LLM pertama dalam bahasa Swahili untuk meningkatkan layanan kesehatan ibu di Afrika Timur. Alat yang disebut UlizaLlama ini didasarkan pada sistem Llama 3 dari Meta dan dirancang untuk memberikan tanggapan yang lebih cepat dan akurat kepada ibu hamil terkait pertanyaan tentang diet, gerakan janin, hingga olahraga saat kehamilan. Saat ini, platform ini menawarkan tanggapan otomatis yang telah diprogram sebelumnya. Namun, setelah UlizaLlama diintegrasikan pada akhir Juni, tanggapan akan disesuaikan dengan kebutuhan individu, memberikan panduan kehamilan dan dukungan darurat yang lebih spesifik.

Di Afrika Selatan, inisiatif Masakhane menggunakan pembelajaran mesin berbasis sumber terbuka untuk menerjemahkan bahasa Afrika. Lelapa AI, sebuah laboratorium penelitian AI di Afrika Selatan, telah mengembangkan VulaVula sebuah alat pemrosesan bahasa nirlaba yang mampu menerjemahkan, mentranskripsi, dan menganalisis bahasa seperti Inggris, Afrikaans, Zulu, dan Sesotho.

Namun, para ahli AI menghadapi tantangan besar dalam mengembangkan LLM dalam bahasa Afrika, termasuk keterbatasan data dan isu etika terkait persetujuan, kompensasi, dan hak cipta. Banyak bahasa Afrika memiliki sedikit sumber daya, sehingga sulit melatih model dengan efektif. Michael Michie dari Everse Technology Africa menekankan pentingnya menghormati komunitas yang enggan berbagi bahasa mereka untuk LLM.

Saat ini, belum ada regulasi yang mengatur pengumpulan data di Afrika, sehingga diperlukan pedoman untuk mencegah eksploitasi dan memastikan LLM bermanfaat bagi komunitas yang dilayani. Pendekatan sumber terbuka seperti Creative Commons juga memiliki keterbatasan dalam memberikan kompensasi kepada kontributor asli.

Melalui inisiatif ini, diharapkan alat AI yang mendukung bahasa lokal dapat membantu mengurangi kesenjangan digital di Afrika dan memastikan bahwa teknologi ini bermanfaat bagi semua lapisan masyarakat.


Bagikan artikel ini

Video Terkait