Alibaba Cloud Rilis Dua Large Language Models (LLM) Open Source


Alibaba Cloud

Ilustrasi Alibaba Cloud

Alibaba Cloud, perusahaan teknologi digital yang menjadi bagian dari Alibaba Group, baru-baru ini mengumumkan ketersediaan dua Large Language Models (LLM) open source, Qwen-72B dan Qwen-1.8B. Kedua model ini memiliki parameter sebanyak 72 miliar dan 1,8 miliar, berasal dari model fondasi milik Alibaba, Tongyi Qianwen. Pengumuman ini dilakukan melalui komunitas model AI mereka, ModelScope, dan platform AI kolaboratif, Hugging Face.

Jingren Zhou, Chief Technology Officer (CTO) Alibaba Cloud, menekankan pentingnya membangun ekosistem open-source untuk mendorong pengembangan LLM dan aplikasi AI. Zhou menyatakan, "Kami bercita-cita menjadi cloud paling terbuka dan membuat kemampuan AI generatif dapat diakses oleh semua orang. Untuk mencapai tujuan itu, kami akan terus memberikan teknologi canggih kami serta memfasilitasi pengembangan komunitas open-source bersama dengan mitra kami,” ujarnya.

Dengan pelatihan lebih dari 3 triliun token sebelumnya, model 72-miliar parameter ini melampaui model open-source utama lainnya, termasuk Massive Multi-task Language Understanding (MMLU) dan HumanEval untuk pengujian kemampuan generasi kode. Keunggulan lainnya adalah kemampuan menangani perintah rumit, seperti bermain peran dan transfer gaya bahasa, yang dapat bermanfaat dalam aplikasi AI seperti chatbot yang dipersonalisasi.

Untuk mendorong penelitian dan komersial, Alibaba Cloud juga menyediakan lebih banyak LLM multimodal, termasuk Qwen-Audio dan Qwen-Audio-Chat. Model ini melibatkan pemahaman audio dan visual, memungkinkan lebih dari 30 tugas pemrosesan audio, seperti transkripsi multi-bahasa dan analisis keterangan audio.

Perusahaan dan lembaga penelitian dapat mengakses kode model Qwen-72B secara gratis untuk tujuan penelitian, sementara penggunaan komersialnya gratis untuk perusahaan dengan pengguna bulanan aktif kurang dari 100 juta. Alibaba Cloud juga merilis model LLM berparameter 1,8 miliar yang dapat berjalan pada edge, memungkinkan inferensi pada perangkat dengan sumber daya komputasi terbatas, seperti ponsel.

Upaya ini merupakan langkah terbaru Alibaba Cloud dalam menyediakan model multi-modal large language yang dapat memahami berbagai jenis data di luar teks ke komunitas open-source. Sejak Agustus, model-model seperti Qwen-7B dan Qwen-14B telah diunduh lebih dari 1,5 juta kali di komunitas open-source model AI Alibaba Cloud, ModelScope, dan Hugging Face, menandai kontribusi positif mereka dalam mendorong perkembangan kecerdasan buatan. ModelScope sendiri telah menjadi komunitas model AI terbesar di Cina dengan lebih dari 2,8 juta pengembang aktif dan lebih dari 100 juta unduhan model hingga saat ini.


Bagikan artikel ini