Alibaba Luncurkan Model AI Pesaing OpenAI

Pabila Syaftahan
•
29 Nov 2024 08.05 WIB

Alibaba Cloud

Alibaba baru-baru ini merilis model kecerdasan buatan (Artificial Intelligence/AI) terbaru mereka, QwQ-32B-Preview, yang dirancang untuk tugas reasoning (penalaran). Model ini menjadi pesaing serius bagi o1 milik OpenAI, yang sebelumnya mendominasi dalam hal kemampuan reasoning AI. QwQ-32B-Preview tersedia dengan lisensi permisif yang memungkinkan pengguna mengunduh dan menggunakannya untuk berbagai aplikasi, termasuk komersial.

Model ini dikembangkan oleh tim Qwen dari Alibaba dan memiliki 32,5 miliar parameter, yang memungkinkan model ini memproses prompt dengan panjang hingga 32.000 kata. Parameter ini berfungsi sebagai ukuran kemampuan model dalam menyelesaikan masalah, dan model dengan lebih banyak parameter umumnya lebih unggul dalam performa. QwQ-32B-Preview telah diuji dan menunjukkan hasil yang lebih baik dibandingkan o1-preview dan o1-mini dari OpenAI dalam beberapa uji coba, termasuk AIME dan MATH. AIME adalah sistem yang mengukur kinerja model menggunakan model AI lainnya, sementara MATH berisi soal-soal matematika berbentuk kata yang menguji logika dan pemecahan masalah.

Keunggulan utama QwQ-32B-Preview terletak pada kemampuannya untuk melakukan reasoning yang kompleks. Model ini dapat menyelesaikan teka-teki logika dan menjawab soal matematika yang menantang. QwQ-32B-Preview bekerja dengan merencanakan langkah-langkah secara sistematis, membantu model untuk menemukan jawaban dengan cara yang lebih mirip dengan cara manusia berpikir. Namun, meskipun kuat dalam reasoning, model ini juga memiliki kekurangan. Alibaba mencatat bahwa model ini terkadang bisa berubah bahasa tanpa diduga, terjebak dalam loop, atau tidak optimal dalam tugas yang memerlukan penalaran berdasarkan akal sehat.

Yang menarik dari QwQ-32B-Preview adalah kemampuannya untuk memeriksa hasil reasoning-nya sendiri melalui proses self-fact-checking. Fitur ini membantu mengurangi kesalahan yang sering terjadi pada model lain, meskipun prosesnya lebih lambat. Model ini membutuhkan waktu lebih lama untuk menyelesaikan tugas dibandingkan model AI lainnya yang tidak memiliki kemampuan self-checking.

QwQ-32B-Preview dapat diunduh dan dijalankan di platform pengembang AI, Hugging Face. Meskipun dapat digunakan untuk aplikasi komersial, hanya sebagian dari komponen model yang dirilis, sehingga sulit untuk mereplikasi atau memahami seluruh mekanisme internalnya. Dengan demikian, meskipun model ini lebih terbuka dibandingkan dengan model lainnya, tetap ada batasan dalam hal akses ke data dan pengoperasiannya.

Sebagai perusahaan asal Tiongkok, Alibaba mematuhi regulasi pemerintah Tiongkok, yang mengharuskan model AI mereka untuk mencerminkan nilai-nilai sosialisme inti. Hal ini terlihat dalam cara QwQ-32B-Preview menangani topik sensitif, seperti pertanyaan mengenai Taiwan dan Tiananmen Square. Model ini menjawab bahwa Taiwan adalah bagian yang tidak terpisahkan dari Tiongkok, sesuai dengan posisi pemerintah Tiongkok, dan memberikan respons kosong terkait Tiananmen Square.

Munculnya model reasoning seperti QwQ-32B-Preview juga terjadi di tengah penurunan ekspektasi terhadap teori “scaling laws”, yang menyatakan bahwa semakin besar data dan kekuatan komputasi yang digunakan, semakin baik kinerja model. Beberapa laporan menunjukkan bahwa model-model dari OpenAI, Google, dan Anthropic tidak lagi mengalami peningkatan signifikan seperti yang diharapkan sebelumnya. Hal ini mendorong eksperimen dengan pendekatan baru, salah satunya adalah komputasi waktu uji (test-time compute), yang memberikan model lebih banyak waktu untuk memproses tugas.

Dengan peluncuran QwQ-32B-Preview, Alibaba menambah persaingan dalam dunia AI reasoning, memperkenalkan model yang tidak hanya lebih canggih dalam hal kemampuan berpikir, tetapi juga lebih terbuka untuk digunakan oleh komunitas pengembang. Namun, meskipun lebih terbuka dibandingkan model AI lainnya, ada batasan akses yang tetap diterapkan, menjadikan transparansi dan pengawasan terhadap model AI masih menjadi isu penting di dunia teknologi saat ini.