Artikel Terbaru Aplikasi Artificial Intelligence

Terdapat 105 Artikel Aplikasi Artificial Intelligence

Ilustrasi Human Preferences

Belajar dari Preferensi: Awal RLHF dalam Dunia AI

Pengetahuan Dasar

|

  • 08 Jun 2025 14.52 WIB

Pada tahun 2017, sekelompok peneliti dari OpenAI dan DeepMind, dua organisasi yang kala itu berada di garis depan pengembangan Artificial General Intelligence (AGI), menerbitkan makalah penting yang memperkenalkan pendekatan baru dalam mengajarkan keterampilan kepada agen AI, dengan judul Deep Reinforcement Learning from Human Preferences. Di balik judul yang terdengar teknis ini, tersembunyi sebuah ide revolusioner: bahwa mesin tidak hanya bisa belajar dari angka dan perhitungan imbalan (reward), tetapi juga dari preferensi manusia yang tidak selalu terkuantifikasi secara eksplisit.