KATEGORI Pengetahuan Dasar

Terdapat 917 Artikel dengan Kategori Pengetahuan Dasar

Ilustrasi Human Preferences

Belajar dari Preferensi: Awal RLHF dalam Dunia AI

Pengetahuan Dasar

|

  • 20 jam yang lalu

Pada tahun 2017, sekelompok peneliti dari OpenAI dan DeepMind, dua organisasi yang kala itu berada di garis depan pengembangan Artificial General Intelligence (AGI), menerbitkan makalah penting yang memperkenalkan pendekatan baru dalam mengajarkan keterampilan kepada agen AI, dengan judul Deep Reinforcement Learning from Human Preferences. Di balik judul yang terdengar teknis ini, tersembunyi sebuah ide revolusioner: bahwa mesin tidak hanya bisa belajar dari angka dan perhitungan imbalan (reward), tetapi juga dari preferensi manusia yang tidak selalu terkuantifikasi secara eksplisit.