Mengenal Bias, Underfitting, dan Overfitting pada AI

Mutiara Aisyah
•
26 Apr 2025 22.50 WIB

Dalam pengembangan sistem kecerdasan buatan, terutama yang berbasis machine learning, terdapat tantangan konseptual yang mendasar namun seringkali menjadi sumber utama kegagalan model. Tiga di antaranya adalah bias failure, underfitting, dan overfitting. Pemahaman yang mendalam tentang ketiganya sangat penting bagi para praktisi agar dapat membangun model yang tidak hanya akurat secara statistik, tetapi juga andal dalam penerapan di dunia nyata.

Bias Failure: Ketika Asumsi Model Menjadi Masalah

Istilah bias failure mengacu pada kondisi ketika model mengadopsi asumsi-asumsi yang terlalu kuat dan menyederhanakan hubungan dalam data secara berlebihan. Dalam konteks pembelajaran mesin, bias adalah bagian dari trade-off klasik antara bias dan varians. High bias terjadi ketika model tidak mampu merepresentasikan kompleksitas fungsi target karena keterbatasan arsitektur atau desain model itu sendiri.

Contoh sederhana dari high bias adalah penggunaan model linier untuk memetakan hubungan yang bersifat non-linier dalam data. Meskipun pendekatan ini dapat mempercepat proses pelatihan dan menghindari noise, konsekuensinya adalah hilangnya pola-pola penting yang sebenarnya signifikan. Dalam dunia medis, hal ini dapat berarti kegagalan mendeteksi kondisi penyakit karena model tidak mengakomodasi interaksi kompleks antara biomarker, riwayat pasien, dan konteks lingkungan.

Underfitting: Gejala dari High Bias

Underfitting adalah manifestasi langsung dari bias failure yang tinggi. Ia terjadi ketika model gagal menangkap struktur mendalam dalam data pelatihan, menghasilkan performa yang buruk tidak hanya pada data uji, tetapi juga pada data pelatihan itu sendiri. Ciri khas dari underfitting antara lain adalah nilai error yang tinggi secara konsisten dan tidak adanya peningkatan performa meskipun data pelatihan ditambah.

Gejala underfitting dapat disebabkan oleh beberapa faktor berikut:

Model yang terlalu sederhana (misalnya, hanya menggunakan satu layer dalam neural network).
Kurangnya jumlah fitur atau representasi yang relevan.
Regularisasi yang terlalu kuat sehingga menekan kemampuan model belajar dari data.
Waktu pelatihan yang terlalu singkat.

Dalam konteks sistem rekomendasi medis, underfitting bisa muncul ketika model hanya mempertimbangkan usia dan jenis kelamin untuk memprediksi risiko penyakit, tanpa mempertimbangkan data penting lainnya seperti pola tidur, tingkat stres, atau catatan laboratorium.

Overfitting: Ketika Model Belajar Terlalu Banyak

Di sisi lain dari spektrum, overfitting terjadi ketika model belajar terlalu detail dari data pelatihan, termasuk noise atau pola-pola acak yang tidak mewakili struktur umum. Model yang overfit menunjukkan performa sangat tinggi pada data pelatihan, tetapi menurun drastis ketika diuji pada data baru. Ini mencerminkan low bias namun high variance.

Overfitting sering kali dialami pada model yang kompleks seperti deep neural networks dengan banyak parameter, terutama jika jumlah data pelatihan terbatas atau tidak representatif. Dalam skenario medis, overfitting dapat menyebabkan model memberikan diagnosis yang sangat spesifik terhadap pasien yang ada dalam data pelatihan, namun gagal mengenali gejala yang sama pada pasien lain dengan latar belakang berbeda.

Beberapa penyebab umum overfitting antara lain:

Jumlah parameter model terlalu besar dibanding data.
Tidak cukup regularisasi (dropout, L1/L2 penalty, dll).
Data pelatihan mengandung banyak noise atau tidak cukup bervariasi.
Tidak menggunakan teknik validasi silang secara memadai.

High Bias: Akar dari Model yang Terlalu Sederhana

High bias adalah kondisi ketika model secara sistematis mengabaikan hubungan penting antar fitur dan target. Ini biasanya terjadi karena asumsi dasar model terlalu ketat, misalnya mengasumsikan bahwa semua hubungan bersifat linier, atau bahwa fitur-fitur independen satu sama lain.

Dalam pengukuran error, high bias menyebabkan error yang tinggi pada data pelatihan dan uji, dan sering kali tidak bisa diperbaiki hanya dengan menambah data. Satu-satunya solusi efektif adalah meningkatkan kompleksitas model, menambahkan fitur relevan, atau mengubah arsitektur yang digunakan.

Contoh konkret dalam domain medis adalah model regresi linier yang digunakan untuk memprediksi tingkat keparahan penyakit berdasarkan hasil tes darah, padahal hubungan yang terjadi bersifat non-linier dan dipengaruhi oleh faktor-faktor komorbiditas yang tidak bisa direpresentasikan secara linier.

Menemukan Titik Seimbang antara Bias dan Varians

Dalam praktik pengembangan model AI, tantangan utama adalah mencari keseimbangan antara bias dan varians. Istilah ini sering disebut sebagai bias-variance tradeoff. Model ideal adalah yang memiliki bias dan variance yang cukup rendah, mampu menangkap pola umum tanpa terlalu peka terhadap noise.

Beberapa pendekatan yang dapat membantu mengatur keseimbangan ini:

Pemilihan model: Mulai dari model sederhana dan secara bertahap menambah kompleksitas.
Cross-validation: Membagi data menjadi bagian pelatihan dan validasi untuk mengukur generalisasi model.
Regularisasi: Mengontrol overfitting tanpa mengorbankan terlalu banyak representasi.
Feature engineering: Menyusun fitur yang relevan dan informatif untuk memperkaya representasi data.
Early stopping: Menghentikan pelatihan ketika performa pada data validasi mulai menurun, meski masih meningkat pada data pelatihan.

Penutup: Mengembangkan Model AI yang Andal

Kegagalan memahami dan menangani bias failure, underfitting, maupun overfitting dapat menyebabkan model yang tidak akurat, tidak etis, dan bahkan berbahaya. Dalam domain kritis seperti medis, di mana keputusan berbasis AI bisa berdampak langsung pada kehidupan pasien, keandalan model menjadi suatu keharusan yang tidak bisa ditawar.

Dengan memahami konsep high bias sebagai gejala awal dari underfitting, dan mengenali ancaman dari overfitting, para pengembang AI dapat membangun sistem yang tidak hanya unggul dalam metrik performa, tetapi juga tangguh dan bertanggung jawab dalam penerapannya.