Machine unlearning

Revolusi "Melupakan" dalam AI: Memperkenalkan Graph Propagated Projection Unlearning (GPPU)

Pelajari GPPU, algoritma machine unlearning revolusioner untuk model AI visi dan audio. Hapus data spesifik kelas secara efisien, pertahankan privasi, dan penuhi kepatuhan regulasi dengan kecepatan 10-20x lebih cepat.

ARSA Technology Team

16 Apr 2026 • 5 min read

Dalam era dominasi kecerdasan buatan (AI), kemampuan untuk "melupakan" informasi yang telah dipelajari oleh model menjadi sama pentingnya dengan kemampuannya untuk belajar. Kebutuhan ini didorong oleh tuntutan privasi data, kepatuhan regulasi seperti GDPR, dan desain sistem yang adaptif. Namun, metode penghapusan data (machine unlearning) yang ada seringkali mahal dan tidak efisien, membatasi penerapannya dalam skala besar.

Pendahuluan: Membutuhkan "Lupa" dalam AI

Seiring pesatnya perkembangan jaringan saraf tiruan (deep neural networks) di bidang visi komputer dan audio—mulai dari pengenalan objek hingga verifikasi pembicara—model-model ini semakin banyak digunakan di berbagai aplikasi krusial. Namun, keberhasilan ini juga membawa tantangan baru: bagaimana jika informasi tertentu perlu dihapus dari model AI setelah pelatihan? Ini bisa terjadi karena permintaan pengguna untuk melindungi privasi, atau untuk memenuhi regulasi data yang ketat.

Permasalahan ini memunculkan bidang "machine unlearning," yang bertujuan untuk secara selektif menghapus pengaruh kelas atau sampel data tertentu dari model AI. Teknik unlearning yang ada saat ini seringkali memerlukan pelatihan ulang model secara ekstensif atau optimasi adversarial yang memakan waktu, menjadikannya tidak praktis untuk kumpulan data dan model modern yang besar. Untuk mengatasi kendala ini, sebuah pendekatan baru diperkenalkan: Graph-Propagated Projection Unlearning (GPPU).

Tantangan dalam Penghapusan Data AI Tradisional

Metode unlearning tradisional memiliki beberapa batasan signifikan. Pendekatan yang paling sederhana adalah melatih ulang seluruh model dari awal setelah data yang ingin dihapus dikeluarkan. Ini menjamin penghapusan total, namun sangat memakan waktu dan sumber daya komputasi, terutama untuk model skala besar dan dataset yang masif.

Alternatif lainnya adalah strategi algoritmik yang mencoba mengedit parameter atau prediksi jaringan secara lokal. Misalnya, beberapa metode menggunakan informasi Fisher untuk memandu pengeditan bobot selektif, sementara yang lain menggunakan pendekatan gradient untuk menghapus fitur diskriminatif kelas. Meskipun memiliki daya tarik konseptual, metode ini seringkali sulit diskalakan, berisiko menurunkan kinerja model pada data yang tidak dihapus secara tidak sengaja, dan seringkali membutuhkan akses berulang ke data pelatihan atau pelatihan ulang yang berkepanjangan. Di domain audio, tantangan ini semakin rumit karena struktur representasi ucapan dan pembicara yang kompleks, seperti yang dibahas dalam studi oleh Pathak dan Das (2026). Ini menyoroti kebutuhan akan metode yang lebih efisien dan andal.

GPPU: Kerangka Kerja Terpadu untuk Melupakan Data

Peneliti Shreyansh Pathak dan Jyotishman Das dari Indian Institute of Technology Jodhpur memperkenalkan Graph-Propagated Projection Unlearning (GPPU), sebuah algoritma yang menyatukan dan meningkatkan efisiensi proses unlearning untuk model diskriminatif baik di domain visi maupun audio. GPPU hadir sebagai solusi yang mengatasi masalah skalabilitas dan keterbatasan metode sebelumnya dengan pendekatan dua fase yang inovatif.

GPPU secara eksplisit mengidentifikasi dan menghapus informasi spesifik kelas dari representasi mendalam jaringan saraf. Ini dilakukan melalui dua tahap utama: pertama, identifikasi arah "lupa" berbasis grafik dalam ruang fitur, dan kedua, penghapusan representasi melalui proyeksi ortogonal dan penyesuaian (fine-tuning) yang ditargetkan. Pendekatan ini memastikan informasi kelas target dihapus secara efektif dan ireversibel, sambil mempertahankan kinerja model pada kelas-kelas yang tidak dihapus.

Mekanisme Kerja GPPU: Identifikasi dan Proyeksi Geometris

Bagaimana GPPU mencapai tujuannya? Fase pertama melibatkan pembentukan "grafik tetangga terdekat k" (k-nearest neighbor, k-NN) berdasarkan kesamaan fitur. Data fitur dari semua sampel model diL2-normalisasi, dan grafik k-NN dibangun berdasarkan kesamaan kosinus. Struktur grafik ini kemudian digunakan untuk menghaluskan variasi intra-kelas dan mempertajam batas antar-kelas melalui proses propagasi berbasis grafik, mirip dengan jaringan saraf graf (Graph Convolutional Networks). Dari grafik ini, GPPU mengekstrak "arah lupa" sebagai vektor unit yang menunjuk ke pusat kelas (class centroids) dengan cara yang sadar manifold.

Pada fase kedua, GPPU memproyeksikan representasi model ke sub-ruang ortogonal terhadap arah lupa yang telah diidentifikasi. Secara sederhana, ini seperti "mematikan" dimensi dalam data yang mengandung informasi yang ingin dilupakan. Setelah proyeksi ini, lapisan akhir model disesuaikan (fine-tuned) agar fitur-fitur baru secara inheren ortogonal terhadap sub-ruang yang telah dilupakan. Kombinasi proyeksi geometris dan pembaruan parameter yang minimal namun ditargetkan ini memungkinkan GPPU menghapus informasi kelas target secara efektif sambil mempertahankan kinerja pada kelas non-target, dengan overhead komputasi yang dapat diabaikan dibandingkan dengan metode berbasis pelatihan ulang. Misalnya, ARSA Technology dapat menggunakan metode unlearning yang efisien ini dalam solusi AI Box Series mereka, memastikan privasi data tanpa mengorbankan kinerja atau memerlukan infrastruktur yang berlebihan di lokasi.

Dampak dan Efisiensi GPPU: Transformasi Machine Unlearning

Evaluasi komprehensif GPPU dilakukan pada enam dataset visi dan dua benchmark audio skala besar. Arsitektur yang diuji bervariasi, termasuk Jaringan Saraf Konvolusional (CNNs), Vision Transformers, dan Audio Transformers. Hasilnya menunjukkan bahwa GPPU mencapai efisiensi unlearning yang luar biasa, dengan peningkatan kecepatan 10-20 kali lipat dibandingkan dengan metodologi sebelumnya. Ini dicapai sambil mempertahankan utilitas model yang tinggi dan degradasi minimal pada kelas-kelas yang dipertahankan.

GPPU secara konsisten mencapai akurasi mendekati nol pada kelas yang "dilupakan" pasca-unlearning, sebuah indikasi kuat bahwa informasi target telah dihapus secara efektif. Kerangka kerja ini menawarkan pendekatan yang berprinsip dan agnostik terhadap modalitas (artinya bekerja pada berbagai jenis data seperti visi dan audio) untuk machine unlearning, dievaluasi pada skala yang belum banyak mendapat perhatian dalam penelitian sebelumnya (Pathak & Das, 2026). Kemampuan ini mendukung pengembangan pembelajaran mendalam yang lebih efisien dan bertanggung jawab. Organisasi yang memerlukan kontrol penuh atas data mereka, seperti yang memilih solusi AI Video Analytics on-premise dari ARSA, akan sangat diuntungkan dari efisiensi unlearning semacam ini.

Implikasi Bisnis dan Penerapan AI yang Bertanggung Jawab

Inovasi seperti GPPU memiliki implikasi besar bagi bisnis dan institusi yang menggunakan AI:

Kepatuhan Regulasi: Dalam dunia yang semakin sadar akan privasi data, kemampuan untuk menghapus informasi secara selektif sangat penting untuk memenuhi peraturan seperti GDPR atau PDPA. Ini mengurangi risiko denda dan masalah hukum.
Keamanan dan Privasi: Untuk aplikasi sensitif seperti verifikasi identitas atau pengawasan, kemampuan untuk "melupakan" data individu tanpa mengganggu fungsi inti model adalah kunci. ARSA Technology, yang telah berpengalaman sejak 2018 dalam menyediakan solusi AI untuk berbagai industri, memahami pentingnya privasi-by-design dan kendali data.
Adaptasi Model yang Cepat: Model AI yang dapat "melupakan" informasi usang atau tidak relevan dapat beradaptasi lebih cepat terhadap perubahan data atau kebutuhan operasional tanpa perlu melatih ulang secara keseluruhan, meningkatkan produktivitas dan mengurangi biaya.
Efisiensi Biaya dan ROI: Dengan menghindari pelatihan ulang yang mahal dan memakan waktu, GPPU secara signifikan mengurangi biaya operasional dan mempercepat pengembalian investasi (ROI) dari penerapan AI.

GPPU merepresentasikan langkah maju yang signifikan dalam bidang machine unlearning, menawarkan solusi yang efisien, akurat, dan dapat diskalakan untuk tantangan privasi dan kepatuhan dalam AI. Kemampuannya untuk bekerja secara agnostik di seluruh modalitas visi dan audio membuka jalan bagi penerapan AI yang lebih bertanggung jawab dan adaptif di berbagai sektor.

---

Referensi:

Pathak, S., & Das, J. (2026). Graph Propagated Projection Unlearning: A Unified Framework for Vision and Audio Discriminative Models. Indian Institute of Technology Jodhpur. https://arxiv.org/abs/2604.13127

Tertarik untuk memahami lebih lanjut bagaimana solusi AI yang bertanggung jawab dan efisien dapat diterapkan dalam operasi Anda? Jelajahi berbagai penawaran ARSA Technology dan jadwalkan konsultasi gratis dengan tim kami untuk mendapatkan wawasan yang disesuaikan dengan kebutuhan Anda.