Mengatasi Bias Demografi dalam Diagnosis Penyakit Medis Berbasis AI: Solusi Dua Tingkat untuk CT Scan
Pelajari bagaimana bias demografi dalam diagnosis AI dari CT scan dapat diatasi dengan pendekatan objektif dua tingkat, memastikan keadilan dan akurasi yang lebih tinggi untuk semua pasien.
Penyakit paru-paru terus menjadi salah satu penyebab kematian utama di seluruh dunia, dan lanskap diagnostiknya semakin rumit dalam beberapa tahun terakhir. Di tengah tantangan ini, diagnosis otomatis menggunakan citra Computed Tomography (CT) telah menunjukkan kemajuan signifikan berkat teknologi deep learning. Namun, ada celah krusial: model AI yang dilatih dengan data yang tidak seimbang cenderung menunjukkan kinerja yang tidak merata di berbagai demografi pasien. Situasinya lebih kompleks dari sekadar bias demografi sederhana; dalam data klinis, ketidakseimbangan kelas penyakit dan kurangnya representasi kelompok seringkali terjadi secara bersamaan, menciptakan mode kegagalan gabungan yang tidak dapat diatasi oleh penyeimbangan ulang standar maupun koreksi keadilan saja.
Sebuah penelitian baru (Sumber: Robust Fair Disease Diagnosis in CT Images) mengusulkan pendekatan inovatif untuk mengatasi masalah kompleks ini. Pendekatan ini berfokus pada pengembangan objektif dua tingkat yang menargetkan kedua masalah tersebut. Dengan menggabungkan logit-adjusted cross-entropy loss di tingkat sampel dan agregasi Conditional Value at Risk (CVaR) di tingkat kelompok, model AI dapat secara signifikan meningkatkan akurasi diagnosis dan mengurangi disparitas demografi.
Menganalisis Tantangan Diagnosis Penyakit Berbasis AI
Penyakit seperti kanker paru-paru, dengan lebih dari 1,8 juta kematian setiap tahunnya, dan COVID-19 yang baru-baru ini muncul, memerlukan diagnosis yang cepat dan akurat. CT scan dada telah menjadi alat diagnostik yang vital, dengan ketersediaan yang luas di fasilitas kesehatan. Namun, jumlah pemindaian yang dihasilkan jauh melebihi kapasitas radiolog untuk membacanya dalam waktu yang wajar. Kesenjangan throughput inilah yang mendorong perkembangan solusi deep learning otomatis untuk analisis citra medis.
Meskipun solusi deep learning telah matang dengan cepat dan mencapai kinerja agregat yang kuat pada benchmark institusi tunggal, kinerja agregat seringkali menjadi metrik yang berbahaya. Data klinis CT secara konsisten memiliki struktur yang dapat dieksploitasi secara tidak merata oleh model. Masalah spesifiknya adalah interaksi antara ketidakseimbangan kelas penyakit dan bias demografi. Kondisi langka secara alami kurang terwakili dalam data pelatihan karena memang jarang terjadi. Namun, yang kurang jelas adalah bahwa ketidakseimbangan ini tidak sama di seluruh kelompok pasien.
Anatomi Ketidakseimbangan Gabungan
Penelitian ini menyoroti masalah konkret: squamous cell carcinoma memiliki total 84 sampel dalam dataset pelatihan, dengan hanya 5 di antaranya adalah pasien perempuan. Ini adalah contoh nyata dari ketidakseimbangan gabungan, di mana kelangkaan kelas (penyakit langka) bertepatan dengan kelangkaan demografi (pasien perempuan). Sebuah pengklasifikasi yang dilatih dengan metode standar akan mempelajari fitur squamous cell hampir seluruhnya dari presentasi pasien laki-laki, karena sebagian besar data pelatihan berasal dari mereka. Akibatnya, model tersebut akan gagal pada pasien perempuan yang menunjukkan penyakit yang sama. Karena kelas penyakit ini sudah kecil, penurunan akurasi secara keseluruhan mungkin tidak terlalu signifikan dalam metrik agregat, namun kegagalannya sangat nyata dan berbahaya secara klinis bagi kelompok minoritas tersebut.
Literatur tentang keadilan dan penyeimbangan ulang kelas telah mengusulkan solusi untuk masing-masing masalah secara terpisah. Misalnya, logit adjustment menambahkan offset yang bergantung pada frekuensi ke logit (nilai keluaran mentah model sebelum dikonversi ke probabilitas), memperbesar margin untuk kelas-kelas langka. Ini membantu model lebih memperhatikan kelas yang jarang. Namun, logit adjustment tidak mempertimbangkan label kelompok demografi; setiap pasien mendapatkan offset yang sama terlepas dari jenis kelaminnya. Jika sampel squamous cell laki-laki mendominasi gradien, koreksi tetap mengalir sebagian besar melalui data laki-laki. Di sisi lain, agregasi berbasis Conditional Value at Risk (CVaR) mengarahkan pengoptimalan ke kelompok demografi yang saat ini memiliki loss (kesalahan) lebih tinggi. Namun, jika loss per sampel itu sendiri tidak seimbang berdasarkan kelas, CVaR akan menyamakan sinyal yang bias. Kedua kelompok mungkin mendapatkan nilai loss yang serupa, tetapi di dalam setiap kelompok, kelas yang langka masih diabaikan.
Solusi Dua Tingkat: Membangun Keadilan dan Akurasi
Untuk mengatasi mode kegagalan gabungan ini, penelitian ini memperkenalkan objektif pelatihan dua tingkat yang mengombinasikan logit-adjusted cross-entropy dengan agregasi kelompok CVaR. Kedua mekanisme ini bertindak pada dimensi yang berbeda dari fungsi loss:
Logit-adjusted cross-entropy loss: Beroperasi pada tingkat sampel, menggeser margin keputusan berdasarkan frekuensi kelas. Ini membantu model memberikan perhatian yang lebih besar pada kelas-kelas penyakit yang langka, seperti squamous cell carcinoma*, bahkan jika representasi demografisnya juga minim. Conditional Value at Risk (CVaR) aggregation: Beroperasi pada tingkat kelompok, mengarahkan tekanan optimasi ke kelompok demografi yang saat ini memiliki loss* lebih tinggi. Artinya, jika model berkinerja buruk pada kelompok pasien perempuan, CVaR akan secara khusus meningkatkan penalti untuk kesalahan tersebut, mendorong model untuk belajar lebih baik pada kelompok tersebut.
Kedua mekanisme ini saling melengkapi. Satu mengontrol arah gradien per sampel sepanjang sumbu kelas, sementara yang lain mengontrol besarnya gradien per kelompok sepanjang sumbu demografi. Komposisi ini memungkinkan gradien untuk akhirnya mencapai "persimpangan" spesifik di mana risiko klinis nyata berada, dan yang tidak dapat dijangkau oleh salah satu metode secara terpisah. Ini menghasilkan sistem yang secara inheren lebih adil dan akurat, mengurangi risiko kesalahan diagnosis yang tidak merata antar kelompok.
Metodologi dan Hasil yang Menjanjikan
Pendekatan ini diimplementasikan pada arsitektur 3D ResNet-18 yang telah dilatih sebelumnya pada Kinetics-400. Evaluasi dilakukan pada benchmark Fair Disease Diagnosis dari PHAROS-AIF-MIH CVPR Workshop, tugas klasifikasi CT paru-paru empat kelas (Adenocarcinoma, Squamous Cell Carcinoma, COVID-19, dan Normal) dengan anotasi jenis kelamin pasien.
Dataset pelatihan secara konkret menggambarkan masalah gabungan: squamous cell carcinoma memiliki total 84 sampel, dan hanya 5 di antaranya adalah pasien perempuan. Dengan menerapkan objektif gabungan, penelitian ini mencapai F1 makro rata-rata jenis kelamin sebesar 0,8403 dengan kesenjangan keadilan sebesar 0,0239. Ini menunjukkan peningkatan skor sebesar 13,3% dan pengurangan disparitas demografi sebesar 78% dibandingkan dengan baseline. Analisis abrasi lebih lanjut menunjukkan bahwa setiap komponen objektif ini, jika diterapkan sendiri, tidak dapat mencapai hasil optimal ini.
Implikasi Praktis untuk Layanan Kesehatan
Inovasi ini memiliki implikasi besar bagi penyedia layanan kesehatan dan pengembang teknologi AI. Dengan model diagnostik yang lebih adil dan robust, rumah sakit dapat:
- Meningkatkan Akurasi Diagnosis: Mengurangi kemungkinan kesalahan diagnosis pada pasien dari kelompok demografi yang kurang terwakili atau dengan kondisi langka.
- Mengurangi Risiko Klinis: Menghindari konsekuensi negatif dari diagnosis yang salah atau terlambat, yang dapat berdampak serius pada hasil pengobatan pasien.
- Mendorong Kesetaraan Kesehatan: Memastikan bahwa manfaat AI dalam diagnosis medis tersebar secara merata ke seluruh populasi, tanpa memperburuk disparitas yang ada.
- Optimalisasi Sumber Daya: Dengan diagnosis otomatis yang lebih andal, radiolog dapat memfokuskan perhatian pada kasus yang paling kompleks, meningkatkan efisiensi operasional.
Penerapan AI untuk analisis video, seperti dalam diagnosis medis, adalah salah satu area keahlian AI Video Analytics ARSA Technology. Dengan solusi seperti AI Box Series, ARSA dapat menyediakan sistem AI edge yang dapat memproses data secara lokal dengan latensi rendah dan menjamin privasi data, menjadikannya pilihan ideal untuk implementasi di lingkungan sensitif seperti fasilitas kesehatan. Selain itu, ARSA juga menawarkan solusi AI kustom untuk memenuhi kebutuhan spesifik dan kompleks dari berbagai industri, termasuk sektor kesehatan yang menuntut akurasi dan keadilan tinggi.
Pentingnya keadilan dalam AI medis tidak dapat dilebih-lebihkan. Solusi yang diusulkan dalam penelitian ini menunjukkan jalan ke depan untuk membangun sistem AI yang tidak hanya cerdas tetapi juga etis dan adil, membawa manfaat transformatif bagi semua pasien, terlepas dari demografi mereka.
Ingin mempelajari lebih lanjut tentang bagaimana solusi AI dan IoT dapat meningkatkan akurasi dan keadilan dalam operasi Anda? Jelajahi berbagai penawaran ARSA Technology dan hubungi tim ARSA untuk konsultasi gratis.