Spektroskopi Near-Infrared

Model Fondasi Tabular Tingkatkan Akurasi Kalibrasi Spektroskopi Near-Infrared dengan AI

Pelajari bagaimana model fondasi tabular seperti TabPFN merevolusi kalibrasi data Spektroskopi Near-Infrared (NIRS), menawarkan analisis kimia yang cepat dan akurat untuk berbagai industri.

ARSA Technology Team

22 May 2026 • 5 min read

Revolusi Analisis Kimia: Memanfaatkan AI untuk Kalibrasi NIRS yang Lebih Baik

Spektroskopi Near-Infrared (NIRS) telah menjadi teknologi sensor kimia yang semakin penting. Metode ini memungkinkan analisis sampel yang cepat dan non-destruktif di berbagai sektor, mulai dari pangan, farmasi, biologi, hingga lingkungan. Namun, keberhasilan penerapan sensor NIRS di lapangan sangat bergantung pada model kalibrasi yang kuat. Model ini harus mampu mengatasi data spektrum berdimensi tinggi, korelasi antar data yang kuat, keterbatasan ukuran sampel, ketergantungan pada pra-pemrosesan data, keberadaan outlier spektrum, dan kemampuan ekstrapolasi di luar domain kalibrasi. Sebuah studi inovatif mengevaluasi potensi model fondasi tabular untuk menyediakan strategi kalibrasi baru yang lebih andal untuk sensor kimia NIRS (Reiter et al., 2026).

Spektroskopi Near-Infrared (NIRS): Jendela ke Analisis Kimia Cepat

NIRS adalah teknik analitis yang memanfaatkan interaksi cahaya infra-merah dekat dengan sampel untuk mengungkap komposisi kimianya. Keunggulan utamanya terletak pada kecepatannya, sifat non-destruktifnya, dan kemampuannya untuk menganalisis sampel yang kompleks tanpa persiapan yang rumit. Dengan NIRS, kita dapat, misalnya, dengan cepat menentukan kadar gula dalam buah, kualitas biji-bijian, atau mengidentifikasi bahan aktif dalam produk farmasi. Ini sangat vital untuk kontrol kualitas, penelitian, dan berbagai aplikasi industri di mana analisis cepat sangat dibutuhkan.

Namun, data yang dihasilkan NIRS memiliki kompleksitas tersendiri. Spektrum yang diukur seringkali sangat detail (berdimensi tinggi), dengan banyak titik data yang saling terkait (kolinieritas tinggi). Sinyal yang terukur juga rentan terhadap gangguan fisik seperti hamburan cahaya, variabilitas jalur optik, dan drift instrumen, yang semuanya dapat memengaruhi akurasi hasil. Inilah mengapa desain model dan pra-pemrosesan data menjadi komponen krusial dalam analisis spektroskopi. Solusi seperti AI Video Analytics, meskipun berbeda domainnya, juga menunjukkan bagaimana data kompleks dari sensor dapat diubah menjadi wawasan operasional yang berharga.

Tantangan Kalibrasi Data NIRS Tradisional

Secara historis, kalibrasi NIRS sangat bergantung pada model kemometrik klasik seperti Partial Least Squares (PLS) dan variannya. Model-model ini populer karena ketahanan, interpretasi yang relatif mudah, dan kemampuannya menangani kolinearitas data. Namun, PLS mungkin kurang efektif ketika hubungan antara spektrum dan variabel target bersifat sangat non-linear.

Belakangan, metode machine learning modern mulai diperkenalkan untuk menangkap pola yang lebih kompleks. Model linear teregulasi seperti Ridge regression menawarkan baseline yang kuat dengan menstabilkan estimasi dalam pengaturan data berdimensi tinggi. Metode ensemble seperti gradient boosting (contohnya CatBoost) menyediakan pemodelan non-linear yang fleksibel dengan kinerja empiris yang kuat pada data tabular. Model deep learning, khususnya Convolutional Neural Networks (CNN) satu dimensi, juga telah dieksplorasi untuk memanfaatkan struktur terurut dari spektrum, meskipun model ini umumnya memerlukan penyetelan yang cermat dan jumlah data yang cukup besar. Meski ada kemajuan ini, tetap ada tarik ulur: model kemometrik sederhana dan kokoh untuk data kecil dan kolinier, tetapi mungkin terbatas pada hubungan non-linear. Sementara itu, metode machine learning dan deep learning bisa menangani non-linearitas, tetapi seringkali butuh banyak data dan tuning yang ekstensif.

Model Fondasi Tabular (TabPFN): Pendekatan AI Baru

Sebuah arah yang menjanjikan datang dari Prior-Data Fitted Networks (PFNs), sebuah kelas model yang diperkenalkan pada tahun 2021. PFNs dilatih dengan pre-training sebuah transformer besar (arsitektur neural-network yang mendasari mekanisme self-attention) di berbagai dataset sintetis untuk menyelesaikan masalah klasifikasi atau regresi. Artinya, tidak seperti pendekatan machine learning klasik, PFNs sudah "terkalibrasi" di muka dan tidak memerlukan optimasi parameter saat diberi dataset baru. Prediksi dilakukan hanya dengan satu forward-pass melalui jaringan yang sudah dilatih.

TabPFN adalah salah satu implementasi PFN yang paling menonjol dan dapat dianggap sebagai model fondasi tabular. Model ini dirancang khusus untuk menangani masalah umum yang ditemui pada dataset tabular di dunia nyata, termasuk fitur yang tidak informatif, fitur kategorikal, outlier, atau nilai yang hilang. TabPFN dilatih pada sekitar 100 juta dataset sintetis. Versi terbaru yang diterbitkan bahkan mencapai kinerja state-of-the-art, mampu menghasilkan prediksi dalam hitungan detik yang mengungguli model berbasis pohon seperti CatBoost, dan bahkan menyamai akurasi metode ensemble paling canggih yang di-tuning selama berjam-jam. Karena pelatihannya pada dataset sintetis berukuran kecil hingga sedang, TabPFN sangat efektif pada dataset hingga 50.000 sampel dan 2.000 fitur.

Metodologi Penelitian dan Hasil Utama

Studi yang dilakukan oleh Reiter et al. (2026) ini mengevaluasi apakah model fondasi tabular ini efektif untuk kalibrasi NIRS. Penelitian ini membandingkan kinerja TabPFN dengan PLS/PLS-DA, Ridge, CatBoost, dan CNN-1D pada 66 dataset NIRS, mencakup 54 tugas regresi dan 12 tugas klasifikasi. Mereka menggunakan kerangka validasi terpadu di mana pemilihan pra-pemrosesan dan model dilakukan secara eksklusif pada data kalibrasi sebelum evaluasi tes eksternal yang independen.

Hasilnya menunjukkan bahwa dalam tugas regresi, TabPFN yang dioptimalkan dengan pra-pemrosesan data mencapai peringkat rata-rata terbaik secara keseluruhan. Model ini secara signifikan mengungguli PLS, CatBoost, TabPFN pada spektrum mentah, dan CNN-1D, sambil tetap sebanding secara statistik dengan Ridge. Dalam tugas klasifikasi, TabPFN yang diterapkan langsung pada spektrum mentah memberikan peringkat rata-rata terbaik, dengan kinerja yang hampir sama dengan varian yang dioptimalkan. Ini menunjukkan bahwa untuk data spektral yang kompleks, pra-pemrosesan bisa sangat membantu TabPFN dalam regresi, tetapi untuk klasifikasi, TabPFN sudah sangat tangguh bahkan tanpa pra-pemrosesan spesifik. ARSA Technology, dengan pengalaman sejak 2018, telah mengembangkan AI Box Series yang merupakan sistem AI edge siap pakai, menunjukkan komitmen terhadap solusi AI yang praktis dan efisien.

Implikasi dan Penerapan Praktis

Temuan ini sangat signifikan bagi industri yang mengandalkan NIRS. TabPFN menawarkan potensi untuk mempercepat dan menyederhanakan proses pengembangan model kalibrasi, terutama dalam skenario di mana ukuran sampel terbatas – kondisi yang umum terjadi pada banyak aplikasi NIRS. Kemampuannya untuk menghasilkan prediksi yang cepat tanpa tuning ekstensif dapat mengurangi waktu dan sumber daya yang diperlukan untuk menerapkan solusi NIRS baru.

Namun, studi ini juga menyoroti area di mana model kemometrik klasik masih memiliki keunggulan. Analisis ketahanan menunjukkan bahwa meskipun TabPFN memberikan kinerja prediktif rata-rata yang kuat, keunggulannya berkurang pada outlier spektrum dan sampel yang diekstrapolasi (di luar jangkauan data pelatihan), di mana model kemometrik tradisional masih kompetitif. Ini menggarisbawahi pentingnya memiliki strategi penerapan yang sadar akan ketidakpastian, dan mungkin kebutuhan akan priors yang lebih spesifik untuk spektroskopi dalam pengembangan model fondasi tabular di masa depan. Pengembangan Custom AI Solution adalah contoh bagaimana ARSA dapat menyesuaikan teknologi AI untuk mengatasi tantangan unik dalam berbagai sektor.

Masa Depan Kalibrasi NIRS dengan AI

Secara keseluruhan, hasil penelitian ini menunjukkan bahwa model fondasi tabular dapat melengkapi alur kerja kemometrik yang telah mapan untuk sensor kimia NIRS. Ini sangat relevan dalam pengaturan kalibrasi berukuran kecil hingga menengah. Kemampuan TabPFN untuk mentransformasi infrastruktur pasif menjadi mesin keputusan cerdas, seperti yang dijelaskan dalam visi ARSA Technology, menjanjikan efisiensi dan akurasi yang lebih tinggi dalam analisis kimia.

Penelitian lebih lanjut diperlukan untuk mengintegrasikan priors spesifik spektroskopi ke dalam model fondasi tabular ini agar dapat meningkatkan ketahanan terhadap outlier dan kemampuan ekstrapolasi. Dengan demikian, kita dapat terus mendorong batas-batas analisis kimia yang cepat dan akurat, membuka jalan bagi inovasi di berbagai industri dengan dukungan AI yang semakin cerdas.

Sumber: Reiter, R., Cornet, D., Michel, F., Rouan, L., & Beurier, G. (2026). Tabular foundation models for robust calibration of near-infrared chemical sensing data. arXiv preprint arXiv:2605.21544. https://arxiv.org/abs/2605.21544

Untuk mengetahui lebih lanjut tentang bagaimana solusi AI dan IoT dapat diimplementasikan untuk kebutuhan spesifik perusahaan Anda, jangan ragu untuk menghubungi tim ARSA untuk konsultasi gratis.