Mengoptimalkan AI di Edge: Pemanfaatan Sumber Daya Differentiable Logic Gate Networks pada FPGA
Pelajari cara Differentiable Logic Gate Networks (LGN) dan FPGA menghadirkan AI efisien di perangkat edge. Temukan tradeoff arsitektur dan optimasi hardware untuk kinerja superior.
Pengantar: Era Edge AI dan Kebutuhan Efisiensi
Kecerdasan Buatan (AI) di perangkat edge semakin menjadi pilar penting dalam lanskap teknologi modern. Ini berarti AI beroperasi langsung pada perangkat lokal, bukan bergantung pada cloud, sehingga memungkinkan inferensi yang cepat, privasi data yang lebih baik, dan mengurangi ketergantungan pada konektivitas jaringan. Namun, tantangan utama dalam implementasi AI on-edge adalah bagaimana memaksimalkan kecerdasan model kecil sambil meminimalkan ukuran sirkuit dan daya yang dibutuhkan untuk menjalankan inferensi. Banyak arsitektur jaringan saraf tradisional, meskipun akurat, seringkali menuntut sumber daya perangkat keras dan energi yang signifikan, membatasi penerapannya pada perangkat kecil atau tertanam (embedded).
Untuk menjawab kebutuhan ini, muncul inovasi dalam bentuk Differentiable Logic Gate Networks (LGN). LGN menghadirkan alternatif yang menjanjikan dengan menggabungkan ekspresivitas jaringan saraf dengan efisiensi sumber daya dari sirkuit berbasis logika. Teknologi ini telah menunjukkan kecepatan prediksi dalam skala nanodetik dan mengurangi persyaratan sumber daya dibandingkan dengan jaringan saraf biner tradisional. Kemampuan LGN yang dapat dijelaskan (explainable) lebih lanjut menjadikannya pilihan menarik untuk diterapkan pada Field Programmable Gate Arrays (FPGA) dan akselerator perangkat keras berdaya rendah lainnya.
Differentiable Logic Gate Networks (LGN): Solusi AI yang Efisien
Differentiable Logic Gate Networks (LGN) adalah jenis jaringan saraf yang dilatih untuk mempelajari kombinasi gerbang logika dasar seperti AND, OR, atau XNOR. Keunikan LGN terletak pada kemampuannya untuk secara langsung memetakan fungsi yang dipelajari ke dalam implementasi perangkat keras berbasis logika, seperti yang ditemukan dalam FPGA. Ini berbeda dengan jaringan saraf konvensional yang seringkali memerlukan proses konversi kompleks untuk berjalan di perangkat keras khusus, yang mungkin kurang efisien.
FPGA, atau Field Programmable Gate Arrays, adalah sirkuit terpadu yang dapat diprogram ulang setelah manufaktur, memungkinkan fleksibilitas luar biasa untuk mempercepat tugas komputasi spesifik. Dengan menggunakan FPGA, implementasi LGN dapat mencapai kecepatan inferensi yang sangat tinggi. Meskipun demikian, hubungan antara ukuran model LGN, latensi inferensi, pemanfaatan sumber daya FPGA (seperti Look Up Tables/LUTs), dan konsumsi daya masih belum terkarakterisasi dengan baik. Inilah mengapa penelitian ini menjadi sangat penting, memberikan panduan bagi para insinyur AI dalam memilih arsitektur LGN awal yang sesuai untuk mencapai tujuan kinerja dan batasan sumber daya tertentu.
Metodologi Penelitian: Menguji Batasan Hardware FPGA
Penelitian yang dipublikasikan dalam "Resource Utilization of Differentiable Logic Gate Networks Deployed on FPGAs" ini bertujuan untuk menghasilkan tradeoff desain yang praktis antara variasi arsitektur LGN, akurasi model, kecepatan inferensi sirkuit, pemanfaatan sumber daya, dan daya perangkat. Serangkaian model LGN dilatih untuk melakukan klasifikasi pada dataset gambar umum menggunakan repositori sumber terbuka bernama DiffLogic. Setelah dilatih, setiap model LGN kemudian dikonversi ke kode Hardware Description Language (HDL), yang merupakan bahasa standar untuk mendeskripsikan sirkuit elektronik, sebelum dilakukan proses sintesis untuk ditargetkan ke FPGA.
Dalam studi ini, semua desain ditargetkan pada Alveo-U200, sebuah akselerator yang dilengkapi FPGA XCU200. FPGA ini memiliki fabrik logika yang mengandung 892.000 LUTs (Look Up Tables). LUTs adalah blok bangunan dasar yang dapat diprogram ulang, mirip unit memori kecil, yang digunakan dalam FPGA untuk mengimplementasikan fungsi logika apa pun. Jumlah LUT yang besar ini memungkinkan pengujian arsitektur LGN yang kompleks. Desain perangkat keras yang berhasil kemudian digunakan untuk mengkarakterisasi tradeoff kinerja LGN dan menyajikan metodologi untuk memilih arsitektur LGN dasar untuk aplikasi baru, yang mungkin dapat diterapkan dalam solusi seperti ARSA AI Box Series.
Inovasi Arsitektur dan Pemanfaatan Sumber Daya
Desain LGN dalam penelitian ini mempertimbangkan bahwa model dapat dikonversi menjadi HDL menggunakan tiga blok logika utama: LUT input (untuk streaming input), LUT logic (untuk logika keputusan kombinatorial), dan LUT sum (untuk melakukan klasifikasi berdasarkan operasi groupsum dan argmax). Total LUT yang digunakan (LUT total) adalah jumlah dari ketiga komponen ini ditambah delta untuk logika passing input/output ke dan dari memori DDR.
Empat variasi LGN dirancang: model baseline (lebar lapisan konstan), model dengan "tutup depan" (front caps), "tutup akhir" (end caps), atau keduanya (dual caps). "Tutup" ini adalah lapisan tambahan yang bertujuan mengurangi masalah routing pada model yang lebih besar. Temuan kunci dari penelitian ini adalah bahwa lapisan terakhir LGN sangat penting untuk meminimalkan waktu dan penggunaan sumber daya, dengan potensi penurunan hingga 28%. Hal ini karena lapisan terakhir menentukan ukuran logika operasi penjumlahan (summing operations) yang pada gilirannya mempengaruhi LUT sum. Dengan kata lain, LGN yang lebih dalam dan lebih lebar dapat disintesis untuk FPGA ketika lapisan terakhirnya dirancang secara ramping (narrow), tunduk pada kendala waktu dan routing.
Implikasi Bisnis dan Aplikasi Dunia Nyata
Wawasan dari penelitian ini memiliki implikasi bisnis yang signifikan. Bagi perusahaan yang mengembangkan solusi AI on-edge seperti AI Video Analytics, pemahaman mendalam tentang tradeoff ini memungkinkan mereka merancang sistem yang tidak hanya akurat tetapi juga sangat efisien dalam penggunaan daya dan sumber daya. Ini sangat penting untuk berbagai aplikasi komputasi edge, termasuk:
- Perangkat Medis Berdaya Rendah: Memungkinkan diagnostik dan pemantauan real-time dengan konsumsi daya minimal, memperpanjang masa pakai baterai perangkat yang dikenakan atau ditanam.
Kendaraan Otonom: Memastikan pengambilan keputusan nanodetik yang kritis untuk keamanan dan navigasi, tanpa keterlambatan karena pemrosesan cloud*.
- Robotika Tertanam: Meningkatkan kemampuan robot untuk berinteraksi dengan lingkungannya secara cerdas dan responsif, terutama dalam aplikasi industri atau layanan.
- Sistem Keamanan: Memungkinkan deteksi ancaman dan anomali secara instan di lokasi, meningkatkan respons keamanan.
Dengan menyediakan metodologi praktis untuk memetakan jumlah LUT pada FPGA ke arsitektur LGN baseline, penelitian ini memungkinkan para insinyur Machine Learning untuk memilih titik awal yang optimal ketika melatih LGN untuk tugas-tugas baru. Ini membantu mempercepat waktu pengembangan, mengurangi biaya prototipe, dan memastikan bahwa solusi AI dapat disebarkan secara efektif dan berkelanjutan. ARSA Technology, perusahaan yang telah berpengalaman sejak tahun 2018 dalam mengembangkan solusi AI dan IoT, melihat nilai besar dalam penelitian semacam ini untuk terus menghadirkan inovasi yang relevan dan efisien bagi para pelanggan.
Sumber: Wormald, S., Kravatsky, G., Woodard, D., & Forte, D. (2026). Resource Utilization of Differentiable Logic Gate Networks Deployed on FPGAs. arXiv preprint arXiv:2605.04109v1. https://arxiv.org/abs/2605.04109
Ingin mengeksplorasi bagaimana solusi AI dan IoT yang dioptimalkan dapat diterapkan pada operasi bisnis Anda? Hubungi tim ARSA untuk konsultasi gratis.