Prediksi Jumlah Penumpang Bus: Mengungkap Kekuatan Model Pembelajaran Mesin Spasial untuk Transportasi Cerdas

Pelajari bagaimana model pembelajaran mesin berbasis poligon dan analisis spasial merevolusi prediksi jumlah penumpang bus, mengatasi keterbatasan model tradisional untuk efisiensi transportasi publik yang lebih baik.

Prediksi Jumlah Penumpang Bus: Mengungkap Kekuatan Model Pembelajaran Mesin Spasial untuk Transportasi Cerdas

      Transportasi publik memegang peranan krusial dalam kehidupan urban modern, menjadi tulang punggung mobilitas bagi jutaan orang setiap hari. Namun, pengelolaan dan optimalisasi sistem transportasi publik, khususnya bus, menghadapi tantangan besar dalam memprediksi jumlah penumpang secara akurat. Metode tradisional seringkali gagal menangkap dinamika lokal yang unik di berbagai area perkotaan, memperlakukan seluruh kota sebagai satu kesatuan yang homogen. Sebuah studi akademik, "Comparative Analysis of Polygon-Based and Global Machine Learning Models for Bus Occupancy Prediction," memperkenalkan kerangka kerja inovatif untuk meningkatkan prediksi jumlah penumpang bus dengan mengintegrasikan metodologi pengelompokan spasial dengan analisis fitur multi-dimensi. Pendekatan ini menawarkan solusi yang lebih tepat sasaran untuk perencanaan dan peningkatan layanan transportasi publik.

Tantangan Prediksi Penumpang Bus Tradisional

      Selama beberapa dekade terakhir, pertumbuhan populasi di perkotaan telah meningkatkan ketergantungan pada transportasi publik untuk mobilitas sehari-hari. Dengan semakin padatnya jalan raya akibat penggunaan kendaraan pribadi, peningkatan kualitas transportasi publik menjadi landasan upaya mitigasi kemacetan dan langkah penting menuju transportasi berkelanjutan. Penentuan jadwal, komponen esensial dalam transportasi publik, menetapkan waktu keberangkatan dan kedatangan kendaraan di berbagai halte, yang sangat penting untuk menyediakan layanan yang efisien dan nyaman bagi penumpang.

      Secara tradisional, agen transit mengembangkan jadwal ini menggunakan survei perilaku perjalanan, seperti catatan harian perjalanan rumah tangga dan penghitungan manual penumpang yang naik-turun. Data survei ini digunakan untuk memperkirakan rata-rata beban penumpang selama periode tertentu (misalnya, puncak pagi dan sore). Perkiraan ini kemudian menjadi dasar untuk menentukan frekuensi layanan dan jeda antar perjalanan dalam jadwal statis untuk memenuhi permintaan yang dirasakan. Namun, praktik penjadwalan saat ini seringkali kurang optimal. Ketergantungan pada survei yang hanya merepresentasikan "snapshot" temporal menyebabkan kurangnya cakupan spatiotemporal yang memadai, biaya tinggi, dan waktu yang lama dalam pelaksanaannya, serta kegagalan untuk menghasilkan data yang cukup guna menangkap fluktuasi permintaan yang dinamis dan pertumbuhan transportasi publik. Akibatnya, jadwal yang berasal dari metode ini mungkin tidak mencerminkan pola mobilitas aktual, yang dapat menyebabkan kepadatan berlebih selama lonjakan tak terduga atau layanan yang tidak efisien selama periode permintaan rendah.

Evolusi Perencanaan Transportasi Publik dengan Data Besar

      Munculnya era baru dalam penelitian perkotaan, didorong oleh kemajuan dalam analisis data besar (big data), telah membuka pemahaman yang lebih dalam tentang sistem perkotaan. Pergeseran ini didorong oleh pertumbuhan cepat dalam volume, kecepatan, dan variasi data besar, bersama dengan kemajuan signifikan dalam ilmu data. Inovasi seperti alat penambangan data canggih dan teknologi komputasi awan yang kuat telah membuka kemungkinan baru untuk menganalisis pola perilaku penumpang dalam jangka waktu lama dan di area perkotaan yang luas. Ketersediaan data besar memiliki potensi besar untuk meningkatkan perencanaan dan penelitian transportasi.

      Untuk memanfaatkan kemajuan ini dan menciptakan model yang andal untuk memprediksi jumlah penumpang bus, ketersediaan dataset transportasi publik yang akurat dan komprehensif sangatlah penting. Berbagai basis data telah dikembangkan untuk meningkatkan pemahaman sistem transportasi publik di berbagai tingkatan:

  • General Transit Feed Specification (GTFS): Menyediakan jadwal komprehensif dan informasi rute untuk semua jalur transportasi publik yang direncanakan setiap hari.
  • Smart Card Payment Systems (AFC): Menggunakan protokol TAP untuk validasi masuk dan keluar penumpang melalui kartu pintar, memastikan perhitungan tarif yang akurat dan boarding yang efisien.
  • Automatic Passenger Counter (APC): Sistem berbasis laser yang mencatat jumlah penumpang yang naik dan turun di setiap halte.
  • Service Interface for Real Time Information (SIRI): Menyediakan informasi standar yang dapat dibaca mesin tentang operasi transportasi publik, termasuk data real-time dan terjadwal seperti lokasi kendaraan dan perkiraan waktu kedatangan.


      Semua basis data ini dapat diintegrasikan untuk memberikan pemahaman yang komprehensif tentang sistem transportasi publik. Memanfaatkan data ini secara efektif adalah kunci untuk sistem prediktif yang lebih canggih.

Mengapa Model Lokal Lebih Baik: Heterogenitas Spasial Kota

      Pendekatan tradisional seringkali menerapkan asumsi global yang kaku, yang mengabaikan heterogenitas spasial intrinsik dari permintaan perkotaan. Dalam studi yang diulas ini, para peneliti mengusulkan metodologi baru untuk prediksi jumlah penumpang bus jangka panjang, yang mampu memperkirakan hingga satu minggu ke depan jumlah penumpang yang tersisa di dalam bus setelah setiap stasiun, mengikuti proses naik dan turun di halte tersebut. Pendekatan ini tidak bergantung pada identifikasi eksplisit jalur atau halte tertentu—seperti nomor rute, nama halte, atau koordinat geografis—sehingga dapat diterapkan di berbagai sistem transportasi publik.

      Terinspirasi dari Hukum Geografi Pertama Tobler yang menyatakan bahwa "segala sesuatu berhubungan dengan segala sesuatu yang lain, tetapi hal-hal yang dekat lebih berhubungan daripada hal-hal yang jauh," penelitian ini berhipotesis bahwa akurasi prediksi akan meningkat dengan menggunakan model yang terlokalisasi. Model-model ini dilatih menggunakan data dari klaster spasial, dibandingkan dengan model global tunggal. Pendekatan terlokalisasi ini memungkinkan penangkapan pendorong permintaan secara spesifik di setiap wilayah, seperti perilaku yang berbeda antara pusat kota dan zona pinggiran.

      Untuk mengatasi ini, kerangka kerja studi tersebut mengintegrasikan max-p regions (wilayah Max-p) dengan tree-based ensembles. Wilayah Max-p adalah metode pengelompokan spasial yang mengelompokkan halte-halte bus yang berdekatan menjadi wilayah-wilayah yang terhubung, dengan memastikan bahwa setiap poligon memenuhi ambang batas minimum untuk jumlah rata-rata aliran penumpang. Ini menciptakan batas-batas berbasis data yang mencerminkan perilaku perjalanan dunia nyata. Sementara pendekatan ini meningkatkan kompleksitas komputasi dengan mempertahankan banyak sub-model, ia memungkinkan penangkapan pendorong permintaan secara lokal yang biasanya gagal diselesaikan oleh regressor global yang bersifat satu ukuran untuk semua.

Metodologi Inovatif: Pengelompokan Berbasis Poligon dan Pembelajaran Mesin

      Untuk mengekstrak informasi komprehensif bagi tugas prediksi, data diperoleh dari dataset APC kota, yang berisi detail tentang jalur bus, tanggal keberangkatan, hari dalam seminggu, serta jumlah penumpang yang naik, turun, dan jumlah penumpang di setiap bus pada setiap halte di sepanjang perjalanannya. Dataset tambahan juga digabungkan, termasuk data meteorologi, yang dapat membantu menjelaskan variasi penggunaan transportasi publik di hari yang berbeda. Selain itu, kedekatan setiap halte dengan pusat kota dapat membantu menjelaskan bagaimana dan mengapa halte bus yang berbeda menarik jumlah penumpang yang bervariasi.

      Terakhir, representasi jaringan sistem transportasi publik yang berbasis jam dibangun, memungkinkan ekstraksi ukuran sentralitas jaringan, serta bobot edge dan statistik mereka untuk jumlah penumpang, jarak, dan faktor terkait. Fitur-fitur ini memfasilitasi generalisasi model di luar konteks kota spesifik dan menangkap karakteristik struktural jaringan transportasi publik dalam dataset.

      Setelah mengumpulkan dan menganalisis data dari semua sumber, kota tersebut dibagi menjadi wilayah-wilayah yang berdekatan secara spasial menggunakan algoritma pengelompokan spasial Max-p. Dalam studi ini, algoritma tersebut diterapkan untuk membuat poligon yang mengelompokkan halte-halte terdekat ke dalam wilayah-wilayah yang terhubung, sembari memastikan bahwa setiap poligon memenuhi ambang batas minimum untuk jumlah rata-rata aliran penumpang. Pendekatan ini secara khusus bertujuan untuk meningkatkan akurasi dengan memungkinkan model terlokalisasi yang dilatih pada data dari klaster-klaster spasial, dibandingkan dengan model global tunggal. Hasilnya menunjukkan bahwa model lokal ini mencapai akurasi yang sebanding dengan model global, membuktikan efektivitas strategi pemodelan yang sadar spasial dan terlokalisasi untuk prediksi transportasi publik.

Implikasi Praktis dan Manfaat Strategis

      Penerapan model pembelajaran mesin yang sadar spasial ini memiliki implikasi besar bagi operator transportasi publik dan perencana kota. Dengan memahami pola permintaan yang sangat terlokalisasi, mereka dapat:

  • Mengoptimalkan Penjadwalan: Menyesuaikan frekuensi bus secara dinamis sesuai dengan permintaan aktual di setiap klaster, mengurangi kepadatan di jam sibuk dan meningkatkan efisiensi di jam sepi.
  • Meningkatkan Pengalaman Penumpang: Mengurangi waktu tunggu dan kepadatan bus, yang mengarah pada peningkatan kepuasan penumpang dan mendorong penggunaan transportasi publik.
  • Pengurangan Biaya Operasional: Menghindari pengerahan bus yang tidak perlu di area dengan permintaan rendah, sehingga menghemat bahan bakar dan biaya tenaga kerja.
  • Perencanaan Kota yang Lebih Baik: Memberikan wawasan berharga bagi perencana kota untuk mengembangkan infrastruktur dan layanan yang lebih sesuai dengan kebutuhan komuter.


      Untuk mengimplementasikan solusi semacam ini, perusahaan seperti ARSA Technology menawarkan kapabilitas dalam analisis video AI dan sistem IoT. Misalnya, dengan menggunakan solusi AI Video Analytics, data real-time mengenai kepadatan kerumunan di halte bus atau pola naik-turun penumpang dapat dikumpulkan secara akurat. Sementara itu, AI BOX - Traffic Monitor dapat membantu dalam penghitungan dan klasifikasi kendaraan, yang penting untuk analisis lalu lintas dan penyesuaian jadwal bus berdasarkan kondisi jalan. Dengan pengalaman experienced since 2018 dalam membangun sistem AI & IoT yang siap produksi, ARSA dapat membantu bisnis mengimplementasikan solusi yang memanfaatkan data ini untuk membuat keputusan operasional yang lebih cerdas.

Kesimpulan

      Studi tentang "Comparative Analysis of Polygon-Based and Global Machine Learning Models for Bus Occupancy Prediction" ini menggarisbawahi pentingnya pendekatan yang sadar spasial dalam memprediksi jumlah penumpang bus. Dengan mengatasi keterbatasan model global dan memanfaatkan kekayaan data besar melalui pengelompokan spasial dan pembelajaran mesin, kita dapat membuka jalan bagi sistem transportasi publik yang lebih responsif, efisien, dan berkelanjutan. Penemuan ini menunjukkan bahwa dengan penyesuaian yang tepat terhadap heterogenitas spasial perkotaan, AI dapat memberikan dampak transformasional pada cara kita mengelola mobilitas di kota-kota kita. Implementasi teknologi seperti ini tidak hanya janji masa depan, tetapi sebuah realitas yang dapat diwujudkan hari ini untuk kota-kota di seluruh dunia.

      Sumber: Daniel Azenkot, Eran Ben Elia, Michael Fire. "Comparative Analysis of Polygon-Based and Global Machine Learning Models for Bus Occupancy Prediction." arXiv preprint arXiv:2605.00083 (2026). Tersedia di: https://arxiv.org/abs/2605.00083

      Apakah Anda siap untuk mengubah sistem transportasi Anda dengan kekuatan AI dan IoT? Jelajahi solusi ARSA dan hubungi tim ARSA untuk konsultasi gratis.