MTFM: Inovasi Model Fondasi untuk Sistem Rekomendasi Industri yang Skalabel dan Efisien

Pelajari MTFM, model fondasi AI dari Meituan yang revolusioner untuk sistem rekomendasi industri. Optimalkan efisiensi, skalabilitas, dan ekstensibilitas dengan tokenisasi heterogen dan arsitektur transformer canggih.

MTFM: Inovasi Model Fondasi untuk Sistem Rekomendasi Industri yang Skalabel dan Efisien

MTFM: Era Baru Sistem Rekomendasi Industri

      Di era di mana Model Bahasa Besar (LLM) telah mengubah lanskap kecerdasan buatan, konsep "Model Fondasi" (Foundation Model/FM) telah menjadi pusat perhatian. Model-model ini, yang awalnya dimulai sebagai unimodal, kini berkembang menjadi multimodal, mampu memahami dan memproses berbagai jenis data secara bersamaan. Paralel dengan evolusi ini, komunitas riset sistem rekomendasi juga mulai memahami pentingnya "Hukum Skalabilitas" (Scaling Laws) – prinsip bahwa peningkatan ukuran model dan volume data secara signifikan akan menghasilkan peningkatan kinerja yang konsisten. Namun, potensi penuh dari sebuah Model Fondasi Rekomendasi seringkali terhalang karena model masih terisolasi dalam satu skenario atau domain.

      Inilah yang menjadi inti dari penelitian MTFM (Meituan Foundation Model for Recommendation) oleh tim Meituan. Mereka berpendapat bahwa terobosan berikutnya terletak pada menjembatani heterogenitas lintas skenario. Dengan beralih dari optimasi satu skenario ke kerangka kerja multi-skenario yang terpadu, kita dapat memanfaatkan beragam sinyal perilaku untuk membuka manfaat Scaling Laws lebih lanjut. Hal ini dapat meningkatkan batas atas kinerja dan membangun paradigma yang lebih skalabel untuk sistem rekomendasi. Untuk mewujudkan visi ini, sebuah Model Fondasi Rekomendasi ideal harus memiliki tiga properti utama: Skalabilitas, Ekstensibilitas, dan Efisiensi.

Tantangan dalam Sistem Rekomendasi Industrial

      Sistem rekomendasi di lingkungan industri modern menghadapi serangkaian tantangan kompleks. Model rekomendasi lintas domain (Cross-Domain Recommendation/CDR) dan multi-skenario (Multi-Scenario Recommendation/MSR) yang ada seringkali membutuhkan sumber daya yang sangat besar dan penyesuaian input yang ketat. Ketergantungan pada template fitur yang kaku ini membatasi ekstensibilitas dan menyulitkan integrasi skenario baru. Misalnya, dalam platform pengiriman makanan, skema fitur untuk rekomendasi restoran dan rekomendasi makanan sangat berbeda karena jenis pasokan dan presentasi antarmuka pengguna yang berbeda. Memaksa ratusan fitur heterogen ke dalam template yang tetap tidak hanya rentan terhadap kesalahan tetapi juga menyebabkan hilangnya informasi yang signifikan.

      Lebih lanjut, banyak struktur model yang ada dibuat secara manual berdasarkan heuristik para ahli untuk menangani serangkaian skenario yang tetap. Desain yang rumit dan disesuaikan dengan skenario seperti itu tidak memiliki fleksibilitas struktural yang dibutuhkan untuk mendapatkan manfaat dari hukum skalabilitas yang diamati pada model fondasi lainnya. Terakhir, biaya komputasi yang mahal menjadi penghalang utama. Dalam paradigma tradisional, biaya pelatihan meningkat secara linear dengan volume data. Integrasi data multi-skenario yang besar secara paksa menyebabkan biaya yang terlalu tinggi, membuat model menjadi tidak efisien secara ekonomi untuk penerapan di dunia nyata. Di sinilah inovasi seperti yang ditawarkan oleh MTFM menjadi krusial untuk mengatasi hambatan ini dan membuka potensi penuh dari sistem rekomendasi berbasis AI.

Memperkenalkan MTFM: Solusi Inovatif Meituan

      Meituan Foundation Model (MTFM) muncul sebagai kerangka kerja terpadu yang dirancang untuk memenuhi tiga properti penting: Ekstensibilitas, Skalabilitas, dan Efisiensi. Untuk memastikan Ekstensibilitas, MTFM melampaui template fitur yang kaku. Alih-alih melakukan pra-penyelarasan input, MTFM mengubah data lintas domain menjadi "token heterogen" yang terpadu. Representasi berbasis token ini memungkinkan model untuk menyerap sinyal yang berbeda di berbagai skenario tanpa penyelarasan manual atau kehilangan informasi. Ini adalah langkah maju yang signifikan, karena memungkinkan sistem untuk memahami dan memproses informasi dari berbagai sumber (misalnya, data preferensi makanan, riwayat pencarian restoran, data promosi toko) secara bersamaan, tanpa perlu menyamakan formatnya terlebih dahulu.

      Membangun di atas konsep tokenisasi ini, MTFM menggunakan arsitektur inti berbasis transformer yang dirancang untuk Skalabilitas. Dengan mengganti struktur berbasis heuristik yang dibuat secara manual dengan mekanisme self-attention yang mendalam, MTFM memberdayakan model untuk secara otomatis menangkap baik hukum perilaku universal maupun nuansa spesifik skenario seiring dengan peningkatan skala model dan data. Ini berarti model dapat belajar dari pola umum perilaku pengguna yang berlaku di seluruh platform, sekaligus memahami preferensi unik yang berlaku dalam skenario tertentu. Model ini dibangun untuk memungkinkan kinerja yang lebih baik secara konsisten dan terukur seiring dengan peningkatan parameter model dan volume data. Perusahaan seperti ARSA yang berpengalaman sejak 2018 dalam mengembangkan solusi AI kustom memahami pentingnya arsitektur yang fleksibel dan skalabel untuk implementasi AI yang berkelanjutan.

Optimalisasi Efisiensi: Hybrid Target Attention dan Beyond

      Untuk mencapai Efisiensi yang unggul tanpa mengorbankan kapasitas pemodelan, MTFM memperkenalkan Hybrid Target Attention (HTA). Meskipun arsitektur full-attention sangat unggul dalam ekspresivitas, kompleksitas kuadratiknya (yang berarti biaya komputasi meningkat secara eksponensial dengan panjang urutan data) sangat mahal untuk urutan panjang berskala industri. Terinspirasi oleh penerapan sparse attention dalam LLM, HTA berfungsi sebagai jalan tengah strategis: ia secara selektif menerapkan full attention ke beberapa lapisan penting untuk mempertahankan penangkapan dependensi global, sambil menggunakan target attention untuk sebagian besar stack model.

      HTA dirancang untuk mengoptimalkan penggunaan memori dan kompleksitas komputasi. Ini sangat penting saat menangani volume data besar yang dihasilkan di berbagai skenario, seperti dalam kasus Meituan. Lebih lanjut, dengan mengintegrasikan Grouped-Query Attention (GQA), MTFM secara signifikan mengkompresi jejak memori dan meningkatkan throughput pelatihan. Ini memungkinkan pemrosesan lebih banyak token multi-skenario dengan overhead minimal.

      Selain inovasi arsitektur, tim Meituan juga menerapkan serangkaian optimasi sistematis untuk menjembatani kesenjangan antara model teoretis dan penerapan di dunia nyata. Pada sisi data, mereka memanfaatkan agregasi tingkat pengguna dari berbagai skenario untuk mengubah sampel yang terfragmentasi menjadi urutan padat, secara substansial meningkatkan throughput pelatihan. Pada tingkat sistem, mereka berhasil menggandakan throughput pelatihan dan inferensi dengan menghilangkan hambatan kritis melalui berbagai teknik, seperti orkestrasi pipeline CPU-GPU, kernel fusion, dan structured sparsity. Co-desain ini memastikan bahwa MTFM layak secara ekonomi untuk produksi berskala besar. Konsep optimalisasi di edge atau perangkat lokal ini sangat relevan dengan solusi ARSA AI Box Series yang dirancang untuk pemrosesan AI di perangkat, mengurangi latensi dan kebutuhan bandwidth.

Dampak dan Validasi Dunia Nyata

      Kinerja MTFM telah dievaluasi melalui eksperimen offline dan pengujian A/B online di berbagai skenario di Meituan. Hasilnya sangat menjanjikan, menunjukkan bahwa keuntungan kinerja yang signifikan dicapai dengan menskalakan kapasitas model dan data pelatihan multi-skenario. Secara spesifik, untuk tugas CTR (Click-Through Rate), MTFM mencapai peningkatan rata-rata GAUC (Grouped Area Under the Curve) sebesar 0,36 poin persentase (pp), dengan perolehan maksimum 0,76 pp. Untuk tugas CTCVR (Click-Through Conversion Rate), model menghasilkan peningkatan rata-rata GAUC sebesar 0,29 pp dan peningkatan puncak sebesar 0,53 pp.

      Lebih penting lagi, pengujian A/B online di dunia nyata menunjukkan pertumbuhan bisnis yang signifikan: peningkatan +2,98% dalam pesanan untuk Rekomendasi Paket Kupon Shenqiangshou (SQS) dan peningkatan +1,45% untuk Rekomendasi Makanan Pinhaofan (PHF). Angka-angka ini secara konkret menunjukkan bagaimana inovasi AI dapat langsung berdampak pada metrik bisnis inti, seperti peningkatan pendapatan dan keterlibatan pengguna. Dengan kemampuan untuk mengoptimalkan rekomendasi di berbagai skenario, perusahaan dapat melihat peningkatan efisiensi operasional dan kepuasan pelanggan yang substansial. Ini adalah contoh nyata bagaimana solusi solusi AI kustom yang diterapkan dengan cerdas dapat menghasilkan ROI yang terukur.

Masa Depan Rekomendasi Berbasis AI

      MTFM menunjukkan bahwa model fondasi AI memiliki potensi besar untuk mengubah sistem rekomendasi di industri. Dengan fokus pada skalabilitas, ekstensibilitas melalui tokenisasi heterogen, dan efisiensi melalui mekanisme attention yang cerdas serta optimasi sistem, Meituan telah membuka jalan bagi pendekatan yang lebih holistik dan hemat biaya. Ini memungkinkan organisasi untuk tidak hanya meningkatkan kinerja rekomendasi mereka tetapi juga mengintegrasikan skenario baru dengan lebih mudah dan mengelola volume data yang terus bertambah.

      Pendekatan ini sangat relevan bagi perusahaan yang beroperasi di berbagai industri, mulai dari e-commerce, logistik, hingga konten digital. Kebutuhan untuk memberikan rekomendasi yang dipersonalisasi dan relevan di berbagai titik kontak pengguna menjadi semakin penting. Dengan memanfaatkan model fondasi yang cerdas, bisnis dapat membangun ekosistem rekomendasi yang lebih kuat, responsif, dan adaptif terhadap perubahan pasar.

      Untuk organisasi yang tertarik untuk memanfaatkan kekuatan AI canggih untuk sistem rekomendasi atau tantangan operasional lainnya, mencari mitra teknologi yang tepat sangatlah krusial. ARSA Technology, sebagai penyedia solusi AI & IoT yang mendalam, dapat membantu merancang dan menerapkan sistem AI transformatif yang dirancang untuk efisiensi, skalabilitas, dan dampak nyata di dunia nyata.

      [Source: MTFM: A Scalable and Alignment-free Foundation Model for Industrial Recommendation in Meituan, https://arxiv.org/abs/2602.11235]

      Jika Anda siap untuk mentransformasi sistem rekomendasi atau operasi bisnis Anda dengan solusi AI terdepan, tim ARSA siap berdiskusi. Jelajahi solusi AI kami dan hubungi ARSA untuk konsultasi gratis.