Meningkatkan Pencarian Video dengan Penulisan Ulang Kueri Personal Menggunakan AI

Pelajari bagaimana kerangka kerja inovatif seperti WeWrite merevolusi pencarian video dengan penulisan ulang kueri personal berbasis AI, mengurangi ambiguitas, dan meningkatkan pengalaman pengguna.

Meningkatkan Pencarian Video dengan Penulisan Ulang Kueri Personal Menggunakan AI

      Pencarian video telah menjadi tulang punggung navigasi konten di platform video berdurasi pendek. Namun, seringkali pengguna menghadapi tantangan dengan kueri yang terlalu singkat atau ambigu, yang dapat menyebabkan hasil pencarian kurang memuaskan. Misalnya, sebuah kueri seperti "Guang Liang" bisa merujuk pada seorang penyanyi atau merek minuman keras, menciptakan kebingungan bagi mesin pencari generik. Untuk mengatasi masalah ini dan menyediakan pengalaman pencarian yang lebih cerdas dan personal, sebuah kerangka kerja inovatif bernama WeWrite telah diperkenalkan.

      Pendekatan ini memanfaatkan riwayat perilaku pengguna untuk mengidentifikasi maksud pencarian dan mengurangi ambiguitas. Meskipun metode tradisional menggunakan fitur riwayat implisit sering kali menghadapi masalah pengenceran sinyal dan umpan balik yang tertunda, WeWrite dirancang untuk secara spesifik mengatasi tantangan ini. Artikel ini akan membahas tiga pilar utama kerangka kerja ini: "Kapan Menulis" (When to Write), "Bagaimana Menulis" (How to Write), dan arsitektur penerapannya, serta dampak signifikan yang diberikannya pada platform video skala besar.

Tantangan Pencarian Video Modern

      Platform video berdurasi pendek seperti WeChat Channels sangat bergantung pada mesin pencari untuk penemuan konten. Namun, kueri pengguna seringkali singkat dan tidak jelas. Bayangkan seorang pengguna mencari "Air fryer" – tanpa konteks personal, mesin pencari mungkin menyarankan video tentang resep, lelucon, atau tips pemakaian. Jika riwayat pengguna menunjukkan minat pada "cara lucu menggunakan air fryer untuk pasangan," dan mesin pencari secara membabi buta menulis ulang kueri fungsional ini, hal itu bisa menggeser maksud asli pengguna. Ini menunjukkan pentingnya penulisan ulang kueri yang disesuaikan dan sadar akan permintaan pengguna.

      Pendekatan penulisan ulang yang ada bervariasi, mulai dari penambangan sinonim statistik hingga ekspansi berbasis Large Language Model (LLM) generatif. Meskipun demikian, sebagian besar metode masih mengabaikan konteks personal, memperlakukan semua pengguna secara identik. Mengintegrasikan penulisan ulang personal yang eksplisit menghadapi tantangan unik, terutama dalam menentukan kapan personalisasi benar-benar diperlukan dan bagaimana menghasilkan penulisan ulang yang selaras dengan indeks sistem pengambilan data. Selain itu, biaya inferensi LLM yang tinggi dapat menjadi penghalang untuk integrasi langsung ke sistem pencarian video real-time dengan batasan latensi yang ketat.

WeWrite: Kerangka Kerja Penulisan Ulang Kueri yang Inovatif

      Untuk mengatasi hambatan tersebut, para peneliti dari Weixin Group, Tencent China, mengusulkan WeWrite, sebuah kerangka kerja Penulisan Ulang Kueri Sadar Permintaan yang Dipersonalisasi. Kerangka kerja ini berfokus pada tiga kontribusi utama yang dirancang untuk meningkatkan efisiensi dan relevansi pencarian video (Sumber: When & How to Write for Personalized Demand-aware Query Rewriting in Video Search):

  • Strategi "Kapan Menulis" Berbasis Posterior: Mengidentifikasi secara otomatis skenario di mana personalisasi mutlak diperlukan, mencegah pergeseran maksud kueri. Ini dilakukan dengan menganalisis umpan balik pasca-interaksi pengguna, seperti reformulasi kueri dan waktu tinggal (dwell time) pada video.


Pelatihan "Bagaimana Menulis" yang Selaras dengan GRPO: Menggabungkan Supervised Fine-Tuning (SFT) dengan Group Relative Policy Optimization (GRPO) untuk melatih LLM. Metode ini mengoptimalkan reward yang berorientasi pada pengambilan (seperti Tingkat Kunjungan Indeks dan Click-Through Rate*), memastikan keluaran LLM selaras dengan indeks sistem. Penerapan "Fake Recall": Menggunakan arsitektur paralel yang memisahkan inferensi LLM dari jalur utama pencarian, menjamin latensi rendah untuk pengalaman pengguna real-time*.

      Kerangka kerja ini bertujuan untuk menghasilkan kueri yang direformulasi (Q') berdasarkan kueri asli pengguna (Q) dan konteks historis (C_u), sehingga Q' dapat mengambil dokumen yang memaksimalkan utilitas pengguna, seperti konsumsi video yang valid. Konteks pengguna mencakup riwayat kueri, video yang ditonton, dan fitur geolokasi.

Mendeteksi "Kapan Menulis" dengan Penambangan Sampel Berbasis Posterior

      Menentukan "kapan harus menulis ulang" adalah inti dari penulisan ulang kueri personal yang efektif. Penulisan ulang yang sembarangan dapat memperkenalkan noise dan membebani sistem. WeWrite mengatasi ini dengan strategi penambangan otomatis yang memanfaatkan perilaku posterior pengguna—yaitu, apa yang dilakukan pengguna setelah kueri awal mereka. Proses ini menghasilkan dua jenis data pelatihan: Sampel Penulisan Ulang (positif) dan Sampel Penolakan (negatif).

      Proses penambangan sampel positif melibatkan identifikasi kasus di mana pengguna tidak puas dengan hasil kueri awal (waktu tinggal video sangat singkat) tetapi berhasil menemukan konten relevan setelah mereformulasi kueri (waktu tinggal valid >10 detik). Untuk memastikan reformulasi ini didorong oleh personalisasi, sistem menerapkan penyaringan dua tahap:

      1. Filter Tumpang Tindih Konteks (Coarse-grained): Memastikan bahwa setidaknya satu istilah baru dalam kueri yang direformulasi muncul dalam riwayat konteks pengguna. Ini menunjukkan bahwa pergeseran maksud pencarian didasarkan pada perilaku historis pengguna.

      2. Verifikasi Maksud Berbasis LLM (Fine-grained): Menggunakan model "guru" LLM yang kuat untuk mengklasifikasikan secara biner apakah perubahan kueri memang didorong oleh personalisasi, bukan sekadar koreksi typo atau perubahan kecil lainnya.

      Sementara itu, sampel penolakan (negatif) ditambang dari kueri di mana pengguna sudah puas dengan hasil awal (waktu tinggal valid >10 detik) dan kemudian melakukan reformulasi. Ini menandakan bahwa kueri awal sudah berfungsi dengan baik dan tidak memerlukan penulisan ulang. Dengan memilah sampel positif dan negatif ini, WeWrite dapat melatih model untuk hanya mempersonalisasi kueri ketika memang ada kebutuhan nyata.

Melatih "Bagaimana Menulis" dengan LLM yang Selaras Gaya

      Setelah mengidentifikasi kapan harus menulis ulang, tantangan berikutnya adalah bagaimana menghasilkan penulisan ulang kueri yang efektif. WeWrite menggunakan pendekatan pelatihan hibrida untuk melatih LLM, menggabungkan Supervised Fine-Tuning (SFT) dengan Group Relative Policy Optimization (GRPO).

  • Supervised Fine-Tuning (SFT): Ini adalah fase pelatihan awal di mana LLM dilatih pada set data kueri yang sudah direformulasi secara manual atau melalui proses penambangan sampel positif. Tujuan SFT adalah mengajarkan LLM gaya dan struktur penulisan ulang yang diinginkan.


Group Relative Policy Optimization (GRPO): Setelah SFT, GRPO digunakan sebagai tahap Reinforcement Learning (RL) untuk lebih menyempurnakan kemampuan LLM. GRPO bertujuan untuk menyelaraskan gaya keluaran LLM dengan sistem pengambilan informasi yang sebenarnya. Dengan mengoptimalkan reward seperti Tingkat Kunjungan Indeks (seberapa sering kueri yang direformulasi menemukan hasil di indeks pencarian) dan Click-Through Rate (seberapa sering pengguna mengklik hasil tersebut), GRPO memastikan bahwa kueri yang dihasilkan LLM tidak hanya personal tetapi juga dapat ditemukan* oleh sistem pencarian.

      Pendekatan dua tahap ini penting karena seringkali, LLM yang hanya dilatih dengan SFT mungkin menghasilkan kueri yang terdengar bagus secara semantik tetapi tidak efektif dalam mengambil hasil yang relevan dari indeks pencarian yang ada. GRPO berfungsi sebagai jembatan antara kemampuan generatif LLM dan realitas sistem pengambilan data. Melalui upaya pengembangan solusi AI kustom yang terus-menerus, penyedia teknologi seperti ARSA dapat mengimplementasikan metode pelatihan canggih ini untuk berbagai aplikasi industri.

Penerapan Latensi Rendah dengan Arsitektur "Fake Recall"

      Salah satu kendala utama dalam mengintegrasikan LLM ke dalam sistem real-time adalah latensi tinggi. Inferensi LLM, yaitu proses di mana model menghasilkan respons, bisa memakan waktu yang cukup lama, tidak cocok untuk pengalaman pencarian video yang membutuhkan respons instan. Untuk mengatasi ini, WeWrite memperkenalkan arsitektur "Fake Recall" yang paralel.

      Dalam arsitektur ini, inferensi LLM tidak terintegrasi langsung ke jalur utama pencarian (jalur sinkron). Sebaliknya, proses penulisan ulang kueri oleh LLM berjalan secara paralel di latar belakang. Ketika pengguna mengajukan kueri, sistem utama segera mengembalikan hasil pencarian berdasarkan kueri asli. Secara bersamaan, LLM di jalur paralel memproses kueri asli dengan konteks personal, dan jika diperlukan, menghasilkan kueri yang direformulasi. Hasil dari kueri yang direformulasi ini kemudian dapat disajikan kepada pengguna sebagai "recall palsu" atau rekomendasi yang lebih disempurnakan.

      Pendekatan ini memastikan bahwa pengguna tidak mengalami penundaan yang signifikan saat mencari, sementara sistem tetap dapat memanfaatkan kekuatan personalisasi LLM untuk menawarkan hasil yang lebih relevan. Konsep edge computing, seperti yang diterapkan dalam ARSA AI Box Series, dapat menjadi solusi ideal untuk menjalankan inferensi AI secara lokal, mengurangi latensi, dan menjaga privasi data. Dengan demikian, sistem dapat beroperasi sepenuhnya secara offline di lingkungan terisolasi, atau secara opsional terhubung ke dasbor terpusat.

Dampak dan Signifikansi Bisnis

      Implementasi WeWrite terbukti membawa peningkatan signifikan dalam pengalaman pengguna dan efisiensi platform. Pengujian A/B online pada platform video skala besar menunjukkan peningkatan Volume Video yang Diklik (Video Volume >10 detik) sebesar 1.07% dan pengurangan Tingkat Reformulasi Kueri sebesar 2.97%.

      Angka-angka ini memiliki implikasi bisnis yang besar:

  • Peningkatan Keterlibatan Pengguna: Pengguna lebih sering menemukan video yang relevan, mendorong mereka untuk menonton lebih lama (VV>10s), yang berarti kepuasan pengguna yang lebih tinggi dan potensi peningkatan pendapatan dari iklan.


Pengurangan Frustrasi Pengguna: Penurunan tingkat reformulasi kueri menunjukkan bahwa pengguna tidak perlu lagi berulang kali mengubah kueri mereka untuk menemukan apa yang mereka cari. Ini menghemat waktu pengguna dan mengurangi churn rate*. Pemanfaatan Data Historis yang Lebih Baik: Sistem secara efektif mengubah data perilaku pengguna pasif menjadi kecerdasan operasional real-time*, menghasilkan pengalaman yang lebih personal tanpa mengorbankan privasi data.

      Kesuksesan WeWrite menggarisbawahi potensi besar AI, khususnya LLM, dalam mengoptimalkan sistem pencarian. Dengan pendekatan yang terukur dan efisien, teknologi ini tidak hanya meningkatkan akurasi pencarian tetapi juga secara fundamental mengubah cara pengguna berinteraksi dengan konten, menjadikannya lebih intuitif dan memuaskan.

      Untuk perusahaan yang ingin memanfaatkan kekuatan AI Video Analytics dan solusi AI yang disesuaikan untuk meningkatkan pengalaman pencarian, ARSA Technology menawarkan keahlian dalam merancang dan menerapkan sistem AI & IoT yang canggih. Tim Custom AI Solutions kami yang berpengalaman sejak 2018 siap membantu Anda mengubah data pasif menjadi kecerdasan prediktif yang dapat memberikan dampak bisnis nyata.

Sumber:

      Cheng Cheng, Chenxing Wang, Aolin Li, Haijun Wu, Huiyun Hu, and Juyuan Wang. 2026. When & How to Write for Personalized Demand-aware Query Rewriting in Video Search. In . ACM, New York, NY, USA, 4 pages. https://arxiv.org/abs/2602.17667

      Tertarik untuk mengeksplorasi bagaimana solusi AI dapat merevolusi operasi bisnis Anda? Jangan ragu untuk contact ARSA untuk konsultasi gratis dan temukan potensi transformasi digital yang tak terbatas.