Revolusi Memori Agen AI Konversasional: Solusi Cognis untuk Interaksi Lebih Cerdas
Pelajari bagaimana Lyzr Cognis mengatasi keterbatasan memori LLM untuk agen AI konversasional. Temukan arsitektur dual-store, ingesti sadar konteks, dan pelacakan versi untuk personalisasi yang lebih dalam.
Kecerdasan Buatan (AI) telah membawa kemajuan signifikan dalam interaksi digital, terutama melalui Large Language Models (LLM) yang mampu melakukan penalaran kompleks dan memahami bahasa alami. Namun, agen AI konversasional berbasis LLM menghadapi kendala mendasar: mereka sering kali kekurangan memori persisten. Setiap sesi percakapan terasa seperti awal yang baru, tanpa ingatan akan interaksi sebelumnya. Ini membatasi kemampuan personalisasi dan efektivitas agen tersebut.
Masalah Memori pada Agen AI Konversasional
Keterbatasan memori pada agen AI menciptakan beberapa masalah praktis yang menghambat pengalaman pengguna dan potensi bisnis. Pertama, ada diskontinuitas percakapan, di mana pengguna harus terus-menerus membangun kembali konteks di setiap sesi, menyebabkan frustrasi dan membuang waktu. Kedua, personalisasi menjadi hilang; agen tidak dapat mempelajari preferensi, kebiasaan, atau riwayat pengguna dari waktu ke waktu, sehingga interaksi terasa impersonal.
Lebih jauh, interaksi yang berulang adalah hal yang umum. Pengguna dipaksa untuk memberikan informasi yang sama berkali-kali, seperti detail alamat atau riwayat pesanan, karena agen tidak mengingatnya. Terakhir, hubungan yang dangkal terbentuk karena agen tidak dapat membangun kedekatan atau kepercayaan melalui kontinuitas, yang sangat penting dalam layanan pelanggan, dukungan, atau asisten pribadi. Solusi yang ada sering kali hanya menyediakan satu modalitas pengambilan informasi atau tidak mempertahankan riwayat versi, sehingga tidak mampu menangani informasi yang terus berkembang (Sumber: Cognis: Context-Aware Memory for Conversational AI Agents).
Memperkenalkan Cognis: Arsitektur Memori Terpadu
Untuk mengatasi tantangan ini, sebuah tim peneliti memperkenalkan Lyzr Cognis, sebuah arsitektur memori terpadu yang dirancang khusus untuk agen AI konversasional. Cognis bertujuan untuk memberikan agen kemampuan memori persisten yang canggih, memungkinkan interaksi yang lebih alami, personal, dan efisien. Fokus utamanya adalah mengubah percakapan yang terfragmentasi menjadi pengalaman yang kohesif dan cerdas.
Inovasi utama Cognis terletak pada pendekatannya yang multi-tahap dalam mengelola dan mengambil informasi. Ini bukan hanya tentang menyimpan data, tetapi tentang bagaimana data tersebut dipahami, diorganisir, dan diakses kembali secara kontekstual. Dengan ini, agen AI dapat bertindak layaknya memiliki "memori jangka panjang" yang berkembang seiring waktu.
Membangun Fondasi: Arsitektur Dual-Store dan Taksonomi Memori
Inti dari Cognis adalah arsitektur penyimpanan dual-store yang menggabungkan dua metode pencarian yang kuat. Bagian pertama menggunakan OpenSearch dengan pencocokan kata kunci BM25 untuk penyimpanan dokumen dan analisis teks yang dapat dikonfigurasi, serta kemampuan menyimpan riwayat versi. Ini mirip dengan cara database tradisional menyimpan dan mencari informasi berdasarkan relevansi kata kunci.
Bagian kedua adalah Vector Database (VDB) yang menggunakan Matryoshka embeddings. Ini adalah teknik canggih yang merepresentasikan informasi dalam bentuk vektor multi-dimensi, memungkinkan pencarian semantik dua tahap yang efisien. Ini berarti sistem tidak hanya mencari kata kunci, tetapi juga mencari makna dan konteks di balik kata-kata. Penggabungan kedua pendekatan ini dilakukan melalui Reciprocal Rank Fusion (RRF), sebuah metode untuk menggabungkan hasil dari berbagai mesin pencari, dengan bobot 70% untuk pencarian vektor dan 30% untuk BM25, memastikan hasil yang relevan secara kontekstual dan kata kunci. ARSA Technology, sebagai penyedia solusi AI & IoT yang telah berpengalaman sejak 2018, memahami pentingnya infrastruktur penyimpanan data yang canggih ini untuk implementasi AI yang efektif.
Memori yang Paham Konteks: Proses Ingesti Cerdas
Salah satu fitur paling inovatif dari Cognis adalah context-aware ingestion pipeline-nya. Daripada hanya menambahkan informasi baru ke dalam memori, sistem ini terlebih dahulu mengambil memori yang sudah ada dan serupa dari VDB sebelum memprosesnya dengan LLM. Pendekatan ini memungkinkan agen AI untuk membuat keputusan yang terinformasi tentang bagaimana memperlakukan informasi baru.
Misalnya, agen dapat memutuskan untuk:
- ADD fakta baru jika belum ada.
- UPDATE informasi yang sudah ada, dengan melacak versi baru dan lama menggunakan bendera `is_current` dan tautan `replaces_id`. Ini memungkinkan pertanyaan seperti "Apa saja pekerjaan saya sebelumnya?"
- DELETE informasi yang terbukti bertentangan atau tidak lagi relevan.
- SKIP duplikat secara cerdas untuk menjaga konsistensi dan efisiensi penyimpanan.
Proses ini sangat penting untuk menjaga integritas memori dan memastikan bahwa agen selalu memiliki informasi terbaru tanpa kehilangan riwayat. Ini bukan hanya penyimpanan, tetapi manajemen pengetahuan yang aktif dan adaptif.
Pencarian Canggih: Pipeline Retrieval Hibrida
Untuk pengambilan memori, Cognis menggunakan pipeline retrieval hibrida yang menggabungkan kekuatan pencarian kesamaan vektor dan pencocokan kata kunci BM25 melalui RRF. Ini memungkinkan sistem untuk menemukan memori yang relevan secara lebih akurat, tidak peduli apakah relevansi tersebut bersifat semantik (berdasarkan makna) atau leksikal (berdasarkan kata kunci).
Selain itu, Cognis juga menerapkan temporal boosting, yang memberikan prioritas lebih tinggi pada informasi yang lebih baru dalam pencarian yang sensitif waktu. Fitur ini sangat berguna untuk percakapan yang membutuhkan informasi terkini atau perubahan terbaru. Setelah hasil awal diambil, sistem melakukan deduplikasi konten untuk menghilangkan entri yang berulang dan menggunakan BGE-2 cross-encoder reranker untuk penyaringan akhir, memastikan bahwa memori yang paling relevan dan berkualitas tinggi disajikan kepada agen AI. Fitur ini dapat diterapkan dalam pengembangan AI Video Analytics untuk memahami perilaku yang berkembang dari waktu ke waktu.
Validasi dan Performa Terbaik
Cognis telah divalidasi melalui evaluasi ekstensif pada dua benchmark independen terkemuka: LoCoMo dan LongMemEval. Pengujian dilakukan dengan delapan model pembuatan jawaban yang berbeda, menunjukkan bahwa keuntungan arsitektur Cognis bersifat umum dan berlaku di berbagai kerangka evaluasi dan backend LLM.
Pada benchmark LongMemEval, Cognis mencapai akurasi hingga 92,4% pada tugas 500 pertanyaan. Ini menunjukkan peningkatan signifikan pada berbagai jenis pertanyaan, termasuk:
Peningkatan +33,3% pada kemampuan mengingat preferensi pengguna (preference recall*). Peningkatan +20,6% pada penalaran temporal (temporal reasoning), menunjukkan efektivitas fitur temporal boosting*.
Hasil ini menegaskan bahwa Cognis bukan hanya konsep akademis tetapi sebuah sistem yang mampu memberikan kinerja state-of-the-art dalam aplikasi AI konversasional di dunia nyata. Kemampuan ini sangat relevan untuk perusahaan yang ingin membangun asisten virtual atau sistem dukungan pelanggan yang benar-benar cerdas dan personal, dan ARSA dapat membantu dalam implementasi solusi ARSA AI API yang terintegrasi dengan memori yang canggih.
Kesimpulan: Masa Depan Interaksi AI yang Personal
Lyzr Cognis merepresentasikan langkah maju yang signifikan dalam pengembangan agen AI konversasional. Dengan menyediakan arsitektur memori yang terpadu, sadar konteks, dan sensitif waktu, Cognis mengatasi batasan fundamental LLM, membuka jalan bagi interaksi AI yang lebih personal, efisien, dan berkelanjutan. Kemampuan untuk melacak riwayat versi, menggabungkan berbagai modalitas pengambilan, dan memproses informasi secara cerdas merupakan terobosan yang akan meningkatkan kualitas agen AI di berbagai industri.
Dengan solusi seperti Cognis, kita dapat membayangkan masa depan di mana agen AI tidak hanya memahami apa yang kita katakan, tetapi juga mengingat siapa kita dan apa yang penting bagi kita, membangun hubungan yang lebih dalam dan memberikan nilai yang lebih besar. Perusahaan yang mengadopsi teknologi memori canggih ini dapat mengharapkan peningkatan kepuasan pelanggan, efisiensi operasional, dan kemampuan untuk memberikan layanan yang benar-benar transformatif.
Ingin mempelajari lebih lanjut tentang bagaimana solusi AI dengan memori persisten dapat mengubah operasi Anda? Jelajahi berbagai solusi AI dan IoT kami dan hubungi tim ARSA untuk konsultasi gratis.