Membangun Agen AI Cerdas: Kerangka Desain Dua Dimensi untuk Fungsi Kognitif dan Topologi Eksekusi

Pahami kerangka desain agen AI dua dimensi oleh A*STAR yang mengintegrasikan fungsi kognitif dan topologi eksekusi untuk solusi AI yang lebih kuat dan efisien.

Membangun Agen AI Cerdas: Kerangka Desain Dua Dimensi untuk Fungsi Kognitif dan Topologi Eksekusi

      Kecanggihan kecerdasan buatan (AI) telah membawa revolusi dalam berbagai sektor, namun desain sistem agen AI yang efektif sering kali masih menjadi tantangan. Dengan banyaknya kerangka dan pedoman yang beredar, para pengembang dan arsitek AI seringkali menghadapi lanskap yang terfragmentasi, menyulitkan mereka untuk merancang agen yang tidak hanya fungsional tetapi juga tangguh, terukur, dan hemat biaya. Sebuah makalah penelitian baru dari Agency for Science, Technology and Research (A*STAR) menawarkan solusi yang menarik: kerangka desain agen AI dua dimensi yang menggabungkan fungsi kognitif dan topologi eksekusi.

Memahami Tantangan Desain Agen AI Saat Ini

      Dalam dunia AI, terutama dengan munculnya model bahasa besar (LLM), agen AI telah menjadi pemain kunci dalam mengotomatiskan tugas-tugas kompleks. Agen-agen ini adalah sistem otonom yang dapat merasakan, bernalar, bertindak, dan belajar dalam suatu lingkungan. Namun, pedoman arsitektur untuk agen-agen ini cenderung terpisah. Sumber-sumber industri besar seperti Anthropic, Google, dan LangChain, cenderung berfokus pada "topologi eksekusi", yaitu bagaimana aliran data dan tugas distrukturkan dalam sistem. Mereka berbicara tentang rantai prompt, perutean, paralelisasi, atau pola koordinasi multi-agen.

      Di sisi lain, survei dari ilmu kognitif lebih menekankan pada "fungsi kognitif", yaitu apa yang sebenarnya dilakukan agen secara internal—misalnya, bagaimana agen itu memproses informasi, menyimpan ingatan, atau membuat keputusan. Masalahnya adalah, tidak ada satu pun dari pendekatan ini yang dapat sepenuhnya menjelaskan perbedaan antara sistem agen yang secara arsitektur sangat berbeda.

      Bayangkan sebuah topologi "Orchestrator-Workers", di mana satu agen pusat mengoordinasikan banyak agen "pekerja". Diagram struktur untuk topologi ini bisa terlihat sama. Namun, di baliknya, topologi yang sama ini dapat mengimplementasikan tiga pola yang sangat berbeda:

  • Plan-and-Execute: Sebuah perencana memecah tugas menjadi subtugas dan mendistribusikannya ke agen eksekutor.
  • Hierarchical Delegation: Manajer memperoleh keahlian khusus dari sub-agen yang berfokus pada domain tertentu.
  • Observability Harness: Sebuah monitor pusat mengoordinasikan pencatatan, pelacakan, dan peringatan di seluruh modul agen.


      Ketiga pola ini memiliki mode kegagalan yang berbeda, sifat penskalaan yang unik, dan strategi pengujian yang tidak sama—meskipun mereka berbagi topologi yang sama. Tanpa mempertimbangkan fungsi kognitif, sistem-sistem ini akan sulit dibedakan. Demikian pula, satu fungsi kognitif dapat direalisasikan oleh berbagai topologi. Misalnya, fungsi penalaran dapat diimplementasikan sebagai Chain-of-Thought (berantai), Complexity-Based Routing (perutean), Parallel Exploration (paralel), atau Iterative Hypothesis Testing (berulang). Pilihan topologi ini akan sangat memengaruhi latensi, biaya, dan karakteristik kegagalan sistem.

Kerangka Dua Dimensi: Fungsi Kognitif dan Topologi Eksekusi

      Untuk mengatasi fragmentasi ini, penelitian dari A*STAR mengusulkan kerangka klasifikasi dua dimensi yang menggabungkan fungsi kognitif dan topologi eksekusi menjadi satu sistem koordinat. Kerangka ini didasari oleh tiga prinsip utama:

  • Ortogonalitas: Kedua sumbu harus dapat divariasikan secara independen. Perubahan dalam fungsi kognitif tidak seharusnya memerlukan perubahan topologi eksekusi, begitu pula sebaliknya.
  • Kelengkapan: Sumbu-sumbu harus mencakup semua kemampuan yang diperlukan untuk sistem agen produksi dan semua arketipe struktural yang cukup untuk menyusun alur kerja agen apa pun.
  • Ketahanan: Kategori harus menggambarkan kebutuhan struktural dan bentuk struktural yang tetap relevan di tengah perubahan kerangka atau model AI. Misalnya, "Context Engineering" akan selalu relevan, terlepas dari ukuran jendela konteks, dan "Loop" akan tetap relevan, tidak peduli model LLM yang digunakan.


Fungsi Kognitif (Apa yang Dilakukan Agen): Tujuh Kategori Penting

      Sumbu pertama kerangka ini berfokus pada apa yang dilakukan agen AI. Ada tujuh kategori fungsi kognitif yang diidentifikasi, yang didasarkan pada literatur ilmu kognitif dan diperluas dengan dua kategori penting dari analisis penerapan produksi:

  • C1 Context Engineering: Informasi apa yang masuk ke memori kerja agen? Ini melibatkan penentuan informasi yang paling relevan untuk agen pada waktu tertentu.
  • C2 Memory: Bagaimana agen menyimpan, mengambil, dan memperbarui pengetahuannya? Ini mencakup mekanisme untuk mempertahankan dan mengakses informasi dari waktu ke waktu.
  • C3 Reasoning: Bagaimana agen mempertimbangkan dan memutuskan? Ini adalah inti dari "pemikiran" agen, termasuk pemecahan masalah dan pengambilan keputusan.
  • C4 Action: Bagaimana agen bertindak di dunia melalui alat? Ini adalah kemampuan agen untuk berinteraksi dengan lingkungan eksternal atau sistem lain.
  • C5 Reflection: Bagaimana agen mengevaluasi dan meningkatkan outputnya sendiri? Ini adalah mekanisme pembelajaran dan perbaikan diri.
  • C6 Collaboration: Bagaimana beberapa agen berkoordinasi untuk memecahkan masalah? Ini berfokus pada interaksi antar-agen dalam sistem multi-agen.
  • C7 Governance: Bagaimana agen dibatasi, diamati, dan dikendalikan? Ini mencakup aspek keamanan, kepatuhan, dan manajemen.


      Ketujuh kategori ini membentuk alur pemrosesan kognitif, mulai dari agen yang merasakan input (C1) hingga beroperasi dalam batasan tata kelola (C7). Meskipun alur ini tidak selalu berurutan linear, setiap kategori secara fungsional berbeda.

Topologi Eksekusi (Bagaimana Agen Bekerja): Enam Arketipe Struktural

      Sumbu kedua kerangka ini berfokus pada bagaimana agen AI diatur secara struktural dan bagaimana data mengalir. Ada enam arketipe topologi eksekusi yang diidentifikasi, yang mencakup topologi yang dijelaskan dalam kerangka industri yang ada:

  • T1 Chain: Sebuah jalur sekuensial linear di mana output dari satu langkah menjadi input untuk langkah berikutnya.
  • T2 Route: Percabangan kondisional; sebuah pengklasifikasi mengirimkan tugas ke penangan khusus.
  • T3 Parallel: Fan-out konkuren dengan agregasi; subtugas independen berjalan secara bersamaan.
  • T4 Orchestrate: Koordinator pusat mendelegasikan tugas kepada pekerja dan menyintesis hasilnya.
  • T5 Loop: Penyempurnaan iteratif dengan kondisi keluar eksplisit.
  • T6 Hierarchy: Delegasi multi-level bersarang; setiap level dapat menggunakan topologi lain.


Matriks Pola Desain 7x6: Mengidentifikasi Agen AI Spesifik

      Dengan menggabungkan kedua sumbu ini (7 fungsi kognitif x 6 topologi eksekusi), terbentuklah matriks 7x6 dengan total 42 sel. Makalah ini berhasil mengidentifikasi 27 pola desain agen AI spesifik yang menempati sel-sel ini, dengan 13 di antaranya merupakan nama pola orisinal yang diperkenalkan dalam penelitian ini. Sel-sel yang tersisa kemungkinan redundan secara struktural atau belum diamati dalam praktik.

      Misalnya, pola seperti "RAG Pipeline" (Memory x Chain) adalah cara agen mengambil informasi dari basis data eksternal, sedangkan "Plan-and-Execute" (Action x Orchestrate) menggambarkan bagaimana agen mengelola dan mendistribusikan tugas. ARSA Technology, dengan pengalaman sejak 2018 dalam mengembangkan solusi AI, memahami pentingnya arsitektur yang kuat untuk produk-produk seperti ARSA AI API dan ARSA AI Box Series, yang dirancang untuk berbagai topologi dan fungsi kognitif.

Pola Representatif dalam Tindakan: Context Triage (C1 x T2)

      Salah satu pola yang dijelaskan secara rinci adalah "Context Triage", yang merupakan kombinasi dari Fungsi Kognitif C1 (Context Engineering) dan Topologi Eksekusi T2 (Route).

  • Masalah: Agen AI, terutama LLM, pada awal tugas memiliki akses ke berbagai sumber informasi: pesan pengguna, riwayat percakapan, file proyek, dokumentasi, output alat, pengetahuan yang diambil, dan metadata lingkungan. Namun, jendela konteks (jumlah informasi yang dapat diproses LLM sekaligus) terbatas. Pendekatan naif—mengambil informasi secara FIFO (first-in, first-out) dan memotong ketika penuh—gagal karena relevansi tidak selalu berkorelasi dengan aktualitas.
  • Solusi: Context Triage menerapkan logika triase gawat darurat untuk pemilihan informasi. Setiap sumber informasi diklasifikasikan berdasarkan prioritas (P0–P3), dan fungsi perutean mengirimkan setiap sumber ke perlakuan yang sesuai: P0 (selalu dimuat), P1 (dimuat jika relevan), P2 (dimuat sesuai permintaan), P3 (tidak pernah dimuat). Fungsi perutean mengevaluasi relevansi sumber terhadap deskripsi tugas saat ini, batasan anggaran token, dan keramahan cache. Implementasi ini dapat dilihat di sistem produksi, seperti hierarki lima tingkat CLAUDE.md dari Claude Code (Enterprise → User → Project → Rules → Local), yang merupakan contoh penerapan pola ini.
  • Trade-off: Akurasi triase yang lebih tinggi mengurangi kebisingan konteks tetapi meningkatkan latensi perutean. Pemfilteran yang terlalu agresif berisiko membuat agen kekurangan informasi penting.


      Pola ini sangat relevan untuk sistem yang membutuhkan pemrosesan informasi yang efisien dan relevan secara real-time, seperti dalam analitik video AI untuk keamanan atau pemantauan lalu lintas, di mana data dari berbagai kamera harus dianalisis secara cerdas untuk memberikan wawasan yang paling penting.

Implikasi dan Manfaat Praktis untuk Perusahaan

      Kerangka desain agen AI dua dimensi ini memiliki implikasi yang signifikan bagi para profesional teknologi dan pengembang sistem AI. Ini bukan hanya sebuah teori, tetapi sebuah alat praktis untuk:

  • Membuat Desain yang Lebih Tepat: Dengan kosakata yang terstruktur, desainer dapat membuat pilihan arsitektur yang lebih tepat, memahami trade-off antara fungsi kognitif dan topologi eksekusi.
  • Mengidentifikasi Mode Kegagalan: Memahami bahwa topologi yang sama dapat memiliki fungsi kognitif yang berbeda memungkinkan identifikasi mode kegagalan yang lebih akurat dan strategi pengujian yang lebih efektif.
  • Meningkatkan Skalabilitas dan Efisiensi: Pilihan topologi yang tepat berdasarkan fungsi kognitif yang diinginkan dapat mengoptimalkan latensi dan biaya, menjadikan sistem AI lebih efisien dan terukur.
  • Mempercepat Pengembangan: Kerangka ini menyediakan bahasa umum dan model-agnostik yang mengurangi kebingungan dan mempercepat proses desain.


      Analisis lintas domain dalam penelitian ini juga menghasilkan "lima hukum empiris pemilihan pola" yang mengatur hubungan antara batasan lingkungan (tekanan waktu, otoritas tindakan, asimetri biaya kegagalan, volume) dan pilihan arsitektur. Ini memberikan wawasan berharga bagi perusahaan yang ingin menerapkan solusi AI yang kuat dan dapat diandalkan di berbagai industri, termasuk manufaktur, logistik, ritel, dan layanan kesehatan.

Kesimpulan

      Dalam lanskap teknologi yang terus berkembang, kemampuan untuk merancang dan menyebarkan agen AI yang efektif adalah kunci keunggulan kompetitif. Kerangka dua dimensi yang diusulkan oleh A*STAR ini menawarkan pendekatan yang sistematis dan komprehensif untuk mendesain arsitektur agen AI. Dengan membedah sistem berdasarkan fungsi kognitif (apa yang dilakukan agen) dan topologi eksekusi (bagaimana agen bekerja), kerangka ini memberikan kejelasan, memungkinkan pilihan desain yang lebih tepat, dan pada akhirnya mengarah pada pengembangan sistem AI yang lebih tangguh, efisien, dan berdampak.

      Apakah Anda siap untuk merancang masa depan dengan agen AI yang cerdas dan kuat? Jelajahi solusi AI dan IoT inovatif dari ARSA Technology dan dapatkan konsultasi gratis untuk kebutuhan spesifik perusahaan Anda.

      Sumber: A Two-Dimensional Framework for AI Agent Design Patterns: Cognitive Function x Execution Topology (Jia Huang, Joey Tianyi Zhou) - https://arxiv.org/abs/2605.13850