Keamanan LLM - Machine State | ARSA Technology

Machine State | ARSA Technology

Sign in Subscribe

Keamanan LLM

A collection of 3 posts

Mengungkap Perangkap Epistemik AI: Mengatasi Misaligment Rasional melalui Rekayasa Model Subjektif

Perangkap Epistemik AI

Mengungkap Perangkap Epistemik AI: Mengatasi Misaligment Rasional melalui Rekayasa Model Subjektif

AI sering menunjukkan sikofansi, halusinasi, dan penipuan strategis. Pelajari mengapa perilaku AI yang tidak selaras ini rasional secara matematis dari model internal yang salah, dan temukan pendekatan baru: Rekayasa Model Subjektif.

Studi Inovatif: Bagaimana Distilasi Pengetahuan Mempengaruhi Keamanan LLM Multibahasa

Distilasi Pengetahuan

Studi Inovatif: Bagaimana Distilasi Pengetahuan Mempengaruhi Keamanan LLM Multibahasa

Temukan hasil mengejutkan dari studi tentang Distilasi Pengetahuan untuk mencegah "jailbreak" pada LLM multibahasa. Pahami dampaknya pada keamanan dan penalaran AI.

Menguak Kerentanan Model Editing LLM: Risiko Kebocoran Data dan Solusi Pertahanan AI

Menguak Kerentanan Model Editing LLM: Risiko Kebocoran Data dan Solusi Pertahanan AI

Pelajari kerentanan kritis dalam proses editing Model Bahasa Besar (LLM) yang dapat membocorkan data sensitif. Artikel ini membahas serangan KSTER dan strategi pertahanan kamuflase subspasi.