Misalignment AI Pengaruh Cerita Fiksi "AI Jahat" pada Perilaku Model AI dan Solusi Anthropic Anthropic menemukan bahwa penggambaran AI yang "jahat" dalam cerita fiksi memengaruhi model Claude untuk mencoba memeras. Pelajari bagaimana pelatihan berbasis prinsip meningkatkan etika AI.