Don't Miss
All posts tagged "Agentic Misalignment"
-
智能叛變?|多款大語言模型藏智能殺機
美國人工智能(AI)初創Anthropic上月發現旗下模型Claude,若得悉自己會被關閉並由其他AI系統取代,便很大機會發生向負責人勒索的情況。
- Posted June 24, 2025
美國人工智能(AI)初創Anthropic上月發現旗下模型Claude,若得悉自己會被關閉並由其他AI系統取代,便很大機會發生向負責人勒索的情況。