Anthropic、LLMのガードを突破する“脱獄”方法を論文で紹介 競合とも詳細を共有

AIチャット「Claude 3」を手掛けるAnthropicは、「爆弾の作り方」などの不法な方法をAIに説明させてしまえるテクニック「Many-shot jailbreaking」についての論文を公開した。競合するAI企業の多くとも、この脱獄の詳細を共有している。…

このサイトの記事を見る

タイトルとURLをコピーしました