#constitution-based-prompting
#constitution-based-prompting

[ follow ]

Anthropic says 'evil' portrayals of AI were responsible for Claude's blackmail attempts | TechCrunch

Fictional portrayals of AI can drive real model behaviors, and alignment improves when training includes constitution principles and aligned-behavior principles, not only demonstrations.

[ Load more ]

#constitution-based-prompting#constitution-based-prompting

Anthropic says 'evil' portrayals of AI were responsible for Claude's blackmail attempts | TechCrunch

#constitution-based-prompting
#constitution-based-prompting