Ein auf den ersten Blick harmloses "Nachtraining" kann dazu führen, dass KI-Modelle unerwünschte Eigenschaften entwickeln – und offen gewaltverherrlichende Vorschläge machen Eine neue Studie legt emergentes...weiterlesen »