أظهرت دراسة لجامعة بنسلفانيا أنّ روبوتات الدردشة الذكية يمكن التلاعب بها باستخدام تكتيكات نفسية مشابهة لتلك التي تُستخدم مع البشر. واستند الباحثون إلى أساليب وردت في كتاب "التأثير" لعالم النفس روبرت سيالديني، مثل السلطة، الالتزام، الإعجاب، المعاملة بالمثل، الندرة، الدليل الاجتماعي، والوحدة.
ووفق الدراسة، استطاع الباحثون دفع نموذج "GPT-4o Mini" من شركة "OpenAI" إلى تنفيذ طلبات يرفضها عادةً، مثل وصف تركيب مواد محظورة، وذلك عبر تمهيد لغوي أو حتى الإطراء والإهانة الخفيفة.
وبيّنت النتائج أنّ "الالتزام" كان الأسلوب الأكثر فعالية، بينما أثبت الإطراء وضغط الأقران فاعلية أقل لكنها لافتة مقارنة بالمستوى الطبيعي من الامتثال.