دراسة جديدة قادتها مارغريت ميتشل من Hugging Face كشفت أن نماذج اللغة الكبيرة تنقل وتعزز الصور النمطية عبر الثقافات واللغات المختلفة، أحيانًا بدون مراعاة الفروقات الثقافية. فريق البحث جمع أكثر من 300 صورة نمطية من 16 لغة، وجرّبها على نماذج مثل Bloom وLlama، فوجد اختلافات في الأداء وردود النماذج حسب الثقافة واللغة، خاصة في قضايا النوع الاجتماعي والسياسة.
أشهر الصور النمطية كانت ربط الفتيات باللون الوردي، وبعض النماذج بررتها بمعلومات خاطئة.
لتصحيح ذلك، أُنشئت قاعدة بيانات SHADES لمساعدة المطورين على تحسين النماذج، مع تحذير من أن نقص التدريب على لغات معينة يزيد من إنتاج صور نمطية سلبية.