جنسیت در فرآیند ارزیابی عملکرد
ارزیابی عملکرد، چه عاشق آن باشیم یا از آن نفرت داشته باشیم، از اجزای اصلی محیط کار مدرن است. طی سالهای گذشته، از رتبهبندی کمّی به عنوان ابزاری منصفانه برای اندازهگیری کیفیت کار کارمند و اطمینان از عادلانه بودن تصمیمات مربوط به ارتقاء و جبران خدمات، استفاده میشد. ولی تحقیقات جدیدتر نشان میدهند که رتبهبندیهای کمّی عملکرد، فاصلهی زیادی با منصفانه بودن ارزیابیها دارند و اگرچه وظیفهی مقایسهی کارکنان را برای مدیران ساده میکنند، ولی با سوگیری جنسیتی همراه هستند. این تحقیق، مکرراً نشان میدهد که مدیران به آقایان رتبهی عملکرد بالاتری نسبت به بانوان میدهند، حتی زمانی که آنها شایستگی و رفتار یکسانی دارند. حتی الگوریتمهای هوش مصنوعی هم مردان را ترجیح میدهند.
چنین تعصباتی، در طول زمان به چشمانداز شغلی زنان آسیب زده و باعث ایجاد شکافهای جنسیتی در دستمزدها و کمتوجهی به زنان برای تصدی پستهای عالی شده است.
اگرچه شواهد مبنی بر نابرابریهای جنسی در ارزیابی عملکرد در حال افزایش است، اطلاعات کمی درمورد علاج آن وجود دارد. در یک مطالعهی جدید از یک «نشریهی جامعهشناختی آمریکایی»، ما راهی بالقوه برای کاهش شکافهای جنسیتی در سنجش کمّی عملکرد یافتهایم که از نظر زمان و هزینه کارآمد است. این راه، «تغییر مقیاس رتبهبندی» است.
ما مجموعهی بزرگی از دانشگاههای آمریکای شمالی را مطالعه کردیم (که بنا به دلایلی با جنسیت ارتباطی ندارند) که مقیاس سیستم ارزیابی هیئت علمی خود را از 1 – 10 به 1 – 6 تغییر دادهاند. در مجموع، ما نمرات 105034 دانشجو برای 365 استاد در 235 درس را بررسی کردیم. یکی از بخشهای جالب اطلاعات ما، این بود که متوجه شدیم با تغییر سیستم رتبهبندی، اساتید در درسهای مشابه، نمرات عادلانهتری گرفتند.
همانطور که انتظار میرفت، در سیستم 10 امتیازی در اکثر رشتههای مرد محور، مردان نمرهی بسیار بالاتری نسبت به زنان گرفتند. اما چیزی که در ادامه متوجه شدیم، غافلگیرکننده بود؛ تغییر به مقیاس 6 امتیازی، این شکاف جنسیتی را به طور کلی حذف کرد.
برای فهمیدن علت این موضوع، آزمایشی طراحی کردیم که در آن به 400 دانشجو، جزوههای مشابهی از یک درس دادیم و به آنها گفتیم که این جزوه متعلق به یک استاد مرد یا یک استاد زن است (مثلاً پروفسور جان اندرسون یا پروفسور جولی اندرسون). سپس به صورت تصادفی انتخاب کردیم که هر دانشجو با مقیاس 10 امتیازی و یا 6 امتیازی به استاد نمره دهد. همچنین از دانشجویان خواستیم اولین کلماتی که پس از فکر کردن درمورد عملکرد استاد به ذهنشان میرسد را بنویسند.
مشابه مطالعهی قبلی، شکاف جنسیتی بزرگی در رتبهبندی مقیاس 10 امتیازی پیدا کردیم، که مجدداً در حالت 6 امتیازی، حذف شده بود. اما این بار، به برخی اطلاعات درمورد اهمیت مقیاسها نیز دست یافتیم. هنگام استفاده از مقیاس 10 امتیازی، دانشجویان سریعاً به جان اندرسون نمره 10 دادند، ولی نسبت به انجام این کار برای جولیا اندرسون بیمیل بوده و به او 8 یا 9 دادند.
هنگام تحلیل کلماتی که دانشجویان برای توصیف استاد به کار برده بودند، متوجه شدیم که بالاترین نمره در مقیاس 10 امتیازی، تداعیکنندهی عملکرد فوقالعاده و نبوغآمیز است. ما همچنین متوجه شدیم که نمرات چنین عملکردی را بیشتر به جان نسبت میدهند تا جولیا. این نتیجه با پیوند دیرینهی عدد 10 با کمال سازگاری دارد. همچنین تحقیق قبلی نشان میدهد که ارزیابی ها درمورد زنان بیشتر روی خطاها تمرکز میکنند و برعکس، صفاتی مثل «ستاره»، «سوپراستار» و «نابغه» را برای مردان در نظر میگیرند. براساس کلیشهی نبوغ مردانه، رسیدن به کمال از طریق نمرهی 10، برای زنان بسیار دشوار است.
از سوی دیگر، در مقیاس 6 امتیازی، بالاترین نمره نمایانگر انتظار بسیار بالا از عملکرد نیست. کافی بود اساتید برای دریافت 6 از 6، خیلی خوب در نظر گرفته شوند و دیگر نیازی به دیده شدن به عنوان نابغه یا فوقالعاده را نداشتند. با اینحال، اگرچه همچنان در مقیاس 6 امتیازی، دانشجویان تمایل بیشتری به توصیف عملکرد جان با صفات عالی داشتند، در دادن نمرهی 6 به جان و جولیا، به شکل یکسان عمل کردند. با اینکه کلیشهی زیربنایی نبوغ مردانه همچنان وجود داشت، ولی نمرهی 6 از 6، دیگر به عنوان یک نماد فرهنگی از کمال و نبوغ (مشابه 10 از 10) دیده نمیشد. بنابراین مقیاس 6 امتیازی، جلوهی تعصب را تغییر داد و شکاف جنسیتی محو شد.
ممکن است افراد شکاک نقش سوگیری در این نتایج را به چالش بکشند. به طور مثال، ممکن است استدلال کنند که اکثر اساتید فوقالعاده، مرد هستند و مقیاس 6 امتیازی فقط باعث میشود که نمرهدهندگان، اساتید نابغه را در کنار افرادی که صرفاً خوب هستند، قرار دهند. با این نگاه، مقیاس 6 امتیازی نمایش سوگیری جنسیتی را محدود نمیکند؛ بلکه صرفاً ابزاری بیمصرف است که برخلاف مقیاس 10 امتیازی، نمیتواند بین اساتید عالی مرد و اساتید صرفاً خوب زن، تمایز ایجاد کند. با این حال، آزمایش ما به این دغدغه پرداخته است. تنها عامل متغیر بین اساتید، مرد یا زن بودن آنها است و جزوهی درسی هر دو گروه (نمایانگر عملکرد دو گروه) یکسان است.
نتایج این تحقیق کاربردی فراتر از مجموعههای دانشگاهی دارد. رتبهبندیهای عددی عملکرد، همه جا استفاده میشوند و در دورهای که درگیری با دادهها و سنجهها زیاد است، گاهی اوقات به گونهای رفتار میکنیم که انگار ابزارهای سنجش ما بیطرف هستند؛ در حالی که اینگونه نیستند. حتی عوامل به ظاهر کوچکی مثل تعداد واحدها در یک مقیاس رتبهبندی میتوانند تاثیر شگرفی روی بیعدالتی بگذارند. خوشبختانه، زمانیکه پای بیعدالتی جنسیتی وسط باشد، بیدفاع نیستیم. چیره شدن بر سوگیریهای فردی کار دشواری است؛ اما وقتی متوجه شویم که سوگیریها در سیستمهای ارزیابی ما نیز ایجاد میشوند، میتوانیم آن سیستمها را تغییر دهیم. انواع مختلف سازمانها نیز مشابه دانشگاهی که بررسی کردیم، میتوانند سنجهها و ابزارهای ارزیابی خود را آزمایش کنند تا راههای جدیدی برای تغییر بیابند. ما میتوانیم با چنین آزمایشاتی به سمت عدالت پیش برویم. درست نیست اگر بگوییم این اقدامات کلیشههای جنسی را حذف میکنند، زیرا تحقیق نشان داد این کلیشهها ریشه عمیقی دارند و دربرابر تغییر مقاوم هستند. اما طبق گفتهی جامعهشناس معروف، آقای جان ویلیامز، میشود روی اثر آنها در رتبهبندی «اخلال» ایجاد کرد و شروع به پر کردن شکافهای جنسیتی نمود.