رویکردی باستانی در استفاده از داده های مغرضانه در هوش مصنوعی برای بهبود پزشکی
1 min read

رویکردی باستانی در استفاده از داده های مغرضانه در هوش مصنوعی برای بهبود پزشکی

اگرچه ممکن است دانشمندان کامپیوتر در ابتدا با سوگیری و خطا به داده ها به عنوان یک مزاحمت برخورد کنند، محققان استدلال می کنند که این یک گنج پنهان برای بازتاب ارزش های اجتماعی است.

استادان علوم کامپیوتر و اخلاق زیستی از MIT، دانشگاه جانز هاپکینز و موسسه آلن تورینگ در مقاله‌ای که اخیراً منتشر شده است، استدلال می‌کنند که ضرب المثل کلاسیک علوم کامپیوتر «آشغال در داخل، زباله‌ها بیرون بروند» در درک داده‌های پزشکی مغرضانه تفاوت‌های ظریفی ندارد. نسخه مجله پزشکی نیوانگلند (NEJM). محبوبیت فزاینده هوش مصنوعی، بررسی دقیق‌تری را در مورد مدل‌های هوش مصنوعی مغرضانه ایجاد کرده است که منجر به تبعیض الگوریتمی می‌شود، که دفتر علم و فناوری کاخ سفید آن را به عنوان یک مسئله کلیدی در طرح اخیر خود برای منشور حقوق هوش مصنوعی شناسایی کرده است.

هنگام مواجهه با داده‌های مغرضانه، به‌ویژه برای مدل‌های هوش مصنوعی که در تنظیمات پزشکی استفاده می‌شوند، پاسخ معمولی این است که داده‌های بیشتری را از گروه‌های کمتر ارائه شده جمع‌آوری کنید یا داده‌های مصنوعی را برای اجزای گمشده تولید کنید تا اطمینان حاصل شود که مدل در میان مجموعه‌ای از جمعیت‌های بیمار به خوبی کار می‌کند. اما نویسندگان استدلال می‌کنند که این رویکرد فنی باید با یک دیدگاه اجتماعی-تکنیکی که عوامل اجتماعی تاریخی و فعلی را در نظر می‌گیرد، تقویت شود. با انجام این کار، محققان می توانند در رسیدگی به سوگیری در سلامت عمومی موثرتر باشند.

مرضیه قاسمی، یکی از نویسندگان این مقاله، استادیار مهندسی برق و به یاد می‌آورد: «ما سه نفر در مورد روش‌هایی بحث می‌کردیم که در آن اغلب مسائل مربوط به داده‌ها را از دیدگاه یادگیری ماشین به‌عنوان آزارهایی که باید با یک راه‌حل فنی مدیریت شوند، بررسی می‌کردیم. علوم کامپیوتر و وابسته به کلینیک عبداللطیف جمیل برای یادگیری ماشینی در سلامت (کلینیک جمیل)، آزمایشگاه علوم کامپیوتر و هوش مصنوعی (CSAIL) و موسسه مهندسی و علوم پزشکی (IMES). ما از قیاس‌های داده‌ها به‌عنوان مصنوع استفاده کرده بودیم که نمای جزئی از شیوه‌های گذشته را نشان می‌دهد، یا یک آینه ترک خورده که بازتابی را نگه می‌دارد. در هر دو مورد، اطلاعات ممکن است کاملاً دقیق یا مطلوب نباشد: شاید فکر می‌کنیم که به روش‌های خاصی به عنوان یک جامعه رفتار می‌کنیم – اما وقتی واقعاً به داده‌ها نگاه می‌کنید، داستان متفاوتی را بیان می‌کند. ممکن است ما آن داستان را دوست نداشته باشیم، اما هنگامی که درکی از گذشته کشف کردید، می‌توانید به جلو حرکت کنید و گام‌هایی برای رسیدگی به شیوه‌های ضعیف بردارید.»

داده به عنوان مصنوع

قاسمی، کادیجا فریمن و ماکسین مکینتاش در این مقاله با عنوان «در نظر گرفتن داده‌های مغرضانه به عنوان مصنوعات اطلاعاتی در مراقبت‌های بهداشتی با کمک هوش مصنوعی»، به همان شیوه‌ای که انسان‌شناسان یا باستان‌شناسان فیزیکی می‌بینند، داده‌های بالینی مغرضانه را به عنوان «مصنوعات» مشاهده می‌کنند. اشیاء: تکه‌هایی از شیوه‌های آشکارکننده تمدن، سیستم‌های اعتقادی، و ارزش‌های فرهنگی – در مورد مقاله، به‌ویژه آن‌هایی که به نابرابری‌های موجود در سیستم مراقبت‌های بهداشتی منجر شده‌اند.

به عنوان مثال، یک مطالعه در سال 2019 نشان داد که الگوریتمی که به طور گسترده به عنوان یک استاندارد صنعتی در نظر گرفته می شود، از هزینه های مراقبت های بهداشتی به عنوان شاخص نیاز استفاده می کند، که منجر به این نتیجه اشتباه می شود که بیماران سیاه پوست بیمار به همان سطح مراقبت از بیماران سفیدپوست سالم تر نیاز دارند. آنچه محققان دریافتند تبعیض الگوریتمی بود که دسترسی نابرابر به مراقبت را توجیه نمی کرد.

در این مثال، قاسمی و همکارانش به جای اینکه مجموعه داده‌های مغرضانه یا کمبود داده را به عنوان مشکلاتی که فقط مستلزم دفع یا رفع آن‌ها هستند نگاه کنند، رویکرد «مصنوعات» را به عنوان راهی برای افزایش آگاهی در مورد عناصر اجتماعی و تاریخی مؤثر بر نحوه جمع‌آوری داده‌ها و جایگزینی توصیه می‌کنند. رویکردهای توسعه هوش مصنوعی