رویکردی باستانی در استفاده از داده های مغرضانه در هوش مصنوعی برای بهبود پزشکی
اگرچه ممکن است دانشمندان کامپیوتر در ابتدا با سوگیری و خطا به داده ها به عنوان یک مزاحمت برخورد کنند، محققان استدلال می کنند که این یک گنج پنهان برای بازتاب ارزش های اجتماعی است.
استادان علوم کامپیوتر و اخلاق زیستی از MIT، دانشگاه جانز هاپکینز و موسسه آلن تورینگ در مقالهای که اخیراً منتشر شده است، استدلال میکنند که ضرب المثل کلاسیک علوم کامپیوتر «آشغال در داخل، زبالهها بیرون بروند» در درک دادههای پزشکی مغرضانه تفاوتهای ظریفی ندارد. نسخه مجله پزشکی نیوانگلند (NEJM). محبوبیت فزاینده هوش مصنوعی، بررسی دقیقتری را در مورد مدلهای هوش مصنوعی مغرضانه ایجاد کرده است که منجر به تبعیض الگوریتمی میشود، که دفتر علم و فناوری کاخ سفید آن را به عنوان یک مسئله کلیدی در طرح اخیر خود برای منشور حقوق هوش مصنوعی شناسایی کرده است.
هنگام مواجهه با دادههای مغرضانه، بهویژه برای مدلهای هوش مصنوعی که در تنظیمات پزشکی استفاده میشوند، پاسخ معمولی این است که دادههای بیشتری را از گروههای کمتر ارائه شده جمعآوری کنید یا دادههای مصنوعی را برای اجزای گمشده تولید کنید تا اطمینان حاصل شود که مدل در میان مجموعهای از جمعیتهای بیمار به خوبی کار میکند. اما نویسندگان استدلال میکنند که این رویکرد فنی باید با یک دیدگاه اجتماعی-تکنیکی که عوامل اجتماعی تاریخی و فعلی را در نظر میگیرد، تقویت شود. با انجام این کار، محققان می توانند در رسیدگی به سوگیری در سلامت عمومی موثرتر باشند.
مرضیه قاسمی، یکی از نویسندگان این مقاله، استادیار مهندسی برق و به یاد میآورد: «ما سه نفر در مورد روشهایی بحث میکردیم که در آن اغلب مسائل مربوط به دادهها را از دیدگاه یادگیری ماشین بهعنوان آزارهایی که باید با یک راهحل فنی مدیریت شوند، بررسی میکردیم. علوم کامپیوتر و وابسته به کلینیک عبداللطیف جمیل برای یادگیری ماشینی در سلامت (کلینیک جمیل)، آزمایشگاه علوم کامپیوتر و هوش مصنوعی (CSAIL) و موسسه مهندسی و علوم پزشکی (IMES). ما از قیاسهای دادهها بهعنوان مصنوع استفاده کرده بودیم که نمای جزئی از شیوههای گذشته را نشان میدهد، یا یک آینه ترک خورده که بازتابی را نگه میدارد. در هر دو مورد، اطلاعات ممکن است کاملاً دقیق یا مطلوب نباشد: شاید فکر میکنیم که به روشهای خاصی به عنوان یک جامعه رفتار میکنیم – اما وقتی واقعاً به دادهها نگاه میکنید، داستان متفاوتی را بیان میکند. ممکن است ما آن داستان را دوست نداشته باشیم، اما هنگامی که درکی از گذشته کشف کردید، میتوانید به جلو حرکت کنید و گامهایی برای رسیدگی به شیوههای ضعیف بردارید.»
داده به عنوان مصنوع
قاسمی، کادیجا فریمن و ماکسین مکینتاش در این مقاله با عنوان «در نظر گرفتن دادههای مغرضانه به عنوان مصنوعات اطلاعاتی در مراقبتهای بهداشتی با کمک هوش مصنوعی»، به همان شیوهای که انسانشناسان یا باستانشناسان فیزیکی میبینند، دادههای بالینی مغرضانه را به عنوان «مصنوعات» مشاهده میکنند. اشیاء: تکههایی از شیوههای آشکارکننده تمدن، سیستمهای اعتقادی، و ارزشهای فرهنگی – در مورد مقاله، بهویژه آنهایی که به نابرابریهای موجود در سیستم مراقبتهای بهداشتی منجر شدهاند.
به عنوان مثال، یک مطالعه در سال 2019 نشان داد که الگوریتمی که به طور گسترده به عنوان یک استاندارد صنعتی در نظر گرفته می شود، از هزینه های مراقبت های بهداشتی به عنوان شاخص نیاز استفاده می کند، که منجر به این نتیجه اشتباه می شود که بیماران سیاه پوست بیمار به همان سطح مراقبت از بیماران سفیدپوست سالم تر نیاز دارند. آنچه محققان دریافتند تبعیض الگوریتمی بود که دسترسی نابرابر به مراقبت را توجیه نمی کرد.
در این مثال، قاسمی و همکارانش به جای اینکه مجموعه دادههای مغرضانه یا کمبود داده را به عنوان مشکلاتی که فقط مستلزم دفع یا رفع آنها هستند نگاه کنند، رویکرد «مصنوعات» را به عنوان راهی برای افزایش آگاهی در مورد عناصر اجتماعی و تاریخی مؤثر بر نحوه جمعآوری دادهها و جایگزینی توصیه میکنند. رویکردهای توسعه هوش مصنوعی