
ابزارهای جدیدی برای کمک به کاهش مصرف انرژی در مدل های هوش مصنوعی
در میان رقابت برای بزرگتر کردن و بهتر کردن هوش مصنوعی، آزمایشگاه لینکلن در حال توسعه راههایی برای کاهش نیرو، آموزش کارآمد و شفافسازی مصرف انرژی است.
هنگام جستجوی پروازها در Google، ممکن است متوجه شده باشید که تخمین انتشار کربن هر پرواز اکنون در کنار هزینه آن ارائه شده است. این راهی است برای اطلاع رسانی به مشتریان در مورد تأثیرات زیست محیطی آنها، و به آنها اجازه می دهد تا این اطلاعات را در تصمیم گیری خود لحاظ کنند.
یک نوع شفافیت مشابه هنوز برای صنعت محاسبات وجود ندارد، علیرغم اینکه انتشار کربن آن بیشتر از کل صنعت هواپیمایی است. افزایش این تقاضای انرژی مدل های هوش مصنوعی هستند. مدلهای عظیم و محبوب مانند ChatGPT روند هوش مصنوعی در مقیاس بزرگ را نشان میدهند و پیشبینیهایی را تقویت میکنند که پیشبینی میکنند مراکز داده تا سال 2030 تا 21 درصد از برق جهان را تامین کنند.
مرکز ابر محاسباتی آزمایشگاهی MIT لینکلن (LLSC) در حال توسعه تکنیک هایی برای کمک به مراکز داده در استفاده از انرژی است. تکنیکهای آنها از تغییرات ساده اما مؤثر، مانند سختافزاری با قدرت محدود، تا استفاده از ابزارهای جدید که میتوانند آموزش هوش مصنوعی را در مراحل اولیه متوقف کنند، متغیر است. مهمتر از همه، آنها دریافته اند که این تکنیک ها کمترین تأثیر را بر عملکرد مدل دارند.
در تصویر گسترده تر، کار آنها بسیج تحقیقات محاسبات سبز و ترویج فرهنگ شفافیت است. Vijay Gadepally، کارمند ارشد در LLSC که تلاشهای تحقیقاتی آگاه از انرژی را رهبری میکند، میگوید: «محاسبات آگاه از انرژی واقعاً یک حوزه تحقیقاتی نیست، زیرا همه به دادههای خود پایبند بودهاند. “کسی باید شروع کند، و ما امیدواریم که دیگران دنبال کنند.”
کاهش قدرت و خنک کننده
مانند بسیاری از مراکز داده، LLSC شاهد افزایش قابل توجهی در تعداد مشاغل هوش مصنوعی در حال اجرا بر روی سخت افزار خود بوده است. با توجه به افزایش مصرف انرژی، دانشمندان کامپیوتر در LLSC در مورد راه هایی برای اجرای کارآمدتر مشاغل کنجکاو شدند. محاسبات سبز یک اصل از مرکز است که به طور کامل توسط انرژی بدون کربن تغذیه می شود.
آموزش یک مدل هوش مصنوعی – فرآیندی که توسط آن الگوها را از مجموعه داده های عظیم یاد می گیرد – نیاز به استفاده از واحدهای پردازش گرافیکی (GPU) دارد که سخت افزاری پرقدرت هستند. به عنوان یک مثال، GPUهایی که GPT-3 (پیش ساز ChatGPT) را آموزش داده اند، تخمین زده می شود که 1300 مگاوات ساعت برق مصرف کرده اند که تقریباً برابر با مصرف متوسط 1450 خانوار آمریکایی در ماه است.
در حالی که بیشتر مردم به دلیل قدرت محاسباتی خود به دنبال پردازنده گرافیکی هستند، سازندگان راه هایی را برای محدود کردن میزان توانی که یک GPU مجاز به مصرف آن است ارائه می دهند. سیذارت سامسی، محققی در LLSC میگوید: «ما تأثیرات قدرت درپوش را مطالعه کردیم و دریافتیم که بسته به مدل میتوانیم مصرف انرژی را حدود 12 تا 15 درصد کاهش دهیم.»
معاوضه برای کاهش قدرت در حال افزایش زمان کار است – GPU ها حدود 3 درصد بیشتر طول می کشد تا یک کار را انجام دهند، افزایشی که Gadepally می گوید با توجه به اینکه مدل ها اغلب در طول روزها یا حتی ماه ها آموزش می بینند، “به سختی قابل توجه است”. در یکی از آزمایشهای خود که در آن مدل زبان محبوب BERT را آموزش دادند، محدود کردن توان GPU به 150 وات شاهد افزایش دو ساعته در زمان آموزش (از 80 به 82 ساعت) بود اما معادل انرژی یک هفته یک خانواده آمریکایی صرفهجویی کرد.
سپس این تیم نرمافزاری ساختند که این قابلیت کاهش قدرت را به سیستم زمانبندی پرکاربرد Slurm متصل میکند. این نرم افزار به صاحبان مراکز داده اجازه می دهد تا محدودیت هایی را در سراسر سیستم خود یا بر اساس شغل به کار تعیین کنند.
گادپالی میگوید: «ما امروز میتوانیم این مداخله را مستقر کنیم و این کار را در تمام سیستمهایمان انجام دادهایم.
مزایای جانبی نیز به وجود آمده است. از زمان اعمال محدودیتهای برق، پردازندههای گرافیکی در ابررایانههای LLSC حدود 30 درجه فارنهایت خنکتر و در دمای ثابتتری کار میکنند و استرس سیستم خنککننده را کاهش میدهند. راه اندازی کولر سخت افزاری به طور بالقوه می تواند قابلیت اطمینان و طول عمر سرویس را نیز افزایش دهد. آنها اکنون میتوانند خرید سختافزار جدید را به تأخیر بیندازند – کاهش «کربن تجسمشده» یا انتشار گازهای گلخانهای ایجاد شده از طریق تولید تجهیزات – تا زمانی که کاراییهای بهدستآمده با استفاده از سختافزار جدید این جنبه از ردپای کربن را جبران کند. آنها همچنین در حال یافتن راه هایی برای کاهش نیازهای سرمایشی با برنامه ریزی استراتژیک مشاغل برای اجرا در شب و در ماه های زمستان هستند.
Gadepally میگوید: «مراکز دادهها میتوانند امروزه از این رویکردهای آسان برای افزایش کارایی استفاده کنند، بدون اینکه نیازی به تغییر در کد یا زیرساخت داشته باشند.
نگاهی کل نگر به عملیات مرکز داده برای یافتن فرصت هایی برای کاهش می تواند زمان بر باشد. برای تسهیل این فرآیند برای دیگران، این تیم – با همکاری پروفسور Devesh Tiwari و Baolin Li در دانشگاه نورث ایسترن – اخیراً یک چارچوب جامع برای تجزیه و تحلیل ردپای کربن سیستمهای محاسباتی با کارایی بالا ایجاد و منتشر کرده است. متخصصان سیستم می توانند از این چارچوب تجزیه و تحلیل برای به دست آوردن درک بهتری از پایداری سیستم فعلی خود استفاده کنند و تغییرات را برای سیستم های نسل بعدی در نظر بگیرند.
تنظیم نحوه آموزش و استفاده از مدل ها
علاوه بر ایجاد تنظیمات در عملیات مرکز داده، این تیم در حال ابداع راههایی برای کارآمدتر کردن توسعه مدل هوش مصنوعی است.
هنگام آموزش مدلها، توسعهدهندگان هوش مصنوعی اغلب بر بهبود دقت تمرکز میکنند و به عنوان نقطه شروع، مدلهای قبلی را پایهگذاری میکنند. برای دستیابی به خروجی مورد نظر، آنها باید بفهمند از چه پارامترهایی استفاده کنند و درست کردن آن می تواند هزاران پیکربندی را آزمایش کند. این فرآیند که بهینهسازی هایپرپارامتر نامیده میشود، حوزهای است که محققان LLSC آن را برای کاهش اتلاف انرژی آماده کردهاند.
Gadepally میگوید: «ما مدلی را توسعه دادهایم که اساساً به سرعت یادگیری یک پیکربندی معین میپردازد. با توجه به این نرخ، مدل آنها عملکرد احتمالی را پیش بینی می کند. مدل های با عملکرد ضعیف زود متوقف می شوند. او میگوید: «ما میتوانیم تخمین بسیار دقیقی را در اوایل به شما ارائه دهیم که بهترین مدل در بین 10 مدل برتر از 100 مدل در حال اجرا خواهد بود.
در مطالعات آنها، این توقف اولیه منجر به صرفه جویی چشمگیر شد: کاهش 80 درصدی انرژی مورد استفاده برای آموزش مدل. آنها این تکنیک را برای مدل های توسعه یافته برای بینایی کامپیوتری، پردازش زبان طبیعی و برنامه های کاربردی طراحی مواد به کار برده اند.
گادپالی میگوید: «به نظر من، این تکنیک بیشترین پتانسیل را برای پیشرفت روشهای آموزش مدلهای هوش مصنوعی دارد.
آموزش تنها بخشی از انتشار آلاینده های یک مدل هوش مصنوعی است. بزرگترین عامل انتشار در طول زمان استنتاج مدل یا فرآیند اجرای زنده مدل است، مانند زمانی که کاربر با ChatGPT چت می کند. برای پاسخگویی سریع، این مدلها از سختافزار اضافی استفاده میکنند که همیشه در حال اجرا هستند و منتظر هستند تا کاربر سؤالی بپرسد.
یکی از راه های بهبود کارایی استنتاج استفاده از مناسب ترین سخت افزار است. همچنین با دانشگاه نورث ایسترن، تیم بهینهسازیکنندهای را ایجاد کرد که با مدلی با کارآمدترین ترکیب سختافزار، مانند پردازندههای گرافیکی پرقدرت برای بخشهای محاسباتی شدید استنتاج و واحدهای پردازش مرکزی کم مصرف (CPU) برای افراد کمتر مطابقت دارد. -جنبه های درخواستی این اثر اخیرا برنده جایزه بهترین مقاله در سمپوزیوم بین المللی ACM در محاسبات موازی و توزیع شده با کارایی بالا شد.
استفاده از این بهینه ساز می تواند مصرف انرژی را 10 تا 20 درصد کاهش دهد در حالی که همچنان همان “هدف کیفیت خدمات” را برآورده می کند (مدل با چه سرعتی می تواند پاسخ دهد).
این ابزار به ویژه برای مشتریان ابری که سیستمها را از مراکز داده اجاره میکنند و باید سختافزار را از میان هزاران گزینه انتخاب کنند، مفید است. گادپالی میگوید: «بیشتر مشتریان نیازهای خود را بیش از حد برآورد میکنند؛ آنها سختافزاری را انتخاب میکنند که توانایی بیش از حد را داشته باشد، فقط به این دلیل که چیز بهتری نمیدانند».
رشد آگاهی از محاسبات سبز
انرژی صرفهجویی شده با اجرای این مداخلات نیز هزینههای مرتبط با توسعه هوش مصنوعی را کاهش میدهد، اغلب با نسبت یک به یک. در واقع، هزینه معمولاً به عنوان پروکسی برای مصرف انرژی استفاده می شود. با توجه به این صرفه جویی ها، چرا مراکز داده بیشتری روی تکنیک های سبز سرمایه گذاری نمی کنند؟
سامسی میگوید: «من فکر میکنم این مشکل کمی مشوق و ناهماهنگی است. چنان مسابقهای برای ساخت مدلهای بزرگتر و بهتر وجود داشته که تقریباً همه ملاحظات ثانویه کنار گذاشته شده است.»
آنها اشاره می کنند که در حالی که برخی از مراکز داده اعتبارات انرژی تجدیدپذیر را خریداری می کنند، این انرژی های تجدیدپذیر برای پوشش تقاضای رو به رشد انرژی کافی نیستند. اکثر مراکز داده انرژی الکتریکی از سوختهای فسیلی میآیند و آبی که برای خنکسازی استفاده میشود، به ایجاد حوضههای آبخیز تحت فشار کمک میکند.
همچنین ممکن است تردید وجود داشته باشد زیرا مطالعات سیستماتیک در مورد تکنیک های صرفه جویی در انرژی انجام نشده است. به همین دلیل است که این تیم تحقیقات خود را علاوه بر مخازن منبع باز، در مکان های بررسی شده نیز انجام داده است. برخی از بازیگران بزرگ صنعت، مانند Google DeepMind، از یادگیری ماشینی برای افزایش کارایی مرکز داده استفاده کردهاند، اما کار خود را در دسترس دیگران قرار ندادهاند تا آنها را استقرار یا تکرار کنند.
کنفرانسهای برتر هوش مصنوعی اکنون برای بیانیههای اخلاقی تلاش میکنند که نحوه سوء استفاده از هوش مصنوعی را در نظر میگیرد. این تیم جنبه آب و هوایی را به عنوان یک موضوع اخلاقی هوش مصنوعی می بیند که هنوز توجه زیادی به آن نشده است، اما به نظر می رسد این نیز به آرامی در حال تغییر است. برخی از محققان اکنون ردپای کربن آموزش جدیدترین مدلها را فاش میکنند و صنعت نیز تغییری در شفافیت انرژی نشان میدهد، همانطور که در این گزارش اخیر از Meta AI آمده است.
آنها همچنین اذعان دارند که شفافیت بدون ابزارهایی که بتواند مصرف خود را به توسعه دهندگان هوش مصنوعی نشان دهد دشوار است. گزارش در نقشه راه LLSC برای امسال است. آنها میخواهند بتوانند به هر کاربر LLSC، برای هر شغل، نشان دهند که چقدر انرژی مصرف میکنند و این مقدار چگونه با دیگران مقایسه میشود، مشابه گزارشهای انرژی خانه.
بخشی از این تلاش مستلزم همکاری بیشتر با سازندگان سختافزار برای آسانتر و دقیقتر کردن این دادهها از سختافزار است. اگر سازندگان بتوانند روش خواندن دادهها را استاندارد کنند، ابزارهای ذخیرهسازی انرژی و گزارشدهی میتوانند در پلتفرمهای سختافزاری مختلف اعمال شوند. همکاری بین محققان LLSC و اینتل برای کار بر روی این مشکل در حال انجام است.
حتی برای توسعه دهندگان هوش مصنوعی که از نیازهای انرژی شدید هوش مصنوعی آگاه هستند، نمی توانند به تنهایی کار زیادی برای محدود کردن مصرف انرژی انجام دهند. تیم LLSC می خواهد به سایر مراکز داده کمک کند تا این مداخلات را اعمال کنند و گزینه های آگاه از انرژی را در اختیار کاربران قرار دهند. اولین همکاری آنها با نیروی هوایی ایالات متحده، حامی این تحقیق است که هزاران مرکز داده را اداره می کند. استفاده از این تکنیک ها می تواند کاهش قابل توجهی در مصرف انرژی و هزینه آنها ایجاد کند.
Gadepally میگوید: «ما کنترل را به دست توسعهدهندگان هوش مصنوعی میسپاریم که میخواهند ردپای خود را کاهش دهند. “آیا واقعاً نیاز دارم که مدلهای بینتیجه را بیوقفه آموزش دهم؟ آیا حاضرم برای صرفهجویی در مصرف انرژی، پردازندههای گرافیکی خود را کندتر اجرا کنم؟ طبق اطلاعات ما، هیچ مرکز ابررایانه دیگری به شما اجازه نمیدهد این گزینهها را در نظر بگیرید. امروز با استفاده از ابزارهای ما، میتوانید تصمیم بگیرید.”
برای مشاهده نشریات گروه مربوط به محاسبات آگاه از انرژی و یافته های شرح داده شده در این مقاله از این صفحه وب دیدن کنید.