صفحه اصلی / علم و دانش / هوش مصنوعی از اشتباهاتش درس می گیرد و خود را اصلاح می کند

هوش مصنوعی از اشتباهاتش درس می گیرد و خود را اصلاح می کند

محققان موسسه OpenAI طی ماه‌ های اخیر بر ایجاد هوش مصنوعی متمرکز بوده اند که می تواند بهتر از دیگر انواع این فناوری بیاموزد. براساس گزارش Science Alert، اكنون محققان موسسه موفق شده اند سيستم را به گونه ای ارتقا دهند كه بتواند مانند انسان ها از خطاهای خودش بياموزد.

 اين توانايی مديون الگوريتم منبع بازی به نام HER (مخفف شناخت تكرار تجربه) است كه محققان به تازگی آن را ايجاد كرده اند و همانطور كه از نامش مشخص است، به سيستم امكان می دهد خطاهای خود را بازبينی كرده و از آنها برای انجام درست وظيفه جديد درس بگيرد. از اين رو هوش مصنوعی خطاهای خود را به عنوان موفقيت در نظر می گيرد. به عبارتی، هر خطايی كه اين سيستم هوش مصنوعی در مسير انجام يک دستور انجام می دهد، به هدفی ديگر تبديل می شود، هدفی ناخواسته و مجازی. درست مانند اولين تجربه يادگيری دوچرخه سواری كه در آن فرد ابتدا در حفظ تعادل دچار مشكل می شود. اما هر بار زمين افتادن فرد را به هدفش كه حفظ تعادل است نزديک تر می سازد زيرا بشر به اين شكل و با استفاده از خطاهايش می آموزد.

 با استفاده از HER، اين سيستم هوش مصنوعی قصد دارد به شيوه ای مشابه كارهای جديد را ياد بگيرد. اين تكنيک به تدريج جايگزين سيستم پاداشی خواهد شد كه در مدل های يادگيری <تقويت يادگيری> مورد استفاده قرار می گيرند. برای اينكه يک هوش مصنوعی به خودش درس بدهد، بايد از سيستم پاداشی استفاده كند.‌ سيستمی كه متناسب با رسيدن يا نرسيدن هوش مصنوعی به هدفش به آن جايزه می دهد.

 اين مدل كامل نيست و برخلاف آن سيستم HER حتی زمانی كه هوش مصنوعی دچار خطا می شود نيز به او پاداش می دهد. به اين شكل سيستم با سرعت و كيفيت بالاتری ياد می گيرد. به گفته محققان استفاده از سيستم جديد يادگيری به آن معنی نيست كه ياد دادن كارهای ويژه به هوش مصنوعی ساده تر از گذشته است. حقيقت يادگيری با استفاده از HER در روبات های واقعی هنوز فرايند پيچيده ای است زيرا به دريايی از نمونه ها نياز دارد.


دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *