הרובוטים לומדים כיצד להשלים משימות בעולמות וירטואליים מופשטים, לפתח מיומנויות תוך שעות ספורות, שעלולות להימשך חודשים. לימוד חיזוי סימולציה עמוקה (או RL עמוק) פירושו מיומנות שבדרך כלל לוקחת 55 ימים עבור A.I. ללמוד בעולם האמיתי לוקח רק יום בכיתה מואץ יתר.
"יש לה פוטנציאל לחולל מהפכה אמיתית במה שאנחנו יכולים לעשות בתחום הרובוטיקה", אמרה ריה האסל, מדען מחקר ב- Google DeepMind, ביום חמישי. "אנחנו יכולים ללמוד מיומנויות ברמה האנושית".
זה אולי נשמע אנטי אינטואיטיבי, כמו כל הנקודה של רובוטים הוא מתכנתים יכולים ללמד אותם לעשות דברים, נכון? בעת תכנון המכונה שפועלת בעולם האמיתי, רובוטים צריכים הרבה נתונים כדי להבין איך לעשות משימה במצב לא מוכר. A.I. יכול להשתמש בנתונים אלה כדי "ללמוד" מיומנות המבוססת על כל המופעים שהגיעו קודם.
לימוד חיזוק עמוק אוסף את הנתונים באופן דומה לאופן שבו בני האדם לומדים: רובוט ישלים משימה שוב ושוב, כמו לתפוס כדור, ורשום את הנתונים כדי לבנות תמונה של הדרך הטובה ביותר לתפוס כדור במצב חדש. כאשר DeepMind השתמשו בדגם בשנת 2013 כדי ללמד רובוט כיצד לשלוט במשחקי Atari, פשוט על ידי ישיבה מול המסך ולספר את המטרה הסופית, הקהילה המדעית אהבה את זה.
הבעיה היא, זה לוקח לנצח. אתה צריך לזרוק כדורים על רובוט שוב ושוב, או במקרה Atari, להשאיר את הרובוט לבד בחדר השינה שלה במשך זמן מה. הפעלת סימולציה MuJoCo, בשילוב עם רשת עצבית מתקדמת, מאמנים יכולים להפעיל תוכנית המחקה את הרובוט, מעביר את ההתנהגויות למד הרובוט ומפות את התנועות הווירטואליות לעולם האמיתי.
"אנחנו יכולים להפעיל את הסימולטורים האלה כל היום וכל הלילה, "אמר האדסל.
התוצאות מדברות בעד עצמן. הרובוט הזה, שקיבל את הדיפלומה שלו בתפיסה, יכול עכשיו לעקוב אחרי כדורים וירטואליים כאילו היו אמיתיים, כשהוא עושה את זה ליום הגדול כשזה מתבקש לתפוס כדור אמיתי:
חדשות: יותר חיות מחמד מקבלים מרשמים מאשר אי פעם בעבר
ביום שישי ב 'JAMA רשת פתוחה' מדענים פירסם את המחקר הראשון אי פעם המפרט את מספר מרשמים אופיואידים שנכתבו על ידי וטרינרים. הניתוח שלהם מראה כי מודעות מוגברת לחשיבות של ניהול כאב לבעלי חיים הובילה לעלייה באופיואידים שניתנו לבעלי חיים.
הלמידה שפה בשנת שינה עמוקה היא לא רק מדע בדיוני יותר
בני האדם חלמו להשתמש בשעות הלא מודעות של השינה כדי ללמוד מיומנויות חדשות במשך עשרות שנים. לא היו עדויות רבות התומכות ב"לימוד שינה ". מחקר שפורסם ב"ביולוגיה נוכחית" מציע שלמידה בלמידה תהיה אפשרית אם אתה צודק.
למה חיזוק הלמידה יהיה נעילת מכוניות אוטונומיות עבור ההמונים
במקום לתכנת מכוניות לצפות כל תרחיש אפשרי, מהנדסים יכולים לתכנת מכוניות ללמוד כיצד לנווט תרחישים באמצעות למידה חיזוק.