זה מה שקורה כאשר דונלד טראמפ פוגש בינה מלאכותית

AI & ART - Style Transfer

AI & ART - Style Transfer
Anonim

ברדלי הייז, עמית פוסט-דוקטורט ב- MIT שעוסק במחקר רובוטי, הפך את דונלד "Drumpf" טראמפ לרובוט. הוא תיכנת רשת עצבית חוזרת ונשנית - אינטליגנציה מלאכותית - כדי ללמוד ולדמות את נאומי המועמד הרפובליקני-אישי.

"יום העבודה של הייז", הוא אומר, הוא "המחקר התמקד בצוותים של רובוט אנושי: תכנון אלגוריתמים המאפשרים לרובוטים לעבוד יחד וללמוד מבני אדם כדי שבני אדם יוכלו להיות בטוחים יותר, יעילים יותר ויעילים יותר בעבודתם". @DeepDrumpf הוא "פרויקט צדדי". הוא שאב השראה, בין השאר, מ"סקיצה פנטסטית "של ג'ון אוליבר. ("אני מקווה שהוא יראה את זה - אני מקווה שהוא יראה את זה ויעריך את זה").

הפוך דיבר עם הייז על המאמץ הפטריוטי הזה.

מה עוד נתן לך השראה לעשות @DeepDrumpf?

זה בא מתוך שיחה צהריים עם כמה עמיתים שלי, כי גם לעשות רובוטיקה מחקר להתמודד עם מכונת למידה. דיברנו על כמה טכניקות סטטיסטיות שונות שהיו רלוונטיות באמת למחקר שלנו.מתברר כי אותה טכניקה מאחורי DeepDrumpf עובד הרבה תחומים רובוטיקה, כי זה טכניקה דוגמנות שמנסה ללמוד את המבנה של מידע רציף, או נתונים רציפים. שפה טבעית היא דוגמה מצוינת לנתונים עוקבים, שבהם מבנה המשפט הוא עקבי למדי: יש כללים, ויש מבנה בסיסי לכל הנתונים שאתה מקבל.

ירושה 100 מיליון? ועכשיו אני בונה בכל רחבי העולם. ויש לי קצת מגניב.

- DeepDrumpf (@ DeepDrumpf) 4 מרס 2016

חוקר אחר באוניברסיטת סטנפורד כתב קורס על רשתות עצביות, ובמיוחד פרסם מאמר שכותרתו "היעילות הבלתי סבירה של רשתות עצביות חוזרות ונשנות". לכן, הוא כתב את ההקדמה הפנטסטית לטכניקה זו של מודלים סטטיסטיים, וחבורה של אנשים הראו כי יש לה כוח בלתי סביר זה לייצג מבנה בסוג זה של טופס חופשי טקסט של כתיבה.

ראיתי מאמר המשווה את מורכבות הדיבור של המתמודדים הפוליטיים השונים. המאמר היה אומר איך טראמפ משתמש בשפה פשטנית יותר, וזה מכה ענקית עם ההצבעה הדמוגרפי שלו האוהדים שלו. מנקודת מבט פוליטית, זה באמת נהדר, כי זה עושה את המסר שלך ברור ותוך הבנה של הקהל הרחב ביותר; מנקודת מבט של מכונה-מכונה, פירוש הדבר כי זה עשוי להיות המודל הכי נסבל שאנחנו יכולים לעשות.

האם שמעת על שפת קידוד בשם "הפוך Python נהדר שוב"?

אתה יודע, ראיתי את זה אתמול. TrumpPython או משהו כזה? ראיתי את זה. קראתי מאמר על זה, הלכתי לדף GitHub שלהם, אבל לא היה לי זמן לשחק עם זה עדיין. אבל זה נראה נהדר.

האם אנו יכולים ללמוד משהו על נטיותיו הלשוניות של טראמפ, או משהו כזה, מאלה שלך?

כן, זה אפשרי במובן זה, אם אתה מסתכל על הפלט של המודל, זה מעיד על המבנה כי המודל למד מן הנתונים. אז סוגי החזרה, הדברים שיוצאים מהמודל, יגידו לך - באופן פוטנציאלי - על דברים מסוימים הטבועים בדפוסי הדיבור שלו ובמסר שלו.

קנזס כולם אמרו, "אני לא צריך שום דבר. היתה להם ארץ איומה, ויש לה את התשתית המיוחדת, המדינה שלנו זקוקה לעושר.

- DeepDrumpf (@ DeepDrumpf) 4 מרס 2016

אתה לא בהכרח יכול לקבל את זה מתוך חשבון טוויטר עצמו, בעיקר בגלל טוויטר רק נותן לך 140 תווים לעבוד עם. ומכיוון שאין הרבה נתונים שנכנסו למודל, וגם בחלקו משום שהתמלילים הם מוויכוחים - שבהם המועמדים (ובמיוחד טראמפ) נוטים להפריע לעצמם - זה גורם להפסקות אלה בתפוקה.

יש עדיין קצת עבודה ידנית נדרש כדי בעצם מדגם קיר של טקסט מתוך מודל זה ולאחר מכן לעבור את זה ולבחור את הרצף הטוב ביותר 140 תווים רציף, ולאחר מכן לכתוב את זה.

זה העסק. הנשיא שלנו הוא Obamacare. עכשיו, זה מה שזה לא. תודה רבה לך. אנחנו לא מעודדים שאנחנו מעניינים

- DeepDrumpf (@ DeepDrumpf) 4 מרס 2016

אז זה לא מאוד הידיים בשלב זה?

הוא לומד באופן יעיל כהפצה הסתברותית, ואתה יכול לדגום ממנו. מה זה אומר - יש לך את המודל שלך ואתה יכול לבקש את זה עבור מכתב. ואם אתה שואל את זה מספיק מכתבים ברציפות, זה ייתן לך דברים דומים לאנגלית. או, אפילו טוב יותר, כמה מהם דומים דברים Trump אולי בעצם אמר - כי זה היה מאומן עליו. אז, את התהליך הכללי אני כבר בעקבות הוא: הייתי מדגם, למשל, 500 או 1,000 תווים ממנו. זה היה רק ​​לתת לי קיר של טקסט עם 500 או 1,000 תווים בשווי של, אני מניח, ramblings, ואז, מתוך זה, אני פשוט לבחור את הטוב ביותר 140 תווים בלוק הגיוני. או את המשפט הטוב ביותר שיוצא מזה זה נראה סוג של רלוונטי.

לדוגמה, אתמול בלילה הייתי משתמש בו כדי סוג של לחיות לצטט את הדיון. וכך, אחד הדברים שאתה יכול לעשות עם מודל כזה הוא שאתה יכול ראש אותו. לכן, מכיוון שהמודל נותן לך רק תו אחד בכל פעם, יש לו תלות בדמויות שהופיעו לפניו - האותיות שהוא מפיק קודם לכן. כך היא לומדת מילים, כך היא לוכדת מבנה משפט ואלמנטים מסוימים של הדקדוק.

תגיד אני מתחיל את המשפט שלי עם 'רומני' ולאחר מכן לשאול אותו עבור אלף תווים. אנחנו קוראים לזה תחול. זה ייתן כל פלט שהוא רוצה, אבל זה יהיה להגדיר את החלק הראשוני של רצף זה "רומני הוא …"

האם זה מתייחס אלה tweets עם ביטויים בסוגריים?

בדיוק.

רומני הוא כלי. אני רוצה לספר לך את זה. הם כנראה הדבר האחרון שאנחנו צריכים במנהיג, אנחנו לא יכולים לעשות את זה.

- DeepDrumpf (@ DeepDrumpf) 3 מרס 2016

אחד הדברים שאני מקווה לעשות, ברגע שהתהליך הוא קצת יותר נקי - וזה רק הולך לבוא עם נתונים נוספים - היא להתחיל את זה אינטראקציה עם המועמדים האחרים. אם אתה מסתכל על חשבון טוויטר, זה בעקבות המועמדים העיקריים אחרים. בסופו של דבר, אנחנו מקווים להתחיל להגיב אליהם ואולי מאתגר אותם. אבל זה יותר מסוג של סוף שבוע.

@ RealDonaldTrump הם הולכים להיות משלם עכשיו, וכמו, בהחלט. אני באמת עשיר. הו, אני רוצה לתמוך בהם.

- DeepDrumpf (@ DeepDrumpf) 3 מרס 2016

האם אתה יכול להסביר מה רשת עצבית חוזרת היא בשפה פשטנית ולא מתואמת?

בטח - ננסה. רשת עצבית, באופן כללי, היא לוקחת קצת קלט, אז זה עושה קצת מתמטיקה באמצע, וזה נותן לך פלט. באופן כללי, זה רק מסווג. אז, בהתחשב קצת קלט, זה יגיד לך איזה סוג קלט זה מתאים. דוגמא פופולרית תהיה - רשת עצבית בסיסית - אתה נותן לה תמונה של חתול, ואתה רוצה שזה יגיד לך את זה - אם זה, כמו, חתול, כלב, או מטוס, או מכונית - אתה רוצה זה אומר "אוקיי - עם ביטחון גבוה - זה חתול כי נתת לי עכשיו."

אז זו משימה סיווג ברמה גבוהה. זהו מושג דומה, אבל במקום להיות חתול, כלב, מכונית, השיעורים הם האותיות הפרטיות של האלפבית ופיסוק. אז זה לוקח קלט, ואז זה עושה את זה במתמטיקה על סמך מה הוא למד - אז כל הלמידה קורה "באמצע", אנחנו קוראים לזה - וזה נותן לך סיווג בסוף. אז כמו, המכתב הזה.

מה שעושה את זה חוזר ונשנה רשת עצבית היא שהפלט משלבים קודמים מוזן לשלב הבא כחלק מהמודל. העובדה שהמודל נתן לי "מ'" תזין את הדוגמה הבאה של המודל. אז זה יכול לתת לך 'א', ואז 'k', ולאחר מכן 'e', ​​כי זה מנסה להוציא 'לעשות אמריקה נהדר שוב,' כי זה מיוצג בנתונים הרבה.

האם אתה גאה במיוחד על כל Tweets DeepDrumpf עד כה?

ללא שם: כן, למעשה. יש לי כמה שאני לא ממש פורסם עדיין, אבל -

בלעדי.

צוחק בדיוק. מתוך אלה שפורסמו, אני שמח במיוחד עם 'אני מה ISIS לא צריך.'

אני ISIS לא צריך.

- DeepDrumpf (@ DeepDrumpf) 3 מרס 2016

בוא נראה … עשיתי את זה זרע עם 'אני לא גזעני, אבל …' והמשכו של זה היה '… תאמין', אשר חשבתי היה די מעולה. עמדתי להציל את זה, כאשר זה הפך להיות רלוונטי, אם זה הפך להיות רלוונטי.

שום דבר טוב לא בא אחרי המילים האלה.

האם אתה מעדיף להצביע עבור דונלד טראמפ או להצביע עבור @ DeepDrumpf?

אני חושב שיש חילופי דעות עם כל אחת מהבחירות האלה.