למה א.י. יכול להיאבק להבין ערבית

Uma dívida de gratidão (Homilia Diária.1627: Terça-feira da 32.ª Semana do Tempo Comum)

Uma dívida de gratidão (Homilia Diária.1627: Terça-feira da 32.ª Semana do Tempo Comum)
Anonim

בעולם של בינה מלאכותית, הנתונים הוא המלך. ככל שיש לך יותר, כך הכלים שלך להיות טוב יותר כמו מערכות מסוגלים "ללמוד" יותר על מה לצפות. אבל בהתאם לפלטפורמה א. הוא מצייר נתונים, כמה שפות עשוי להיות מיוצג טוב יותר מאחרים, על פי מרים רדי, מדען מחקר של מעבדות יאהו.

"לדוגמה, כמו פליקר, איפה אנחנו לוקחים את הנתונים שלנו, כמה שפות הם מיוצגים מעט מאוד," אמר Redi, נואם ב לונדון הלמידה Deep Learning ביום חמישי. "אז יש לנו אנגלית, מיליוני תמונות לאנגלית, אבל יש לנו אולי 100,000 לערבית".

הצוות של רדי עובד על כלי שיכול לזהות רכיבים לא גלויים לתמונות, כמו ערכים תרבותיים וקונוטציות רגשיות. הכלי מנתח את הטקסט המצורף לתמונות הזמינות לציבור ב- Flickr. במשך הזמן, א. מתחיל להבין מדוע מישהו יכול לתייג תמונה של "מסיבה מאושרת" או "רגע מביך", אך רעיונות אלה יגדלו באופן מדויק יותר ככל שהכלי מנתח תמונות נוספות.

"למרבה הצער, הדיוק של גילוי סנטימנטים בתמונות עבור שפות בערבית נוטה להיות נמוך יותר כי אין לנו מספיק נתונים," אמר Redi.

בשפות שבהן היו כמויות גדולות יותר של נתונים, הצוות של רדי הבחין בכמה דוגמאות מעניינות. שפות רומנטיות כמו צרפתית וספרדית נטו להביע את עצמן בדרכים דומות, ואילו איטלקית נראתה השפה היחידה שבה משתמשים זיהו תמונות עם המונח "העלמת מס".

חסמי השפה נותרו בעינה של בעיה עבור א. חוקרים. כל מי שהשתמש ב- Google Translate יידע כי החלפת שפות היא לא פשוטה כמו שזה נשמע. עם זאת, התפתחויות חדשות הן שינוי דברים, עם פייסבוק הודיעה בקיץ כי הוא התקרב חלומה של רשת חברתית חד פעמית, תרגום אוטומטי טקסטים עבור המשתמשים.

התפתחויות בהסרת חסמי שפה יכולות לעזור לטפח תקשורת בין-לאומית, אך עבור פרויקטים כמו של Redi, אין תחליף ממשי לנתוני רגש שנוצרו על-ידי האדם.