זה רשת עצבית AI מ Nvidia יוצר תמונות מזויפות Photorealistic

VETORES - parte I - Prof.ª Rafaela

VETORES - parte I - Prof.ª Rafaela
Anonim

במבט אחד, את התמונה למעלה נראה כמו תמונה רגילה של רחוב רגיל, נלקח או מתוך מקף פקה או ממישהו מטופש מספיק כדי לשוטט לתוך הכביש כדי לצלם תמונה של סצינה ארצי כזה.

אבל תסתכל קצת יותר. שימו לב איך אות התנועה מעוות מעט, או איך חלק מהמכוניות נראה מטושטש? יש כאן משהו לא בסדר. זה בכלל לא תצלום. זוהי תמונה שנוצרה כולה על ידי א.

מדעני המחשבים של חברת הטכנולוגיה Nvidia ואוניברסיטת קליפורניה בברקלי כתבו עבודת מחקר, הזמינה בהדפסה מוקדמת על ARXiv, המפרטת כיצד הם הצליחו לקבל רשת עצבית ליצור תמונות רחוב ריאליסטיות ודיוקנאות אנושיים. הם אפילו כללו ממשק משתמש המאפשר לך לצבוט את התמונות עם זאת אתה רוצה על ידי הוספת עלווה נוספת או אפילו לשנות את מזג האוויר.

"המשחקים צומחים במהירות, כי אנשים אוהבים לתקשר זה עם זה בסביבות וירטואליות", אומר מינג-יו ליו, מדען בכיר בנווידיה הפוך בדוא"ל. "עם זאת, בניית עולמות וירטואליים היא יקרה עם הטכנולוגיה של היום, כי זה דורש אמנים במפורש מודל לדמות מרקם ותאורה עבור העולם שהם בונים. עם תרגום תמונות לתמונה, אנו יכולים לדגום את העולם האמיתי כדי ליצור עולמות וירטואליים ".

רשתות עצביות הן מחשבים הדוגלים לעבוד כמו מוח אנושי על ידי לקיחת מידע, יישום זה ולמידה מהתוצאות. מחקר זה השתמש בסוגים מיוחדים של רשתות עצביות שהציגו איאן גודפלו ב -2014, הקרויים רשתות אוויריות גנריות - או GANs - שבדרך כלל מורכבות משתי רשתות, הגנרטור והמפלה.

הגנרטור מקבל תמונות ומתחיל ליצור תמונות סינתטיות הדומות לאלה שניתנו לו. לאחר מכן הוא מציג תערובת של הדימויים שניתנו לו ואת הזיופים למפלה, שתפקידם להבדיל ביניהם. ככל שהתהליך הזה נמשך, הגנרטור הופך להיות טוב יותר לחקות את התמונות המקוריות, והמפלה הופכת טובה יותר לספר את הזיופים זה מזה. התוצאות הן די משכנע - לגמרי מזויף - תמונות.

מחקר זה מתבסס על מודל ה- GANs המסורתי על-ידי הוספת פיצול הרשתות והגנראטור לרשתות משנה אחדות, מה שמאפשר פלט של תמונות ברזולוציה גבוהה יותר. הרשתות העצביות מסוגלות גם הן לצלם מפה סמנטית - או תכנית מתאר איך נראית התמונה - ולמלא את המרקמים באופן אוטונומי. משתמשים יכולים אפילו להיכנס לתכנית ולשנות דברים אם הם רוצים להוסיף בניינים במקום עצים בתצוגת רחוב או להפוך את העיניים רחב יותר דיוקן.

המאמר משווה את תוצאותיו לניסויים דומים שנעשו בשיטה זו, והבולטת ביותר היא להיות pix2pix. המחקר של Nvidia ו- UC Berkeley מסוגל ליצור תמונות עם פרטים זעירים ומדויקים כמו לוחיות רישוי ברורות, בעוד שתמונות pix2pix מפיקות תמונות שנראות כמעט כמו ציורי אקוורל.

בעוד כלי זה יכול לשמש כדי להרוויח קצת קארמה reddit חינם עם כמה תמונות מוזרות, המחברים רואים פוטנציאל עצום ניצול גישה זו כדי ליצור גרפיקה מציאותית עם רק תכנית פשוטה.

מאות שעות של עבודה קפדנית נכנסים ליצירת עולמות וירטואליים לשימוש במפות Google, סרטים ומשחקי וידאו. ליו אומר כי המודל הזה יכול לשמש כדרך ללא כאב לקבל את רוב העיצוב נעשה ולאחר מכן להיכנס לצבוט את הפרטים מאוחר יותר.

"במקום לעצב את העולם על ידי הדוגמנות במפורש זה, אנחנו יכולים לבנות את העולם במרומז על ידי שימוש בתמונה תמונה לתמונה לתרגם בין מודל פשוט של העולם, כי אינו מכיל שום מרקם או תאורה, פלט תמונה מציאותית. יכולת זו צריכה לעשות את זה הרבה יותר זול לבנות עולמות וירטואליים ", הוא מספר הפוך.

עבור השלב הבא במחקר זה, הקבוצה מקווה לחקור וידאו ל-וידאו תרגום, אשר ישתמש רשתות עצביות ליצור קטעי וידאו מציאותיים. מטרה שלדברי לואי טוענת לחוקרים בתחום.

עכשיו אתה יודע כמה קל יכול ליצור תמונות מזויפות. אל תסמוך על כל מה שאתה רואה בתמונות של Google.