Săn thẻ AI 4 CFVN ( »NH«ª¬KhánhशTrắng® 98 (Đz)) part 2
Speechmatics הולך אחרי גוגל. חברת הסטארט-אפ הבריטית לקחה את הלשוניות האוטומטית בחודש שעבר, אינטליגנציה מלאכותית רבת עוצמה שיכולה ללמוד כל שפה לשעתוק טקסט לדיבור בתוך ימים. הצוות רוצה לאפשר את הטכנולוגיה עבור כל אחת מתוך 7,000 שפות בעולם, עם פוטנציאל להפוך את חייהם.
מאז השקת כלי הבלשנות, Speechmatics עובדת על Omniglot, אתגר לבנות שפה ביום. בשבוע שעבר, החברה פגע ציון דרך גדול: הוא הוכה רשמית גוגל, עם 72 שפות ייחודיות בסך הכל.
המערכת משתמשת בלמידה של מכונה כדי להתאים נתוני אודיו עם עמית תעתיק. לאחר מכן הוא משתמש בדפוסים לשוניים משפות אחרות כדי להפוך את התהליך ליותר פשוט, לזהות את קווי הדמיון בין צלילים למבנים דקדוקיים ולהחיל אותם על שפות חדשות. התהליך הוא יעיל ביותר: כדוגמה, עבודה של Speechmatics על הינדי לקח רק שבועיים כדי להגיע 80 אחוז דיוק. כאשר המוצר הסופי נבדק נגד המאמצים של גוגל, זה עשה 23 אחוזים פחות טעויות.
הפוך דיבר עם Benedikt פון Thüngen, מנכ"ל Speechmatics, כדי לברר פרטים נוספים.
איך הצוות הראשון שלך להתחיל לעבוד על הפרויקט?
התחלנו את פרויקט אומניגלוט כאתגר בפני עצמנו - לראות כמה שפות נוכל לבנות בתוך שישה שבועות. הבנו זמן מה בחזרה כי הגישה המסורתית של בניית כל שפה בנפרד הוא כבר לא קיימא כאשר מסתכלים בקנה מידה בקצב מהיר. בהתחשב בכך, היינו צריכים לחשוב מחדש על מה היא שפה, איך היא מובנית ומה הדמיון בין שפות שונות. מצאנו דרך להשתמש באותיות משותפות אלו כדי לזהות דפוסים ולסייע למסגרת AI המופעלת על ידי AI, בלשנית אוטומטית (AL), לבנות שפות מהר יותר מאשר אי פעם - 46 תוך שישה שבועות ליתר דיוק, או על שפה אחת ביום במשך שישה שבועות !
במה זה שונה ממאמציה של Google?
הגישה שלנו לבניית שפה היא אחד ההיבטים העיקריים שמבדילים אותנו מ- Google. למרות שאנו מניחים שהם בונים את השפות שלהם בנפרד (או על ידי מה שאנחנו מכנים 'כוח הזרוע'), אנו משתמשים בכוחו של א. כדי לייעל ולהאיץ את תהליך בניית השפה. בנוסף, בעוד ששירותים אחרים כמו Google מתמקדים בבניית דיאלקטים ולא בשפות ייחודיות, אנו גאים לומר כי מאמצינו התמקדו בשפות ייחודיות מכל רחבי העולם, כולל תחומים שלא זכו בעבר לחברות טכנולוגיה גדולות.
מה הם חלק יישומים בעולם האמיתי עבור זה?
עכשיו יש לנו את הטכנולוגיה והידע כדי להפוך את השירות שלנו מרחיק לכת יותר מאי פעם ולהביא זיהוי דיבור אוטומטי (ASR) לכולם. זה רלוונטי במיוחד במדינות עם שיעורי קרוא וכתוב נמוכים, שם את היכולת להשתמש בעבר לא זמין דיבור לטקסט טכנולוגיה כדי לתקשר יכול לעשות את כל ההבדל עבור אנשים. מקרים אחרים בחיים האמיתיים שבהם טכנולוגיית ASR יכולה לעזור לנו לטפל בבעיות של נגישות - שמיעה ו / או לקויי ראייה מכל רחבי העולם יכולים כעת להשתמש במכשיר פשוט כמו טלפון כדי לקיים אינטראקציה עם הסובבים אותם.
האם זה לשפר את הדיוק של שפות מכוסה היטב כמו אנגלית?
ככל שאנו ממשיכים לפתח שפות נוספות, א. מסגרת תהפוך מיומנת יותר ויותר בזיהוי תכונות ודפוסים לשוניים. נשתמש בידע זה כדי להמשיך ולשכלל את בסיס השפה הנוכחי שלנו, כולל אנגלית.
האם זה יכול לשפר משהו כמו כלי התרגום בזמן אמת של Google Pixel Buds?
אנחנו בהחלט רואים פרויקטים כמו Omniglot עוזר לשפר את כלי התרגום בזמן אמת הולך קדימה. ככל שמשאבים רבים יותר מושקעים בהרחבת השפות והדיוק של שפות, נראה שיפור מתמיד במגזר שירותי התרגום.
האם זה עובד עם כל שפה, אפילו שפות בנויות כמו קלינגון?
עדיין לא ניסינו לבנות קונלנגים, אבל אנחנו לא רואים שום סיבה שהם לא יעבדו. מאחר ששפות אלה עדיין נאמרות על ידי בני אדם, הן גם עוקבות אחר כללים ואילוצים מבניים דומים לשפות יומיומיות (כגון מספר פונמות), דבר שייתן ל- AL מספיק נתונים לבנייה.
האם אתה פתוח המקור הפרויקט?
לא, אין לנו תוכניות לכך.
איך יעבוד הרישוי?
השפות המוצעות במסגרת פרויקט אומניגלוט הינן ללא תשלום ואינן ניתנות לשימוש למטרות מסחריות. ככזה, לא תהיה כל רישוי המצורפת להם בעתיד הנראה לעין.
מהם השלבים הבאים מכאן?
פרויקט אומניגלוט הוא רק ההתחלה עבורנו. אנחנו רוצים בסופו של דבר לבנות כל שפה בעולם, אז אנחנו נעבוד קשה לקראת מטרה זו!
Google Live לתמלל: היה לנו App להקשיב ג 'סטין ביבר ו Twista
גוגל פרסמה גירסת בטא מוגבלת של אפליקציה חייבת להורדה עבור עורכי דין, עיתונאים וסטודנטים יום שלישי. Live תמלול יכול בקפידה לוקח הערות של כל מילה המדוברת בשיחה, ראיון, או שיר ראפ. התוכנה תוכננה במיוחד כדי לסייע לחירש וקשה שמיעה, אבל יכול להיות ...
MIT בלשנים אומרים שפות אנושיות עשוי להיות צפוי
מתרגם אוניברסלי הוא פסגה מדעית סטנדרטית: דג הבבל קיים בצורות רבות (חושב: C-3P0, "Microsofts" של גיבסון ומטריצת הלינגואקוד). בלשנים IRL נחשב זמן רב את היצירה של סוג זה של הטכנולוגיה את הפאזל האולטימטיבי ואת סוג של endgame קוד פיצוח. עכשיו, חוקרים ב ...
10 שפות גוף מעודנות כדי להראות בטוחות יותר
הביטחון אף פעם לא יוצא מהאופנה וזה הכרטיס הזהוב שלך לסצנת ההיכרויות. למדו כיצד תוכלו להפריש ביטחון עם גופכם בעשרה צעדים פשוטים!