Connect with us

רובוטיקה

רובוטים המונעים בינה מלאכותית לומדים תנועות שפתיים אנושיות

mm
Uncanny Robots that Sing and Speak Like Humans 1

מהנדסים מאוניברסיטת קולומביה יצרו רובוט המסוגל לחקות וללמוד תנועות שפתיים אנושיות בזמן דיבור. העיצוב המשודרג משלב רובוטיקה מתקדמת עם בינה מלאכותית, ומאפשר למכשיר – שנקרא Emo – ללמוד מתוך צפייה בהבעות אנושיות ולשכפל רגשות אנושיים בעת הצורך. הנה מה שצריך לדעת.

סיכום: מהנדסים מאוניברסיטת קולומביה פיתחו רובוט הומנואידי המונע בינה מלאכותית המסוגל ללמוד תנועות שפתיים אנושיות ריאליסטיות דרך תצפית, ומשפר באופן דרמטי את הסנכרון בדיבור ואת הביטוי הרגשי.

מדוע רובוטים הומנואידיים מפעילים את “עמק המוזרות”

מימיה הראשונים של הרובוטיקה, התקיים מסע ליצירת רובוטים הומנואידיים. משימה זו קלה הרבה יותר לאמירה מאשר לביצוע, שכן מהנדסי רובוטיקה התקדמו ללא הרף בכיוון זה, אך מעולם לא השיגו במלואם את מטרתם ליצור מכשיר שנראה ומרגיש כמו אדם אמיתי.
כל מי שהיה בסביבה של אפילו הרובוטים ההומנואידיים הבסיסיים ביותר יכול להעיד על תחושת החוסר נוחות שהמכשירים גורמים מבחינת יכולתם להשתלב כאנשים. חוסר הדיוקים הקלים ביותר, כמו תנועות עיניים או הבעות פנים לא טבעיות, יכולים ליצור תחושה זו בצופים.

עמק המוזרות

הרובוטיקאי היפני מסאהירו מורי שם לב לתופעה זו בשנות ה-70. במסתו המפורסמת כעת “Bukimi no Tani Gensho” (עמק המוזרות), הוא נכנס לפרטים על המושג. המאמר מתאר כיצד רובוטים הומנואידיים תמיד מגיעים לנקודת ניתוק חדה עם הצופים בהם בשל פגמים עדינים.
ב-1978, המונח חדר לחוגים המדעיים המערביים דרך ספרה של ג’סיה רייכארדט “Robots: Fact, Fiction, and Prediction,” שתרגם את המונח לשימושו הפופולרי כיום, “עמק המוזרות”. עבודה זו בונה על דיון של מורי, ומתארת כיצד ההבדלים הקטנים ביותר יכולים לגרום לתגובות שליליות בחיבור של הצופה.

פנים אנושיות הן החלק הקשה ביותר במשוואה

בעשורים האחרונים, הושגו כמה אבני דרך לקראת יצירת רובוטים הומנואידיים. טכנולוגיה חדשה, כמו מודלי שפה גדולים (LLMs), מאפשרת למכשירים אלה לתקשר באמצעות שפה טבעית, מה שעוזר לגשר על הפער. עם זאת, אחד התחומים הגדולים שעדיין דורשים תשומת לב רבה הוא הפנים האנושיות.
רובוטים מוזרים ששרים ומדברים כמו בני אדם
הפנים האנושיות הן תערובת מורכבת של רקמות, עצבים ושרירים המסוגלת להפגין אלפי הבעות שונות, שרבות מהן עוזרות להעביר רגשות לאחרים. בדרך זו, הפנים נתפסות כמכשיר התקשורת האולטימטיבי.
מהנדסי רובוטיקה מכירים זה זמן רב בחשיבות ובקושי ביצירת פנים רובוטיות הפועלות כמו בני אדם. לאחר שנים של עבודה קשה, רובוטים הצליחו להשיג פנים שנראות אנושיות, עם עור והבעות. עם זאת, למרות מיליארדי דולרים במחקר, החיבור עדיין חסר.
החלק כדי לגלול →

מאפיין פנים אנושיות רובוטים הומנואידיים מסורתיים מערכת השפתיים בבינה מלאכותית של קולומביה
מורכבות שרירים 30+ שרירי פנים עם תנועה רציפה מנועים מוגבלים עם אילוצים נוקשים 26 מנועים עם חיבור סיליקון רך
סנכרון שפתיים-שמע מסונכרן באופן טבעי בזמן דיבור תנועות מוגדרות מראש, לעיתים קרובות מושהות נלמד דינמית דרך בינה מלאכותית מראייה לפעולה
ביטוי רגשי מיקרו-הבעות עדינות ומודעות להקשר הבעות מינימליות או מוגזמות רמזים שפתיים ופנים קוהרנטיים רגשית
יכולת הסתגלות לומד באופן רציף דרך אינטראקציה ספריות תנועה סטטיות משתפר עצמאית דרך למידה תצפיתית
אפקט עמק המוזרות אין אי נוחות גבוהה של הצופה תגובת המוזרות מופחתת משמעותית

חשיבות השפתיים בתקשורת

רובוטיקאים נתקלו ללא הרף בבעיה משמעותית אחת בעת יצירת מכשירים הומנואידיים – זה כמעט בלתי אפשרי לשחזר תנועת שפתיים. השפתיים שלך עושות יותר מאשר לכוון את צליל קולך ולעזור לך לבטא מילים.
השפתיים שלך למעשה מפגינות רגש ברמה עדינה, אשר, דרך אלפי שנות אבולוציה, הפכה חיונית לתקשורת האנושית. באופן בולט, תנועות השפתיים שלך הן אחת התכונות הממוקדות ביותר בפניך במהלך שיחות. כתוצאה מכך, המוח שלך מקדיש יותר כוח חשיבה למחוות אלה מאשר לפעולות אחרות כמו כיווץ המצח או קריצה.

שפתיים של רובוטים נראות לא טבעיות

למרות שרובוטים רכשו את היכולת להיראות כמעט אנושיים, הם עדיין חסרים מבחינת הבעת פנים שפתית. עשורים של מחקר הוכיחו שהטכנולוגיה להשגת הסנכרון הנכון בין שפתיים לשמע הנדרש ליצירת התנהגות ריאליסטית אינה קיימת. ככאלה, רובוטים תמיד נראים כשלשיחות שלהם יש דיבוב ולא דיבור. אפקט הדיבוב הזה גורם למכשירים אלה להיראות מגושמים וחסרי חיים.
באופן חד, פנים אנושיות מסתמכות על עשרות שרירים כדי ליצור תגובות רגשיות, ולשפתיים רובוטיות עדיין אין רמת מורכבות זו. זה ידרוש סוג חדש של עיצוב כדי להשיג רמת מורכבות זו. בנוסף, רוב תנועות השפתיים הרובוטיות הן תנועות מוגדרות מראה המותאמות לשידורים קוליים מסוימים ולא תנועות שנועדו ליצור את המילה באופן טבעי. מכיוון שרובוטים לא מייצרים למעשה את הצליל עם שפתיהם, התנועות נתפסות כלא טבעיות ומוזרות.

מחקר קולומביה: ללמד רובוטים תנועת שפתיים ריאליסטית

למרבה המזל, צוות של מהנדסי קולומביה אולי הבין כיצד לחצות את עמק המוזרות. המחקר “Learning realistic lip motions for humanoid face robots¹” מציג סוג חדש של פנים רובוטיות המתמקד בעיקר בתנועת שפתיים וסנכרון.

חומרה מיוחדת

אחד המכשולים העיקריים שהצוות נאלץ להתגבר עליו היה הקשיחות של פני הרובוט של היום. בעוד שהיו עיצובים חדשים רבים המספקים תגובות מונעות מנוע בפנים, אף אחד מהם לא יכול לתמוך במורכבות הנדרשת כדי לאפשר תנועות שפתיים ריאליסטיות.
כדי להתגבר על מגבלה זו, המהנדסים השתמשו בשפתיים מסיליקון שנבנו במיוחד כדי לספק ביטוי מקסימלי. לאחר מכן, הם הטמיעו 26 מנועי פנים, טרנספורמר פעולות פנים ומקודד אוטומטי וריאציוני (VAE).

ראייה לפעולה (VLA)

בלב פריצת הדרך הטכנולוגית הזו נמצא מודל הבינה המלאכותית מראייה לפעולה. באמצעות מודל זה, פנים רובוטיות יכולות ליצור באופן אוטונומי שפתיים ריאליסטיות שאינן מסתמכות על הגדרות מכניות מוגדרות מראש לתנועה.
כדי ליצור את המודל, הצוות השתמש בשיטות למידה תצפיתית. סגנון תכנות זה מאפשר למכשיר להסיק דינמיקת שפתיים מדויקת בזמן אמת במהלך דיבור. ככזה, הצעד הראשון היה להזין את האלגוריתם לצינור למידה עצמית מפוקחת.
מקור - קולומביה
צעד זה דרש מהמהנדסים למקם את פני הרובוט מול מראה ולהורות לו ליצור אלפי פרצופים. פעולה זו אפשרה לאלגוריתם ללכוד את יכולות הבעת הפנים שלו. משם, הרובוט צפה לאחר מכן בשעות של תוכן YouTube.
השילוב של שמע ותנועת שפתיים נוטר בקפידה ושומש לתכנת את אלגוריתם הבינה המלאכותית השפתי של הרובוט. במשך כמה ימים, הוא למד בדיוק כיצד הפנים שלו אמורות להיראות מהבעה אנושית במקום להשתמש בפרמטרי קלט. מהנדסים הוסיפו אז שמע והחלו לבחון.

כיצד נבדקה בינת הסנכרון השפתי בין שפות שונות

הצוות בחן את התיאוריה שלהם ב-10 שפות והקשרים לשוניים שונים. המבחן השתמש בשפות חדשות לחלוטין למודל, כדי להבטיח שהוא יצטרך לחשב את ההבעה הפנים והתנועות השפתיות הנכונות לעומת שליפת מילים שאומנו בעבר. מעניין שהמבחן השתמש גם בהקשר ובשירים.

תוצאות מבחן הרובוטים המוזרים

תוצאות המבחן הראו סנכרון קוהרנטי חזותית בין שפתיים ושמע בכל התחומים. באופן בולט, הרובוט המונע אלגוריתם סיפק תנועת שפתיים ריאליסטית שתואמת במדויק מספר קליפים קוליים. באופן מרשים, הוא סנכרן בהצלחה את תנועות השפתיים שלו ב-10 שפות ואפילו שר שיר מאלבום הבכורה המופק בבינה מלאכותית שלו, hello world_.
באופן בולט, הצוות אכן מצא כמה מגבלות לטכנולוגיה. ראשית, הרובוט לא הצליח לשחזר בעקביות תנועות שפתיים קשות הקשורות למילים כמו “pop”. הוא גם התקשה עם מילים מכווצות כמו “whistle”. באופן חד, המהנדסים ציינו שאי השלמויות הקטנות האלה ייפתרו מעצמן ככל שהאלגוריתם ישתפר עם הזמן. תכונת הלמידה העצמית הזו היא ההיבט הטוב ביותר של האלגוריתם. הוא ישתפר ללא הרף כשילכוד יותר נתונים מבני אדם לאורך זמן, ויפתח את הדלת לאינטראקציות אדם-מכונה משמעותיות יותר בעתיד.

יתרונות מרכזיים של רובוטיקה הומנואידית ריאליסטית

יש כמה יתרונות שהטכנולוגיה הזו מביאה לשוק. ראשית, היא תאפשר לבני אדם ליצור קשר עמוק יותר עם מכונות. רוב האנשים לא מודעים לכמה תקשורת מתרחשת דרך הבעות פנים באופן תת-מודע.
מחקר זה פותח את הדלת לטכנולוגיית סנכרון שפתיים ולבינה מלאכותית שיחתית ליצירת חוויות דמויות אדם שיכולות לעזור להילחם במגפת הבדידות ועוד. באמצעות טכנולוגיה זו, רובוטים הומנואידיים יוכלו להתקרב עוד צעד אחד לחציית עמק המוזרות ולדחיפת הרובוטיקה למישור חדש.

יישומים בעולם האמיתי & ציר זמן

יש יישומים רבים לטכנולוגיה זו הנמתחים על פני מספר תעשיות. השימוש הברור בטכנולוגיה זו הוא לעזור לדחוף את טכנולוגיית הרובוטיקה ההומנואידית קדימה. היכולת להקרין פנים רכות וחמות על רובוטים קרים יכולה לעזור לדחוף את האימוץ. הנה כמה יישומים נוספים לחשוב עליהם.

טיפול בזקנים

בעוד שלא נחשבים לאנשים הטכנולוגיים ביותר, הקשישים החלו לאמץ רובוטיקה ברמה חדשה לחלוטין. שוק רובוטי הסיוע לטיפול בזקנים נמצא בעלייה, עם <a href="https://www.grandviewresearch.com/industry-analysis/el

דייוויד המילטון הוא עיתונאי במשרה מלאה וביטקויניסט ותיק. הוא מתמחה בכתיבת מאמרים על הבלוקצ'יין. מאמריו פורסמו במספר פרסומים של ביטקוין, כולל Bitcoinlightning.com

Advertiser Disclosure: Securities.io is committed to rigorous editorial standards to provide our readers with accurate reviews and ratings. We may receive compensation when you click on links to products we reviewed. ESMA: CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. Between 74-89% of retail investor accounts lose money when trading CFDs. You should consider whether you understand how CFDs work and whether you can afford to take the high risk of losing your money. Investment advice disclaimer: The information contained on this website is provided for educational purposes, and does not constitute investment advice. Trading Risk Disclaimer: There is a very high degree of risk involved in trading securities. Trading in any type of financial product including forex, CFDs, stocks, and cryptocurrencies. This risk is higher with Cryptocurrencies due to markets being decentralized and non-regulated. You should be aware that you may lose a significant portion of your portfolio. Securities.io is not a registered broker, analyst, or investment advisor.