رطم روبوتات تعمل بالذكاء الاصطناعي تتعلم حركة شفاه الإنسان – Securities.io
اتصل بنا للحصول على مزيد من المعلومات

الروبوتات

روبوتات تعمل بالذكاء الاصطناعي تتعلم حركة شفاه الإنسان

mm
روبوتات غريبة تغني وتتحدث كالبشر 1

ابتكر مهندسو جامعة كولومبيا روبوتًا قادرًا على محاكاة حركات الشفاه البشرية أثناء الكلام وتعلمها. يجمع التصميم المُطوّر بين تقنيات الروبوتات المتقدمة والذكاء الاصطناعي، مما يمكّن الجهاز - المسمى "إيمو" - من التعلم من خلال مراقبة تعابير الوجه البشرية ومحاكاة المشاعر البشرية عند الحاجة. إليكم ما تحتاجون معرفته.

ملخص: قام مهندسو جامعة كولومبيا بتطوير روبوت بشري يعمل بالذكاء الاصطناعي قادر على تعلم حركات الشفاه البشرية الواقعية من خلال الملاحظة، مما يحسن بشكل كبير من تزامن الكلام والتعبير العاطفي.

لماذا تُثير الروبوتات الشبيهة بالبشر ظاهرة وادي الغرابة؟

منذ بدايات علم الروبوتات، كان هناك سعيٌ حثيثٌ لابتكار روبوتاتٍ شبيهةٍ بالبشر. هذه المهمة أسهل قولاً من فعلاً، إذ أن مهندسي الروبوتات قد أحرزوا تقدماً مستمراً في هذا الاتجاه، لكنهم لم يحققوا هدفهم بالكامل المتمثل في ابتكار جهازٍ يشبه الإنسان الحقيقي في الشكل والملمس.

أي شخص تعامل مع أبسط الروبوتات الشبيهة بالبشر يمكنه أن يشهد على الشعور بعدم الارتياح الذي تسببه هذه الأجهزة فيما يتعلق بقدرتها على الاندماج مع البشر. فأدنى قدر من عدم الدقة، مثل حركات العين غير الطبيعية أو تعابير الوجه غير المألوفة، يمكن أن يخلق هذا الشعور لدى المراقبين.

وادي خارق

لاحظ عالم الروبوتات الياباني ماساهيرو موري هذه الظاهرة في سبعينيات القرن الماضي. في كتابه الشهير الآن "بوكيمي نو تاني جينشوفي مقالته "وادي الغرابة"، يتناول المؤلف المفهوم بالتفصيل. ويصف المقال كيف تصل الروبوتات الشبيهة بالبشر دائمًا إلى نقطة انفصال حاد عن مراقبيها بسبب عيوب دقيقة.

في عام 1978، شقّ المصطلح طريقه إلى الأوساط العلمية الغربية عبر كتاب جاسيا رايشاردت "الروبوتات: بين الحقيقة والخيال والتنبؤ،"الذي ترجم المصطلح إلى استخدامه الشائع الآن، "وادي الغرابة". يستند هذا العمل إلى مناقشة موري، ويصف كيف يمكن لأصغر الاختلافات أن تسبب ردود فعل سلبية في اتصال المراقب.

تُعدّ وجوه البشر أصعب جزء في المعادلة.

على مدى العقود القليلة الماضية، تحققت إنجازات عديدة في مجال تطوير الروبوتات الشبيهة بالبشر. وتتيح التقنيات الحديثة، مثل أنظمة التعلم الآلي، لهذه الأجهزة التواصل باستخدام اللغة الطبيعية، مما يساهم في تضييق الفجوة. ومع ذلك، لا يزال تصميم الوجه البشري من أهم المجالات التي تتطلب اهتماماً كبيراً.

روبوتات غريبة تغني وتتحدث كالبشر

يُعدّ الوجه البشري مزيجًا معقدًا من الأنسجة والأعصاب والعضلات، وهو قادر على إظهار آلاف التعابير المختلفة، والتي يُسهم الكثير منها في نقل المشاعر للآخرين. وبهذا المعنى، يُنظر إلى الوجه على أنه أداة التواصل الأمثل.

لطالما أدرك مهندسو الروبوتات أهمية وصعوبة ابتكار وجوه روبوتية تحاكي البشر في وظائفها. وعلى مرّ سنوات من العمل الدؤوب، تمكنت الروبوتات من الحصول على وجوه تُشبه البشر، ببشرة وتعبيرات وجه. ومع ذلك، ورغم مليارات الدولارات التي أُنفقت على الأبحاث، لا يزال هذا التشابه غير مكتمل.

مرر للتمرير →

الميزات الوجه الإنساني الروبوتات البشرية التقليدية نظام الشفاه بالذكاء الاصطناعي من كولومبيا
تعقيد العضلات أكثر من 30 عضلة وجهية بحركة مستمرة محركات محدودة ذات قيود صارمة 26 محركًا بمفاصل سيليكون ناعمة
مزامنة حركة الشفاه مع الصوت متزامن بشكل طبيعي أثناء الكلام حركات محددة مسبقاً، وغالباً ما تكون متأخرة يتم التعلم بشكل ديناميكي عبر الذكاء الاصطناعي من الرؤية إلى الفعل
التعبير العاطفي تعابير دقيقة وحساسة للسياق تعابير بسيطة أو مبالغ فيها إشارات الشفاه ووجه الوجه المتناسقة عاطفياً
القدرة على التكيف يتعلم باستمرار من خلال التفاعل مكتبات الحركة الثابتة التطوير الذاتي من خلال التعلم بالملاحظة
تأثير الوادي الغريب بدون سلوفان انزعاج كبير لدى المراقب انخفاض ملحوظ في الاستجابة الغريبة

أهمية الشفاه في التواصل

لطالما واجه علماء الروبوتات مشكلة كبيرة عند تصميم الأجهزة الشبيهة بالبشر، ألا وهي صعوبة محاكاة حركة الشفاه. فالشفاه لا تقتصر وظيفتها على توجيه الصوت ومساعدتك على نطق الكلمات فحسب.

تُعبّر شفتاك عن المشاعر بدقة متناهية، وهو ما أصبح، عبر آلاف السنين من التطور، عنصراً أساسياً في التواصل البشري. ومن الجدير بالذكر أن حركات شفتيك تُعدّ من أكثر سمات وجهك تركيزاً أثناء المحادثات. ونتيجةً لذلك، يُخصّص دماغك طاقةً ذهنيةً أكبر لهذه الإيماءات مقارنةً بأفعال أخرى كعبوس الجبهة أو الغمز.

شفاه الروبوتات تبدو غير طبيعية

على الرغم من اكتساب الروبوتات القدرة على محاكاة المظهر البشري تقريبًا، إلا أنها لا تزال تفتقر إلى تعابير الوجه الطبيعية. وقد أثبتت عقود من البحث أن التقنية اللازمة لتحقيق التزامن الصحيح بين حركة الشفاه والصوت، المطلوب لخلق سلوك واقعي، غير متوفرة حاليًا. ونتيجة لذلك، تبدو محادثات الروبوتات وكأنها مدبلجة وليست منطوقة. هذا التأثير الصوتي المدبلج يجعل هذه الأجهزة تبدو خرقاء وبلا حياة.

بذكاء، تعتمد تعابير الوجه البشري على عشرات العضلات للتعبير عن المشاعر، بينما لا تمتلك الشفاه الآلية هذا المستوى من التعقيد حتى الآن. يتطلب الوصول إلى هذا المستوى من التعقيد تصميمًا جديدًا. إضافةً إلى ذلك، فإن معظم حركات الشفاه الآلية هي حركات مُحددة مسبقًا لتتوافق مع بث صوتي معين، وليست حركات مصممة لنطق الكلمات بشكل طبيعي. ولأن الروبوتات لا تُصدر الصوت بشفاهها، تبدو حركاتها غير طبيعية ومُريبة.

دراسة كولومبيا: تعليم الروبوتات حركة الشفاه الواقعية

لحسن الحظ، ربما يكون فريق من مهندسي جامعة كولومبيا قد اكتشف كيفية تجاوز وادي الغرابة.تعلم حركات الشفاه الواقعية لروبوتات الوجه الشبيهة بالبشر¹"تقدم هذه الدراسة نوعًا جديدًا من الوجوه الروبوتية التي تركز بشكل أساسي على حركة الشفاه والتزامن."

الأجهزة المتخصصة

كان أحد أبرز التحديات التي واجهها الفريق هو صلابة وجوه الروبوتات الحالية. فرغم وجود العديد من التصاميم الجديدة التي توفر ردود فعل تعمل بمحركات في الوجه، إلا أن أياً منها لا يستطيع توفير التعقيد اللازم لتمكين حركات شفاه واقعية.

وللتغلب على هذا القيد، استخدم المهندسون شفاهًا مصنوعة من السيليكون خصيصًا لتوفير أقصى قدر من التعبير. ثم قاموا بتضمين 26 محركًا للوجه، ومحول حركة الوجه، وجهاز تشفير تلقائي متغير (VAE).

الرؤية إلى العمل (VLA)

يكمن جوهر هذا الإنجاز التكنولوجي في نموذج الذكاء الاصطناعي الذي يحوّل الرؤية إلى فعل. وباستخدام هذا النموذج، يستطيع وجه الروبوت أن يُنشئ شفاهًا واقعية بشكل مستقل، دون الاعتماد على إعدادات ميكانيكية مُسبقة للحركة.

لإنشاء النموذج، استخدم الفريق أساليب التعلم بالملاحظة. يُمكّن هذا النمط من البرمجة الجهاز من تحديد ديناميكيات الشفاه بدقة أثناء الكلام في الوقت الفعلي. ولذلك، كانت الخطوة الأولى هي إدخال الخوارزمية في مسار التعلم الذاتي.

المصدر - كولومبيا

تطلّبت هذه الخطوة من المهندسين وضع وجه الروبوت أمام مرآة وتوجيهه لإنشاء آلاف الوجوه. سمح هذا الإجراء للخوارزمية بالتقاط قدراته على التعبير عن تعابير الوجه. بعد ذلك، شاهد الروبوت ساعات من محتوى يوتيوب.

تم تتبع حركة الشفاه مع الصوت بدقة، واستُخدمت هذه البيانات لبرمجة خوارزمية الذكاء الاصطناعي لحركة الشفاه في الروبوت. على مدار بضعة أيام، تعلّم الروبوت بدقة كيف يجب أن يبدو وجهه من تعابير الوجه البشرية، بدلاً من استخدام معايير الإدخال. بعد ذلك، أضاف المهندسون الصوت وبدأوا الاختبار.

كيف تم اختبار تقنية الذكاء الاصطناعي لمزامنة الشفاه عبر اللغات

اختبر الفريق نظريتهم عبر عشر لغات وسياقات لغوية مختلفة. استخدم الاختبار لغات جديدة تمامًا على النموذج، مما يضمن قدرته على حساب تعابير الوجه وحركات الشفاه المناسبة بدلًا من استرجاع الكلمات التي تم تدريبه عليها مسبقًا. ومن المثير للاهتمام أن الاختبار استخدم أيضًا السياق والأغاني.

نتائج اختبار الروبوتات الغريبة

أظهرت نتائج الاختبار تزامنًا بصريًا متناسقًا بين حركة الشفاه والصوت في جميع الحالات. والجدير بالذكر أن الروبوت المدعوم بالخوارزمية قدّم حركة شفاه واقعية تتطابق بدقة مع العديد من المقاطع الصوتية. ومن المثير للإعجاب أنه نجح في مزامنة حركات شفاهه عبر 10 لغات، بل وغنّى أغنية من ألبومه الأول الذي تم إنشاؤه بواسطة الذكاء الاصطناعي. مرحبا بالعالم_.

لاحظ الفريق بعض القيود على هذه التقنية. فعلى سبيل المثال، لم يتمكن الروبوت من محاكاة حركات الشفاه القوية المصاحبة لكلمات مثل "بوب" بدقة. كما واجه صعوبة في نطق كلمات تتطلب تجعيد الشفاه مثل "صفير". لكن المهندسين أشاروا بذكاء إلى أن هذه العيوب البسيطة ستُحل تلقائيًا مع تحسن الخوارزمية بمرور الوقت. وتُعد خاصية التعلم الذاتي هذه أفضل ما يميز الخوارزمية، إذ ستتحسن باستمرار مع جمع المزيد من البيانات من البشر، مما يفتح المجال لتفاعلات أكثر جدوى بين الإنسان والآلة في المستقبل.

الفوائد الرئيسية للروبوتات البشرية الواقعية

تُقدّم هذه التقنية فوائد عديدة للسوق، منها أنها ستُمكّن البشر من بناء علاقة أعمق مع الآلات. يجهل معظم الناس مدى التواصل الذي يتم عبر تعابير الوجه بشكل لا واعٍ.

تفتح هذه الدراسة آفاقًا جديدة أمام تقنيات مزامنة الشفاه والذكاء الاصطناعي التفاعلي لخلق تجارب شبيهة بالبشر، مما قد يُسهم في مكافحة وباء الوحدة وغيره. وباستخدام هذه التقنية، ستتمكن الروبوتات الشبيهة بالبشر من الاقتراب خطوةً أخرى من تجاوز مرحلة "وادي الغرابة" ودفع علم الروبوتات إلى آفاق جديدة.

التطبيقات الواقعية والجدول الزمني

تتعدد تطبيقات هذه التقنية لتشمل قطاعات صناعية مختلفة. ويتمثل استخدامها الأبرز في تطوير تقنيات الروبوتات الشبيهة بالبشر. كما أن القدرة على عرض وجوه ناعمة ودافئة على الروبوتات الباردة قد تُسهم في زيادة الإقبال عليها. إليكم بعض التطبيقات الأخرى التي تستحق التفكير.

رعاية المسنين

على الرغم من أنهم لا يُعتبرون من أكثر الناس دراية بالتكنولوجيا، إلا أن كبار السن بدأوا في تبني الروبوتات على مستوى جديد تمامًا. يشهد سوق الروبوتات المساعدة في رعاية كبار السن نموًا متزايدًا، مع إحصائيات وتشير التقارير نفسها إلى أنها بلغت 3.38 مليار دولار في عام 2025. وتتوقع التقارير نفسها أن تتجاوز 9.85 مليار دولار بحلول عام 2033.

سيكون كبار السن أكثر استعدادًا للتفاعل مع الروبوتات وتقبّلها إذا لم تكن تبدو معقدة تقنيًا. لذا، قد يكون المساعد الروبوتي القادر على التواصل باستخدام الكلام وحركات الوجه الواقعية هو الخيار الأمثل. سيجد المرضى المسنون فيه وسيلة للتواصل إلى جانب المساعدة التي هم في أمسّ الحاجة إليها.

الترفيه

قد تكون صناعة الترفيه من أوائل القطاعات التي تتبنى هذه التقنية. يعتمد صناع الأفلام بشكل كبير على الروبوتات في صناعة الترفيه اليوم. فمن الروبوتات المتحركة، كتلك المستخدمة في مدن الملاهي مثل ديزني، إلى روبوتات التقاط الحركة المستخدمة في الأفلام الضخمة، ساهمت هذه الأجهزة في دفع صناعة الترفيه إلى الأمام.

يتجاوز حجم قطاع الروبوتات الترفيهية اليوم 4.72 مليار دولار أمريكي. ومن المتوقع أن ينمو هذا الرقم إلى 26.94 مليار دولار أمريكي بحلول عام 2034، مدفوعًا بالطلب المتزايد على شخصيات CGI الواقعية. وفي المستقبل القريب، قد تسد هذه التقنية هذا النقص، مما يُمكّن الممثلين من مشاركة وجوههم مع الشخصيات بطرق جديدة وأكثر مباشرة.

قطاع التعليم

يُعدّ القطاع التعليمي مجالاً آخر يُمكن أن تزدهر فيه هذه التقنية. ففيه، يُمكن إعداد هذه الأجهزة كمعلمين خصوصيين. وقد بدأ بالفعل بعضها التقارير وقد أظهرت الدراسات أن الطلاب حققوا زيادة بنسبة 30% في فهم الرياضيات باستخدام الدروس المُعدّلة بواسطة الروبوتات.

الجدول الزمني للتبني

من المتوقع أن تبدأ هذه التقنية بالانتشار في حياتنا اليومية خلال السنوات الخمس إلى العشر القادمة. تتواجد الروبوتات بالفعل في العديد من المصانع وأماكن العمل، ومن المتوقع أن يزداد هذا الاندماج. يدرك خبراء الروبوتات أن دمج هذا النوع من التكنولوجيا يُسهم في جعل أجهزتهم أكثر سهولة في الاستخدام.

باحثون رئيسيون في جامعة كولومبيا

تمت استضافة الدراسة من قبل مختبر الآلات الإبداعية في كولومبيا. تسرد الورقة يوهانج هو، وجيونج لين، وجودا ألين جولدفيدر، وفيليب إم. وايدر، وييفينج كاو، وستيفن تيان، ويونزي وانج، وجينجران وانج، ومينجمينج وانج، وجي زينج، وكاميرون ميلمان، وينكي وانج، وديلين تسينج، وبويوان تشين، وهود ليبسون كمساهمين.

ما الذي ينتظر الروبوتات الشبيهة بالبشر؟

سيركز الفريق الآن على تحسين الخوارزمية بشكل أكبر. ستتضمن هذه الخطوة المزيد من التفاعلات البشرية، وقد تتطور إلى وحدات متعددة قادرة على التعلم في الوقت الفعلي ومشاركة تلك البيانات مع نموذج مركزي.

الاستثمار في ابتكارات الروبوتات

يُعدّ قطاع الروبوتات قطاعًا سريع النمو، وقد شهد تطورًا ملحوظًا خلال السنوات الخمس الماضية. ساهم إدخال تقنيات جديدة، مثل وحدات الطباعة ثلاثية الأبعاد والطابعات ثلاثية الأبعاد، في دفع الابتكار إلى مستويات جديدة. للاطلاع على نظرة شاملة على فرص السوق الأوسع، اقرأ دليلنا حول الاستثمار في الذكاء الاصطناعي الفيزيائي والروبوتات الشبيهة بالبشر في عام 2026.

إليكم إحدى الشركات التي كانت في طليعة هذه الثورة.

Teradyne (36 مليار دولار)

Teradyne، Inc. (TER + 0.02٪) هي الشركة الأم لشركة يونيفرسال روبوتس (UR)، الرائدة في سوق الروبوتات التعاونية. ورغم أن شركة تيراداين لا تصنع وجوهاً بشرية، إلا أنها حالياً اللاعب الأبرز في تطبيق تقنية الذكاء الاصطناعي القائمة على "المراقبة والتعلم" الموصوفة في دراسة جامعة كولومبيا في المصانع.

والأهم من ذلك، أن شركة Teradyne قد أقامت شراكة استراتيجية مع شركة Nvidia (NVDA + 1.54٪) لدمج منصة "Isaac Manipulator". وهذا يسمح لروبوتات Teradyne باستخدام كاميرات الذكاء الاصطناعي "لرؤية" بيئتها وتعديل مسارها ديناميكيًا - تمامًا كما يتعلم روبوت Emo تعديل شفتيه - بدلاً من الاعتماد على كود جامد مكتوب مسبقًا.

Teradyne، Inc. (TER + 0.02٪)

الأداء والتقييم في عام 2026: تُعتبر شركة تيراداين على نطاق واسع من أسهم شركات الروبوتات الرائدة. وقد ارتفعت أسهمها بنسبة تقارب 50% في عام 2025، واستمرت في الارتفاع في أوائل عام 2026، حيث يتم تداولها بالقرب من نطاق 230 دولارًا.

تحذير للمستثمرين: رغم قوة الزخم، يشير المحللون إلى أن سهم TER يُتداول حاليًا بعلاوة تقييم عالية (أكثر من 70 ضعف نسبة السعر إلى الأرباح). يُعدّ هذا السهم رهانًا على أن دمج الذكاء الاصطناعي سيُحفّز دورة تحديث ضخمة للأجهزة في قطاع التصنيع، ولكنه ينطوي على مخاطر تقلبات كبيرة مقارنةً بأسهم الشركات الصناعية التقليدية مثل Deere أو Caterpillar.

آخر أخبار وأداء شركة تيراداين (TER)

الخاتمة

يُعدّ إدخال وجوه روبوتية واقعية خطوةً منطقيةً للغاية. فالأجهزة ذات التعلم الآلي قادرة الآن على محاكاة الكلام البشري، وعند دمجها مع تعابير وجه واقعية، ستوفر هذه الأجهزة مستوىً جديدًا من التدريب والتعلم والرعاية الصحية وغيرها. في الوقت الراهن، سيركز الفريق على معالجة أوجه القصور وإيجاد شركاء استراتيجيين وتأمين التمويل اللازم.

تعرف على المزيد من الاكتشافات الرائعة في مجال الروبوتات هنا.

مراجع حسابات

1. يوهانغ هو وآخرون.تعلم حركات الشفاه الواقعية لروبوتات الوجه الشبيهة بالبشر. علوم الروبوتات 11، eadx3017 (2026). DOI:10.1126/scirobotics.adx3017

ديفيد هاميلتون هو صحفي متفرغ ومهتم بالبيتكوين منذ فترة طويلة. وهو متخصص في كتابة المقالات حول blockchain. تم نشر مقالاته في العديد من منشورات البيتكوين بما في ذلك Bitcoinlightning.com

المعلن الإفصاح: تلتزم Securities.io بمعايير تحريرية صارمة لتزويد قرائنا بمراجعات وتقييمات دقيقة. قد نتلقى تعويضًا عند النقر فوق روابط المنتجات التي قمنا بمراجعتها.

ESMA: العقود مقابل الفروقات هي أدوات معقدة وتنطوي على مخاطر عالية لخسارة الأموال بسرعة بسبب الرافعة المالية. ما بين 74-89% من حسابات مستثمري التجزئة يخسرون الأموال عند تداول عقود الفروقات. يجب عليك أن تفكر فيما إذا كنت تفهم كيفية عمل عقود الفروقات وما إذا كان بإمكانك تحمل المخاطر العالية بخسارة أموالك.

إخلاء المسؤولية عن النصائح الاستثمارية: المعلومات الواردة في هذا الموقع مقدمة لأغراض تعليمية، ولا تشكل نصيحة استثمارية.

إخلاء المسؤولية عن مخاطر التداول: هناك درجة عالية جدًا من المخاطر التي ينطوي عليها تداول الأوراق المالية. التداول في أي نوع من المنتجات المالية بما في ذلك الفوركس وعقود الفروقات والأسهم والعملات المشفرة.

هذا الخطر أعلى مع العملات المشفرة نظرًا لكون الأسواق لا مركزية وغير منظمة. يجب أن تدرك أنك قد تفقد جزءًا كبيرًا من محفظتك الاستثمارية.

Securities.io ليس وسيطًا أو محللًا أو مستشارًا استثماريًا مسجلاً.