रोबोटिक्स

एआई-संचालित रोबोट मानवीय होंठ गति सीखते हैं

Published January 22, 2026

Updated March 30, 2026

David Hamilton

Uncanny Robots that Sing and Speak Like Humans 1

कोलंबिया इंजीनियरों ने एक ऐसा रोबोट बनाया है जो बोलते समय मानवीय होंठ गतियों की नकल करना और सीखना सक्षम है। उन्नत डिज़ाइन उन्नत रोबोटिक्स को एआई के साथ जोड़ता है, जिससे यह उपकरण—जिसका नाम एमो रखा गया है—मानवीय अभिव्यक्तियों का अवलोकन करके सीख सकता है और उचित समय पर मानवीय भावनाओं की नकल कर सकता है। यहां वह सब कुछ है जो आपको जानना आवश्यक है।

सारांश: कोलंबिया के इंजीनियरों ने एक एआई-संचालित ह्यूमनॉइड रोबोट विकसित किया है जो अवलोकन के माध्यम से यथार्थवादी मानवीय होंठ गतियां सीखने में सक्षम है, जिससे भाषण समकालिकरण और भावनात्मक अभिव्यक्ति में नाटकीय सुधार हुआ है।

ह्यूमनॉइड रोबोट अजीब घाटी (अनकैनी वैली) की भावना क्यों पैदा करते हैं

रोबोटिक्स के प्रारंभिक दिनों से ही, ह्यूमनॉइड रोबोट बनाने की खोज जारी है। यह कार्य कहने से करना कहीं अधिक कठिन है, क्योंकि रोबोटिक इंजीनियर लगातार उस दिशा में प्रगति करते रहे हैं, लेकिन एक ऐसा उपकरण बनाने के अपने लक्ष्य को कभी पूरी तरह से हासिल नहीं कर पाए हैं जो वास्तविक मानव जैसा दिखे और महसूस हो।

जो कोई भी सबसे बुनियादी ह्यूमनॉइड रोबोट्स के आसपास रहा है, वह उस बेचैनी की गवाही दे सकता है जो ये उपकरण मनुष्यों के रूप में घुलने-मिलने की उनकी क्षमता के कारण पैदा करते हैं। थोड़ी सी भी अशुद्धियाँ, जैसे अप्राकृतिक आंखों की गति या चेहरे के भाव, पर्यवेक्षकों में यह भावना पैदा कर सकती हैं।

अजीब घाटी (अनकैनी वैली)

जापानी रोबोटिस्ट मसाहिरो मोरी ने 1970 के दशक में इस घटना पर ध्यान दिया। अपने अब प्रसिद्ध “बुकिमी नो तानी गेंशो” (वैली ऑफ़ ईरिनेस) निबंध में, वह इस अवधारणा पर विस्तार से चर्चा करते हैं। पेपर बताता है कि कैसे ह्यूमनॉइड रोबोट सूक्ष्म दोषों के कारण हमेशा अपने पर्यवेक्षकों के साथ तीव्र असंबद्धता के बिंदु पर पहुंच जाते हैं।

1978 में, यह शब्द जसिया रीचार्ट की पुस्तक “रोबोट्स: फैक्ट, फिक्शन, एंड प्रिडिक्शन,” के माध्यम से पश्चिमी वैज्ञानिक हलकों में पहुंचा, जिसने इस शब्द का अनुवाद अपने अब लोकप्रिय प्रयोग, “अनकैनी वैली” में किया। यह कार्य मोरी की चर्चा पर आधारित है, जो बताता है कि सबसे छोटे अंतर भी पर्यवेक्षक के जुड़ाव में प्रतिकूल प्रतिक्रियाएं पैदा कर सकते हैं।

मानव चेहरा समीकरण का सबसे कठिन हिस्सा है

पिछले कुछ दशकों में, ह्यूमनॉइड रोबोट बनाने की दिशा में कई मील के पत्थर हासिल किए गए हैं। नई तकनीक, जैसे एलएलएम, इन उपकरणों के लिए प्राकृतिक भाषा का उपयोग करके संचार करना संभव बनाती है, जिससे अंतर को पाटने में मदद मिलती है। हालांकि, सबसे बड़े क्षेत्रों में से एक जिस पर अभी भी बहुत ध्यान देने की आवश्यकता है, वह है मानव चेहरा।

अनकैनी रोबोट जो मनुष्यों की तरह गाते और बोलते हैं

मानव चेहरा ऊतकों, तंत्रिकाओं और मांसपेशियों का एक जटिल मिश्रण है जो हजारों अलग-अलग भाव प्रदर्शित करने में सक्षम है, जिनमें से कई दूसरों तक भावनाएं संप्रेषित करने में मदद करते हैं। इस तरह, चेहरे को अंतिम संचार उपकरण के रूप में देखा जाता है।

रोबोटिक इंजीनियरों ने लंबे समय से मानवों की तरह काम करने वाले रोबोटिक चेहरे बनाने के महत्व और कठिनाई को पहचाना है। वर्षों की कड़ी मेहनत के माध्यम से, रोबोट मानव जैसे दिखने वाले चेहरे, त्वचा और भावों के साथ, हासिल करने में कामयाब रहे हैं। फिर भी, अरबों शोध के बावजूद, जुड़ाव अभी भी कमी है।

स्वाइप करके स्क्रॉल करें →

विशेषता	मानव चेहरा	पारंपरिक ह्यूमनॉइड रोबोट	कोलंबिया एआई लिप सिस्टम
मांसपेशी जटिलता	30+ चेहरे की मांसपेशियां निरंतर गति के साथ	सीमित मोटर्स कठोर बाधाओं के साथ	26 मोटर्स नरम सिलिकॉन संधि के साथ
होंठ-ऑडियो समकालिकरण	स्वाभाविक रूप से बोलते समय समकालिक	पूर्वनिर्धारित, अक्सर विलंबित गतियां	विजन-टू-एक्शन एआई के माध्यम से गतिशील रूप से सीखा गया
भावनात्मक अभिव्यक्ति	सूक्ष्म, संदर्भ-जागरूक सूक्ष्म अभिव्यक्तियां	न्यूनतम या अतिरंजित अभिव्यक्तियां	भावनात्मक रूप से सुसंगत होंठ और चेहरे के संकेत
अनुकूलनशीलता	अंतःक्रिया के माध्यम से लगातार सीखता है	स्थिर गति लाइब्रेरी	अवलोकनात्मक शिक्षा के माध्यम से स्व-सुधार
अजीब घाटी प्रभाव	कोई नहीं	उच्च पर्यवेक्षक असुविधा	अजीब प्रतिक्रिया में उल्लेखनीय कमी

संचार में होंठों का महत्व

ह्यूमनॉइड उपकरण बनाते समय रोबोटिस्ट लगातार एक महत्वपूर्ण मुद्दे से टकराते रहे हैं—होंठों की गति को फिर से बनाना लगभग असंभव है। आपके होंठ केवल आपकी आवाज़ की ध्वनि को निर्देशित करने और शब्दों का उच्चारण करने में मदद करने से अधिक काम करते हैं।

आपके होंठ वास्तव में सूक्ष्म स्तर पर भावना प्रदर्शित करते हैं, जो हज़ारों साल के विकास के माध्यम से, मानव संचार के लिए महत्वपूर्ण बन गए हैं। विशेष रूप से, वार्तालाप के दौरान आपकी होंठ गतियां आपके चेहरे की सबसे अधिक केंद्रित विशेषताओं में से एक हैं। परिणामस्वरूप, आपका मस्तिष्क माथे को चढ़ाने या आंख मारने जैसे अन्य कार्यों की तुलना में इन इशारों पर अधिक सोचने की शक्ति समर्पित करता है।

रोबोटों के होंठ अप्राकृतिक दिखते हैं

रोबोटों के लगभग मानव जैसा दिखने की क्षमता हासिल करने के बावजूद, वे अभी भी होंठ चेहरे की अभिव्यक्ति के मामले में पीछे हैं। दशकों के शोध ने साबित किया है कि यथार्थवादी व्यवहार बनाने के लिए आवश्यक उचित होंठ-ऑडियो समकालिकरण प्राप्त करने के लिए तकनीक मौजूद नहीं है। इस प्रकार, रोबोट हमेशा ऐसे दिखते हैं जैसे उनकी बातचीत डब की गई हो न कि बोली गई हो। यह डब्ड वॉइस प्रभाव इन उपकरणों को भद्दा और निर्जीव दिखने का कारण बनता है।

सूक्ष्मता से, मानव चेहरे भावनात्मक प्रतिक्रियाएं बनाने के लिए दर्जनों मांसपेशियों पर निर्भर करते हैं, और रोबोटिक होंठों में अभी तक इस स्तर की जटिलता नहीं है। इस स्तर की जटिलता प्राप्त करने के लिए एक नए प्रकार के डिजाइन की आवश्यकता होगी। इसके अतिरिक्त, रोबोटिक होंठ गतियों का बहुमत कुछ मुखर प्रसारण से मेल खाने के लिए निर्धारित पूर्वनिर्धारित गतियां हैं, न कि शब्द को स्वाभाविक रूप से बनाने के लिए डिज़ाइन की गई गतियां। चूंकि रोबोट वास्तव में अपने होंठों से ध्वनि उत्पन्न नहीं कर रहे हैं, इसलिए गतियां अप्राकृतिक और अजीब लगती हैं।

कोलंबिया अध्ययन: रोबोटों को यथार्थवादी होंठ गति सिखाना

शुक्र है, कोलंबिया इंजीनियरों की एक टीम ने अजीब घाटी को पार करने का तरीका खोज लिया होगा। “ह्यूमनॉइड फेस रोबोट्स के लिए यथार्थवादी लिप मोशन सीखना¹” अध्ययन एक नए प्रकार के रोबोटिक चेहरे का परिचय देता है जो मुख्य रूप से होंठ गति और समकालिकरण पर केंद्रित है।

विशेष हार्डवेयर

टीम को जिस मुख्य बाधा को दूर करना था, वह थी आज के रोबोटिक चेहरों की कठोरता। हालांकि कई नए डिज़ाइन हैं जो चेहरे में मोटर-संचालित प्रतिक्रियाएं प्रदान करते हैं, लेकिन कोई भी यथार्थवादी होंठ गतियों को सक्षम करने के लिए आवश्यक जटिलता का समर्थन नहीं कर सकता है।

इस सीमा को दूर करने के लिए, इंजीनियरों ने उद्देश्य-निर्मित सिलिकॉन होंठों का उपयोग किया जो अधिकतम अभिव्यक्ति प्रदान करने के लिए डिज़ाइन किए गए थे। फिर, उन्होंने

David Hamilton

डेविड हैमिल्टन एक पूर्णकालिक पत्रकार और एक लंबे समय से बिटकॉइनिस्ट हैं। वह ब्लॉकचेन पर लेख लिखने में माहिर हैं। उनके लेख कई बिटकॉइन प्रकाशनों में प्रकाशित हुए हैं, जिनमें Bitcoinlightning.com शामिल है।