रोबोटिक्स
एआई-संचालित रोबोट मानवीय होंठ गति सीखते हैं

कोलंबिया इंजीनियरों ने एक ऐसा रोबोट बनाया है जो बोलते समय मानवीय होंठ गतियों की नकल करना और सीखना सक्षम है। उन्नत डिज़ाइन उन्नत रोबोटिक्स को एआई के साथ जोड़ता है, जिससे यह उपकरण—जिसका नाम एमो रखा गया है—मानवीय अभिव्यक्तियों का अवलोकन करके सीख सकता है और उचित समय पर मानवीय भावनाओं की नकल कर सकता है। यहां वह सब कुछ है जो आपको जानना आवश्यक है।
ह्यूमनॉइड रोबोट अजीब घाटी (अनकैनी वैली) की भावना क्यों पैदा करते हैं
रोबोटिक्स के प्रारंभिक दिनों से ही, ह्यूमनॉइड रोबोट बनाने की खोज जारी है। यह कार्य कहने से करना कहीं अधिक कठिन है, क्योंकि रोबोटिक इंजीनियर लगातार उस दिशा में प्रगति करते रहे हैं, लेकिन एक ऐसा उपकरण बनाने के अपने लक्ष्य को कभी पूरी तरह से हासिल नहीं कर पाए हैं जो वास्तविक मानव जैसा दिखे और महसूस हो।
जो कोई भी सबसे बुनियादी ह्यूमनॉइड रोबोट्स के आसपास रहा है, वह उस बेचैनी की गवाही दे सकता है जो ये उपकरण मनुष्यों के रूप में घुलने-मिलने की उनकी क्षमता के कारण पैदा करते हैं। थोड़ी सी भी अशुद्धियाँ, जैसे अप्राकृतिक आंखों की गति या चेहरे के भाव, पर्यवेक्षकों में यह भावना पैदा कर सकती हैं।
अजीब घाटी (अनकैनी वैली)
जापानी रोबोटिस्ट मसाहिरो मोरी ने 1970 के दशक में इस घटना पर ध्यान दिया। अपने अब प्रसिद्ध “बुकिमी नो तानी गेंशो” (वैली ऑफ़ ईरिनेस) निबंध में, वह इस अवधारणा पर विस्तार से चर्चा करते हैं। पेपर बताता है कि कैसे ह्यूमनॉइड रोबोट सूक्ष्म दोषों के कारण हमेशा अपने पर्यवेक्षकों के साथ तीव्र असंबद्धता के बिंदु पर पहुंच जाते हैं।
1978 में, यह शब्द जसिया रीचार्ट की पुस्तक “रोबोट्स: फैक्ट, फिक्शन, एंड प्रिडिक्शन,” के माध्यम से पश्चिमी वैज्ञानिक हलकों में पहुंचा, जिसने इस शब्द का अनुवाद अपने अब लोकप्रिय प्रयोग, “अनकैनी वैली” में किया। यह कार्य मोरी की चर्चा पर आधारित है, जो बताता है कि सबसे छोटे अंतर भी पर्यवेक्षक के जुड़ाव में प्रतिकूल प्रतिक्रियाएं पैदा कर सकते हैं।
मानव चेहरा समीकरण का सबसे कठिन हिस्सा है
पिछले कुछ दशकों में, ह्यूमनॉइड रोबोट बनाने की दिशा में कई मील के पत्थर हासिल किए गए हैं। नई तकनीक, जैसे एलएलएम, इन उपकरणों के लिए प्राकृतिक भाषा का उपयोग करके संचार करना संभव बनाती है, जिससे अंतर को पाटने में मदद मिलती है। हालांकि, सबसे बड़े क्षेत्रों में से एक जिस पर अभी भी बहुत ध्यान देने की आवश्यकता है, वह है मानव चेहरा।

मानव चेहरा ऊतकों, तंत्रिकाओं और मांसपेशियों का एक जटिल मिश्रण है जो हजारों अलग-अलग भाव प्रदर्शित करने में सक्षम है, जिनमें से कई दूसरों तक भावनाएं संप्रेषित करने में मदद करते हैं। इस तरह, चेहरे को अंतिम संचार उपकरण के रूप में देखा जाता है।
रोबोटिक इंजीनियरों ने लंबे समय से मानवों की तरह काम करने वाले रोबोटिक चेहरे बनाने के महत्व और कठिनाई को पहचाना है। वर्षों की कड़ी मेहनत के माध्यम से, रोबोट मानव जैसे दिखने वाले चेहरे, त्वचा और भावों के साथ, हासिल करने में कामयाब रहे हैं। फिर भी, अरबों शोध के बावजूद, जुड़ाव अभी भी कमी है।
स्वाइप करके स्क्रॉल करें →
| विशेषता | मानव चेहरा | पारंपरिक ह्यूमनॉइड रोबोट | कोलंबिया एआई लिप सिस्टम |
|---|---|---|---|
| मांसपेशी जटिलता | 30+ चेहरे की मांसपेशियां निरंतर गति के साथ | सीमित मोटर्स कठोर बाधाओं के साथ | 26 मोटर्स नरम सिलिकॉन संधि के साथ |
| होंठ-ऑडियो समकालिकरण | स्वाभाविक रूप से बोलते समय समकालिक | पूर्वनिर्धारित, अक्सर विलंबित गतियां | विजन-टू-एक्शन एआई के माध्यम से गतिशील रूप से सीखा गया |
| भावनात्मक अभिव्यक्ति | सूक्ष्म, संदर्भ-जागरूक सूक्ष्म अभिव्यक्तियां | न्यूनतम या अतिरंजित अभिव्यक्तियां | भावनात्मक रूप से सुसंगत होंठ और चेहरे के संकेत |
| अनुकूलनशीलता | अंतःक्रिया के माध्यम से लगातार सीखता है | स्थिर गति लाइब्रेरी | अवलोकनात्मक शिक्षा के माध्यम से स्व-सुधार |
| अजीब घाटी प्रभाव | कोई नहीं | उच्च पर्यवेक्षक असुविधा | अजीब प्रतिक्रिया में उल्लेखनीय कमी |
संचार में होंठों का महत्व
ह्यूमनॉइड उपकरण बनाते समय रोबोटिस्ट लगातार एक महत्वपूर्ण मुद्दे से टकराते रहे हैं—होंठों की गति को फिर से बनाना लगभग असंभव है। आपके होंठ केवल आपकी आवाज़ की ध्वनि को निर्देशित करने और शब्दों का उच्चारण करने में मदद करने से अधिक काम करते हैं।
आपके होंठ वास्तव में सूक्ष्म स्तर पर भावना प्रदर्शित करते हैं, जो हज़ारों साल के विकास के माध्यम से, मानव संचार के लिए महत्वपूर्ण बन गए हैं। विशेष रूप से, वार्तालाप के दौरान आपकी होंठ गतियां आपके चेहरे की सबसे अधिक केंद्रित विशेषताओं में से एक हैं। परिणामस्वरूप, आपका मस्तिष्क माथे को चढ़ाने या आंख मारने जैसे अन्य कार्यों की तुलना में इन इशारों पर अधिक सोचने की शक्ति समर्पित करता है।
रोबोटों के होंठ अप्राकृतिक दिखते हैं
रोबोटों के लगभग मानव जैसा दिखने की क्षमता हासिल करने के बावजूद, वे अभी भी होंठ चेहरे की अभिव्यक्ति के मामले में पीछे हैं। दशकों के शोध ने साबित किया है कि यथार्थवादी व्यवहार बनाने के लिए आवश्यक उचित होंठ-ऑडियो समकालिकरण प्राप्त करने के लिए तकनीक मौजूद नहीं है। इस प्रकार, रोबोट हमेशा ऐसे दिखते हैं जैसे उनकी बातचीत डब की गई हो न कि बोली गई हो। यह डब्ड वॉइस प्रभाव इन उपकरणों को भद्दा और निर्जीव दिखने का कारण बनता है।
सूक्ष्मता से, मानव चेहरे भावनात्मक प्रतिक्रियाएं बनाने के लिए दर्जनों मांसपेशियों पर निर्भर करते हैं, और रोबोटिक होंठों में अभी तक इस स्तर की जटिलता नहीं है। इस स्तर की जटिलता प्राप्त करने के लिए एक नए प्रकार के डिजाइन की आवश्यकता होगी। इसके अतिरिक्त, रोबोटिक होंठ गतियों का बहुमत कुछ मुखर प्रसारण से मेल खाने के लिए निर्धारित पूर्वनिर्धारित गतियां हैं, न कि शब्द को स्वाभाविक रूप से बनाने के लिए डिज़ाइन की गई गतियां। चूंकि रोबोट वास्तव में अपने होंठों से ध्वनि उत्पन्न नहीं कर रहे हैं, इसलिए गतियां अप्राकृतिक और अजीब लगती हैं।
कोलंबिया अध्ययन: रोबोटों को यथार्थवादी होंठ गति सिखाना
शुक्र है, कोलंबिया इंजीनियरों की एक टीम ने अजीब घाटी को पार करने का तरीका खोज लिया होगा। “ह्यूमनॉइड फेस रोबोट्स के लिए यथार्थवादी लिप मोशन सीखना¹” अध्ययन एक नए प्रकार के रोबोटिक चेहरे का परिचय देता है जो मुख्य रूप से होंठ गति और समकालिकरण पर केंद्रित है।
विशेष हार्डवेयर
टीम को जिस मुख्य बाधा को दूर करना था, वह थी आज के रोबोटिक चेहरों की कठोरता। हालांकि कई नए डिज़ाइन हैं जो चेहरे में मोटर-संचालित प्रतिक्रियाएं प्रदान करते हैं, लेकिन कोई भी यथार्थवादी होंठ गतियों को सक्षम करने के लिए आवश्यक जटिलता का समर्थन नहीं कर सकता है।
इस सीमा को दूर करने के लिए, इंजीनियरों ने उद्देश्य-निर्मित सिलिकॉन होंठों का उपयोग किया जो अधिकतम अभिव्यक्ति प्रदान करने के लिए डिज़ाइन किए गए थे। फिर, उन्होंने












