Google का रीयल-टाइम हैंड ट्रैकिंग एल्गोरिथम, साइन लैंग्वेज रिकॉग्निशन को बेहतर बनाने के लिए स्मार्टफ़ोन का उपयोग करता है

तकनीक / Google का रीयल-टाइम हैंड ट्रैकिंग एल्गोरिथम, साइन लैंग्वेज रिकॉग्निशन को बेहतर बनाने के लिए स्मार्टफ़ोन का उपयोग करता है 2 मिनट पढ़ा वास्तविक समय हाथ ट्रैकिंग

वास्तविक समय हाथ ट्रैकिंग



सांकेतिक भाषा का उपयोग दुनिया भर के लाखों लोगों द्वारा किया जाता है। शोधकर्ता ऐसी तकनीकों के निर्माण के लिए काम कर रहे हैं जो इशारों को समझ सकें और स्वचालित रूप से उन्हें मानव-समझने योग्य भाषा में परिवर्तित कर सकें। हालांकि, इस तरह की परियोजनाओं को सटीकता के मामले में बड़ी सफलता नहीं मिली है।

Google ने हाल ही में एक एल्गोरिथ्म विकसित किया है जिसका उपयोग वास्तविक समय पर नज़र रखने के लिए किया जा सकता है। बुद्धिमान प्रणाली हाथ का नक्शा बनाने के लिए मशीन लर्निंग का लाभ उठाती है। कैमरा या स्मार्टफोन की मदद से मैप बनाया जाता है। हम इस तथ्य से इनकार नहीं कर सकते हैं कि अधिकांश सिस्टम त्वरित हाथ आंदोलनों को सही ढंग से पकड़ने में विफल होते हैं। Google ने इस शोध में इस समस्या को विशेष रूप से संबोधित किया है। दिलचस्प बात यह है कि उनके पास पहले से एल्गोरिदम द्वारा संसाधित किए गए डेटा की मात्रा सीमित है।



वास्तविक समय हाथ ट्रैकिंग कैसे काम करता है?

मौजूदा परियोजनाओं में से अधिकांश पूर्ण हाथ के आकार और स्थिति का पता लगाकर सांकेतिक भाषा का अनुवाद करते हैं। इस शोध के साथ। शोधकर्ताओं ने विभिन्न आकारों में आयताकार आकार को संभालने की आवश्यकता को समाप्त कर दिया है। Google की प्रणाली सिर्फ हथेली को पहचानती है जो आकार में चौकोर है। दूसरे, उंगलियों के लिए एक अलग विश्लेषण प्रक्रिया की जाती है।



गूगल

हाथ के इशारे



शोधकर्ताओं ने मशीन लर्निंग एल्गोरिदम को प्रशिक्षित करने के लिए लगभग 30.000 हाथ की छवियों का उपयोग किया। इन छवियों को विभिन्न हल्की परिस्थितियों और मुद्रा में कैप्चर किया गया था। प्रणाली तब हाथ की मुद्रा और एक गेंद या खुशी जैसे ज्ञात संस्थाओं की सूची के बीच तुलना करके इशारे का पता लगाती है। Google एक में जेस्चर पहचान का वर्णन करता है ब्लॉग पोस्ट ।

फिर हम पूर्व निर्धारित परिभाषित इशारों के एक सेट में उंगली के राज्यों का नक्शा बनाते हैं। यह सरल लेकिन प्रभावी तकनीक हमें उचित गुणवत्ता के साथ बुनियादी स्थिर इशारों का अनुमान लगाने की अनुमति देती है। मौजूदा पाइपलाइन कई संस्कृतियों से गिनती के इशारों का समर्थन करती है, उदा। अमेरिकी, यूरोपीय और चीनी, और 'थम्ब अप', बंद मुट्ठी, 'ओके', 'रॉक' और 'स्पाइडरमैन' सहित विभिन्न हाथ संकेत।

अंतिम हाथ-ट्रैकिंग एल्गोरिथ्म इसकी गति और सटीकता के संदर्भ में कला परिणामों की स्थिति पैदा करता है। एल्गोरिथ्म चलाने के लिए MediaPipe ढांचे का उपयोग करता है। यह तकनीक सांकेतिक भाषा डोमेन में एक प्रमुख उन्नति की तरह प्रतीत होती है। हालांकि अभी भी सुधार की बहुत गुंजाइश है। सांकेतिक भाषा की बेहतर समझ बनाना। बेहतर परिणाम प्राप्त करने के लिए चेहरे के भाव और दोनों हाथों का उपयोग करने के लिए कोई भी इस काम का विस्तार कर सकता है।



हालाँकि Google से कोई शब्द नहीं है, लेकिन एक संभावना है कि Google अपने उत्पादों में इसका उपयोग करने के लिए इस वास्तविक समय की ट्रैकिंग तकनीक को बेहतर बना सकता है। इस बीच, यदि आप कोड के साथ खेलना चाहते हैं, तो यह है GitHub पर पारंपरिक रूप से उपलब्ध है ।

टैग गूगल