तीन नए उपयोग बहुभाषी मॉड्यूल TensorFlow के लिए आ रहे हैं

तकनीक / तीन नए उपयोग बहुभाषी मॉड्यूल TensorFlow के लिए आ रहे हैं 2 मिनट पढ़ा

Google Voice खोज



Google एआई अनुसंधान के अग्रदूतों में से एक है और उनकी परियोजनाओं की एक भीड़ ने सिर घुमा दिया है। AlphaZero Google की ओर से DeepMind टीम एआई अनुसंधान में एक सफलता थी, कार्यक्रम की क्षमता को खुद से (बिना मानव प्रशिक्षण और हस्तक्षेप के) सीखने के लिए। Google ने भी उत्कृष्ट कार्य किया है प्राकृतिक भाषा प्रसंस्करण कार्यक्रम (एनएलपी), जो मानव भाषण को समझने और संसाधित करने में Google सहायक की दक्षता के पीछे एक कारण है।

Google ने हाल ही में तीन नए जारी करने की घोषणा की है उपयोग बहुभाषी मॉड्यूल और शब्दार्थ समान पाठ को पुनः प्राप्त करने के लिए अधिक बहुभाषी मॉडल प्रदान करते हैं।



पहले दो मॉड्यूल शब्दार्थ समान पाठ को पुनर्प्राप्त करने के लिए बहुभाषी मॉडल प्रदान करते हैं, एक पुनर्प्राप्ति प्रदर्शन के लिए अनुकूलित और दूसरा गति और कम स्मृति उपयोग के लिए। तीसरा मॉडल के लिए विशेष है सवाल-जवाब पुनर्प्राप्ति सोलह भाषाओं में (USE-QA) और USE की एक पूरी तरह से नए अनुप्रयोग का प्रतिनिधित्व करता है। सभी तीन बहुभाषी मॉड्यूल एक का उपयोग कर प्रशिक्षित किया जाता है मल्टी-टास्क डुअल-एनकोडर फ्रेमवर्क अंग्रेजी के लिए मूल USE मॉडल के समान, तकनीकों में सुधार करते हुए हमने इसका उपयोग किया additive मार्जिन सॉफ्टमैक्स दृष्टिकोण के साथ दोहरे एनकोडर । वे न केवल अच्छे हस्तांतरण सीखने के प्रदर्शन को बनाए रखने के लिए डिज़ाइन किए गए हैं, बल्कि अच्छी तरह से एन शब्दार्थिक पुनर्प्राप्ति कार्य करने के लिए भी हैं।



सिस्टम में भाषा प्रसंस्करण एक लंबा रास्ता तय कर चुका है, जिसमें मूल सिंटैक्स ट्री पार्सिंग से लेकर बड़े वेक्टर एसोसिएशन मॉडल हैं। पाठ में संदर्भ को समझना एनएलपी क्षेत्र की सबसे बड़ी समस्याओं में से एक है और यूनिवर्सल सेंटेंस एनकोडर इसे उच्च आयामी वैक्टर में पाठ को परिवर्तित करके हल करता है, जिससे पाठ रैंकिंग और डिटोटेशन आसान हो जाता है।



यूटीई अंकन संरचना स्रोत - Google ब्लॉग

Google के अनुसार, ' तीन नए मॉड्यूल सभी शब्दार्थ पुनर्प्राप्ति वास्तुकला पर बनाए गए हैं, जो आम तौर पर अलग-अलग तंत्रिका नेटवर्क में प्रश्नों और उत्तरों के एन्कोडिंग को विभाजित करते हैं, जो कि मिलीसेकंड के भीतर अरबों संभावित उत्तरों के बीच खोज करना संभव बनाता है। “दूसरे शब्दों में, यह डेटा के बेहतर अनुक्रमण में मदद करता है।

' सभी तीन बहुभाषी मॉड्यूल एक का उपयोग कर प्रशिक्षित किया जाता है मल्टी-टास्क डुअल-एनकोडर फ्रेमवर्क अंग्रेजी के लिए मूल USE मॉडल के समान, तकनीकों में सुधार करते हुए हमने इसका उपयोग किया additive मार्जिन सॉफ्टमैक्स दृष्टिकोण के साथ दोहरे एनकोडर । वे न केवल अच्छे हस्तांतरण सीखने के प्रदर्शन को बनाए रखने के लिए डिज़ाइन किए गए हैं, बल्कि अच्छी तरह से एन शब्दार्थिक पुनर्प्राप्ति कार्य करने के लिए भी हैं । ' सॉफ्टमैक्स फ़ंक्शन का उपयोग अक्सर वैक्टर को घातांक करके और फिर हर तत्व को घातांक के योग द्वारा कम्प्यूटेशनल पावर को बचाने के लिए किया जाता है।



सिमेंटिक रिट्रीवल आर्किटेक्चर

“तीन नए मॉड्यूल सभी शब्दार्थ पुनर्प्राप्ति आर्किटेक्चर पर बनाए गए हैं, जो आम तौर पर प्रश्नों और उत्तरों के एन्कोडिंग को अलग-अलग न्यूरल नेटवर्क में विभाजित करते हैं, जिससे मिलीसेकंड के भीतर अरबों संभावित उत्तरों के बीच खोज संभव हो जाती है। कुशल शब्दार्थ पुनर्प्राप्ति के लिए दोहरे एन्कोडर का उपयोग करने की कुंजी सभी उम्मीदवारों के पूर्व-प्रत्याशित इनपुट प्रश्नों का उत्तर देना है और उन्हें एक सदिश डेटाबेस में संग्रहीत करना है जिसे हल करने के लिए अनुकूलित किया गया है। निकटतम पड़ोसी समस्या , जिससे बड़ी संख्या में उम्मीदवारों को अच्छे से जल्दी खोजा जा सके सटीक और याद '

आप इन मॉड्यूल को TensorFlow Hub से डाउनलोड कर सकते हैं। आगे पढ़ने के लिए GoogleAI का पूरा संदर्भ लें ब्लॉग पोस्ट ।

टैग गूगल