मैं हाल ही में दीपवॉक और लाइन जैसे ग्राफ एम्बेडिंग के पार आया। हालाँकि, मेरे पास अभी भी स्पष्ट विचार नहीं है क्योंकि ग्राफ एम्बेडिंग का क्या मतलब है और इसका उपयोग कब करना है (एप्लिकेशन)? किसी भी सुझाव का स्वागत है!
मैं हाल ही में दीपवॉक और लाइन जैसे ग्राफ एम्बेडिंग के पार आया। हालाँकि, मेरे पास अभी भी स्पष्ट विचार नहीं है क्योंकि ग्राफ एम्बेडिंग का क्या मतलब है और इसका उपयोग कब करना है (एप्लिकेशन)? किसी भी सुझाव का स्वागत है!
जवाबों:
ग्राफ एम्बेडिंग प्रासंगिक नेटवर्क गुणों को संरक्षित करते हुए एक नेटवर्क से एक वेक्टर अंतरिक्ष में मैपिंग सीखता है।
वेक्टर रिक्त स्थान ग्राफ्स की तुलना में डेटा विज्ञान के लिए अधिक उत्तरदायी हैं। रेखांकन में किनारों और नोड्स होते हैं, उन नेटवर्क संबंधों में केवल गणित, सांख्यिकी और मशीन सीखने का एक विशिष्ट उपसमूह का उपयोग किया जा सकता है। वेक्टर रिक्त स्थान उन डोमेन से एक अमीर टूलसेट है। इसके अतिरिक्त, वेक्टर ग्राफ़ अक्सर समान ग्राफ़ संचालन की तुलना में सरल और तेज़ होते हैं।
एक उदाहरण निकटतम पड़ोसियों का पता लगा रहा है। आप एक ग्राफ में नोड से दूसरे नोड में "हॉप्स" कर सकते हैं। कई वास्तविक दुनिया के ग्राफ़ में, एक जोड़ी के बाद, बहुत कम सार्थक जानकारी होती है (जैसे, दोस्तों के दोस्तों की सिफारिशें)। हालांकि, वेक्टर रिक्त स्थान में, आप मात्रात्मक परिणाम प्राप्त करने के लिए दूरी मीट्रिक का उपयोग कर सकते हैं (जैसे, यूक्लिडियन दूरी या कोसाइन समानता)। यदि आपके पास एक सार्थक वेक्टर अंतरिक्ष में मात्रात्मक दूरी मीट्रिक है, तो निकटतम पड़ोसियों को ढूंढना सीधा है।
" ग्राफ एंबेडिंग तकनीक, अनुप्रयोग और प्रदर्शन: एक सर्वेक्षण " एक सिंहावलोकन लेख है जो अधिक विवरण में जाता है।
ग्राफ़ एंबेडिंग क्या हैं? "ग्राफ एंबेडिंग" मशीन सीखने का एक गर्म क्षेत्र है। यह मूल रूप से रेखांकन के "अव्यक्त वेक्टर प्रतिनिधित्व" का अर्थ है जो ग्राफ के टोपोलॉजी (बहुत मूल अर्थ में) को पकड़ता है। हम इस "वेक्टर प्रतिनिधित्व" को शीर्ष-शिखर संबंधों, धार-सूचना आदि पर विचार करके भी समृद्ध बना सकते हैं। ग्राफ़ में लगभग दो स्तर एम्बेडिंग हैं (बेशक हम कभी भी पूरे ग्राफ़ को तार्किक रूप से विभाजित करके अधिक स्तरों को परिभाषित कर सकते हैं। विभिन्न आकार के उपसमूह):
अनुप्रयोग - ध्यान से देखने पर, एम्बेडिंग "अव्यक्त" अभ्यावेदन हैं, जिसका अर्थ है कि यदि ग्राफ में एक | V | V | * - वी | आसन्न मैट्रिक्स जहां | V | = 1M, एल्गोरिथ्म में 1M * 1M नंबर का उपयोग या संसाधित करने के लिए इसकी मेहनत। तो, आयाम 'd' के अव्यक्त एम्बेडिंग, जहां d << | V |, आसन्न मैट्रिक्स बना देगा - V * डी और अपेक्षाकृत आसान उपयोग करने के लिए। एक और आवेदन हो सकता है - एक साधारण परिदृश्य पर विचार करें जहां हम उन लोगों को उत्पादों की सिफारिश करना चाहते हैं जिनके सामाजिक नेटवर्क में समान हित हैं। शीर्ष एम्बेडिंग प्राप्त करके (यहां इसका अर्थ है प्रत्येक व्यक्ति का वेक्टर प्रतिनिधित्व), हम इन वैक्टरों को प्लॉट करके समान खोज सकते हैं और यह अनुशंसा को आसान बनाता है। ये कुछ एप्लिकेशन हैं और कुछ अन्य हैं। आप एक अच्छे सर्वेक्षण पत्र - ग्राफ एंबेडिंग तकनीक, एक सर्वेक्षण का उल्लेख कर सकते हैं ।
यह सब कहां से आया? इस क्षेत्र में बहुत सारे काम हुए हैं और लगभग सभी प्राकृतिक भाषा प्रसंस्करण क्षेत्र - मिकोलोव द्वारा "वर्ड 2 वीईसी" में आधारभूत अनुसंधान से आता है। यदि आप ग्राफ एम्बेडिंग पर अनुसंधान के साथ शुरुआत करना चाहते हैं, तो मैं सबसे पहले यह समझने की सलाह दूंगा कि Word2Vec कैसे काम करता है। आप अच्छे स्पष्टीकरण पा सकते हैं - Word2Vec पैरामीटर सीखने की व्याख्या और स्टैनफोर्ड व्याख्यान । फिर आप उन कागजात पर कूद सकते हैं जिन्हें आपने सूचीबद्ध किया था। उन कार्यों को इस प्रकार वर्गीकृत किया जा सकता है:
"वर्टेक्स एंबेडिंग " के आधार पर काम करता है: - डीपवॉक , नोड 2 वीईसी , लाइन ।
"ग्राफ एंबेडिंग" पर आधारित कार्य: - डीप ग्राफ कर्नेल , सबग्राफ 2 वीईसी ।
पेपर में लेविन et.al द्वारा यादृच्छिक डॉट उत्पाद ग्राफ़ के एक सर्वव्यापी एम्बेडिंग के लिए एक केंद्रीय सीमा प्रमेय। कागज, एक विशिष्ट प्रकार का ग्राफ एम्बेडिंग (ओम्निबस एम्बेडिंग) ग्राफ एम्बेडिंग को एक कार्यप्रणाली के रूप में परिभाषित करता है "जिसमें एक ग्राफ के कोने को कम-आयामी यूक्लिडियन स्थान में वैक्टर को मैप किया जाता है।" अधिक जानकारी के लिए लिंक की जाँच करें।