ग्राफ एम्बेडिंग क्या हैं?


13

मैं हाल ही में दीपवॉक और लाइन जैसे ग्राफ एम्बेडिंग के पार आया। हालाँकि, मेरे पास अभी भी स्पष्ट विचार नहीं है क्योंकि ग्राफ एम्बेडिंग का क्या मतलब है और इसका उपयोग कब करना है (एप्लिकेशन)? किसी भी सुझाव का स्वागत है!


1
एक ग्राफ एम्बेडिंग रेखांकन के लिए एक एम्बेडिंग है! तो यह एक ग्राफ लेता है और ग्राफ, किनारों, या कोने के लिए एम्बेडिंग रिटर्न देता है। एंबेडिंग्स समानता खोज को सक्षम करती हैं और आम तौर पर प्रतिनिधित्व प्रदान करके मशीन सीखने की सुविधा प्रदान करती हैं
Emre

@ आगे एम्बेड करने का क्या मतलब है? :)
वोल्का

1
जैसा कि एम्बेड का अर्थ है, किसी चीज़ पर चीज़ों को ठीक करना। ग्राफ एंबेडिंग एक नेटवर्क पर एक चित्र कहने के लिए सतह और ड्राइंग किनारों पर लंबवत फिक्सिंग की तरह है। तो उदाहरण ऐसे हो जैसे प्लैनर ग्राफ को किनारे से पार किए बिना सतह पर एम्बेड किया जा सकता है । वजन किनारों को सौंपा जा सकता है और उचित किनारे लंबाई अर्थात। @Emre उल्लेख समानता खोज आदि के रूप में हमें समझने / अनुमान करने में मदद करता है2D
किरीट गक

@KiriteeGak धन्यवाद :) उनकी असली दुनिया के अनुप्रयोग क्या हैं? वे कहते हैं कि उन्हें सिफारिश और सभी के लिए इस्तेमाल किया जा सकता है? पर कैसे?
वोल्का

1
Youtube वीडियो अनुशंसा को एक मॉडल के रूप में देखा जा सकता है जहां वीडियो आप वर्तमान में देख रहे हैं वह नोड है जिस पर आप हैं और अगले वीडियो जो आपकी अनुशंसा में हैं वे वही हैं जो आप के समान हैं जो कि समान उपयोगकर्ताओं ने अगले और कई बार देखे हैं। पाठ्यक्रम के और अधिक कारक जो एक बहुत बड़ा नेटवर्क है। यह पेपर आवेदन को समझने पर एक सरल अच्छा पढ़ा है।
किरीटी गाक

जवाबों:


19

ग्राफ एम्बेडिंग प्रासंगिक नेटवर्क गुणों को संरक्षित करते हुए एक नेटवर्क से एक वेक्टर अंतरिक्ष में मैपिंग सीखता है।

वेक्टर रिक्त स्थान ग्राफ्स की तुलना में डेटा विज्ञान के लिए अधिक उत्तरदायी हैं। रेखांकन में किनारों और नोड्स होते हैं, उन नेटवर्क संबंधों में केवल गणित, सांख्यिकी और मशीन सीखने का एक विशिष्ट उपसमूह का उपयोग किया जा सकता है। वेक्टर रिक्त स्थान उन डोमेन से एक अमीर टूलसेट है। इसके अतिरिक्त, वेक्टर ग्राफ़ अक्सर समान ग्राफ़ संचालन की तुलना में सरल और तेज़ होते हैं।

एक उदाहरण निकटतम पड़ोसियों का पता लगा रहा है। आप एक ग्राफ में नोड से दूसरे नोड में "हॉप्स" कर सकते हैं। कई वास्तविक दुनिया के ग्राफ़ में, एक जोड़ी के बाद, बहुत कम सार्थक जानकारी होती है (जैसे, दोस्तों के दोस्तों की सिफारिशें)। हालांकि, वेक्टर रिक्त स्थान में, आप मात्रात्मक परिणाम प्राप्त करने के लिए दूरी मीट्रिक का उपयोग कर सकते हैं (जैसे, यूक्लिडियन दूरी या कोसाइन समानता)। यदि आपके पास एक सार्थक वेक्टर अंतरिक्ष में मात्रात्मक दूरी मीट्रिक है, तो निकटतम पड़ोसियों को ढूंढना सीधा है।

" ग्राफ एंबेडिंग तकनीक, अनुप्रयोग और प्रदर्शन: एक सर्वेक्षण " एक सिंहावलोकन लेख है जो अधिक विवरण में जाता है।


26

ग्राफ़ एंबेडिंग क्या हैं? "ग्राफ एंबेडिंग" मशीन सीखने का एक गर्म क्षेत्र है। यह मूल रूप से रेखांकन के "अव्यक्त वेक्टर प्रतिनिधित्व" का अर्थ है जो ग्राफ के टोपोलॉजी (बहुत मूल अर्थ में) को पकड़ता है। हम इस "वेक्टर प्रतिनिधित्व" को शीर्ष-शिखर संबंधों, धार-सूचना आदि पर विचार करके भी समृद्ध बना सकते हैं। ग्राफ़ में लगभग दो स्तर एम्बेडिंग हैं (बेशक हम कभी भी पूरे ग्राफ़ को तार्किक रूप से विभाजित करके अधिक स्तरों को परिभाषित कर सकते हैं। विभिन्न आकार के उपसमूह):

  • वर्टेक्स एंबेडिंग - यहां आप दिए गए ग्राफ में हर वर्टेक्स का अव्यक्त वेक्टर प्रतिनिधित्व पाते हैं। फिर आप इन वैक्टरों को अंतरिक्ष में प्लॉट करके अलग-अलग कोने की तुलना कर सकते हैं और दिलचस्प रूप से "समान" वर्टीकल एक-दूसरे के करीब प्लॉट किए जाते हैं, जो भिन्न या कम संबंधित हैं। यह वही काम है जो पेरोज़ज़ी द्वारा "डीपवाक" में किया गया है।
  • ग्राफ एंबेडिंग - यहाँ आप पूरे ग्राफ का अव्यक्त वेक्टर प्रतिनिधित्व पाते हैं। उदाहरण के लिए, आपके पास रासायनिक यौगिकों का एक समूह है जिसके लिए आप जांचना चाहते हैं कि कौन से यौगिक एक दूसरे के समान हैं, समूह (क्लस्टर) आदि में कितने प्रकार के यौगिक हैं आप इन वैक्टर का उपयोग कर सकते हैं और उन्हें अंतरिक्ष में प्लॉट कर सकते हैं और उपरोक्त सभी जानकारी प्राप्त करें। यह वह काम है जो यानार्डग द्वारा "डीप ग्राफ कर्नेल" में किया जाता है।

अनुप्रयोग - ध्यान से देखने पर, एम्बेडिंग "अव्यक्त" अभ्यावेदन हैं, जिसका अर्थ है कि यदि ग्राफ में एक | V | V | * - वी | आसन्न मैट्रिक्स जहां | V | = 1M, एल्गोरिथ्म में 1M * 1M नंबर का उपयोग या संसाधित करने के लिए इसकी मेहनत। तो, आयाम 'd' के अव्यक्त एम्बेडिंग, जहां d << | V |, आसन्न मैट्रिक्स बना देगा - V * डी और अपेक्षाकृत आसान उपयोग करने के लिए। एक और आवेदन हो सकता है - एक साधारण परिदृश्य पर विचार करें जहां हम उन लोगों को उत्पादों की सिफारिश करना चाहते हैं जिनके सामाजिक नेटवर्क में समान हित हैं। शीर्ष एम्बेडिंग प्राप्त करके (यहां इसका अर्थ है प्रत्येक व्यक्ति का वेक्टर प्रतिनिधित्व), हम इन वैक्टरों को प्लॉट करके समान खोज सकते हैं और यह अनुशंसा को आसान बनाता है। ये कुछ एप्लिकेशन हैं और कुछ अन्य हैं। आप एक अच्छे सर्वेक्षण पत्र - ग्राफ एंबेडिंग तकनीक, एक सर्वेक्षण का उल्लेख कर सकते हैं ।

यह सब कहां से आया? इस क्षेत्र में बहुत सारे काम हुए हैं और लगभग सभी प्राकृतिक भाषा प्रसंस्करण क्षेत्र - मिकोलोव द्वारा "वर्ड 2 वीईसी" में आधारभूत अनुसंधान से आता है। यदि आप ग्राफ एम्बेडिंग पर अनुसंधान के साथ शुरुआत करना चाहते हैं, तो मैं सबसे पहले यह समझने की सलाह दूंगा कि Word2Vec कैसे काम करता है। आप अच्छे स्पष्टीकरण पा सकते हैं - Word2Vec पैरामीटर सीखने की व्याख्या और स्टैनफोर्ड व्याख्यान । फिर आप उन कागजात पर कूद सकते हैं जिन्हें आपने सूचीबद्ध किया था। उन कार्यों को इस प्रकार वर्गीकृत किया जा सकता है:


2
Wowww !! यह बिल्कुल सही जवाब है। बहुत बहुत धन्यवाद :) बहुत अच्छा किया :)
Volka

हाय मौसम जैन। क्या आप मुझे बता सकते हैं कि क्या मैं नेटवर्क में महत्वपूर्ण नोड्स की पहचान करने के लिए ग्राफ एम्बेडिंग का उपयोग कर सकता हूं?
Volka

हाय, वोल्का। इस प्रश्न का उत्तर देने के लिए, मुझे यह जानना होगा कि आप किस प्रकार के ग्राफ़ पर काम कर रहे हैं; क्या यह ट्विटर, फेसबुक, रेडिट या कुछ और है?
फ्लाइंगडोप

आपके जवाब के लिए धन्यवाद। मैं वास्तव में एक सामाजिक नेटवर्क में काम कर रहा हूं, जहां मैं सबसे ज्यादा सामाजिक लोगों की पहचान करना चाहता हूं :)
वोल्का डे

0

पेपर में लेविन et.al द्वारा यादृच्छिक डॉट उत्पाद ग्राफ़ के एक सर्वव्यापी एम्बेडिंग के लिए एक केंद्रीय सीमा प्रमेय। कागज, एक विशिष्ट प्रकार का ग्राफ एम्बेडिंग (ओम्निबस एम्बेडिंग) ग्राफ एम्बेडिंग को एक कार्यप्रणाली के रूप में परिभाषित करता है "जिसमें एक ग्राफ के कोने को कम-आयामी यूक्लिडियन स्थान में वैक्टर को मैप किया जाता है।" अधिक जानकारी के लिए लिंक की जाँच करें।


मंच पर आपका स्वागत है। यदि आप एक पेपर का उल्लेख करना चाहते हैं, तो कृपया इसका नाम पाठ के हिस्से के रूप में लिखें (क्योंकि लिंक तोड़े जा सकते हैं)।
Mark.F
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.