मूल रूप से, ग्राफ क्लस्टरिंग और समुदाय का पता लगाने के तरीकों का लक्ष्य समूहों की गणना करना है। क्या उनके बीच कोई अंतर है?
मूल रूप से, ग्राफ क्लस्टरिंग और समुदाय का पता लगाने के तरीकों का लक्ष्य समूहों की गणना करना है। क्या उनके बीच कोई अंतर है?
जवाबों:
सं। ग्राफ में सामुदायिक पहचान से उदाहरण के लिए उद्धरण , हाल ही में और सैंटो फॉर्चुनटो द्वारा एक बहुत अच्छा सर्वेक्षण, "वास्तविक नेटवर्क की इस विशेषता को सामुदायिक संरचना (गिरवन और नया आदमी, 2002), या क्लस्टरिंग" कहा जाता है। बिंदु को और विस्तृत करने में बहुत कम बात है, वास्तव में। मुझे लगता है कि शुरुआती सामाजिक नेटवर्क विश्लेषण शैली के कागजात में नेटवर्क सरल (वजनदार नहीं) होने की प्रवृत्ति थी, लेकिन यह ऐसा कुछ नहीं है जिसे मैं बहस करना चाहता हूं, और न ही यह महत्वपूर्ण है। आपके प्रश्न का उत्तर नहीं है।
में नेटवर्क में पता लगाने समुदाय संरचनाएं एक विशिष्ट समस्या कंप्यूटर विज्ञान के संदर्भ में परिभाषित किया गया है, M.Newman परिभाषित ग्राफ क्लस्टरिंग।
आइए कुछ गणना पर विचार करें, जिन्हें कई सरल कार्यों में विभाजित किया जा सकता है। इन्हें हमारे नेटवर्क में नोड के रूप में दर्शाया गया है। लिंक परिचालन के बीच निर्भरता के अनुरूप हैं, अर्थात एक ऑपरेशन के परिणाम को दूसरे की आवश्यकता है। समांतर प्रसंस्करण उद्देश्यों के लिए समस्या कई प्रोसेसर पर संचालन को वितरित करने में शामिल है। दूसरे शब्दों में, हम प्रत्येक नोड (ऑपरेशन) को एक विशिष्ट वर्ग (प्रोसेसर) को सौंपना चाहते हैं, अर्थात हम ग्राफ को विभाजित करना चाहते हैं।
हालांकि तीन बाधाएं हैं। पहले समुदायों की पूर्वनिर्धारित संख्या प्राप्त करना है, क्योंकि प्रोसेसर की संख्या स्पष्ट रूप से अग्रिम में जानी जाती है। दूसरा एक संतुलित लोड प्राप्त करना है: हम चाहते हैं कि प्रत्येक प्रोसेसर लगभग समान संचालन की संख्या का प्रदर्शन करे। ग्राफ के संदर्भ में, हम चाहते हैं कि समुदायों में लगभग समान संख्या में नोड्स हों। तीसरा प्रोसेसर के बीच सबसे कम संभव संचार प्राप्त करना है, क्योंकि यह प्रक्रिया को धीमा कर देता है। इसलिए, ग्राफ के संदर्भ में, हम समुदायों के बीच लिंक की संख्या को कम करना चाहते हैं।
इसलिए, इस दृष्टिकोण से, ग्राफ की क्लस्टरिंग की तुलना में सामुदायिक पहचान को अधिक सामान्य समस्या माना जा सकता है। तीसरे बाधा को दोनों समस्याओं में लागू किया जाता है, लेकिन समुदाय की पहचान में समुदायों की संख्या और आकार को प्राथमिकता नहीं दी जाती है ।
ये दो अलग-अलग नाम वैज्ञानिकों के विभिन्न समुदायों द्वारा एक ही चीज को दिए गए हैं, इस पर निर्भर करता है कि कोई सामाजिक-नेटवर्क प्रेरणा पर जोर देना चाहेगा या नहीं। शायद कोई व्यक्ति अलग-अलग चीजों के रूप में क्लस्टरिंग और सामुदायिक पहचान को परिभाषित कर रहा है, लेकिन उनमें से एक का अध्ययन करने वाले अधिकांश लोग आपको यह नहीं बता पाएंगे कि वे दूसरे शब्द का उपयोग क्यों नहीं कर रहे हैं।
यदि एक बड़े नेटवर्क को दो टुकड़ों में विभाजित किया जाता है, तो आपको क्या गारंटी है कि यह दो भाग दो समुदाय हैं? दो समूहों में कम संबंध है इसका मतलब यह नहीं है कि प्रत्येक क्लस्टर में समान नोड्स हैं या नोड्स के समान कनेक्शन हैं (इसलिए समुदाय)। सामाजिक नेटवर्क ग्राफ के बारे में सोचो। निश्चित रूप से बहुत सारे समुदाय हैं। इसके अलावा एल्गोरिदम को क्लस्टर करके आप इसे दो टुकड़ों में बाँट सकते हैं। इस मामले में, क्या आप प्रत्येक टुकड़े को एक समुदाय कहेंगे। ? मेरा जवाब है नहीं। क्योंकि, दो क्लस्टर दो भौगोलिक क्षेत्र के लोग हो सकते हैं। और फिर वे निश्चित रूप से समुदाय नहीं हैं।
क्लस्टरिंग एल्गोरिदम केवल न्यूनतम कटौती की परवाह करता है, नोड समानता या कनेक्शन समानता या घने कनेक्शन के बारे में नहीं। क्लस्टरिंग एल्गोरिदम में प्लस, क्लस्टर की संख्या पूर्वनिर्धारित होनी चाहिए।
समुदाय का पता लगाने वाले एल्गोरिदम, वे घनत्व के बारे में परवाह करते हैं, वे नेटवर्क के सघन भाग को ढूंढते हैं और उन प्रकार के एल्गोरिदम (मैंने अब तक देखा है) को समुदायों की संख्या को पूर्वनिर्धारित करने की आवश्यकता नहीं है।
हालांकि, क्लस्टरिंग एल्गोरिदम का उपयोग समुदायों को खोजने के लिए किया जा सकता है, फिर, क्योंकि यह गारंटी नहीं देता है कि प्रत्येक क्लस्टर एक अच्छा सामुदायिक संरचना रखता है, प्रत्येक क्लस्टर की सावधानीपूर्वक जांच की जानी चाहिए।
"कोई क्लस्टरिंग को हल करने के लिए समुदाय की खोज को तुच्छ रूप से लागू नहीं कर सकता है और इसके विपरीत। उनकी समानता के बावजूद, दृष्टिकोण में महत्वपूर्ण डि approaches इरेक्शन हैं। सामुदायिक खोज स्पार्स कनेक्शन मानती है, जबकि क्लस्टरिंग घने डेटासेट के साथ काम कर सकती है, क्लस्टरिंग में हम आम तौर पर कई प्रकार के गुणों के साथ व्यवहार करते हैं; , जबकि समुदाय की खोज आम तौर पर एकल विशेषता प्रकार - किनारों - अक्सर बाइनरी के साथ होती है, बिना वजन वाले नेटवर्क के मामले में "अधिक जानकारी के लिए निम्नलिखित पेपर पढ़ें:" रिकार्डो गाईडॉट्टी और मिशेल कोस्किया द्वारा "सामुदायिक डिस्कवरी और क्लस्टरिंग के बीच समानता पर"।