इसका क्या मतलब है जब एक वास्तविक दुनिया नेटवर्क / ग्राफ में सभी किनारों को सांख्यिकीय रूप से सिर्फ मौका द्वारा होने की संभावना है?


11

मैं इस पत्र में उल्लिखित रीढ़ नेटवर्क निष्कर्षण विधि का उपयोग कर रहा हूं: http://www.pnas.org/content/106/16/6483.br

मूल रूप से, लेखक आंकड़ों के आधार पर एक विधि प्रस्तावित करते हैं, जो ग्राफ में प्रत्येक किनारे के लिए एक संभावना पैदा करता है, कि किनारे सिर्फ संयोग से हो सकता है। मैं 0.05 के विशिष्ट सांख्यिकीय महत्व कटऑफ का उपयोग करता हूं।

मैं कई वास्तविक दुनिया नेटवर्क के लिए इस पद्धति को लागू कर रहा हूं, और दिलचस्प रूप से कुछ नेटवर्क महत्वपूर्ण के रूप में बिना किनारों के समाप्त होते हैं। मैं यह समझने की कोशिश कर रहा हूं कि यह नेटवर्क के लिए क्या है। केवल दूसरी बार जब मैंने किसी नेटवर्क में विधि लागू की है और कोई किनारा नहीं था, तो उतना ही महत्वपूर्ण था जब मैंने यादृच्छिक नेटवर्क के लिए विधि लागू की थी जो मैंने उत्पन्न की थी, जो कि वास्तव में हम उम्मीद करेंगे।

एक उदाहरण के रूप में वास्तविक विश्व नेटवर्क, आपने पिछले 25 वर्षों में अमेरिकी सीनेट के ध्रुवीकरण को दर्शाने वाले द इकोनोमिस्ट पर हाल के नेटवर्क दृश्य देखे होंगे: http://www.economist.com/news/united-states/21591190 -संयुक्त राज्यों-अमीबा । मैंने उन नेटवर्कों पर बैकबोन नेटवर्क निष्कर्षण विधि लागू की और कोई किनारा महत्वपूर्ण नहीं था। भले ही कच्चे किनारों जाहिरा तौर पर तरजीही लगाव और क्लस्टरिंग दिखाते हैं, क्या यह सिर्फ संयोग से है? क्या सीनेट मतदान नेटवर्क नेटवर्क अनिवार्य रूप से यादृच्छिक है?

जवाबों:


6

रीढ़ की हड्डी के तरीकों के पीछे अशक्त परिकल्पना है

[] एक डिग्री के एक निश्चित नोड के कनेक्शन के अनुरूप सामान्यीकृत वज़न एक समान वितरण से एक यादृच्छिक असाइनमेंट द्वारा उत्पादित किया जाता है।

यदि कोई भी "महत्वपूर्ण" किनारा नहीं है, तो पूरी परिकल्पना के लिए अशक्त परिकल्पना निहित है, अर्थात, संबंधों को भेजने और प्राप्त करने के लिए नोड प्रोपेंसिटी से बढ़त भार होता है।

आपके द्वारा विश्लेषण किए जा रहे रिश्तों के आधार पर, रीढ़ की हड्डी विधि उपयुक्त नहीं हो सकती है। यह विधि उन नेटवर्कों के लिए सबसे अच्छा काम करती है जो वैचारिक रूप से एक-मोड भारित नेटवर्क हैं। दो-मोड नेटवर्क को एक भारित वन-मोड नेटवर्क के रूप में पेश किया जा सकता है, लेकिन अक्सर ऐसा करने का कोई मतलब नहीं होता है।

इकोनॉमिस्ट में अपने उदाहरण पर आकर्षित, यह साझा वोट की संख्या से भारित एक-मोड नेटवर्क के रूप में सीनेट मतदान का विश्लेषण करने के लिए कोई मतलब नहीं है। सीनेट में मतदान एक हस्ताक्षरित, दो-मोड संबंध है। सीनेटरों (i) के विधान (j) के टुकड़ों से संबंध हैं और वे या तो मतदान (0) से बचते हैं या वे (+1) या (-1) विधान के लिए मतदान करते हैं। नेटवर्क को एक भारित एक-मोड समझौते नेटवर्क में बदलने के लिए, फिर उस पर एक बैकबोन विश्लेषण करना डेटा की गंभीर कमी होगी। कानून के कुछ टुकड़े अधिक राजनीतिक रूप से विभाजनकारी हैं और कुछ में दूसरों की तुलना में अधिक वोट हैं - रीढ़ के तरीके इन तंत्रों पर कब्जा नहीं करेंगे।

आप रीढ़ की हड्डी के तरीकों के बजाय सशर्त वर्दी ग्राफ (सीयूजी) परीक्षणों पर विचार करना चाह सकते हैं। इन परीक्षणों के पीछे का विचार यह निर्धारित करना है कि संयोग से कुछ ग्राफ-स्तरीय गुण (जैसे, क्लस्टरिंग, औसत पथ लंबाई, केंद्रीकरण, होमोफिली) परिणाम हैं। प्रक्रिया इस प्रकार है:

  1. मनाया ग्राफ से माप ले लो
  2. एक यादृच्छिक ग्राफ उत्पन्न करें जो देखे गए ग्राफ के कुछ गुणों के लिए नियंत्रित करता है (जैसे, आकार, किनारों की संख्या, डिग्री वितरण, आदि)
  3. यादृच्छिक ग्राफ से माप
  4. शून्य वितरण का उत्पादन करने के लिए चरण 2 और 3 को कई बार दोहराएं (जैसे, 1000)
  5. मनाया माप की तुलना अशक्त वितरण से करें

दो-मोड नेटवर्क के लिए, यह मनाया ग्राफ (आर में दोनों tnet और स्टेटनेट दोनों दो-मोड नेटवर्क की अनुमति के लिए दिनचर्या है) की अनुमति देकर यादृच्छिक ग्राफ बनाने के लिए समझ में आता है। यदि माप च के लिए एक-मोड नेटवर्क की आवश्यकता होती है, तो रैंडमाइजेशन प्रक्रिया को एक-मोड नेटवर्क के रूप में पेश करने से पहले दो-मोड नेटवर्क पर किया जाना चाहिए।


4

आपके द्वारा उद्धृत लेख में, लेखक मानते हैं कि, एक जटिल नेटवर्क में, "[] नोड्स [मॉडल किए गए] सिस्टम के तत्वों का प्रतिनिधित्व करते हैं और भारित किनारे एक इंटरैक्शन की उपस्थिति और इसकी सापेक्ष शक्ति की पहचान करते हैं " (मेरे द्वारा जोर दिया गया) ।

आपके द्वारा अध्ययन किए जाने वाले नेटवर्क में, यदि मैं इकोनॉमिस्ट लेख को सही ढंग से समझता हूं, तो 2 सीनेटरों के बीच एक लिंक है यदि वे कम से कम 100 बार इसी तरह मतदान करते हैं। इसलिए, लिंक बातचीत का मॉडल नहीं बनाते हैं, लेकिन समानताएं (सीनेटरों के मतदान व्यवहार के बीच)। मेरे अनुभव से, समानता नेटवर्क इंटरैक्शन नेटवर्क की तुलना में समान डिग्री वितरण का प्रदर्शन नहीं करते हैं, इस अर्थ में कि यह विषम नहीं है। इसके अलावा, थ्रेशोल्ड पैरामीटर का उपयोग नेटवर्क निकालते समय (यहां: 100) कभी-कभी डिग्री वितरण पर एक मजबूत प्रभाव पड़ता है।

इसके अलावा, मैं अर्थशास्त्री लेख में किसी भी वजन का उल्लेख नहीं पा सका। फिर भी, seemsngeles Serrano et al के काम में वर्णित विधि में वज़न की उपस्थिति एक महत्वपूर्ण बिंदु है । आप अपने प्रश्न का हवाला देते हैं।

इन दो टिप्पणियों से, यह संभव लगता है कि विधि इन आंकड़ों पर सटीक प्रदर्शन नहीं करती है क्योंकि यह इस प्रकार के नेटवर्क को संसाधित करने के लिए डिज़ाइन नहीं किया गया था। शायद आप डिग्री वितरण की जांच कर सकते हैं: क्या यह एक विशिष्ट मूल्य पर केंद्रित है, या विषम? और वजन के बारे में क्या, क्या कोई है?


मैंने स्रोत वेब साइट से स्वयं डेटा पुन: प्रस्तुत किया, इसलिए मैंने वज़न शामिल किया और मनमाना कटऑफ़ सीमा लागू नहीं की। इस प्रकार मुझे लगता है कि मैंने जो डेटा बैकबोन विधि लागू किया था, वह इन मुद्दों से प्रभावित नहीं होना चाहिए था। डिग्री वितरण की जांच करने पर अच्छा विचार - मुझे एक नज़र रखना होगा!
रैंडी ओल्सन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.