तार्किक और बिजली कानून वितरण (नेटवर्क डिग्री वितरण) के बीच अंतर की व्याख्या


22

सबसे पहले, मैं एक सांख्यिकीविद् नहीं हूँ। हालांकि, मैं अपने पीएचडी के लिए सांख्यिकीय नेटवर्क विश्लेषण कर रहा हूं।

नेटवर्क विश्लेषण के हिस्से के रूप में, मैंने नेटवर्क डिग्रियों का एक पूरक कार्यान्वयन वितरण समारोह (CCDF) दिया। मैंने पाया कि पारंपरिक नेटवर्क वितरण (जैसे डब्ल्यूडब्ल्यूडब्ल्यू) के विपरीत, वितरण को सबसे अच्छा वितरण द्वारा फिट किया जाता है। मैंने इसे पावर लॉ के खिलाफ फिट करने की कोशिश की और क्लैट एट अल मैटलैब स्क्रिप्ट का उपयोग करते हुए, मैंने पाया कि कर्व की पूंछ कट-ऑफ के साथ पावर लॉ का अनुसरण करती है।

यहां छवि विवरण दर्ज करें

बिंदीदार रेखा शक्ति कानून फिट का प्रतिनिधित्व करती है। बैंगनी रेखा लॉग-सामान्य फिट का प्रतिनिधित्व करती है। ग्रीन लाइन घातीय फिट का प्रतिनिधित्व करती है।

मैं यह समझने के लिए संघर्ष कर रहा हूं कि इसका मतलब क्या है? मैंने न्यूमैन द्वारा इस पत्र को पढ़ा है जो इस विषय पर थोड़ा स्पर्श करता है: http://arxiv.org/abs/cond-mat/04324

नीचे मेरा जंगली अनुमान है:

यदि डिग्री वितरण एक पावर लॉ वितरण का अनुसरण करता है, तो मैं समझता हूं कि इसका मतलब है कि लिंक और नेटवर्क डिग्री के वितरण में रैखिक तरजीही लगाव है (अमीर को समृद्ध प्रभाव या यूलस प्रक्रिया मिलती है)।

क्या मैं यह कहने में सही हूं कि मैं जिस असामान्य वितरण का साक्षी रहा हूं, वहाँ वक्र के आरंभ में उदासीनता का आभास होता है और पूंछ की ओर अधिक रैखिक हो जाता है, जहां इसे एक शक्ति नियम द्वारा फिट किया जा सकता है?

साथ ही, चूंकि लॉग-सामान्य वितरण तब होता है जब रैंडम वेरिएबल (X) का लॉगरिदम सामान्य रूप से वितरित किया जाता है, इसका मतलब यह है कि लॉग-सामान्य वितरण में, X के छोटे मान अधिक हैं और X के कम बड़े मान एक से अधिक हैं रैंडम वैरिएबल जो पावर लॉ डिस्ट्रीब्यूशन को फॉलो करता है?

अधिक महत्वपूर्ण बात, नेटवर्क डिग्री वितरण के संबंध में, क्या लॉग-नॉर्मल तरजीही लगाव अभी भी स्केल-फ्री नेटवर्क का सुझाव देता है? मेरी वृत्ति मुझे बताती है कि चूंकि वक्र की पूंछ एक बिजली कानून द्वारा फिट की जा सकती है, इसलिए नेटवर्क को अभी भी स्केल-फ्री विशेषताओं का प्रदर्शन करने के रूप में निष्कर्ष निकाला जा सकता है।


2
माइक, मुझे लगता है कि जिस भूखंड को आप देख रहे हैं, उसे देखना बहुत दिलचस्प होगा। क्या आप इसे शामिल करने के लिए अपने उत्तर का संपादन करने का मन करेंगे? एक बात जिस पर मैंने तुरंत गौर किया है वह यह है कि बिजली कानूनों और अधिमान्य लगाव के बारे में निहितार्थ पीछे की ओर है। जबकि (कुछ) तरजीही अनुलग्नक योजनाएं पावर-लॉ डिग्री वितरण उत्पन्न करती हैं, रिवर्स निहितार्थ सही नहीं है (यानी, यह एकमात्र तरीका नहीं है)। आप किस तरह के नेटवर्क को देख रहे हैं, इस बारे में कुछ जानकारी भी सहायक हो सकती है। चीयर्स।
कार्डिनल

1
मेरा मतलब है कि तरजीही लगाव "अमीर अमीर हो जाता है" प्रभाव के लिए बस एक और नाम है? यदि ऐसा है तो रैखिक (पावर लॉ) नेटवर्क डिग्री वितरण सिर्फ कई डिग्री वितरणों में से एक है जो तरजीही लगाव प्रदर्शित कर सकता है? दूसरे शब्दों में, जब तक वक्र की ढाल लॉग-लॉग प्लॉट पर नकारात्मक होती है तब तक वितरण के बावजूद, तरजीही लगाव के कुछ तत्व होते हैं? फिर लॉग-नॉर्मल और पॉवर-लॉ डिग्री डिस्ट्रीब्यूशन के बीच का अंतर इतना नहीं है कि क्या प्रेफरेंशियल अटैचमेंट है, लेकिन वहां की प्रॉपरिटी।
माइक

1
ध्यान दें कि अधिमान्य लगाव एक (स्टोकेस्टिक) प्रक्रिया है जो एक नेटवर्क के लिए पावर-लॉ डिग्री वितरण उत्पन्न करता है। पावर-लॉ के लिए स्केलिंग घातांक के अनुसार लाइन की ढलान बदल जाएगी, लेकिन लॉगऑन के मामले में, प्लॉट रैखिक नहीं होगा, यहां तक ​​कि पूंछ में भी। उत्तरजीविता वितरण की ढाल हमेशा नकारात्मक होगी चाहे कोई भी प्रभाव हो। (क्यों?)
कार्डिनल

यह एक बहुत अच्छा संपादन है। धन्यवाद, माइकल! आपके द्वारा दिखाए गए क्षेत्र में लॉगऑनॉर्मल फिट बहुत उल्लेखनीय है। ऐसा लगता है कि यह पूंछ में थोड़ा टूट रहा हो सकता है।
कार्डिनल

आपके उत्तर के लिए धन्यवाद फिर से कार्डिनल। तो क्या आप इस बात से सहमत हैं कि मैं जिस नेटवर्क का अवलोकन कर रहा हूं उसमें तरजीही लगाव अभी भी काम में है? एक और सवाल जो आगे बढ़ता है वह यह है कि क्या नेटवर्क स्केल-फ्री है। यदि अधिमान्य लगाव नेटवर्क में काम पर है और जब तक नेटवर्क नए सदस्यों को लेता है तब नेटवर्क को स्केल-फ्री के रूप में वर्गीकृत किया जा सकता है, भले ही नेटवर्क डिग्री वितरण रैखिक न हो। यह वह जगह है जहाँ मुझे बहुत यकीन नहीं है।
माइक

जवाबों:


12

मुझे लगता है कि प्रश्न को दो भागों में अलग करना मददगार होगा:

  1. आपके अनुभवजन्य वितरण का कार्यात्मक रूप क्या है? तथा
  2. आपके नेटवर्क में उत्पन्न होने वाली प्रक्रिया के बारे में वह कार्यात्मक रूप क्या दर्शाता है?

पी>0.1एक्स15पी<0.1मूल रूप से एक ही काम कर रहा है। क्या आप उस मॉडल को डिग्री वितरण डेटा के लिए निर्माण प्रक्रिया के रूप में अस्वीकार कर सकते हैं जो आपके पास है? यदि नहीं, तो आपको लॉग-सामान्य को "प्रशंसनीय" श्रेणी में रखने की अनुमति है।

एक्स»1

दूसरा प्रश्न वास्तव में दोनों में से कठिन है। जैसा कि कुछ लोगों ने उपरोक्त टिप्पणियों में बताया है, ऐसे कई तंत्र हैं जो बिजली-कानून वितरण और तरजीही लगाव (इसके सभी रूपों और महिमा में) का उत्पादन करते हैं, बस कई में से एक है। इस प्रकार, आपके डेटा में एक पावर-लॉ वितरण का अवलोकन (यहां तक ​​कि एक वास्तविक जो आवश्यक सांख्यिकीय परीक्षण पास करता है) पर्याप्त सबूत नहीं है निष्कर्ष निकालने के लिए कि उत्पादन प्रक्रिया अधिमान्य लगाव थी। या, आम तौर पर, यदि आपके पास एक तंत्र ए है जो डेटा में कुछ पैटर्न एक्स का उत्पादन करता है (उदाहरण के लिए, आपके नेटवर्क में लॉग-सामान्य डिग्री वितरण)। आपके डेटा में पैटर्न X का अवलोकन करना इस बात का प्रमाण नहीं है कि आपका डेटा तंत्र A द्वारा निर्मित किया गया था। डेटा A के अनुरूप हैं, लेकिन इसका मतलब यह नहीं है कि A सही तंत्र है।

वास्तव में यह दिखाने के लिए कि ए उत्तर है, आपको इसकी यंत्रवत मान्यताओं का सीधे परीक्षण करना होगा और दिखाना होगा कि वे आपके सिस्टम के लिए भी हैं, और अधिमानतः यह भी दिखाते हैं कि तंत्र की अन्य भविष्यवाणियां भी डेटा में हैं। धारणा-परीक्षण भाग का एक बहुत बड़ा उदाहरण सिड रेडनर द्वारा किया गया था ( इस पेपर के चित्र 4 देखें ), जिसमें उन्होंने दिखाया कि उद्धरण नेटवर्क के लिए, रैखिक तरजीही लगाव धारणा वास्तव में डेटा में है।

अंत में, "स्केल-फ्री नेटवर्क" शब्द को साहित्य में अधिभारित किया गया है, इसलिए मैं दृढ़ता से इससे बचने का सुझाव दूंगा। लोग इसका उपयोग पावर-लॉ डिग्री वितरण के साथ नेटवर्क को संदर्भित करने के लिए करते हैं और(रैखिक) तरजीही लगाव द्वारा विकसित नेटवर्क के लिए। लेकिन जैसा कि हमने अभी बताया, ये दोनों चीजें एक जैसी नहीं हैं, इसलिए दोनों को संदर्भित करने के लिए एक ही शब्द का उपयोग करना सिर्फ भ्रमित करना है। आपके मामले में, एक लॉग-सामान्य वितरण पूरी तरह से क्लासिक रैखिक तरजीही अनुलग्नक तंत्र के साथ असंगत है, इसलिए यदि आप तय करते हैं कि लॉग-सामान्य प्रश्न 1 (मेरे उत्तर में) का उत्तर है, तो इसका मतलब यह होगा कि आपका नेटवर्क नहीं है ' पैमाने मुक्त 'उस अर्थ में। तथ्य यह है कि एक शक्ति-कानून वितरण के रूप में ऊपरी पूंछ 'ठीक है' उस मामले में निरर्थक होगी, क्योंकि किसी भी अनुभवजन्य वितरण की ऊपरी पूंछ का हमेशा कुछ हिस्सा होता है जो उस परीक्षा को पास करेगा (और यह पास होगा क्योंकि परीक्षण शक्ति खो देता है जब वहाँ जाने के लिए बहुत अधिक डेटा नहीं होता है, जो वास्तव में चरम ऊपरी पूंछ में होता है)।


जब आप बात कर रहे थे, तो ऊपरी पूंछ के लिए पी-मूल्य पर बात कर रहा था?
डेविड नाथन

इस टिप्पणी में पी-मूल्य की स्थिति सही है। यहां संदर्भित पी-मान arxiv.org/abs/0706.1062 की धारा 4.1 से आते हैं , जहां बड़े मूल्य अच्छे फिट का प्रतिनिधित्व करते हैं और छोटे मूल्य बुरे फिट का प्रतिनिधित्व करते हैं। पृष्ठ 17 के तल पर विशेष फुटनोट 8 में देखें।
जोनाथन एस।

3

ऐसा मस्त सवाल। मैं इस बारे में संबंधित वार्तालाप कर रहा हूं, मैंने एक प्रश्न के साथ जुड़ा हुआ है जो मैंने कहीं और पूछा है। वहां, मैंने पूछा कि क्या गामा वितरण एक सामाजिक नेटवर्क के सिमुलेशन में उपयोग करने के लिए एक अच्छा वितरण था, जहां संबंधों की संभावना कुछ निरंतर "लोकप्रियता" नोड्स की विशेषता के लिए अंतर्जात है। @NickCox ने सुझाव दिया कि मैं इसके बजाय lognormal वितरण का उपयोग करता हूं। मैंने उत्तर दिया कि लॉगऑनॉर्मल डिस्ट्रीब्यूशन में लोकप्रियता का वर्णन करने वाली अंतर्निहित प्रक्रिया के रूप में कुछ सैद्धांतिक औचित्य है क्योंकि लोकप्रियता को कई सकारात्मक-मूल्यवान यादृच्छिक चर (उदाहरण के लिए, धन, आय, ऊंचाई, यौन कौशल, लड़ना कौशल, बुद्धि) के उत्पाद के रूप में व्याख्या की जा सकती है। यह मेरे लिए बिजली कानून के सैद्धांतिक औचित्य की तुलना में अधिक समझ में आता है, और यह अनुभवजन्य डेटा के साथ रहता है, जो बताता है कि डिग्री वितरण में क्रॉस-नेटवर्क भिन्नता को समझाने के लिए बिजली कानून का आकार बहुत ही अनम्य है। लॉगऑनॉर्मल, तुलना करके, उच्च लचीलेपन के लिए शून्य के करीब पहुंच मोड के साथ एक बहुत ही लचीला आकार है। इसके अलावा, यह समझ में आता है कि डिग्री वितरण की विषमता अधिमान्य लगाव प्रभाव के कारण विचरण के साथ बढ़नी चाहिए।

संक्षेप में, मुझे लगता है कि लॉगनॉर्मल डिस्ट्रीब्यूशन आपके डेटा को सबसे अच्छी तरह से फिट करता है क्योंकि लॉगनॉर्मल डिस्ट्रीब्यूशन पावर डिस्ट्रीब्यूशन या एक्सपोनेंशियल डिस्ट्रीब्यूशन की तुलना में डिग्री डिस्ट्रीब्यूशन फॉर्मेशन की अंतर्निहित प्रक्रिया का बेहतर वर्णन करता है।


2

मेरा बुलबुला वितरण गिनने और चिपचिपाहट डेटा के लिए बिजली कानून का उपयोग करने के बाद इस साइट पर आ रहा हूं।

क्लैट एट अल द्वारा पावर लॉ पेपर में उदाहरण डेटा सेट के माध्यम से स्किमिंग। उन्होंने अपने तर्क का समर्थन करने के लिए बिजली कानून के डेटा सेटों से दूर, डेटा सेटों की कुछ वास्तविक भयावहता को रखा है। बस सामान्य ज्ञान से मैं निश्चित रूप से उनमें से अधिकांश के लिए पूरे डेटा रेंज में एक पावर लॉ फंक्शन फिट करने की कोशिश नहीं की होगी। हालांकि, वास्तविक दुनिया में स्व-स्केलिंग व्यवहार किसी मनाया प्रणाली के एक हिस्से के लिए मान्य हो सकता है, लेकिन कुछ सिस्टम संपत्ति भौतिक या कार्यात्मक सीमा तक पहुंचने पर टूट जाती है।

नीचे दिए गए बहुत ही पठनीय कागजात, जनसंख्या के व्यवहार के अवलोकन-आधारित मॉडल के आधार पर, बिजली कानून और संबंधित वितरण पर एक अच्छी चर्चा के साथ, पारिस्थितिकीविदों के लिए विकास-वक्र फिटिंग का उल्लेख करते हैं।

लेखक क्लैट एट अल की तुलना में बहुत अधिक व्यावहारिक है। उद्धरण: "... यदि उद्देश्य केवल एक सबसे अच्छा sc t है और डेटा सेट की स्केल विंडो के बाहर तराजू पर चर्चा नहीं की जाती है, तो कोई भी मॉडल given CE को दे सकता है कि यह एक अच्छा and t पैदा करता है और स्केल विंडो के अंदर कोई मैक्सिमा या मिनिमा नहीं बनाता है। । " "एक को अक्सर एक ही मॉडल के लिए मजबूर किया जाता है, जैसा कि अन्य शोधकर्ताओं ने अपने डेटा पर लागू किया है, ताकि पैरामीटर मानों की तुलना करने में सक्षम हो, लेकिन एक बेहतर model टेटिंग मॉडल या मॉडल के आवेदन के अलावा बेहतर उम्मीद के साथ ऐसा कर सकता है। आकार, या दोनों। " संयमित शब्द।

Tjørve, ई। (2003)। प्रजातियों-क्षेत्र के आकार और कार्य: घटता संभव मॉडल की समीक्षा। जर्नल ऑफ़ बायोग्राफी, 30 (6), 827-835।

Tjørve, ई। (2009)। प्रजातियों-क्षेत्र के आकार और कार्य (ii): नए मॉडल और मापदंडों की समीक्षा। जर्नल ऑफ़ बायोग्राफी, 36 (8), 1435-1445।


1

उपरोक्त परिणाम दिखाते हैं कि डिग्री वितरण पावर लॉ और लॉगऑनॉर्मल दोनों हो सकता है, जो यह सुझाव दे सकता है कि अध्ययन के तहत नेटवर्क में छोटे संसार और पैमाने मुक्त गुण सह-मौजूद हैं। यह जांचने के लिए कि अधिमान्य लगाव के साथ नेटवर्क स्केल स्केल (निरंतर स्केलिंग पैरामीटर के साथ) है, प्रायोगिक डिजाइन की अक्सर आवश्यकता होती है। ऊपर वर्णित सिड रेडनर के लेख में, विकास तंत्र को समझने के लिए विकास दर का उपयोग किया जाता है। जबकि गैलोस, सॉन्ग और मक्स नेटवर्क को कवर करने के लिए बक्से का उपयोग करते हैं, और यह निष्कर्ष निकालते हैं कि यदि एनबी (एलबी) ~ एलबी ^ -डीबी है तो नेटवर्क डिग्री वितरण बिजली कानून वितरण का अनुसरण करता है। या क्लस्टर गुणांक और डिग्री (क्या संबंध शक्ति कानून को संतुष्ट करता है) के बीच संबंधों की जांच करना। अन्यथा, यह चर्चा की जाती है कि श्रेणीबद्ध नेटवर्क में छोटी दुनिया और पैमाने मुक्त नेटवर्क गुण दोनों हैं। (टाइपिंग फ्रैक्टल स्केल फ्री,

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.