कैसे एक बिजली कानून के लिए एक प्रवृत्ति के फिट की अच्छाई को मापने / तर्क करने के लिए?


21

मेरे पास कुछ डेटा है जिसके लिए मैं एक ट्रेंडलाइन फिट करने की कोशिश कर रहा हूं। मेरा मानना ​​है कि डेटा एक शक्ति कानून का पालन करता है, और इसलिए लॉग-इन कुल्हाड़ियों पर डेटा को एक सीधी रेखा की तलाश में लगाया है। इसके परिणामस्वरूप (लगभग) सीधी रेखा और इसलिए Excel में मैंने एक पावर लॉ के लिए एक ट्रेंडलाइन जोड़ा है। एक आँकड़े newb होने के नाते, मेरा सवाल यह है कि अब मेरे लिए सबसे अच्छा तरीका क्या है कि "अच्छी तरह से लाइन लगती है जैसे यह बहुत अच्छी तरह से फिट होती है" "संख्यात्मक संपत्ति यह साबित करता है कि यह ग्राफ एक शक्ति कानून द्वारा उचित रूप से फिट है"? एक्स

एक्सेल में मुझे एक आर-स्क्वैयर मान मिल सकता है, हालांकि आंकड़ों के अपने सीमित ज्ञान को देखते हुए, मुझे यह भी नहीं पता है कि क्या यह विशिष्ट परिस्थितियों में वास्तव में उपयुक्त है या नहीं। मैंने एक्सेल में जिस डेटा के साथ काम कर रहा है, उसके प्लॉट को दिखाते हुए नीचे एक इमेज शामिल की है। मुझे आर के साथ थोड़ा सा अनुभव है, इसलिए यदि मेरा विश्लेषण मेरे उपकरणों द्वारा सीमित किया जा रहा है, तो मैं आर के उपयोग से इसे सुधारने के बारे में सुझाव देने के लिए खुला हूं।

वैकल्पिक शब्द


आप यहाँ कुछ विचार प्राप्त कर सकते हैं freakonometrics.blog.free.fr/index.php?post/2010/09/29/…

जवाबों:


24

देखें आरोन क्लॉज़ का पेज:

जिसमें फिटिंग पावर कानूनों के लिए कोड के लिंक हैं (Matlab, R, Python, C ++) साथ ही साथ Clauset and Shalizi द्वारा एक पेपर जिसे आपको पहले पढ़ना चाहिए।

आप पहले पेपर पर क्लॉज़ और शालिज़ी के ब्लॉग पोस्ट पढ़ना चाहते हैं:

अंतिम लिंक का सारांश यह हो सकता है:

  • वितरण के बहुत सारे आपको लॉग-लॉग प्लॉट पर सीधी-ईश लाइनें देते हैं।

  • लीनियर रिग्रेशन का दुरुपयोग करने से बच्चा गॉस रोता है।
    कम से कम वर्गों द्वारा अपने लॉग-लॉग प्लॉट के लिए एक लाइन फिट करना एक बुरा विचार है।

  • स्केलिंग घातांक का अनुमान लगाने के लिए अधिकतम संभावना का उपयोग करें।
  • स्केलिंग क्षेत्र कहां शुरू होता है, इसका अनुमान लगाने के लिए फिट की अच्छाई का उपयोग करें।
  • फिटनेस की जांच के लिए एक अच्छाई-से-फिट परीक्षण का उपयोग करें।
  • विकल्पों की जांच करने के लिए वुंग के परीक्षण का उपयोग करें, और निराशा के लिए तैयार रहें।

1
मैं इसे अपनी सहमति देता हूँ। ऐसे कई उदाहरण हैं जो एक शक्ति कानून की तरह दिखते हैं, लेकिन जब जांच की गई तो थोड़ा और सख्ती से पता चला कि .... और नहीं, चार्ट पर उच्च आर ^ 2 पर्याप्त नहीं है।
पीटरआर

"तो आपको लगता है ..." एक उत्कृष्ट संदर्भ है। अंक 1-6 (7 में से) सीधे यहां दिए गए प्रश्न को संबोधित करते हैं।
whuber

लेकिन एक पावर-लॉ डिस्ट्रीब्यूशन दो अलग-अलग वेरिएबल्स के बीच पावर लॉ रिलेशनशिप को फिट करने के समान नहीं है। मुझे लगता है कि सवाल बाद के बारे में था, हालांकि मैं निश्चित नहीं हूं।
21:39

χ2

2
@ जेएम: वास्तव में, ची-स्क्वायर बिनिंग के प्रति संवेदनशील नहीं है और पूंछ में उतार-चढ़ाव जटिल है। मुझे लगता है कि केएस के साथ भी, वे अतिवादी बिंदुओं के लिए आंकड़े पर भरोसा करते हैं, और कुछ अन्य परीक्षणों की चर्चा है। @onestop: मैंने दूसरा तरीका अपनाया, और फिर से पढ़ने पर, आप सही हो सकते हैं। मैं वास्तव में यकीन नहीं है ..
आर्स

3

यदि आप bivariate पॉवर-लॉ फ़ंक्शंस में रुचि रखते हैं (जैसा कि पावर-लॉ वितरणों का विरोध करना), तो

वार्टन एट अल। " बायोमेट्री लाइन-फिटिंग मेथड फॉर एलामेट्री ।" बॉय। रेव। 81, 259-201 (2006)

एक उत्कृष्ट संदर्भ है। इस मामले में, प्रतिगमन सही काम है, हालांकि आप क्या चाहते हैं कि प्रतिगमन के परिणाम क्या चाहते हैं, इसके आधार पर कुछ सुधार (ओएलएस बनाम आरएमए, आदि) हो सकते हैं।


हारून - वह लिंक मर चुका है, क्या आप एक ताजा पोस्ट कर सकते हैं?
केफ्लेविच

इसके लिए धन्यवाद। अधिकांश जानकारी अविभाजित वितरण के लिए है, जो रिश्वत
गीतोलोलो
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.