एक स्थानिक प्रक्रिया के लिए मापदंडों का अनुमान लगाना


12

मुझे सकारात्मक पूर्णांक मानों का एक ग्रिड दिया गया है । ये संख्या एक तीव्रता का प्रतिनिधित्व करती है जो उस ग्रिड स्थान पर कब्जा करने वाले व्यक्ति के विश्वास की ताकत के अनुरूप होना चाहिए (एक उच्च मूल्य जो एक उच्च विश्वास को दर्शाता है)। एक व्यक्ति की सामान्य तौर पर कई ग्रिड कोशिकाओं पर प्रभाव होगा।n×n

मेरा मानना ​​है कि तीव्रता के पैटर्न को "गौसियन दिखना चाहिए" जिसमें उच्च तीव्रता का एक केंद्रीय स्थान होगा, और फिर तीव्रता सभी दिशाओं में रेडियल रूप से बंद हो जाती है। विशेष रूप से, मैं "स्केल्ड गाऊसी" से आने वाले मानों को मॉडल करना चाहूंगा, जो कि विचरण के लिए एक पैरामीटर और स्केल फैक्टर के लिए दूसरा होगा।

दो जटिल कारक हैं:

  • पृष्ठभूमि शोर और अन्य प्रभावों के कारण किसी व्यक्ति की अनुपस्थिति शून्य मान के अनुरूप नहीं होगी, लेकिन मूल्य छोटे होने चाहिए। हालांकि वे अनियमित हो सकते हैं, और पहले सन्निकटन में सरल गाऊसी शोर के रूप में मॉडल करना मुश्किल हो सकता है।
  • इंटेंसिटी रेंज अलग-अलग हो सकती है। एक उदाहरण के लिए, मान 1 और 10 के बीच हो सकते हैं, और दूसरे में, 1 और 100 के बीच हो सकते हैं।

मैं एक उपयुक्त पैरामीटर अनुमान रणनीति, या प्रासंगिक साहित्य की ओर इशारा करता हूं। संकेत करने के लिए कि मैं इस समस्या को पूरी तरह से गलत तरीके से क्यों कर रहा हूं, की सराहना की जाएगी :)। मैं kriging, और गाऊसी प्रक्रियाओं के बारे में पढ़ रहा हूं, लेकिन यह मेरी समस्या के लिए बहुत भारी मशीनरी की तरह लगता है।


1
गॉसियन द्वारा विचरण और स्केल पैरामीटर के साथ आपका क्या मतलब है ? विचरण पैरामीटर है एक गाऊसी के पैमाने पैरामीटर! मैं आपके द्वारा अब तक स्थापित किए गए मॉडल के बारे में थोड़ा अनिश्चित हूं। क्या आप उस समस्या का वर्णन कर सकते हैं जिसे आप वास्तव में अधिक विस्तार से हल करने की कोशिश कर रहे हैं? एक गॉसियन का उपयोग कर कम ग्रैन्युलैरिटी पूर्णांक-मूल्यवान अवलोकनों को मॉडल बनाना लगता है।
कार्डिनल

(+1) एक दिलचस्प सवाल के लिए। आगे समझने के लिए कि आप क्या बेहतर हल करने की कोशिश कर रहे हैं।
कार्डिनल

यहाँ कई अवलोकन दिए गए हैं: 1. यदि आपके मान पूर्णांक हैं, तो गाऊसी का उपयोग करना उचित नहीं लगता है। 2. यह स्पष्ट नहीं है कि आपके मॉडल का उद्देश्य क्या है, क्या आप उदाहरण के लिए मजबूत विश्वास के समूहों की पहचान करना चाहते हैं? यदि आपके पास उनके मापदंडों की व्याख्या क्या होगी? 3. चूँकि आपके पास एक ग्रिड है, तो आप बीवरिएट वितरण के मिश्रण को फिट करने की कोशिश क्यों नहीं करते? फिर ग्रिड वितरण का समर्थन होगा (इकाई वर्ग का कहना है) और तीव्रता उच्च संभावना वाले क्षेत्रों के अनुरूप होगी।
म्पिकटस

दिलचस्प बिंदुओं के लिए धन्यवाद। मुझे स्पष्ट करने का प्रयास करें। "गाऊसी" की पसंद, टिप्पणियों के आलोक में, एक लाल हेरिंग हो सकती है जो इसकी मदद से अधिक भ्रम का कारण बनती है। डेटा की मुख्य विशेषता व्यक्ति के स्थान में उच्चतम विश्वास के बिंदु पर उच्च तीव्रता के मान हैं, और इसके चारों ओर "रेडियल" से टेप करना (जो मैंने अनुभवजन्य रूप से मनाया है)। तीव्रता मान एक (रैखिक) उलटा समस्या के समाधान से आते हैं, और इसलिए वास्तव में जरूरी नहीं कि अभिन्न होने की जरूरत है - यह सिर्फ हमारे पास होने वाला डेटा है।
सुरेश वेंकटसुब्रमण्यम

btw मैं इस सवाल को अधिक अच्छी तरह से परिभाषित और बेहतर मॉडलिंग करने के प्रयासों की सराहना करता हूं। मैं वास्तविक डेटा सेटिंग की व्याख्या करने की पूरी कोशिश करूँगा ताकि सही मॉडलिंग मान्यताओं पर धर्मान्तरित हो सकूँ।
सुरेश वेंकटसुब्रमण्यम

जवाबों:


5

आप नीचे बताए गए स्थानिक डेटा विश्लेषण विधियों के लिए pysal python लाइब्रेरी के इस मॉड्यूल का उपयोग कर सकते हैं ।

प्रत्येक व्यक्ति का रवैया उसके आस-पास के लोगों के दृष्टिकोण से कैसे प्रभावित होता है, इसका आपका वर्णन एक स्थानिक ऑटोरिएरेटिव मॉडल (SAR) द्वारा किया जा सकता है ( इस SE उत्तर 2 से मेरा सरल SAR स्पष्टीकरण भी देखें )। सबसे सरल दृष्टिकोण अन्य कारकों को अनदेखा करना है, और प्रभाव की ताकत का अनुमान लगाना है कि आसपास के लोग मोरन I के आंकड़े का उपयोग करके एक दूसरे के दृष्टिकोण को कैसे प्रभावित करते हैं।

यदि आप आसपास के लोगों के प्रभाव की ताकत का आकलन करते हुए अन्य कारकों के महत्व का आकलन करना चाहते हैं, एक अधिक जटिल कार्य है, तो आप एक प्रतिगमन के मापदंडों का अनुमान लगा सकते हैं: । डॉक्स यहां देखें । (इस प्रकार के प्रतिगमन का आकलन करने के तरीके स्थानिक अर्थमिति के क्षेत्र से आते हैं और मेरे द्वारा दिए गए संदर्भ से बहुत अधिक परिष्कृत हो सकते हैं।)y=एक्स+आरडब्ल्यूy+

आपकी चुनौती एक स्थानिक भार मैट्रिक्स ( ) का निर्माण करना होगा । मुझे लगता है कि प्रत्येक तत्व डब्ल्यू मैं j मैट्रिक्स के 1 या 0 कि व्यक्ति के आधार पर होना चाहिए मैं कुछ दूरी के भीतर है यदि आपको लगता है कि यह अन्य व्यक्ति को प्रभावित करने के लिए आवश्यक है जेडब्ल्यूwमैंजेमैंजे

समस्या का सहज ज्ञान प्राप्त करने के लिए, नीचे मैं यह वर्णन करता हूं कि कैसे एक स्थानिक ऑटोरिएरेटिव डेटा जनरेटिंग प्रक्रिया (DGP) मूल्यों का एक पैटर्न बनाएगी। नकली मूल्यों के 2 अक्षांशों के लिए सफेद ब्लॉक उच्च मूल्यों का प्रतिनिधित्व करते हैं और अंधेरे ब्लॉक कम मूल्यों का प्रतिनिधित्व करते हैं।

ग्रिड के नीचे पहली जाली में सामान्य रूप से वितरित यादृच्छिक प्रक्रिया (या गॉसियन) द्वारा उत्पन्न किया गया है, जहां शून्य है।आर

रैंडम (गाऊसी)

आरयहाँ छवि विवरण दर्ज करें


यह बहुत दिलचस्प है (और इसी तरह संबंधित गीली सी)। यह मेरी जरूरत के करीब हो सकता है।
सुरेश वेंकटसुब्रमण्यन

गिरी सी आपको यह देखने में मदद करती है कि वितरण के बीच में एक दूसरे क्लस्टर के मान कैसे सम्‍मिलित हैं। मोरन की मैं आपको यह देखने में मदद करता हूं कि बहुत उच्च मूल्यों के साथ बहुत उच्च मूल्य क्लस्टर कैसे होता है, और बहुत कम मूल्यों के आसपास बहुत कम मूल्य क्लस्टर होता है। तो शायद आप सही हैं और सबसे सरल और सबसे अच्छा तरीका है गियररी सी। याद रखें कि गियररी का सी दृष्टिकोण खोजपूर्ण है और आपको अन्य कारकों पर अपने परिणामों को स्थिति में नहीं आने देगा। गियररी के C: pysal.org/1.1/library/esda/geary.html को चलाने के लिए कोड के लिए इस अजगर मॉड्यूल को देखें
b_dev

मुझे इन कुछ और के साथ खेलते हैं। अगर ऐसा लगता है कि मुझे क्या चाहिए (और मुझे लगता है कि यह होगा), तो यह सबसे अच्छा जवाब लगता है।
सुरेश वेंकटसुब्रमण्यन

3

यहाँ एक सरल विचार है जो काम कर सकता है। जैसा कि मैंने टिप्पणियों में कहा है कि अगर आपके पास तीव्रता के साथ एक ग्रिड है, तो द्विभाजन वितरण का घनत्व क्यों फिट नहीं है?

यहाँ मेरी बात को स्पष्ट करने के लिए नमूना ग्राफ है: यहाँ छवि विवरण दर्ज करें

प्रत्येक ग्रिड बिंदु को एक वर्ग के रूप में प्रदर्शित किया जाता है, जो तीव्रता के अनुसार रंगीन होता है। ग्राफ पर सुपरइम्पोज़्ड बाइवरिएट सामान्य घनत्व प्लॉट का समोच्च भूखंड है। जैसा कि आप देख सकते हैं कि समोच्च रेखाएं घटती तीव्रता की दिशा में विस्तार करती हैं। केंद्र को द्विभाजित सामान्य के माध्यम से नियंत्रित किया जाएगा और सहसंयोजक मैट्रिक्स के अनुसार तीव्रता का प्रसार किया जाएगा।

औसत और सहसंयोजक मैट्रिक्स के अनुमानों को प्राप्त करने के लिए सरल संख्यात्मक अनुकूलन का उपयोग किया जा सकता है, मतलब और कोवरियस मैट्रिक्स के मापदंडों के रूप में घनत्व फ़ंक्शन के मूल्यों के साथ तीव्रता की तुलना करें। अनुमान प्राप्त करने के लिए कम से कम।

यह निश्चित रूप से सख्ती से एक सांख्यिकीय अनुमान नहीं है, लेकिन कम से कम यह आपको एक विचार देगा कि कैसे आगे बढ़ना है।

यहाँ ग्राफ को पुन: प्रस्तुत करने के लिए कोड है:

require(mvtnorm)
sigma=cbind(c(0.1,0.7*0.1),c(0.7*0.1,0.1))

x<-seq(0,1,by=0.01)
y<-seq(0,1,by=0.01)
z<-outer(x,y,function(x,y)dmvnorm(cbind(x,y),mean=mean,sigma=sigma))

mz<-melt(z)

mz$X1<-(mz$X1-1)/100
mz$X2<-(mz$X2-1)/100

colnames(mz)<-c("x","y","z")

mz$intensity<-round(mz$z*1000)

ggplot(mz, aes(x,y)) + geom_tile(aes(fill = intensity), colour = "white") + scale_fill_gradient(low = "white",     high = "steelblue")+geom_contour(aes(z=z),colour="black")

2

एक्स[मैं,जे]एक्स[मैं,जे](एक्स[मैं1,जे1],,एक्स[मैं,जे])(एक्स[मैं1+,जे1+एल],एक्स[मैं+,जे+एल])सीआरआर(एक्स[मैं1,जे1],एक्स[मैं2,जे2])([मैं1,जे1],[मैं2,जे2])ρ()ρ()=-1

([मैं1,जे1],[मैं2,जे2])=|मैं1-मैं2|+|जे1-जे2|ρ()जैसे कि अधिकतम संभावना। अधिक विचारों के लिए, "यादृच्छिक क्षेत्र" देखें।


1
"स्थानिक स्थिरता मान लेना चाहते हैं" सीधे ओपी की धारणा का विरोध करते हुए प्रकट होता है कि "तीव्रता सभी दिशाओं में रेडियल रूप से टेंपर करती है।"
whuber

ऐसा कैसे? इस तरह का एक पैटर्न मेरे द्वारा प्रस्तावित ऑटोकॉर्पेशन संरचना के साथ होगा।
charles.y.zheng 19

1
@charles यह एक महत्वपूर्ण बिंदु है: यदि वास्तव में इस स्पष्ट प्रवृत्ति को आटोक्लेररेशन के लिए जिम्मेदार ठहराया जाना है, तो सिद्धांत रूप में प्रक्रिया का एक और स्वतंत्र अहसास नाटकीय रूप से अलग प्रवृत्ति हो सकता है, जैसे कि एक केंद्रीय बिंदु से दूर मूल्य में वृद्धि। क्योंकि ओपी ने स्पष्ट रूप से कुछ नियतात्मक तत्वों को ट्रेंड ("रेडियल टेपरिंग") और कॉरेलेशनल तत्वों ("कई ग्रिड कोशिकाओं पर प्रभाव") के रूप में स्पष्ट और प्रतिष्ठित किया है, एक उत्तर जो इस बात का सम्मान करता है कि संभवतः एक से अधिक सकारात्मक परिणाम देखे जाएंगे। ओपी अपने मन को बदलने के लिए "इच्छा" करेगा।
whuber

मुझे यकीन नहीं है कि मैं स्थानिक स्थानिक स्थिति को समझता हूं। सतह पर, यह एक विशिष्ट स्थान पर "चोटी से बाहर निकलने वाले" होने के विचार के साथ होता है, लेकिन मैं स्पष्ट रूप से कुछ नहीं समझ रहा हूं।
सुरेश वेंकटसुब्रमण्यम

1
@charles, आपके द्वारा वर्णित पैटर्न प्रत्येक स्थानिक ग्रिड पॉइंट के लिए मौजूद होगा , स्थानिक स्थिरता धारणा के कारण। मौलिकता मूल रूप से कह रही है कि मेरे सभी बिंदु समान रूप से व्यवहार करते हैं। यह ओपी द्वारा वर्णित मामला नहीं है। जवाब अभी भी बहुत अच्छा है, लेकिन इस मामले में उचित नहीं है।
म्पिकटस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.