मैं यह निर्धारित करने के लिए दो मानचित्रों की तुलना कैसे करूं जो बेहतर है?


10

मैं एक ही क्षेत्र के लिए दो अलग-अलग नक्शों की एक उद्देश्य तुलना करने की कोशिश कर रहा हूं। फिलहाल, मैं उन मानदंडों को परिभाषित करने के लिए संघर्ष कर रहा हूं जो मुझे एक डिस्पैसिएट मूल्यांकन करने की अनुमति देंगे।

क्या किसी को यह करने के लिए कोई विचार है, या मुझे समस्या का सामना कैसे करना चाहिए?

जैसा कि आप देख सकते हैं, न तो नक्शा बेहतर है, नीले सेट पर कुछ अंतराल, लाल पर कुछ।

यहां छवि विवरण दर्ज करें


7
प्रश्न बहुत खराब परिभाषित किया गया है? गुणवत्ता से आपका क्या अभिप्राय है? क्या पूर्णता, सटीकता, ज्यामिति के बारे में कोई अनुमान हैं ...? क्या कोई तीसरा संदर्भ डेटासेट है जिसके खिलाफ तुलना करें?
पेट्ज्लक्स

बस एक विचार, उच्च संकल्प हवाई कल्पना का उपयोग करके उनकी तुलना क्यों नहीं की जाती है? हो सकता है कि उन्हें केएमएल में भी रूपांतरित करें और Google धरती में उनकी सटीकता का आकलन करें।
हारून

2
@Martin, क्या आप दो परतों के ज्यामितीय अंतर को उजागर करने के लिए कोई विधि पूछ रहे हैं?
कलाकृति 21

1
विषय पर बहुत साहित्य है। : कुछ कागजात आपके प्रारंभ करने के underdark.wordpress.com/projects/...
UnderDark

1
क्या यह प्रश्न वास्तव में कार्टोग्राफी या मानचित्रों के बजाय डेटा गुणवत्ता के साथ बहुत कम है? शायद आप अपने प्रश्न को पुनः प्राप्त कर सकते हैं और डेटा गुणवत्ता पक्ष पर अधिक संदर्भ प्रदान कर सकते हैं।
blah238

जवाबों:


14

यह उत्तर दो स्थानिक डेटासेट के बीच मनमानी विसंगतियों को मापने के लिए एक उद्देश्य विधि का वर्णन करता है। ऐसी विसंगतियों में स्थिति की बदलाव, आकार में बदलाव और एक डेटासेट में मौजूद विशेषताएं शामिल हो सकती हैं लेकिन दूसरे में नहीं। यह उत्तर यह निर्धारित करने के लिए कोई साधन प्रदान नहीं करता है कि "बेहतर" क्या है, क्योंकि यह केवल डेटा की तुलना में बहुत अधिक निर्भर करता है और यह विशेष रूप से इस बात पर निर्भर करता है कि डेटा का उपयोग किस लिए किया जाएगा।

पृष्ठभूमि

इस तरह के माप के एक बड़े सेट के लिए एक अच्छी नींव प्रत्येक डेटासेट के यूक्लिडियन दूरी परिवर्तन पर निर्भर करती है । यह विमान के बिंदुओं के संग्रह का प्रतिनिधित्व करने के रूप में प्रत्येक डेटासेट को देखता है। आइए इन कलेक्शंस B को ब्लू फीचर्स के लिए और R को रेड फीचर्स के लिए कॉल करें ।

विमान में किसी भी बिंदु x के लिए, एक बिंदु सेट के यूक्लिडियन दूरी परिवर्तन एक्स और ए के बीच की दूरी की सबसे बड़ी निचली सीमा की गणना करता है । हम इस परिवर्तन को एक "सतह" बनाने के बारे में सोच सकते हैं जिसकी x पर ऊँचाई x से A तक की सबसे छोटी दूरी के बराबर है । इस प्रकार इस सतह पर A के सभी बिंदुओं पर घाटियाँ हैं , जहाँ इसकी ऊँचाई शून्य है, और A से 1: 1 ढलान पर ऊपर उठती है । यह स्पष्ट है कि दूरी बदले में परिणत निर्धारित करता है एक (या तकनीकी रूप से अपने मीट्रिक बंद है, जो जीआईएस डेटासेट के लिए के रूप में ही है एक) शून्य की ऊंचाई पर सभी बिंदुओं के सेट के रूप में। इस प्रकार यह दूरी A की सभी स्थानिक जानकारी को पूरी तरह से पकड़ लेती है जो GIS प्रतिनिधित्व करने में सक्षम है।

आकृति 1

यह आंकड़ा छद्म राहत में बी (बाईं ओर) और आर (दाईं ओर) की दूरी को दिखाता है।

दो डैट्स की तुलना करना

B और R की तुलना करने के लिए , प्रत्येक को दूसरे के दूरी परिवर्तन के साथ ओवरले करें:

चित्र 2

दूरी के मूल्यों को लाल रंग के माध्यम से ब्लूज़ (0 के पास) से रंग के रूप में दिखाया गया है।

उदाहरण के लिए, बाएं मानचित्र, B के बिंदु दिखाता है और R से उनकी दूरी के अनुसार उन्हें रंग देता है । B और R की भूमिकाएँ सही नक्शे में स्विच की गई हैं।

पहले से ही ये तुलना करने में आंख की सहायता करते हैं: प्रत्येक मानचित्र एक डेटासेट के बिंदु दिखाता है और, रंग के उपयोग से, उन बिंदुओं पर जोर देता है जो अन्य डेटासेट में किसी भी बिंदु से बहुत दूर हैं। ध्यान दें कि तुलना के लिए दोनों मानचित्रों की आवश्यकता होती है, क्योंकि प्रत्येक शो एक-दूसरे पर इंगित करता है।

विस्तृत नक्शे पर, रंग को देखना मुश्किल हो सकता है, इसलिए हम इसे प्रस्तुति या दृश्य मूल्यांकन के लिए थोड़ा धुंधला करने का विकल्प चुन सकते हैं:

चित्र तीन

नायब: रंग दो मानचित्रों के बीच तुलनीय नहीं हैं: प्रत्येक नक्शे के भीतर उन्हें उस नक्शे में दूरी की पूरी श्रृंखला दिखाने के लिए स्केल किया जाता है।

मतभेदों का सांख्यिकीय विश्लेषण

इस दृष्टिकोण की सुंदरता पोस्ट-प्रोसेसिंग में क्या हो सकती है, इसमें निहित है। दूरी परिवर्तन और उनकी ओवरले का प्रतिनिधित्व करने के लिए एक रेखापुंज का उपयोग करना , हम विसंगतियों को मापने के लिए आसानी से आंकड़े - स्थानीय और वैश्विक - प्राप्त कर सकते हैं। उदाहरण के लिए, हम कुछ छोटी सीमा से बड़ी सभी दूरी पर ध्यान केंद्रित कर सकते हैं जो उनकी आवृत्ति वितरण का पता लगाते हैं:

चित्र 4

इस हिस्टोग्राम में ब्लू बार ब्लू फीचर्स के लिए होता है, रेड फीचर्स के लिए रेड बार। (क्षैतिज अक्ष पर लघुगणक पैमाने पर ध्यान दें।) यह हिस्टोग्राम मूल अतिव्यापी डेटा दिखाता है, न कि व्युत्पन्न धुंधले डेटा। इसने मूल छवि में केवल तीन पिक्सल्स से बड़ी दूरी को चुना है।

इन हिस्टोग्राम्स से पता चलता है कि नीले रंग की सुविधाओं के लिए इसके विपरीत लाल विशेषताओं से बहुत अधिक झूठ बोलना संभव है : नीले रंग की पट्टियाँ लाल रंग की तुलना में अधिक होती हैं और वे अधिक दूरी (दाईं ओर) तक फैल जाती हैं। वर्णनात्मक आंकड़ों का पूरा शस्त्रागार अब दो डेटासेट के बीच अंतर को निर्धारित करने के लिए उपलब्ध है। इन आंकड़ों को ब्याज के पूरे क्षेत्र पर लागू किया जा सकता है या स्थान के अनुसार दोनों डेटासेट अलग-अलग हैं, यह पता लगाने के लिए इसे "विंडो" पर लागू किया जा सकता है।

कार्यान्वयन

अधिकांश रेखापुंज GISes एक यूक्लिडियन दूरी परिवर्तन प्रदान करते हैं (जैसे कि आर्कगिस में यूक्लिडियनडिस्टेंस और GRASS में r.grow.distance ), और सभी इस विश्लेषण को करने के लिए सरल (मास्किंग) ओवरले का समर्थन करते हैं। धुंधला हो जाना, यदि वांछित है, तो एक पड़ोस मीन या कर्नेल कनवल्शन के साथ किया जा सकता है (जिसमें सभी इमेज प्रोसेसिंग सॉफ्टवेयर में उपलब्ध "गॉसियन ब्लर" शामिल है)। अधिकांश जीआईएस , रेखापुंज डेटा के पूर्ण सांख्यिकीय विश्लेषण के लिए पर्याप्त समर्थन प्रदान नहीं करते हैं, हालांकि, वे सांख्यिकीय और गणितीय सॉफ़्टवेयर जैसे कि Rया मैथमेटिका (जो यहां सभी आंकड़े बनाते हैं) द्वारा पठनीय प्रारूप में इस तरह के डेटा को निर्यात करने में अच्छे हैं ।


हमेशा की तरह, आपका उत्तर एक आकर्षक रीड है, और मुझे सीखने और सोचने के लिए नई चीजें मिलती हैं। क्या आप मुझे यह भी बता सकते हैं कि आपने 'हाथ से तैयार' प्रकार का ग्राफ कैसे बनाया?
देवदत्त तेंग्शे

3
@Devdatta हिस्टोग्राम में बनाया गया था मेथेमेटिका पर कोड का एक संशोधन के साथ प्रसंस्करण डाक द्वारा mathematica.stackexchange.com/questions/11350/xkcd-style-graphs । इस तरह के ग्राफिक्स के अतिरिक्त उदाहरणों पर हैं stats.stackexchange.com/questions/49123/... और stats.stackexchange.com/questions/48973/... और stats.stackexchange.com/questions/48467/...
whuber

4

चूँकि यह एक ज्यामिति सत्यापन समस्या है, इसके स्वरूप से, वर्तमान कल्पना को लोड करें और देखें कि क्या आप सड़कों को मौजूदा या वर्तमान के रूप में मान्य कर सकते हैं। संभवतः एक डेटा सेट नया और / या अधिक पूर्ण है। पता करें कि कौन से डेटासेट में सबसे बड़ी क्षैतिज सटीकता है और जिसे सबसे हाल ही में और किस प्रक्रिया से एकत्र किया गया है। क्या यह बाघ, ऑसम, जीआईएस और जीपीएस निशान के बीच अंतर है? इमेजरी यहां आपका मित्र है, हाल के विंटेज की HAIP जैसी कम से कम सटीक कल्पना। कसौटी, पूर्णता, कवरेज, सटीकता, शुद्धता, मुद्रा हो सकती है।


1

मुझे लगता है कि ऊपर दिए गए टिप्पणियों और जवाबों के बाद (शायद यह भी एक जवाब के बजाय एक टिप्पणी होनी चाहिए) लेकिन मैं कभी भी मैपिंग का उपयोग करता हूं जो कि दृश्य तुलना द्वारा फाइलों को मान्य करने के लिए उपलब्ध है। उन सुविधाओं को चुनें जहां उपलब्ध प्लॉट किए गए डेटा उपलब्ध हैं। सड़क नेटवर्क के रूप में उपलब्ध हैं (इंग्लैंड में स्कॉटलैंड और वेल्स ओएस से स्वतंत्र रूप से उपलब्ध हैं)।

Google धरती और इमेजरी का उपयोग करने के सुझाव के बाद। सैटेलाइट इमेजरी को पृष्ठभूमि में लोड करने और फिर से तुलना करने के लिए ओपनलेयर प्लगइन का उपयोग करें।

तुलना के लिए आधार के रूप में उपयोग करने के लिए बहुत सारे मुफ्त सटीक नक्शे।


दुर्भाग्य से, मैंने इस तुलना को इस तथ्य के आधार पर करना शुरू कर दिया, कि ओएसएम और अन्य ओपनसोर्स मानचित्र वास्तव में उतने सटीक नहीं हैं जितना कि हम सोचते हैं। लेकिन उपग्रह छवियों का उपयोग करने पर इनपुट का पालन करने के लिए एक नेतृत्व है!
Styp
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.