मेरे पास हजारों बिंदुओं के क्रम पर कई डेटासेट हैं। प्रत्येक डेटासेट में मान X, Y, Z हैं जो अंतरिक्ष में एक समन्वय का जिक्र करते हैं। Z- मान समन्वय युग्म (x, y) में ऊंचाई में अंतर का प्रतिनिधित्व करता है।
आमतौर पर जीआईएस के मेरे क्षेत्र में, ऊंचाई की त्रुटि को आरएमएसई में एक बिंदु बिंदु (LiDAR डेटा बिंदु) के लिए जमीनी सच्चाई बिंदु को घटाकर संदर्भित किया जाता है। आमतौर पर न्यूनतम 20 ग्राउंड-ट्रूटिंग चेक पॉइंट का उपयोग किया जाता है। NDEP (राष्ट्रीय डिजिटल ऊंचाई दिशानिर्देश) और फेमा दिशानिर्देशों के अनुसार, इस RMSE मूल्य का उपयोग करते हुए, सटीकता का एक उपाय गणना किया जा सकता है: सटीकता = 1.96 * RMSE।
इस सटीकता के रूप में कहा गया है: "मौलिक ऊर्ध्वाधर सटीकता वह मान है जिसके द्वारा ऊर्ध्वाधर सटीकता का समान रूप से आंकलन किया जा सकता है और डेटासेट के बीच तुलना की जा सकती है। ऊर्ध्वाधर सटीकता की गणना ऊर्ध्वाधर आरएमएसई के एक समारोह के रूप में 95 प्रतिशत आत्मविश्वास स्तर पर की जाती है।"
मैं समझता हूं कि सामान्य वितरण वक्र के तहत 95% क्षेत्र 1.96 * std.deviation के अंतर्गत आता है, हालांकि यह RMSE से संबंधित नहीं है।
आम तौर पर मैं यह सवाल पूछ रहा हूं: 2-डेटासेट से गणना किए गए आरएमएसई का उपयोग करके, मैं आरएमएसई को किसी प्रकार की सटीकता से कैसे संबंधित कर सकता हूं (अर्थात मेरे डेटा बिंदुओं का 95 प्रतिशत +/- एक्स सेमी के भीतर है)? इसके अलावा, मैं कैसे निर्धारित कर सकता हूं कि मेरे डेटासेट को आम तौर पर एक ऐसे परीक्षण का उपयोग करके वितरित किया जाता है जो इतने बड़े डेटासेट के साथ अच्छा काम करता है? सामान्य वितरण के लिए "अच्छा पर्याप्त" क्या है? सभी परीक्षणों के लिए पी <0.05 होना चाहिए, या क्या यह एक सामान्य वितरण के आकार से मेल खाना चाहिए?
मुझे इस विषय पर कुछ बहुत अच्छी जानकारी निम्न पत्र में मिली:
http://paulzandbergen.com/PUBLICATIONS_files/Zandbergen_TGIS_2008.pdf