यह मापने के कई तरीके हैं कि समान संभावना वाले दो वितरण कैसे हैं। उन विधियों में से जो लोकप्रिय हैं (अलग-अलग मंडलियों में):
कोलमोगोरोव दूरी: वितरण कार्यों के बीच की दूरी;
कांटोरोविच-रूबिनस्टीन दूरी: उम्मीदों के बीच का अधिकतम अंतर लिप्सकैट स्थिरांक साथ कार्यों के दो वितरणों को प्रभावित करता है, जो कि वितरण कार्यों के बीच एल 1 दूरी भी निकलता है ;
बाउंडेड-लिप्सात्ज़ दूरी: केआर दूरी की तरह, लेकिन फ़ंक्शंस को भी अधिकतम पर पूर्ण मान होना आवश्यक है ।
इनके अलग-अलग फायदे और नुकसान हैं। केवल 3. के अर्थ में अभिसरण वास्तव में वितरण में अभिसरण के लिए सटीक रूप से मेल खाता है; 1. या 2. के अर्थ में अभिसरण सामान्य रूप से थोड़ा मजबूत है। (विशेष रूप से, यदि संभावना1 केसाथ, तोXnवितरण में0मेंपरिवर्तित होता है, लेकिन कोलमोगोरोव दूरी में नहीं। हालाँकि, यदि सीमा वितरण निरंतर है तो यह विकृति नहीं होती है।)
प्राथमिक संभावना या माप सिद्धांत के दृष्टिकोण से, 1. बहुत स्वाभाविक है क्योंकि यह कुछ सेट में होने की संभावनाओं की तुलना करता है। दूसरी ओर, अधिक परिष्कृत संभाव्य परिप्रेक्ष्य, संभावनाओं की अपेक्षा अपेक्षाओं पर अधिक ध्यान केंद्रित करता है। इसके अलावा, कार्यात्मक विश्लेषण के दृष्टिकोण से, कुछ फ़ंक्शन स्थान के साथ द्वैतता पर आधारित 2. या 3. जैसी दूरियां बहुत आकर्षक हैं, क्योंकि ऐसी चीजों के साथ काम करने के लिए गणितीय साधनों का एक बड़ा समूह है।
हालांकि, मेरी धारणा (सही है कि अगर मैं गलत हूं तो!) यह है कि आंकड़ों में, कोलमोगोरोव दूरी वितरण की समानता को मापने का आमतौर पर पसंदीदा तरीका है। मैं एक कारण का अनुमान लगा सकता हूं: यदि वितरण में से एक परिमित समर्थन के साथ असतत है - विशेष रूप से, यदि यह कुछ वास्तविक दुनिया डेटा का वितरण है - तो एक मॉडल वितरण के लिए कोलमोगोरोव दूरी गणना करना आसान है। (केआर की दूरी की गणना करना थोड़ा कठिन होगा, और बीएल दूरी व्यावहारिक रूप से असंभव होगी।)
तो मेरा सवाल (अंत में), क्या अन्य कारण हैं, या तो व्यावहारिक या सैद्धांतिक हैं, सांख्यिकीय उद्देश्यों के लिए कोलमोगोरोव दूरी (या कुछ अन्य दूरी) का पक्ष लेना है?