विशेष रूप से वितरण की तुलना करने के लिए एक अवधारणा है, जिसे बेहतर ज्ञात होना चाहिए: सापेक्ष वितरण।
मान लें कि हमारे पास यादृच्छिक चर हैं Y0, वाई संचयी वितरण कार्यों के साथ एफ0, एफ और हम उनका उपयोग करते हुए, उनकी तुलना करना चाहते हैं एफ0 संदर्भ के रूप में।
परिभाषित करें
आर = एफ0( य)
यादृच्छिक चर का वितरण
आर का सापेक्षिक वितरण है
Y, साथ में
Y0संधर्भ से। ध्यान दें कि हमारे पास वह है
एफ0(य0) हमेशा समान वितरण (निरंतर यादृच्छिक चर के साथ, यदि यादृच्छिक चर असतत हैं तो यह अनुमानित होगा)।
आइए एक उदाहरण देखें। वेबसाइट http://www.math.hope.edu/swanson/data/cellphone.txt पुरुष और महिला छात्रों के अंतिम फोन कॉल की लंबाई पर डेटा देता है। आइए हम महिला छात्रों के साथ संदर्भ के रूप में पुरुष छात्रों के लिए फोन कॉल लंबाई के वितरण को व्यक्त करते हैं।
हम तुरंत देख सकते हैं कि पुरुष (इस कॉलेज वर्ग में ...) में महिलाओं की तुलना में कम फोन कॉल होते हैं ... और इसे सीधे, बहुत ही प्रत्यक्ष तरीके से व्यक्त किया जाता है। परएक्स अक्ष को महिलाओं के वितरण में अनुपात दिखाया गया है, और हम इसे पढ़ सकते हैं, उदाहरण के लिए, समय के लिए टी(जो कुछ भी है, उसका मूल्य नहीं दिखाया गया है) जैसे कि 20% महिलाओं की कॉल कम (या बराबर) थीं, उस अंतराल में पुरुषों के लिए सापेक्ष घनत्व लगभग 1.3 और 1.4 के बीच भिन्न होता है। यदि हम (ग्राफ से मानसिक रूप से) लगभग 1.35 के रूप में उस अंतराल में सापेक्ष घनत्व, हम देखते हैं कि उस अंतराल में पुरुषों का अनुपात महिलाओं के अनुपात से लगभग 35% अधिक है। यह उस अंतराल में 27% पुरुषों से मेल खाती है।
हम सापेक्ष घनत्व वक्र के आसपास बिंदुवार आत्मविश्वास अंतराल के साथ एक ही साजिश भी कर सकते हैं:
इस मामले में व्यापक आत्मविश्वास बैंड छोटे नमूने के आकार को दर्शाता है।
इस विधि के बारे में एक पुस्तक है: हैंडकॉक
प्लॉट के लिए R कोड यहाँ है:
phone <- read.table(file="phone.txt", header=TRUE)
library(reldist)
men <- phone[, 1]
women <- phone[, 3]
reldist(men, women)
title("length of mens last phonecall with women as reference")
अंतिम प्लॉट परिवर्तन के लिए:
reldist(men, women, ci=TRUE)
title("length of mens last phonecall with women as reference\nwith pointwise confidence interval (95%)")
ध्यान दें कि भूखंडों को कर्नेल घनत्व अनुमान के उपयोग के साथ उत्पादित किया जाता है, जिसमें चिकनाई की डिग्री को जीसीवी (सामान्यीकृत क्रॉस वैधता) के माध्यम से चुना जाता है।
रिश्तेदार घनत्व के बारे में कुछ और जानकारी। चलोक्यू0 करने के लिए इसी मात्रात्मक समारोह हो एफ0। चलोआर का परिमाण हो आर साथ में yआरमूल माप पैमाने पर संबंधित मूल्य। फिर रिश्तेदार घनत्व के रूप में लिखा जा सकता है
जी( आर ) = एफ( प्र0( आर ) )च0( प्र0( आर ) )
या के रूप में मूल माप पैमाने पर
जी( आर ) = एफ( yआर)च0( yआर)। इससे पता चलता है कि सापेक्ष घनत्व की व्याख्या घनत्व के अनुपात के रूप में की जा सकती है। लेकिन, पहले रूप में, तर्क के साथ
आर, यह भी अपने आप में एक घनत्व है, जो अंतराल पर एक को एकीकृत करता है
( 0 , 1 )। यह अनुमान के लिए एक अच्छा प्रारंभिक बिंदु बनाता है।
hist
; चिकनी घनत्वdensity
; QQ- भूखंडोंqqplot
; स्टेम और पत्ती भूखंड (थोड़ा प्राचीन)stem
। इसके अलावा, कोलमोगोरोव-स्मिर्नोव परीक्षण एक अच्छा पूरक हो सकता हैks.test
।