हां, हम नमूना माध्य और विचरण का उपयोग करके एक अनुरूप परिणाम प्राप्त कर सकते हैं, शायद, प्रक्रिया में उभरने वाले एक जोड़े को थोड़ा आश्चर्य।
सबसे पहले, हमें प्रश्न कथन को थोड़ा सा परिष्कृत करने और कुछ मान्यताओं को निर्धारित करने की आवश्यकता है। महत्वपूर्ण रूप से, यह स्पष्ट होना चाहिए कि हम जनसंख्या के विचरण को दायें हाथ की ओर से नमूना विचरण से बदलने की आशा नहीं कर सकते क्योंकि उत्तरार्ध यादृच्छिक है ! तो, हम बराबर असमानता पर हमारा ध्यान फिर से फ़ोकस
P(X−EX≥tσ)≤11+t2.
मामले में यह स्पष्ट नहीं है कि इन बराबर हैं, ध्यान दें कि हम बस से बदल दिया है
t के साथ
tσ व्यापकता में किसी भी हानि के बिना मूल असमानता में।
दूसरा, हम मानते हैं कि हम नमूने के तौर पर है X1,…,Xn और हम में एक ऊपरी अनुरूप मात्रा के लिए बाध्य कर रहे हैं रुचि
P(X1−X¯≥tS) , जहां X¯ नमूना मतलब और है S नमूना मानक विचलन है।
एक आधा कदम आगे
ध्यान दें कि पहले से ही मूल लगाने से करने के लिए Chebyshev असमानता एक पक्षीय X1−X¯ पर हम पाते हैं कि
P(X1−X¯≥tσ)≤11+nn−1t2
जहां
σ2=Var(X1)है, जो
छोटेमूल संस्करण के दाएँ हाथ की ओर से। यह समझ में आता है! किसी नमूने से किसी यादृच्छिक चर का कोई विशेष बोध उस नमूने के करीब (थोड़ा) हो जाएगा, जिसका जनसंख्या की तुलना में योगदान होता है। हम नीचे देखेंगे, हम बदलने के लिए मिल जाएगा
σद्वारा
Sऔर भी अधिक सामान्य मान्यताओं के तहत।
एक तरफा चेबीशेव का एक नमूना संस्करण
दावा करें : X1,…,Xn एक यादृच्छिक नमूना है जैसे कि P(S=0)=0 । फिर,
P(X1−X¯≥tS)≤11+nn−1t2.
विशेष रूप से, बाउंड का नमूना संस्करणमूल जनसंख्या संस्करण की तुलना मेंतंगहै।
नोट : हम करते नहीं मान लेते हैं कि Xi या तो सीमित मतलब या विचरण है!
Proof. The idea is to adapt the proof of the original one-sided Chebyshev inequality and employ symmetry in the process. First, set Yi=Xi−X¯ for notational convenience. Then, observe that
P(Y1≥tS)=1n∑i=1nP(Yi≥tS)=E1n∑i=1n1(Yi≥tS).
c>0{S>0}
1(Yi≥tS)=1(Yi+tcS≥tS(1+c))≤1((Yi+tcS)2≥t2(1+c)2S2)≤(Yi+tcS)2t2(1+c)2S2.
Then,
1n∑i1(Yi≥tS)≤1n∑i(Yi+tcS)2t2(1+c)2S2=(n−1)S2+nt2c2S2nt2(1+c)2S2=(n−1)+nt2c2nt2(1+c)2,
since
Y¯=0 and
∑iY2i=(n−1)S2.
The right-hand side is a constant (!), so taking expectations on both sides yields,
P(X1−X¯≥tS)≤(n−1)+nt2c2nt2(1+c)2.
Finally, minimizing over
c, yields
c=n−1nt2, which after a little algebra establishes the result.
That pesky technical condition
Note that we had to assume P(S=0)=0 in order to be able to divide by S2 in the analysis. This is no problem for absolutely continuous distributions, but poses an inconvenience for discrete ones. For a discrete distribution, there is some probability that all observations are equal, in which case 0=Yi=tS=0 for all i and t>0.
We can wiggle our way out by setting q=P(S=0). Then, a careful accounting of the argument shows that everything goes through virtually unchanged and we get
Corollary 1. For the case q=P(S=0)>0, we have
P(X1−X¯≥tS)≤(1−q)11+nn−1t2+q.
Proof. Split on the events {S>0} and {S=0}. The previous proof goes through for {S>0} and the case {S=0} is trivial.
A slightly cleaner inequality results if we replace the nonstrict inequality in the probability statement with a strict version.
Corollary 2. Let q=P(S=0) (possibly zero). Then,
P(X1−X¯>tS)≤(1−q)11+nn−1t2.
Final remark: The sample version of the inequality required no assumptions on X (other than that it not be almost-surely constant in the nonstrict inequality case, which the original version also tacitly assumes), in essence, because the sample mean and sample variance always exist whether or not their population analogs do.