Hoeffding असमानता में प्रयुक्त एक लेम्मा के प्रमाण को समझना


11

मैं सांख्यिकी पर लैरी वासरमैन के व्याख्यान नोट्स का अध्ययन कर रहा हूं जो कैसला और बर्जर को इसके प्राथमिक पाठ के रूप में उपयोग करता है। मैं उनके व्याख्यान नोट्स 2 के माध्यम से काम कर रहा हूं और होफेडिंग की असमानता (पीपी .2-3) में इस्तेमाल किए गए लेम्मा की व्युत्पत्ति में फंस गया हूं। मैं नीचे दिए गए नोट्स में प्रमाण को पुन: प्रस्तुत कर रहा हूं और प्रमाण के बाद मैं इंगित करूंगा कि मैं कहां फंस गया हूं।


लेम्मा

मान लीजिए कि और वह । उसके बाद ।E(X)=0aXbE(etX)et2(ba)2/8

सबूत

के बाद से , हम लिख सकते वाला उत्तल संयोजन के रूप में और , अर्थात् जहां । फंक्शन उत्तलता तक हमारे पास हैaXbXabX=αb+(1α)aα=Xabayety

etXαetb+(1α)eta=Xabaetb+bXbaeta

दोनों पक्षों की अपेक्षाएँ लें और पाने के लिए तथ्य का उपयोग करेंE(X)=0

E(etX)abaetb+bbaeta=eg(u)

जहाँ , और । ध्यान दें कि । इसके अलावा सभी u> 0 के लिएजी ( यू ) = - γ यू + लॉग ( 1 - γ + γ यू ) γ = - एक / ( - एक ) जी ( 0 ) = u=t(ba)g(u)=γu+log(1γ+γeu)γ=a/(ba)g(0)=g(0)=0g(u)1/4u>0

टेलर के प्रमेय के द्वारा, एक ε(0,u) ऐसा होता है कि g(u)=g(0)+ug(0)+u22g(ε)=u22g(ε)u28=t2(ba)28

इसलिए E(etX)eg(u)et2(ba)28


मैं तब तक प्रमाण का पालन कर सकता था

E(etX)abaetb+bbaeta=eg(u) लेकिन मैं यह पता लगाने में असमर्थ हूं कि आप कैसे ।u,g(u),γ


3
यह दिलचस्प है कि का अधिकतम मान और इस प्रकार परिणाम प्रभावी रूप से जो बहुत दूर तक जाने वाली है जो कि सरासर संयोग से उत्पन्न होती है। मुझे संदेह है कि एक और, संभवतः आसान हो सकता है, एक संभावित तर्क के माध्यम से परिणाम प्राप्त करने का तरीका। var(X)σmax2=(ba)2/4
E[etX]eσmax2t2/2
दिलीप सरवटे

@DilipSarwate मेरी समझ यह है कि अधिकतम भिन्नता एक समान यादृच्छिक चर । का विचरण । क्या आप यह बता सकते हैं कि आपको कैसे मिला ? XU(a,b)XVar(X)=(ba)212(ba)24
आनंद

एंडपॉइंट पर द्रव्यमान को केंद्रित करके ...
एल्विस

@DilipSarwate मैंने सबूत में कुछ टिप्पणियां जोड़ दीं, जो एक झूठा सा स्पष्ट कर सकता है कि सबसे खराब स्थिति अधिकतम विचलन क्यों है।
एल्विस

1
@DilipSarwate - लेम्मा 1 देखें और 1 व्यायाम यहाँ करें: terrytao.wordpress.com/2010/01/03/… । ऐसा लगता है कि जेनसन की असमानता और टेलर के विस्तार पर निर्भर एक सरल व्युत्पत्ति है। फिर भी इसका विवरण मेरे लिए अस्पष्ट है। शायद कोई इसका बोध करा सके। (9) की व्युत्पत्ति (10) और व्यायाम 1)
सिंह

जवाबों:


17

मुझे यकीन नहीं है कि मैंने आपके सवाल को सही ढंग से समझा। मैं उत्तर देने का प्रयास करूंगा: लिखने की कोशिश करूँगा एक समारोह के रूप में : यह जैसा कि आप में बाउंड होना चाहते हैं, स्वाभाविक है ।

abaetb+bbaeta
u=t(ba)eu28

अनुभव से मदद मिलेगी, आपको पता चल जाएगा कि इसे फॉर्म में लिखना बेहतर है । फिर ओर से with ।eg(u)

eg(u)=abaetb+bbaeta
g(u)=log(abaetb+bbaeta)=log(eta(abaet(ba)+bba))=ta+log(γeu+(1γ))=γu+log(γeu+(1γ)),
γ=aba

क्या आप जिस तरह की चीज मांग रहे थे?

संपादित करें: सबूत पर कुछ टिप्पणियां

  1. पहली चाल को ध्यान से देखने के योग्य है: अगर एक उत्तल कार्य है, और एक केंद्रित यादृच्छिक चर है, तो जहां असतत चर को द्वारा परिभाषित किया गया है परिणामस्वरूप, आपको प्राप्त है। में समर्थन के साथ केंद्रित चर जिसमें सबसे अधिक विचरण है: ध्यान दें कि यदि हम समर्थन चौड़ाई तय करते हैंϕaXb
    E(ϕ(X))abaϕ(b)+bbaϕ(a)=E(ϕ(X0)),
    X0
    P(X0=a)=bbaP(X0=b)=aba.
    X0[a,b]
    Var(X)=E(X2)E(X02)=ba2ab2ba=ab.
    (ba), यह से कम है क्योंकि दिलीप टिप्पणियों में कहते हैं, यह इसलिए है क्योंकि ; लिए बाध्य है ।(ba)24(ba)2+4ab0a=b
  2. अब हमारी समस्या की ओर। केवल आधार पर बाउंड प्राप्त करना क्यों संभव है ? सहज रूप से, यह केवल के पुनर्जीवन की बात है : यदि आपके पास बाउंड लिए एक , तो सामान्य बाउंड है। लेकर प्राप्त किया जा सकता है । अब चौड़ाई 1 के समर्थन के साथ केंद्रित चर के सेट के बारे में सोचें: इतनी अधिक स्वतंत्रता नहीं है, इसलिए तरह एक बाउंड मौजूद होना चाहिए। एक अन्य दृष्टिकोण केवल यह कहना है कि उपरोक्त लेम्मा द्वारा , फिर अधिक सामान्यतः , जो केवल और पर निर्भर करता हैu=t(ba)XE(etX)s(t)ba=1s(t(ba))s(t)

    E(ϕ(X))E(ϕ(tX))E(ϕ(tX0))uγ : यदि आप और , और भिन्न करते हैं, तो स्वतंत्रता की केवल एक डिग्री है और , , । हम प्राप्त करते हैं आपको बस एक बाउंड ढूंढना होगा जिसमें केवल ही शामिल हो ।u=u0=t0(b0a0)γ=γ0=a0b0a0t,a,bt=t0αa=αa0b=αa0

    abaϕ(tb)+bbaϕ(ta)=a0b0a0ϕ(tb0)+b0b0a0ϕ(a0).
    u
  3. अब हम आश्वस्त हैं कि यह किया जा सकता है, यह बहुत आसान होना चाहिए! आप जरूरी करने के लिए नहीं लगता है कि के साथ शुरू। मुद्दा यह है कि आपको और कार्य के रूप में सब कुछ लिखना होगा । पहले ध्यान दें कि , , और । फिर अब हम विशेष मामले में हैं ... I लगता है कि आप खत्म कर सकते हैं।guγ

    γ=aba1γ=bbaat=γubt=(1γ)u

    E(ϕ(tX))abaϕ(tb)+bbaϕ(ta)=γϕ((1γ)u)+(1γ)ϕ(γu)


    ϕ=exp

मुझे उम्मीद है कि मैंने इसे थोड़ा स्पष्ट किया।


ठीक वैसा ही जैसा मैं देख रहा था। बहुत बहुत धन्यवाद।
आनंद

1
@ और मुझे पता है कि यह सलाह का पालन करना कठिन है, लेकिन मुझे लगता है कि आपको तकनीकी विवरणों पर ध्यान केंद्रित करके शुरू नहीं करना चाहिए, बल्कि यह जानने की कोशिश करनी चाहिए कि ऐसा क्यों हो सकता है ... फिर प्रमाण आसान दिखना चाहिए। मैंने आपको दूसरे भाग में क्यों दिखाने की कोशिश की , आज सुबह जोड़ा (आपको इस तरह के प्रश्न पर सोने की ज़रूरत है - कम से कम मुझे ज़रूरत है)। मुझे लगता है कि यह भयानक है कि इस तरह के अंतर्ज्ञान अधिकांश पाठ्यपुस्तकों में दिखाई नहीं देते हैं ... भले ही आपको तकनीकी हिस्सा मिल जाए, जब तक आपके पास विचार नहीं हैं सब कुछ जादू दिखता है। इस विवरण में मुझे सोचने का अवसर देने के लिए धन्यवाद और क्रॉसवी!
एल्विस

1
वाह! संपादित करने के लिए +1। धन्यवाद। लेकिन यह अच्छा नहीं होगा अगर जैसा कुछ प्राप्त करना संभव हो।
E[etX]eE[t2X2/2]=e(t2/2)E[X2]=e(t2/2)var(X)et2σmax2/2?
दिलीप सरवटे

@Elvis सलाह के लिए और सहज ज्ञान युक्त भाग को लिखने के लिए समय निकालने के लिए धन्यवाद। मुझे इसे समझने के लिए कुछ समय बिताने की ज़रूरत है!
आनंद

1
@Elvis अंतर्ज्ञान के बारे में लेते हुए, मैं अपनी समझ को स्पष्ट करना चाहता हूं। तेज सीमा पाने के लिए उच्च क्षणों की आवश्यकता होती है। मार्कोव पहले क्षण का उपयोग करता है, चेबीशेव दूसरे क्षण का और होफडिंग एमजीएफ का उपयोग करता है। क्या ये सही है? यदि कोई इस हिस्से का विस्तार और स्पष्टीकरण कर सकता है तो यह बहुत अच्छा होगा।
आनंद
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.