आपके पहले प्रश्न के लिए, किसी को "मानक" को परिभाषित करना चाहिए, या स्वीकार करना चाहिए कि "विहित मॉडल" को धीरे-धीरे स्थापित किया गया है। इंगित की गई टिप्पणी के रूप में, यह कम से कम दिखाई देता है कि आप जिस तरह से IRWLS का उपयोग करते हैं वह मानक है।
आपके दूसरे प्रश्न के लिए, "पुनरावृत्ति मानचित्रण संभावना में" (हालांकि अनौपचारिक रूप से) "पुनरावर्ती स्टोचस्टिक एल्गोरिदम" के अभिसरण से जोड़ा जा सकता है। मैंने जो पढ़ा है, उसमें मुख्यतः इंजीनियरिंग में इस विषय पर बहुत बड़ा साहित्य है। अर्थशास्त्र में, हम इसका एक छोटा सा उपयोग करते हैं, विशेष रूप से लेन्नेर्ट लजुंग के सेमिनल कार्य-पहला पेपर लजुंग (1977) था - जिसमें दिखाया गया था कि एक पुनरावर्ती स्टोचस्टिक एल्गोरिथ्म का अभिसरण (या नहीं) स्थिरता द्वारा निर्धारित किया जा सकता है (या संबंधित सामान्य अंतर समीकरण का नहीं)।
(टिप्पणियों में ओपी के साथ एक सार्थक चर्चा के बाद क्या फिर से काम किया गया है)
कन्वर्जेंस
मैं रेफरेंस सेबर एलायडी "एन इंट्रोडक्शन टू डिफरेंश इक्वेशन", 2005, 3 डी एड के रूप में उपयोग करूंगा।
इसलिए विश्लेषण, कुछ दिए गए डेटा नमूना पर सशर्त है इलाज कर रहे हैं तय है। x′s
उद्देश्य समारोह के न्यूनीकरण के लिए पहले क्रम हालत, में एक पुनरावर्ती समारोह के रूप में देखा ,
मीटर ( कश्मीर + 1 ) = एन Σ मैं = 1 वी मैं [ मीटर ( कश्मीर ) ] एक्स मैं ,m
m(k+1)=∑i=1Nvi[m(k)]xi,vi[m(k)]≡wi[m(k)]∑Ni=1wi[m(k)][1]
एक निश्चित बिंदु है (उद्देश्य फ़ंक्शन का तर्क)। एलेडी के थियोरम 1.13 पीपी 27-28 के द्वारा, यदि आरएचएस के के संबंध में पहला व्युत्पन्न [ 1 ] , निर्धारित बिंदु m ∗ पर मूल्यांकन किया गया है , तो इसे A ′ ( m ∗ ) निरूपित करें , निरपेक्ष मान में एकता से छोटा है , तो m * है asymptotically स्थिर (के रूप में)। थ्योरम 4.3 p.179 से अधिक हमारे पास यह है कि इसका अर्थ यह भी है कि निश्चित बिंदु समान रूप से (यूएएस) है।
"एसिम्पोटॉटिक रूप से स्थिर" का अर्थ है कि निश्चित बिंदु के आसपास मूल्यों की कुछ सीमा के लिए, एक पड़ोस ( एम ically)m[1]m∗A′(m∗)m∗
, जरूरी आकार में छोटे नहीं, तय हैआकर्षकहै, और यदि ऐसा है तो एल्गोरिथ्म इस पड़ोस में मान देता है, यह अभिसरण होगा। संपत्ति "वर्दी" होने का मतलब है कि इस पड़ोस की सीमा, और इसलिए इसका आकार, एल्गोरिथ्म के प्रारंभिक मूल्य से स्वतंत्र है। निश्चित बिंदु हो जाता हैविश्व स्तर परयूएएस, यदि γ = ∞ ।
तो हमारे मामले में, अगर हम यह साबित करते हैं(m∗±γ)γ=∞
|A′(m∗)|≡∣∣∣∣∑i=1N∂vi(m∗)∂mxi∣∣∣∣<1[2]
हमने यूएएस संपत्ति साबित की है, लेकिन वैश्विक अभिसरण के बिना। फिर हम या तो यह स्थापित करने की कोशिश कर सकते हैं कि आकर्षण का पड़ोस वास्तव में पूरे विस्तारित वास्तविक संख्याएं हैं, या, कि विशिष्ट प्रारंभिक मूल्य ओपी का उपयोग करता है जैसा कि टिप्पणियों में उल्लेख किया गया है (और यह IRLS पद्धति में मानक है), अर्थात नमूना मतलब की की, ˉ एक्स , हमेशा तय बिंदु के आकर्षण का पड़ोस के अंतर्गत आता है।xx¯
हम गणना व्युत्पन्न
∂vi(m∗)∂m=∂wi(m∗)∂m∑Ni=1wi(m∗)−wi(m∗)∑Ni=1∂wi(m∗)∂m(∑Ni=1wi(m∗))2
=1∑Ni=1wi(m∗)⋅[∂wi(m∗)∂m−vi(m∗)∑i=1N∂wi(m∗)∂m]
A′(m∗)=1∑Ni=1wi(m∗)⋅[∑i=1N∂wi(m∗)∂mxi−(∑i=1N∂wi(m∗)∂m)∑i=1Nvi(m∗)xi]
=1∑Ni=1wi(m∗)⋅[∑i=1N∂wi(m∗)∂mxi−(∑i=1N∂wi(m∗)∂m)m∗]
and
|A′(m∗)|<1⇒∣∣∣∣∑i=1N∂wi(m∗)∂m(xi−m∗)∣∣∣∣<∣∣∣∣∑i=1Nwi(m∗)∣∣∣∣[3]
we have
∂wi(m∗)∂m=−ρ′′(|xi−m∗|)⋅xi−m∗|xi−m∗||xi−m∗|+xi−m∗|xi−m∗|ρ′(|xi−m∗|)|xi−m∗|2=xi−m∗|xi−m∗|3ρ′(|xi−m∗|)−ρ′′(|xi−m∗|)⋅xi−m∗|xi−m∗|2=xi−m∗|xi−m∗|2⋅[ρ′(|xi−m∗|)|xi−m∗|−ρ′′(|xi−m∗|)]=xi−m∗|xi−m∗|2⋅[wi(m∗)−ρ′′(|xi−m∗|)]
Inserting this into [3] we have
∣∣∣∣∑i=1Nxi−m∗|xi−m∗|2⋅[wi(m∗)−ρ′′(|xi−m∗|)](xi−m∗)∣∣∣∣<∣∣∣∣∑i=1Nwi(m∗)∣∣∣∣
⇒∣∣∣∣∑i=1Nwi(m∗)−∑i=1Nρ′′(|xi−m∗|)∣∣∣∣<∣∣∣∣∑i=1Nwi(m∗)∣∣∣∣[4]
This is the condition that must be satisfied for the fixed point to be UAS. Since in our case the penalty function is convex, the sums involved are positive. So condition [4] is equivalent to
∑i=1Nρ′′(|xi−m∗|)<2∑i=1Nwi(m∗)[5]
If ρ(|xi−m|) is Hubert's loss function, then we have a quadratic (q) and a linear (l) branch,
ρ(|xi−m|)=⎧⎩⎨(1/2)|xi−m|2|xi−m|≤δδ(|xi−m|−δ/2)|xi−m|>δ
and
ρ′(|xi−m|)={|xi−m||xi−m|≤δδ|xi−m|>δ
ρ′′(|xi−m|)={1|xi−m|≤δ0|xi−m|>δ
⎧⎩⎨⎪⎪wi,q(m)=1|xi−m|≤δwi,l(m)=δ|xi−m|<1|xi−m|>δ
Since we do not know how many of the |xi−m∗|'s place us in the quadratic branch and how many in the linear, we decompose condition [5] as (Nq+Nl=N)
∑i=1Nqρ′′q+∑i=1Nlρ′′l<2[∑i=1Nqwi,q+∑i=1Nlwi,l]
⇒Nq+0<2[Nq+∑i=1Nlwi,l]⇒0<Nq+2∑i=1Nlwi,l
which holds. So for the Huber loss function the fixed point of the algorithm is uniformly asymptotically stable, irrespective of the x's. We note that the first derivative is smaller than unity in absolute value for any m, not just the fixed point.
What we should do now is either prove that the UAS property is also global, or that, if m(0)=x¯ then m(0) belongs to the neighborhood of attraction of m∗.