जब कुछ डेटा सेट पर स्टोचैस्टिक ग्रेडिएंट वंश के माध्यम से एक मानकीकृत मॉडल (जैसे संभावना को अधिकतम करने के लिए) का प्रशिक्षण दिया जाता है, तो आमतौर पर यह माना जाता है कि प्रशिक्षण के नमूने प्रशिक्षण डेटा वितरण से तैयार किए गए हैं। इसलिए यदि लक्ष्य संयुक्त वितरण को मॉडल करना है , तो उस वितरण से प्रत्येक प्रशिक्षण नमूना ( x i , y i ) को iid खींचा जाना चाहिए।
यदि लक्ष्य एक सशर्त वितरण को मॉडल करने के बजाय है , तो आखिर iid की आवश्यकता कैसे बदलती है, यदि है?
- क्या हमें अभी भी संयुक्त वितरण से प्रत्येक नमूना iid निकालना चाहिए ?
- क्या हमें P ( X ) से iid खींचना चाहिए , फिर y i iid को P ( Y | X ) से खींचना चाहिए ?
- क्या हम P ( X ) से iid नहीं बना सकते (उदाहरण के लिए समय के साथ सहसंबद्ध), फिर P ( Y ! X ) से y i iid खींच सकते हैं ?
क्या आप स्टोकेस्टिक ग्रेडिएंट वंश के लिए इन तीन तरीकों की वैधता पर टिप्पणी कर सकते हैं? (या यदि आवश्यक हो तो प्रश्न को फिर से समझने में मेरी मदद करें।)
यदि संभव हो तो मैं # 3 करना चाहूंगा। मेरा आवेदन सुदृढीकरण सीखने में है, जहां मैं एक नियंत्रण नीति के रूप में एक मानकीकृत सशर्त मॉडल का उपयोग कर रहा हूं। राज्यों के अनुक्रम अत्यधिक जोड़ा जाता है, लेकिन कार्रवाई y मैं एक स्टोकेस्टिक नीति से आईआईडी का सैंपल तैयार स्थिति पर वातानुकूलित। परिणामी नमूने ( x i , y i )(या उनमें से एक सबसेट) पॉलिसी को प्रशिक्षित करने के लिए उपयोग किया जाता है। (दूसरे शब्दों में, कुछ वातावरण में लंबे समय तक एक नियंत्रण नीति चलाने की कल्पना करें, राज्य / कार्रवाई के नमूने का एक डेटा सेट इकट्ठा करें। फिर भी समय के साथ राज्यों को सहसंबद्ध होने के बावजूद, कार्रवाई स्वतंत्र रूप से उत्पन्न होती है, राज्य पर वातानुकूलित होती है।) यह कुछ हद तक इस पेपर की स्थिति के समान है ।
मुझे एक पेपर मिला, राइबाको, 2006, "कॉन्स्टिट्यूशनल इंडिपेंडेंट डेटा के लिए पैटर्न रिकॉग्निशन ," जो पहले प्रासंगिक लगता था; हालाँकि, वहाँ स्थिति उलट है कि मुझे क्या चाहिए, जहां (लेबल / श्रेणी / कार्रवाई) को P ( Y ) से iid नहीं बनाया जा सकता है , और x i (ऑब्जेक्ट / पैटर्न / स्थिति) P से iid खींचा गया है ( एक्स | वाई ) ।
अपडेट: रयबाको पेपर में उल्लिखित दो पेपर ( यहां और यहां ) यहां प्रासंगिक लगते हैं। वे मान लेते हैं कि एक मनमानी प्रक्रिया (उदाहरण के लिए iid, संभवतः अप्रतिष्ठित नहीं) से आया हूं। वे बताते हैं कि निकटतम-पड़ोसी और कर्नेल अनुमानक इस मामले में सुसंगत हैं। लेकिन मुझे इस बात में अधिक दिलचस्पी है कि क्या स्टोकेस्टिक ग्रेडिएंट वंश पर आधारित अनुमान इस स्थिति में मान्य है।