पर इस पोस्ट , आप बयान पढ़ सकते हैं:
मॉडल आमतौर पर अंक का प्रतिनिधित्व कर रहे एक परिमित आयामी कई गुना पर।
पर विभेदकों ज्यामिति और सांख्यिकी माइकल मरे और जॉन डब्ल्यू चावल से इन अवधारणाओं को पठनीय भी गणितीय अभिव्यक्ति अनदेखी गद्य में समझाया गया है। दुर्भाग्य से, बहुत कम चित्रण हैं। वही इस पोस्ट के लिए MathOverflow पर जाता है।
मैं मानचित्र के रूप में सेवा करने के लिए एक दृश्य प्रतिनिधित्व के साथ या विषय की अधिक औपचारिक समझ के लिए प्रेरणा के लिए पूछना चाहता हूं।
कई गुना पर अंक क्या हैं? इस ऑनलाइन खोज से यह उद्धरण प्रतीत होता है कि यह इंगित करता है कि यह या तो डेटा बिंदु हो सकता है, या वितरण पैरामीटर:
कई गुना और सूचना ज्यामिति पर आँकड़े दो अलग-अलग तरीके हैं जिनसे अंतर ज्यामिति आँकड़ों से मिलती है। कई गुना आंकड़ों में, यह डेटा है जो कई गुना झूठ है, सूचना ज्यामिति में डेटा , लेकिन संभावना के घनत्व कार्यों के पैरामीटर परिवार को कई गुना माना जाता है। इस तरह के कई गुना सांख्यिकीय सांख्यिकीय के रूप में जाने जाते हैं।
मैंने इस चित्र को यहाँ के स्पर्शरेखा स्थान के स्पष्टीकरण से प्रेरित होकर बनाया है :
[ बारे में नीचे टिप्पणी को प्रतिबिंबित करने के लिए संपादित करें : ] कई गुना, , स्पर्शरेखा स्थान एक बिंदु जुड़े सभी संभावित डेरिवेटिव ("वेग") का सेट है। माध्यम से चल रहे कई गुना पर हर संभव वक्रइसे माध्यम से प्रत्येक वक्र पार से नक्शे के एक सेट के रूप में देखा जा सकता है अर्थात जिसे कंपोज़िशन रूप में परिभाषित किया गया है , with एक वक्र (वास्तविक रेखा से कई गुना ( की सतह तक कार्य करता हैपी∈ एम (ψ: आर → एम )पी। पी, सी ∞ (टी)→ आर , ( च ∘ ψ ) ' (टी)ψ एम पी,च,चपी) बिंदु माध्यम से चल रहा है और ऊपर चित्र पर लाल रंग में चित्रित किया गया है; और एक परीक्षण समारोह का प्रतिनिधित्व करते हैं। "आइसो- " सफेद समोच्च रेखाएं वास्तविक रेखा पर समान बिंदु पर मैप करती हैं, और बिंदु घेरती हैं ।
तुल्यता (या आँकड़ों के लिए लागू समतुल्य) की यहाँ चर्चा की गई है , और निम्नलिखित उद्धरण से संबंधित होगी :
एक घातीय हेतु प्राचल काल एक हैं, तो आयामी खुला सेट है, तो यह पूर्ण रैंक कहा जाता है।
एक घातीय परिवार जो पूर्ण रैंक नहीं है, उसे आम तौर पर एक घुमावदार घातीय परिवार कहा जाता है, क्योंकि आमतौर पर पैरामीटर स्पेस से कम आयाम के में वक्र होता है एस।
ऐसा लगता है कि प्लॉट की व्याख्या निम्नानुसार है: वितरण संबंधी पैरामीटर (घातांक वितरण के परिवारों के इस मामले में) कई गुना अधिक है। में डेटा बिंदुओं को फ़ंक्शन से एक रैंक की कमी वाले गैर-रेखीय अनुकूलन समस्या के मामले में एक पंक्ति में मैप किया जाएगा । यह भौतिकी में वेग की गणना को समानांतर करेगा: "आइसो-एफ" लाइनों (नारंगी में दिशात्मक व्युत्पन्न) के ढाल के साथ फ़ंक्शन के व्युत्पन्न की तलाश में:समारोह वक्र के रूप में एक वितरणात्मक पैरामीटर के चयन के अनुकूलन की भूमिका अदा कर सकता ψ : आर → एम एफ ( च ∘ ψ ) ' ( टी ) । च : एम → आर ψ च के समोच्च लाइनों के साथ कई गुना पर यात्रा करता है।
बैकग्राउंड एडेड स्टड:
ध्यान दें, मेरा मानना है कि ये अवधारणाएं एमएल में गैर-रैखिक आयामीता में कमी से संबंधित नहीं हैं । वे सूचना ज्यामिति के लिए अधिक समान हैं । यहाँ एक उद्धरण है:
महत्वपूर्ण रूप से, कई गुना के आंकड़े कई गुना सीखने से अलग हैं। उत्तरार्द्ध मशीन लर्निंग की एक शाखा है, जहां लक्ष्य सेलेक्टेड डेटा से एक अव्यक्त मैनिफोल्ड सीखना है । आमतौर पर, मांग के बाद अव्यक्त कई गुना का आयाम से कम है । अव्यक्त मैनिफोल्ड रैखिक या गैर-रेखीय हो सकता है, जो विशेष रूप से प्रयुक्त विधि पर निर्भर करता है। एन
ऑरेन फ़्रीफ़ेल्ड द्वारा आकृति आकृति विकृति के अनुप्रयोगों के साथ कई गुना आंकड़ों पर निम्न जानकारी :
जबकि आमतौर पर , हम एक स्पर्शरेखा स्थान को जोड़ सकते हैं, जिसे द्वारा निरूपित किया जाता है , हर बिंदु के लिए । एक सदिश स्थान है जिसका आयाम के समान है । के मूल पर है । यदि कुछ यूक्लिडियन स्पेस में एम्बेडेड है, तो हम को एक उप- रूप में सोच सकते हैं जैसे: 1) यह को को स्पर्श करता है ; 2) कम से कम स्थानीय रूप से, इसके पक्ष में पूरी तरह से निहित है। TpM के तत्वों को स्पर्शरेखा वैक्टर कहा जाता है।टी पी एम पी ∈ एम टी पी एम एम टी पी एम पी एम टी पी एम एम पी एम
[...] कई गुना पर, सांख्यिकीय मॉडल अक्सर स्पर्शरेखा रिक्त स्थान में व्यक्त किए जाते हैं।
[...]
[हम दो पर विचार करते हैं] डेटासेट में बिंदुओं से मिलकर बनता है :
;
आज्ञा देना और दो का प्रतिनिधित्व करते हैं, संभवतः अज्ञात, में अंक । यह माना जाता है कि दो डेटासेट निम्नलिखित सांख्यिकीय नियमों को पूरा करते हैं: एम
{ लॉग μ एस ( क्ष 1 ) , ⋯ , लॉग μ एस ( क्ष एन एस ) } ⊂ टी μ एस एम ,
[...]
दूसरे शब्दों में, जब को व्यक्त किया जाता है (स्पर्शरेखा वैक्टर के रूप में ) पर स्पर्शरेखा स्थान ( ) में , इसे covariance साथ शून्य मीन गाऊसी से आईआईडी नमूनों के सेट के रूप में देखा जा सकता है । इसी तरह, जब पर स्पर्श अंतरिक्ष में व्यक्त किया है यह एक शून्य मतलब गाऊसी साथ सहप्रसरण से आईआईडी नमूने का एक सेट के रूप में देखा जा सकता है । यह यूक्लिडियन मामले को सामान्य करता है। एम μ एल Σ एल डी एस μ एस Σ एस
इसी संदर्भ में, मैं इस आलेखीय अवधारणा के सबसे नज़दीकी (और व्यावहारिक रूप से केवल) उदाहरण के बारे में पूछ रहा हूँ:
क्या यह दर्शाता है कि स्पर्शरेखा वैक्टर के रूप में व्यक्त कई गुना की सतह पर डेटा झूठ है, और मापदंडों को कार्टेशियन विमान पर मैप किया जाएगा?