डेटा स्पेस, वेरिएबल स्पेस, ऑब्जर्वेशन स्पेस, मॉडल स्पेस (जैसे लीनियर रिग्रेशन में)


9

मान लीजिए हमारे पास डेटा मैट्रिक्स , जो -by- , और लेबल वेक्टर , जो -by-one है। यहां, मैट्रिक्स की प्रत्येक पंक्ति एक अवलोकन है, और प्रत्येक कॉलम एक आयाम / चर से मेल खाती है। (मान )XnpYnn>p

तो क्या करते हैं data space, variable space, observation space, model spaceक्या मतलब है?

क्या कॉलम वेक्टर द्वारा स्पेस स्पेस किया गया है, (डिगेंरेटेड) -D स्पेस, क्योंकि इसमें , जबकि रैंक , इसे वेरिएबल स्पेस कहा जाता है, क्योंकि यह वेरिएबल-वेक्टर के द्वारा स्पेस किया जाता है? या इसे अवलोकन स्थान कहा जाता है क्योंकि प्रत्येक आयाम / समन्वय एक अवलोकन से मेल खाती है?nnp

और पंक्ति वैक्टर द्वारा स्पेस के बारे में क्या?


5
ये सार्वभौमिक रूप से ज्ञात शब्द नहीं हैं। क्या आपके पास एक संदर्भ है? यदि नहीं, तो हम अनुमान लगा सकते हैं कि उनका क्या मतलब है।
whuber

1
मेरे पास कोई संदर्भ नहीं है। मैंने एक बार अपने प्रोफेसर को कुछ समय पहले बताया था।
user3813057

3
मुझे पूरा यकीन है, तब, कि आपके प्रोफेसर ने इन शब्दों को किसी बिंदु पर परिभाषित किया है। हो सकता है कि वे आपके क्लास नोट्स में हों ...
whuber

जवाबों:


14

ये शब्द बहुभिन्नरूपी आंकड़ों पर कुछ पुस्तकों में दिखाई देते हैं। मान लीजिए कि आपके पास मात्रात्मक सुविधाएँ डेटा मैट्रिक्स nद्वारा व्यक्ति हैं p। फिर आप अंतरिक्ष में बिंदुओं के रूप में व्यक्तियों को साजिश कर सकते हैं जहां कुल्हाड़ियों की विशेषताएं हैं। यह क्लासिक स्कैटरप्लॉट होगा, उर्फ वैरिएबल स्पेस प्लॉट। हम कहते हैं, व्यक्तियों के बादल कुल्हाड़ियों-विशेषताओं द्वारा परिभाषित स्थान को फैलाते हैं

आप बिंदुओं के साथ-साथ वैरिएबल और कुल्हाड़ियों के व्यक्ति होने के साथ स्कैप्लेट के बारे में भी अनुमान लगा सकते हैं। बिल्कुल पिछले की तरह, केवल टॉपसी-टरवी। यह विषय स्थान प्लॉट (या अवलोकन स्पेस प्लॉट) होगा जिसमें इसे फैलाए गए चर के साथ, इसे परिभाषित करने वाले व्यक्ति होंगे।

ध्यान दें कि यदि (जैसा कि अक्सर) n>pतब, दूसरे मामले में, pआयामों में से केवल कुछ आयाम nगैर-निरर्थक होते हैं; इसका मतलब है कि आप -dimensional प्लॉटp पर चर अंक खींच सकते हैं और ले सकते हैं । इसके अलावा, परंपरा से चर अंक आमतौर पर मूल के साथ जुड़े होते हैं और इसलिए वे वैक्टर (तीर) के रूप में दिखाई देते हैं। हम विषय अंतरिक्ष प्रतिनिधित्व का उपयोग ज्यादातर चर के बीच संबंधों को दिखाने के लिए करते हैं, इसलिए हम कुल्हाड़ियों-विषयों को छोड़ देते हैं और सुविधा के लिए तीर के रूप में अंक दर्शाते हैं।p1

यदि विषय स्थान भूखंड को चित्रित करने से पहले सुविधाओं (डेटा मैट्रिक्स के कॉलम) को केंद्रित किया गया था, तो चर वैक्टर के बीच के कोण उनके पियरसन सहसंबंधों के बराबर होते हैं, जबकि वेक्टर लंबाई चर के मानदंड (चौकों की मूल राशि) के बराबर होती है ) या मानक विचलन (यदि डीएफ द्वारा विभाजित )।

परिवर्तनीय स्थान और विषय स्थान एक ही सिक्के के दो पहलू हैं, वे एक ही यूक्लिडियन विश्लेषणात्मक स्थान हैं, केवल एक दूसरे के लिए दर्पण के समान प्रस्तुत किए जाते हैं। वे समान गुण साझा करते हैं, जैसे कि नॉनज़रो ईजेनवेल्यूज़ और ईजेनवेक्टर। इसलिए यह संभव है कि दोनों विषयों और चर को उस विश्लेषणात्मक स्थान के प्रमुख अक्षों (या अन्य ऑर्थोगोनल आधार) के बिंदु के रूप में एक साथ प्लॉट किया जाए, - इस संयुक्त प्लॉट को बिप्लॉट कहा जाता है । मुझे नहीं पता कि "डेटा स्पेस" शब्द का क्या अर्थ है - यदि इसका अर्थ कुछ विशिष्ट है तो मुझे लगता है कि यह सामान्य विश्लेषणात्मक स्थान है जिसमें विषय स्थान और परिवर्तनशील स्थान दो हाइपोस्टेसिस हैं।

यहाँ छवि विवरण दर्ज करें

कुछ स्थानीय लिंक:


1 कल्पना कीजिए कि आपके पास n=5व्यक्ति और p=2चर हैं और आप किसी तरह से 5-आयामी स्थान में 2 बिंदुओं को आकर्षित करने के लिए जादुई रूप से कामयाब रहे। फिर आप कुल्हाड़ियों के किसी भी 2 द्वारा परिभाषित उप-स्थान को इस तरह से घुमा सकते हैं कि यह 2 बिंदुओं को एम्बेड करता है (जो इस तरह से उस विमान को अब तक फैलाता है); इसके बाद, आप सुरक्षित रूप से अन्य 3 अक्षों (आयामों) को छोड़ देते हैं क्योंकि वे अनावश्यक हो गए हैं। एक दूसरे के सापेक्ष दो चर बिंदुओं की स्थिति संरक्षित थी।


2
+1। लेकिन मुझे यकीन नहीं है कि यह कहने का सटीक गणितीय अर्थ क्या है कि चर और विषय स्थान "एक ही यूक्लिडियन विश्लेषणात्मक स्थान" हैं।
अमीबा

3
@amoeba, उत्तर में गणितीय होने के बिना मुझे उम्मीद थी कि यह सहज रूप से पारदर्शी है (विशेष रूप से आप जैसे रैखिक बीजगणित विशेषज्ञों के लिए)। उदाहरण के लिए, डेटा मैट्रिक्स (svd, जिस पर biplot आधारित है) के एकवचन मान अपघटन में - क्या अंतरिक्ष में स्वदेशी और बाएं और दाएं eigenvectors की विशेषता है? क्या यह एक ही विश्लेषणात्मक स्थान नहीं है, जिसे विभिन्न तरीकों से रखा जा सकता है, - जिनमें से (i) पंक्तियों और स्तंभों में कुल्हाड़ियों के रूप में प्रमुख अक्षों के बिंदुओं के रूप में हैं; (ii) कुल्हाड़ियों द्वारा स्तंभों के बिंदुओं के रूप में पंक्तियाँ; (iii) कुल्हाड़ियों के रूप में पंक्तियों के रूप में कॉलम?
ttnphns
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.