dimensionality-reduction पर टैग किए गए जवाब

जहां तक ​​संभव हो डेटा के बारे में अधिक से अधिक जानकारी को संरक्षित करते हुए बड़ी संख्या में चर या आयामों को डेटा द्वारा कम करने के लिए तकनीकों का संदर्भ देता है। प्रमुख विधियों में पीसीए, एमडीएस, आइसोमैप आदि शामिल हैं। तकनीकों के दो मुख्य उपवर्ग: सुविधा निष्कर्षण और सुविधा चयन।

5
शीर्ष प्रमुख घटक एक आश्रित चर पर भविष्य कहनेवाला शक्ति को कैसे बनाए रख सकते हैं (या बेहतर पूर्वानुमान की ओर भी ले जा सकते हैं)?
मान लीजिए कि मैं एक प्रतिगमन चला रहा हूं । शीर्ष सिद्धांत घटकों का चयन करके , क्या मॉडल पर अपनी भविष्य कहनेवाला शक्ति बरकरार रखता है ?कश्मीर एक्स वाईY∼ एक्सY∼XY \sim Xकश्मीरkkएक्सXXYYY मैं समझता हूं कि यदि शीर्ष eigenvalues ​​के साथ के सहसंयोजक मैट्रिक्स के eigenvectors हैं, तो शीर्ष …

2
कैसे "nonlinear आयामी कमी" के रूप में "nonlinear" समझने के लिए?
मैं लीनियर डायमेंशन रिडक्शन मेथड्स (जैसे, पीसीए) और नॉनलाइनियर अपीयरेंस (उदाहरण के लिए, इस्कैप) के बीच के अंतरों को समझने की कोशिश कर रहा हूं। मैं यह नहीं समझ सकता कि इस संदर्भ में (गैर) रैखिकता क्या है। मैं से पढ़ने विकिपीडिया कि तुलना करके, यदि पीसीए (एक रेखीय आयामी …

3
क्या विज़ुअलाइज़ेशन के लिए आयामी कमी को "बंद" समस्या माना जाना चाहिए, जो टी-एसएनई द्वारा हल किया गया है?
मैं - एल्गोरिथ्म के बारे में बहुत कुछ पढ़ रहा हूँ आयामीता में कमी। मैं एमएनआईएसटी जैसे "क्लासिक" डेटासेट पर प्रदर्शन से बहुत प्रभावित हूं, जहां यह अंकों के स्पष्ट पृथक्करण को प्राप्त करता है ( मूल लेख देखें ):टीटीt मैंने इसका उपयोग एक तंत्रिका नेटवर्क द्वारा सीखी गई सुविधाओं …

2
सभी के बारे में "कम-रैंक प्रतिगमन" क्या है?
मैं द स्टैटिस्टिकल ऑफ स्टैटिस्टिकल लर्निंग पढ़ रहा हूं और मुझे समझ नहीं आ रहा है कि धारा 3.7 "मल्टीपल रिजल्ट सिकुड़न और सिलेक्शन" क्या है। यह आरआरआर (कम-रैंक प्रतिगमन) के बारे में बात करता है, और मैं केवल यह समझ सकता हूं कि आधार एक सामान्यीकृत बहुभिन्नरूपी रैखिक मॉडल …

1
क्यों केवल देखते हैं
पीसीए में, जब आयामों की संख्या ( N के बराबर या उससे अधिक) के नमूनों की संख्या N से अधिक है , तो ऐसा क्यों है कि आपके पास अधिकांश N - 1 गैर-शून्य eigenvectors होंगे? दूसरे शब्दों में, लोगों के बीच सहप्रसरण मैट्रिक्स के पद घ ≥ एन आयाम …

1
t-SNE बनाम MDS
टी-एसएनई ( टी-डिस्ट्रिब्यूटेड स्टोचैस्टिक पड़ोसी एंबेडिंग ) के बारे में कुछ प्रश्न पढ़े हैं , और हाल ही में एमडीएस ( बहुआयामी स्केलिंग ) के बारे में कुछ प्रश्नों का भी दौरा किया । वे अक्सर समान रूप से उपयोग किए जाते हैं, इसलिए ऐसा लग रहा था कि यह …

3
पीसीए जब नमूनों की संख्या से अधिक है
मैं एक ऐसे परिदृश्य पर आया हूं, जहां मेरे पास 10 लोगों (इसलिए 100 नमूनों) के लिए 10 सिग्नल / व्यक्ति हैं जिसमें 14000 डेटा पॉइंट (आयाम) हैं, जिन्हें मुझे एक क्लासिफायर करने की आवश्यकता है। मैं इस डेटा की गतिशीलता को कम करना चाहूंगा और पीसीए ऐसा करने का …

4
मिश्रित डेटा को यूक्लिडियन-आधारित क्लस्टरिंग एल्गोरिदम के लिए एक समस्या क्यों है?
अधिकांश शास्त्रीय क्लस्टरिंग और डायमेंशन कम करने वाले एल्गोरिदम (पदानुक्रमित क्लस्टरिंग, प्रिंसिपल कंपोनेंट एनालिसिस, के-मीन्स, सेल्फ-ऑर्गनाइजिंग मैप्स ...) विशेष रूप से न्यूमेरिक डेटा के लिए डिज़ाइन किए गए हैं, और उनके इनपुट डेटा को यूक्लिडियन स्पेस में पॉइंट के रूप में देखा जाता है। यह निश्चित रूप से एक समस्या …

4
कार्यात्मक प्रमुख घटक विश्लेषण (FPCA): यह सब क्या है?
कार्यात्मक प्रमुख घटक विश्लेषण (FPCA) एक ऐसी चीज है जिस पर मैं लड़खड़ा गया हूं और कभी समझ में नहीं आया। यह सब किस बारे मे है? शांग, 2011 द्वारा "कार्यात्मक प्रमुख घटक विश्लेषण का एक सर्वेक्षण" देखें , और मैं उद्धृत कर रहा हूं: पीसीए "आयामीता के अभिशाप" (बेलमैन …

1
कैसे एक वर्गीकरण तकनीक एलडीए, पीसीए जैसी आयामी कमी तकनीक के रूप में भी कार्य करता है
इस लेख में , लेखक रेखीय विभेदक विश्लेषण (LDA) को प्रमुख घटक विश्लेषण (PCA) से जोड़ता है। अपने सीमित ज्ञान के साथ, मैं यह पालन करने में सक्षम नहीं हूं कि एलडीए पीसीए के समान कैसे हो सकता है। मैंने हमेशा सोचा है कि एलडीए लॉजिस्टिक रिग्रेशन के समान वर्गीकरण …

5
क्या स्ट्रीमिंग डेटा के लिए टी-एसएनई के कोई संस्करण हैं?
टी-एसएनई और बार्न्स-हट सन्निकटन की मेरी समझ यह है कि सभी डेटा बिंदुओं की आवश्यकता होती है ताकि सभी बल इंटरैक्शन की गणना एक ही समय में की जा सके और प्रत्येक बिंदु को 2 डी (या निम्न आयामी) मानचित्र में समायोजित किया जा सके। क्या टी-स्नेन के कोई संस्करण …

1
टी-एसएनई लागू करने से पहले क्या डेटा को केंद्रित किया जाना चाहिए?
मेरे डेटा की कुछ विशेषताओं में बड़े मूल्य हैं, जबकि अन्य सुविधाओं में बहुत छोटे मूल्य हैं। क्या बड़े मूल्यों के प्रति पूर्वाग्रह को रोकने के लिए t-SNE लगाने से पहले + स्केल डेटा को केंद्र में रखना आवश्यक है? मैं डिफ़ॉल्ट यूक्लिडियन दूरी मीट्रिक के साथ पायथन के sklearn.manifold.TSNE …

4
क्या "आयामीता का अभिशाप" वास्तव में वास्तविक डेटा में मौजूद है?
मैं समझता हूं कि "आयामीता का अभिशाप" क्या है, और मैंने कुछ उच्च आयामी अनुकूलन समस्याओं को किया है और घातीय संभावनाओं की चुनौती को जाना है। हालांकि, मुझे संदेह है कि "आयामीता का अभिशाप" सबसे वास्तविक दुनिया डेटा में मौजूद है (अच्छी तरह से छवियों या वीडियो को एक …

4
एसवीडी / पीसीए के लिए "सामान्यीकरण" चर
मान लीजिए हम NNN औसत दर्जे का चर, (a1,a2,…,aN)(a1,a2,…,aN)(a_1, a_2, \ldots, a_N) , हम एक नंबर करने के M>NM>NM > N माप की, और उसके बाद प्रदर्शन करना चाहते विलक्षण मूल्य अपघटन के लिए उच्चतम विचरण के कुल्हाड़ियों को खोजने के लिए परिणामों पर MMM , NNN -डायमेंशनल स्पेस में …

2
हम क्लस्टरिंग के साथ आयामी कमी को कब जोड़ते हैं?
मैं दस्तावेज़-स्तरीय क्लस्टरिंग करने की कोशिश कर रहा हूं। मैंने टर्म-डॉक्यूमेंट फ़्रीक्वेंसी मैट्रिक्स का निर्माण किया है और मैं k- साधनों का उपयोग करके इन उच्च आयामी वैक्टरों को क्लस्टर करने का प्रयास कर रहा हूं। सीधे क्लस्ट करने के बजाय, मैंने जो भी किया, वह पहले यू, एस, वीटी …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.