dimensionality-reduction पर टैग किए गए जवाब

जहां तक ​​संभव हो डेटा के बारे में अधिक से अधिक जानकारी को संरक्षित करते हुए बड़ी संख्या में चर या आयामों को डेटा द्वारा कम करने के लिए तकनीकों का संदर्भ देता है। प्रमुख विधियों में पीसीए, एमडीएस, आइसोमैप आदि शामिल हैं। तकनीकों के दो मुख्य उपवर्ग: सुविधा निष्कर्षण और सुविधा चयन।

3
एसवीडी और पीसीए के बीच संबंध। PCA करने के लिए SVD का उपयोग कैसे करें?
प्रिंसिपल कंपोनेंट एनालिसिस (पीसीए) को आमतौर पर कोवरियन मैट्रिक्स के एक ईजन-अपघटन के माध्यम से समझाया जाता है। हालाँकि, यह डेटा मैट्रिक्स एकवचन मान अपघटन (SVD) के माध्यम से भी किया जा सकता है । यह कैसे काम करता है? इन दोनों दृष्टिकोणों के बीच क्या संबंध है? एसवीडी और …

1
पीसीए को रिवर्स कैसे करें और कई प्रमुख घटकों से मूल चर को फिर से संगठित करें?
प्रिंसिपल कंपोनेंट एनालिसिस (पीसीए) का इस्तेमाल डायमेंशन की कमी के लिए किया जा सकता है। इस तरह की आयामीता में कमी करने के बाद, मूल घटकों / विशेषताओं को कम संख्या में प्रमुख घटकों से कैसे पुन: निर्मित किया जा सकता है? वैकल्पिक रूप से, कोई डेटा से कई प्रमुख …

11
एक बच्चे को "आयामीता का अभिशाप" समझाएं
मैंने कई बार आयामीता के अभिशाप के बारे में सुना, लेकिन किसी तरह मैं अभी भी इस विचार को समझ नहीं पा रहा हूं, यह सब धूमिल है। क्या कोई इसे सबसे सहज तरीके से समझा सकता है, जैसा कि आप इसे एक बच्चे को समझाएंगे, ताकि मैं (और मैं …

4
पीसीए और अनुपात के विचरण को समझाया
सामान्य तौर पर, यह कहने का क्या मतलब है कि पीसीए जैसे विश्लेषण में भिन्नता का अंश पहले प्रमुख घटक द्वारा समझाया गया है? क्या कोई इसे सहज रूप से समझा सकता है, लेकिन प्रमुख घटक विश्लेषण (पीसीए) के संदर्भ में "विचरण समझाया" का एक सटीक गणितीय परिभाषा दे सकता …

2
ZCA वाइटनिंग और PCA वाइटनिंग में क्या अंतर है?
मैं ZCA वाइटनिंग और सामान्य श्वेतकरण के बारे में उलझन में हूं (जो कि पीसीए eigenvalval के वर्गमूल द्वारा प्रमुख घटकों को विभाजित करके प्राप्त किया जाता है)। जहाँ तक मुझे पता है, UxZCAwhite=UxPCAwhite,xZCAwhite=UxPCAwhite,\mathbf x_\mathrm{ZCAwhite} = \mathbf U \mathbf x_\mathrm{PCAwhite}, जहां PCA eigenvectors हैं।UU\mathbf U जेडसीए व्हाइटनिंग के उपयोग क्या …

6
कई स्तरों के साथ श्रेणीबद्ध चर को ढहाने का राजसी तरीका?
सांख्यिकीय मॉडल में एक इनपुट (भविष्यवक्ता) के रूप में उपयोग करने के उद्देश्य से कुछ श्रेणियों को कुछ श्रेणियों को ढहने (या पूलिंग) के लिए क्या तकनीक उपलब्ध है? कॉलेज के छात्र प्रमुख (एक स्नातक छात्र द्वारा चुना गया अनुशासन) जैसे एक चर पर विचार करें । यह अनियंत्रित और …

3
क्या पीसीए बूलियन (बाइनरी) डेटा प्रकारों के लिए काम करेगा?
मैं उच्च आदेश प्रणालियों की गतिशीलता को कम करना चाहता हूं और अधिकांश कोवरियन को अधिमानतः 2 आयामी या 1 आयामी क्षेत्र पर कब्जा करना चाहता हूं। मैं समझता हूं कि यह प्रमुख घटक विश्लेषण के माध्यम से किया जा सकता है, और मैंने कई परिदृश्यों में पीसीए का उपयोग …

2
टी-एसएनई भ्रामक कब है?
लेखकों में से एक से उद्धरण: टी-डिस्ट्रिब्यूटेड स्टॉचस्टिक नेबर एंबेडिंग (टी-एसएनई) आयामीता में कमी के लिए एक ( पुरस्कार विजेता ) तकनीक है जो विशेष रूप से उच्च-आयामी डेटासेट के विज़ुअलाइज़ेशन के लिए अनुकूल है। तो यह बहुत अच्छा लगता है, लेकिन यह लेखक की बात कर रहा है। लेखक …

3
टी-एसएनई का उपयोग क्लस्टरिंग या वर्गीकरण के लिए एक आयामी कमी तकनीक के रूप में क्यों नहीं किया जाता है?
एक हालिया असाइनमेंट में, हमें कहा गया था कि पीसीए का उपयोग एमएनआईएसटी अंकों पर 64 (8 x 8 चित्र) से आयामों को कम करने के लिए 2. हम फिर एक गाऊसी मिक्सचर मॉडल का उपयोग करके अंकों को क्लस्टर करना था। पीसीए केवल 2 प्रमुख घटकों का उपयोग करके …

1
फैक्टर एनालिसिस / पीसीए में रोटेशन करने के पीछे सहज कारण क्या है और उपयुक्त रोटेशन का चयन कैसे करें?
मेरे सवाल कारक विश्लेषण (या पीसीए में घटकों) में कारकों के रोटेशन करने के पीछे सहज कारण क्या है? मेरी समझ यह है, यदि चर शीर्ष घटकों (या कारकों) में लगभग समान रूप से लोड होते हैं तो जाहिर है कि घटकों को अलग करना मुश्किल है। तो इस मामले …

1
पीसीए एक k- साधन क्लस्टरिंग विश्लेषण के साथ कैसे मदद करेगा?
पृष्ठभूमि : मैं किसी शहर के आवासीय क्षेत्रों को उनकी सामाजिक-आर्थिक विशेषताओं के आधार पर समूहों में वर्गीकृत करना चाहता हूं, जिसमें आवास इकाई घनत्व, जनसंख्या घनत्व, हरा अंतरिक्ष क्षेत्र, आवास मूल्य, स्कूलों की संख्या / स्वास्थ्य केंद्र / दिन देखभाल केंद्र आदि शामिल हैं। मैं यह समझना चाहता हूं …

1
एक बड़े, विरल मैट्रिक्स पर आयामीता में कमी (SVD या PCA)
/ संपादित करें: आगे का अनुसरण करें अब आप irlba :: prcomp_irlba का उपयोग कर सकते हैं / संपादित करें: मेरी अपनी पोस्ट पर चल रहा है। irlbaअब "केंद्र" और "पैमाने" तर्क हैं, जो आपको सिद्धांत घटकों की गणना करने के लिए इसका उपयोग करते हैं, उदाहरण के लिए: pc …

5
मशीन लर्निंग में पदानुक्रमित / नेस्टेड डेटा से कैसे निपटें
मैं अपनी समस्या को एक उदाहरण से समझाता हूँ। मान लीजिए कि आप किसी व्यक्ति की आय का अनुमान लगाना चाहते हैं, जो कुछ विशेषताएं बताती है: {आयु, लिंग, देश, क्षेत्र, शहर}। आपके पास एक प्रशिक्षण डाटासेट है train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

4
कैसे आर में आयामी कमी करने के लिए
मेरे पास एक मैट्रिक्स है जहां (i, j) मुझे बताता है कि मैंने कितनी बार अलग-अलग पेज j देखा। 27K व्यक्ति और 95K पृष्ठ हैं। मैं पृष्ठों के स्थान पर "आयाम" या "पहलुओं" का एक मुट्ठी भर होना चाहूंगा जो उन पृष्ठों के सेट के अनुरूप होगा जो अक्सर एक …

2
पाइथन का स्किट-लर्न एलडीए सही ढंग से काम क्यों नहीं कर रहा है और यह एसवीडी के माध्यम से एलडीए की गणना कैसे करता है?
मैं scikit-learnमशीन लर्निंग लाइब्रेरी (Python) से रैखिक डिस्क्रिमिनेटर एनालिसिस (LDA) का उपयोग आयामी कमी के लिए कर रहा था और परिणामों के बारे में थोड़ा उत्सुक था। मैं अब सोच रहा हूं कि एलडीए क्या scikit-learnकर रहा है ताकि परिणाम अलग दिखें, उदाहरण के लिए, आर में किया गया एक …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.