सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

4
डेटा के दो रुझान हैं; स्वतंत्र ट्रेंडलाइन कैसे निकालें?
मेरे पास डेटा का एक सेट है जो किसी विशेष तरीके से ऑर्डर नहीं किया गया है लेकिन जब स्पष्ट रूप से प्लॉट किया गया है तो दो अलग-अलग रुझान हैं। दो श्रृंखलाओं के बीच स्पष्ट अंतर के कारण एक सरल रेखीय प्रतिगमन वास्तव में यहां पर्याप्त नहीं होगा। क्या …

3
पदानुक्रमित मॉडल, तंत्रिका नेटवर्क, ग्राफिकल मॉडल, बायेसियन नेटवर्क के बीच क्या संबंध है?
वे सभी नोड्स और (संभवतः निर्देशित) किनारों के माध्यम से निर्भरता में यादृच्छिक चर का प्रतिनिधित्व करते हैं। मैं जासूसी के दृष्टिकोण में दिलचस्पी रखता हूँ।

4
एक्स और वाई परस्पर संबंधित नहीं हैं, लेकिन एक्स कई प्रतिगमन में वाई का महत्वपूर्ण भविष्यवक्ता है। इसका क्या मतलब है?
X और Y सहसंबद्ध नहीं हैं (-.01); हालाँकि, जब मैं X को एक मल्टीपल रिग्रेशन Y की भविष्यवाणी करता हूं, तो तीन (A, B, C) अन्य (संबंधित) वैरिएबल, X और दो अन्य वैरिएबल (A, B) के साथ Y के महत्वपूर्ण पूर्वानुमान हैं। ध्यान दें कि दो अन्य ( ए, बी) …


4
सिल्हूट भूखंड की व्याख्या कैसे करें?
Im मेरे डेटासेट में क्लस्टर की संख्या निर्धारित करने के लिए सिल्हूट प्लॉट का उपयोग करने की कोशिश कर रहा है। डेटासेट ट्रेन को देखते हुए , मैंने निम्नलिखित मैटलैब कोड का उपयोग किया Train_data = full(Train); Result = []; for num_of_cluster = 1:20 centroid = kmeans(Train_data,num_of_cluster,'distance','sqeuclid'); s = silhouette(Train_data,centroid,'sqeuclid'); …

3
टी-एसएनई का उपयोग क्लस्टरिंग या वर्गीकरण के लिए एक आयामी कमी तकनीक के रूप में क्यों नहीं किया जाता है?
एक हालिया असाइनमेंट में, हमें कहा गया था कि पीसीए का उपयोग एमएनआईएसटी अंकों पर 64 (8 x 8 चित्र) से आयामों को कम करने के लिए 2. हम फिर एक गाऊसी मिक्सचर मॉडल का उपयोग करके अंकों को क्लस्टर करना था। पीसीए केवल 2 प्रमुख घटकों का उपयोग करके …

3
यादृच्छिक वन मॉडल में सटीकता में कमी और मतलब घटती जीआईएनआई की व्याख्या कैसे करें
मुझे यह समझने में कुछ कठिनाई हो रही है कि रैंडम फ़ॉरेस्ट पैकेज से चर महत्व आउटपुट की व्याख्या कैसे करें। सटीकता में कमी का मतलब आमतौर पर "प्रत्येक सुविधा में मूल्यों की अनुमति देने से मॉडल सटीकता में कमी" के रूप में वर्णित किया गया है। क्या यह फीचर …

5
वास्तव में एक बायेसियन मॉडल क्या है?
क्या मैं एक मॉडल को कॉल कर सकता हूं जिसमें बेयस के प्रमेय को "बायेसियन मॉडल" कहा जाता है? मुझे डर है कि ऐसी परिभाषा बहुत व्यापक हो सकती है। तो वास्तव में एक बायेसियन मॉडल क्या है?

2
क्यों एक संभावना-अनुपात परीक्षण ची-चुकता वितरित किया जाता है?
क्यों संभावना अनुपात परीक्षण वितरित ची-चुकता का परीक्षण आँकड़ा है? 2(ln Lalt model−ln Lnull model)∼χ2dfalt−dfnull2(ln⁡ Lalt model−ln⁡ Lnull model)∼χdfalt−dfnull22(\ln \text{ L}_{\rm alt\ model} - \ln \text{ L}_{\rm null\ model} ) \sim \chi^{2}_{df_{\rm alt}-df_{\rm null}}

3
मैन्युअल रूप से एक लॉजिस्टिक प्रतिगमन 95% आत्मविश्वास अंतराल की गणना करने और आर में कॉन्फिन () फ़ंक्शन का उपयोग करने के बीच अंतर क्यों है?
प्रिय हर कोई - मैंने कुछ अजीब देखा है जो मैं समझा नहीं सकता, क्या आप कर सकते हैं? सारांश में: लॉजिस्टिक रिग्रेशन मॉडल में एक आत्मविश्वास अंतराल की गणना करने के लिए मैनुअल दृष्टिकोण, और आर फ़ंक्शन confint()अलग-अलग परिणाम देते हैं। मैं होस्मेर और लेमेशो के एप्लाइड लॉजिस्टिक रिग्रेशन …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

4
निर्णय पेड़ों का कमजोर पक्ष क्या है?
निर्णय वृक्ष एक बहुत ही समझ में आने वाली मशीन सीखने की विधि है। एक बार बनने के बाद इसका मानव द्वारा आसानी से निरीक्षण किया जा सकता है जो कुछ अनुप्रयोगों में एक बड़ा फायदा है। निर्णय पेड़ों के व्यावहारिक कमजोर पक्ष क्या हैं?

5
CDF का उपयोग करके अपेक्षित मान प्राप्त करें
मैं यह कहकर शुरू करने जा रहा हूं कि यह पुस्तक से सीधे घर का बना समस्या है। मैंने अपेक्षित मूल्यों को खोजने के लिए कुछ घंटे बिताए हैं, और निर्धारित किया है कि मैं कुछ भी नहीं समझता हूं। चलो XXX CDF है F(x)=1−x−α,x≥1F(x)=1−x−α,x≥1F(x) = 1 - x^{-\alpha}, x\ge1 …

6
डेटा माइनिंग: मुझे कार्यात्मक रूप खोजने के बारे में कैसे जाना चाहिए?
मैं repeatable प्रक्रियाओं समारोह के कार्यात्मक रूप की खोज के लिए इस्तेमाल किया जा सकता है कि के बारे में उत्सुक हूँ y = f(A, B, C) + error_termजहाँ मेरे ही इनपुट टिप्पणियों का एक सेट है ( y, A, Bऔर C)। कृपया ध्यान दें कि कार्यात्मक रूप fअज्ञात है। …

3
'कमजोर शिक्षार्थी' से क्या अभिप्राय है?
क्या कोई मुझे बता सकता है कि 'कमजोर शिक्षार्थी' वाक्यांश का क्या मतलब है? क्या यह एक कमजोर परिकल्पना माना जाता है? मैं एक कमजोर शिक्षार्थी और एक कमजोर क्लासिफायर के बीच के संबंध को लेकर उलझन में हूं। क्या दोनों समान हैं या कुछ अंतर है? Adaboost एल्गोरिथ्म में, …

3
क्या कोई पर्यवेक्षण-सीखने की समस्या है जो (गहरी) तंत्रिका नेटवर्क स्पष्ट रूप से किसी भी अन्य तरीकों से बेहतर प्रदर्शन नहीं कर सकती है?
मैंने देखा है कि लोगों ने एसवीएम और कर्नेल पर बहुत प्रयास किए हैं, और वे मशीन लर्निंग में एक स्टार्टर के रूप में बहुत दिलचस्प लगते हैं। लेकिन अगर हम उम्मीद करते हैं कि लगभग-हमेशा हम न्यूरल नेटवर्क के मामले में बेहतर समाधान पा सकते हैं, तो इस युग …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.