सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
जब हम जीएलएम फिट करते हैं तो हम फिशर स्कोरिंग का उपयोग करने के बारे में एक बड़ा उपद्रव क्यों करते हैं?
मैं इस बारे में उत्सुक हूं कि हम फिटिंग GLMS का इलाज क्यों करते हैं क्योंकि वे कुछ विशेष अनुकूलन समस्या थी। क्या वो? यह मुझे लगता है कि वे केवल अधिकतम संभावना हैं, और हम संभावना को लिखते हैं और फिर ... हम इसे अधिकतम करते हैं! इसलिए हम …

1
एक यादृच्छिक रसोई सिंक कैसे काम करता है?
एनआईपीएस 2017 में पिछले साल अली रहीमी और बेन रेचट ने अपने पेपर "रैंडम फीचर्स फॉर लार्ज-स्केल कर्नेल मशीन" के लिए समय पुरस्कार का परीक्षण जीता था, जहां उन्होंने यादृच्छिक सुविधाओं को पेश किया था, बाद में यादृच्छिक रसोई सिंक एल्गोरिथ्म के रूप में कोडित किया गया था। अपने पेपर …

4
सीएनएन, गुठली और स्केल / रोटेशन इनवेरियन के बारे में
मेरे पास कुछ सवाल हैं जो मुझे सीएनएन के बारे में भ्रमित कर रहे हैं। 1) CNN का उपयोग करके निकाली गई विशेषताएँ पैमाने और घूर्णन अपरिवर्तनीय हैं? 2) अपने डेटा के साथ हम जिन गुठली का उपयोग करते हैं, वे पहले से ही साहित्य में परिभाषित हैं? ये गुठली …

4
एसीएफ और पीएसीएफ फॉर्मूला
मैं समय-श्रृंखला डेटा से एसीएफ और पीएसीएफ की साजिश रचने के लिए एक कोड बनाना चाहता हूं। ठीक इसी तरह से मिनीटैब (नीचे) से उत्पन्न प्लॉट। मैंने सूत्र को खोजने की कोशिश की है, लेकिन मैं अभी भी इसे अच्छी तरह से नहीं समझता हूं। क्या आप मुझे फार्मूला बताने …

2
कितनी बार हमें के-गुना सीवी दोहराना चाहिए?
मैं बूटस्ट्रैपिंग और क्रॉस वेलिडेशन के बीच के अंतर को देखते हुए इस धागे पर आया - जिस तरह से महान जवाब और संदर्भ। क्या मैं अब सोच रहा हूँ, अगर मैं बार-बार 10 गुना सीवी कहते हैं प्रदर्शन करने के लिए एक वर्गीकारक की सटीकता, गणना करने के लिए …

2
Ggplot2 में प्रतिगमन लाइनों की भविष्यवाणी या विस्तार कैसे करें?
मेरे पास एक डेटा फ्रेम है जिसमें दो टाइम सीरीज़ हैं: एमएसीएस और फ़ायरफ़ॉक्स रिलीज़ की तारीख और संस्करण संख्या। एक ggplot2 कमांड का उपयोग करना आसान है जो चार्ट का उपयोग करता है (एक तरह से जो थोड़ा मनोरंजक लग रहा है, जिसका मुझे कोई मतलब नहीं है) अंक …

1
केएल विचलन गैर-नकारात्मक क्यों है?
केएल विचलन गैर-नकारात्मक क्यों है? सूचना सिद्धांत के दृष्टिकोण से, मुझे ऐसी सहज समझ है: कहते हैं कि एएA और दो असेम्बल हैं जो द्वारा लेबल किए गए तत्वों के एक ही सेट से बने होते हैं । और क्रमशः और से अधिक भिन्न संभाव्यता वितरण हैं।बीबीBएक्सएक्सxपी ( एक्स )पी(एक्स)p(x)क्ष( …

2
डमी चर के साथ फ़ीचर महत्व
मैं यह समझने की कोशिश कर रहा हूं कि कैसे मैं एक श्रेणीबद्ध चर के फीचर महत्व को प्राप्त कर सकता हूं जिसे डमी चर में तोड़ दिया गया है। मैं scikit-learn का उपयोग कर रहा हूं, जो आपके लिए R या h2o करने के लिए श्रेणीबद्ध चर को नहीं …

3
पायथन में कोलीनियर चर को व्यवस्थित रूप से कैसे हटाया जाए? [बन्द है]
बन्द है। यह सवाल ऑफ टॉपिक है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है। इस प्रश्न को सुधारना चाहते हैं? प्रश्न को अपडेट करें ताकि यह क्रॉस मान्य के लिए विषय पर हो । 2 साल पहले बंद हुआ । इस प्रकार, मैंने सहसंबंध तालिकाओं को देखकर …

1
मानक PCA पर कर्नेल PCA के क्या लाभ हैं?
मैं एक पेपर में एक एल्गोरिथ्म को लागू करना चाहता हूं जो डेटा मैट्रिक्स को विघटित करने के लिए कर्नेल SVD का उपयोग करता है। इसलिए मैं कर्नेल विधियों और कर्नेल पीसीए आदि के बारे में सामग्री पढ़ रहा हूं, लेकिन यह अभी भी मेरे लिए बहुत अस्पष्ट है, खासकर …
18 pca  svd  kernel-trick 

3
आरओसी बनाम प्रेसिजन-रिकॉल असंतुलित डेटासेट पर घटता है
मैंने अभी इस चर्चा को पढ़ना समाप्त किया है । उनका तर्क है कि PR AUC असंतुलित डेटासेट पर ROC AUC से बेहतर है। उदाहरण के लिए, हमारे पास परीक्षण डेटासेट में 10 नमूने हैं। 9 नमूने सकारात्मक हैं और 1 नकारात्मक है। हमारे पास एक भयानक मॉडल है जो …

2
तंत्रिका नेटवर्क के प्रशिक्षण के दौरान प्रशिक्षण / परीक्षण त्रुटियों में अचानक गिरावट का क्या कारण होता है?
मैंने परीक्षण / प्रशिक्षण त्रुटि के भूखंडों को अचानक तंत्रिका नेटवर्क प्रशिक्षण के दौरान कुछ निश्चित युगों में अचानक गिरते देखा है, और मुझे आश्चर्य है कि इन प्रदर्शनों के कारण क्या होता है: यह चित्र कैमिंग हीथ गितुब से लिया गया है, लेकिन इसी तरह के भूखंड कई कागजों …

3
अपने इच्छित वितरण के खिलाफ यादृच्छिक रूप से उत्पन्न डेटा का परीक्षण करना
मैंने एक प्रोग्राम लिखा है जो यादृच्छिक डेटा उत्पन्न करता है। यदि प्रोग्राम सही ढंग से काम कर रहा है, तो उस डेटा को एक विशिष्ट, ज्ञात संभावना वितरण का पालन करना चाहिए। मैं कार्यक्रम को चलाना चाहता हूं, परिणाम पर कुछ गणना करता हूं, और पी-मूल्य के साथ आता …

1
जेलमैन के 8 स्कूल उदाहरण में, व्यक्तिगत अनुमान की मानक त्रुटि को क्यों जाना जाता है?
प्रसंग: जेलमैन के 8-स्कूल उदाहरण (बायेसियन डेटा एनालिसिस, 3 डी संस्करण, Ch 5.5) में 8 स्कूलों में आठ समानांतर प्रयोग हैं जो कोचिंग के प्रभाव का परीक्षण करते हैं। प्रत्येक प्रयोग कोचिंग की प्रभावशीलता और संबंधित मानक त्रुटि के लिए एक अनुमान देता है। इसके बाद लेखकों ने कोचिंग प्रभाव …

2
एक वैरिएबल को वर्गीकृत करना इसे महत्वहीन से महत्वपूर्ण में बदल देता है
मेरे पास एक संख्यात्मक चर है जो एक बहुभिन्नरूपी लॉजिस्टिक प्रतिगमन मॉडल में महत्वपूर्ण नहीं है। हालाँकि, जब मैं इसे समूहों में वर्गीकृत करता हूं, तो अचानक यह महत्वपूर्ण हो जाता है। यह मेरे लिए बहुत ही सहज ज्ञान युक्त है: एक चर को वर्गीकृत करते समय, हम कुछ जानकारी …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.