सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

9
सामान्यीकरण और फीचर स्केलिंग कार्य कैसे और क्यों करते हैं?
मैं देख रहा हूं कि बहुत सारे मशीन लर्निंग एल्गोरिदम बेहतर तरीके से कैंसिलेशन और कोवरियन इक्वलाइजेशन के साथ काम करते हैं। उदाहरण के लिए, न्यूरल नेटवर्क तेजी से अभिसरण करते हैं, और के-मीन्स आमतौर पर पूर्व-संसाधित सुविधाओं के साथ बेहतर क्लस्टरिंग देते हैं। मैं इन पूर्व-प्रसंस्करण कदमों के पीछे …

11
आंकड़ों के संदर्भ में ऑर्थोगोनल का क्या अर्थ है?
अन्य संदर्भों में, ऑर्थोगोनल का अर्थ है "समकोण पर" या "लंबवत"। सांख्यिकीय संदर्भ में ऑर्थोगोनल का क्या अर्थ है? किसी भी स्पष्टीकरण के लिए धन्यवाद।

9
प्रतिगमन के लिए चर चयन के लिए लैस्सो का उपयोग करने के क्या नुकसान हैं?
मुझे जो पता है, से चर चयन के लिए लासो का उपयोग करना सहसंबंधित इनपुट की समस्या को संभालता है। इसके अलावा, चूंकि यह लिस्ट एंगल रिग्रेशन के बराबर है, इसलिए यह कम्प्यूटेशनल रूप से धीमा नहीं है। हालाँकि, बहुत से लोग (उदाहरण के लिए मैं जिन लोगों को बायो-स्टैटिस्टिक्स …

8
मैं यह सुनिश्चित करने में कैसे मदद कर सकता हूं कि परीक्षण डेटा प्रशिक्षण डेटा में लीक नहीं होता है?
मान लें कि हमारे पास कोई व्यक्ति एक भविष्य कहनेवाला मॉडल का निर्माण कर रहा है, लेकिन यह आवश्यक नहीं है कि कोई व्यक्ति उचित सांख्यिकीय या मशीन सीखने के सिद्धांतों से अच्छी तरह वाकिफ हो। शायद हम उस व्यक्ति की मदद कर रहे हैं जैसे वे सीख रहे हैं, …


6
डेंड्रोग्राम को काटने के लिए कहां?
पदानुक्रमित क्लस्टरिंग को डेंड्रोग्राम द्वारा दर्शाया जा सकता है। एक निश्चित स्तर पर एक डेंड्रोग्राम काटना क्लस्टर का एक सेट देता है। दूसरे स्तर पर काटने से क्लस्टर का एक और सेट मिलता है। डेंड्रोग्राम को काटने के लिए आप कैसे उठाएंगे? क्या कोई ऐसी चीज है जिस पर हम …

5
K- साधन क्लस्टरिंग और PCA के बीच क्या संबंध है?
क्लस्टरिंग एल्गोरिथ्म (जैसे के-साधन) से पहले पीसीए (प्रमुख घटक विश्लेषण) को लागू करना एक आम बात है। यह माना जाता है कि यह अभ्यास (शोर में कमी) में क्लस्टरिंग परिणामों में सुधार करता है। हालाँकि मुझे पीसीए और के-मीन्स के बीच संबंधों के तुलनात्मक और गहन अध्ययन में दिलचस्पी है। …

12
दो-पूंछ वाले परीक्षण ... मैं अभी आश्वस्त नहीं हूं। क्या बात है?
निम्नलिखित अंश प्रविष्टि से है, एक-पूंछ और दो-पूंछ परीक्षण के बीच अंतर क्या हैं? UCLA के सांख्यिकी सहायता साइट पर। ... दूसरी दिशा में एक प्रभाव को याद करने के परिणामों पर विचार करें। कल्पना कीजिए कि आपने एक नई दवा विकसित की है जो आपको लगता है कि मौजूदा …

3
विकर्ण में स्थिरांक जोड़ने से रिज का अनुमान ओएलएस से बेहतर क्यों हो जाता है?
मैं समझता हूँ कि रिज प्रतिगमन अनुमान है कि के आकार के वर्ग का अवशिष्ट राशि और एक दंड को कम करता हैβββ\betaββ\beta βridge=(λID+X′X)−1X′y=argmin[RSS+λ∥β∥22]βridge=(λID+X′X)−1X′y=argmin⁡[RSS+λ‖β‖22]\beta_\mathrm{ridge} = (\lambda I_D + X'X)^{-1}X'y = \operatorname{argmin}\big[ \text{RSS} + \lambda \|\beta\|^2_2\big] हालांकि, मैं पूरी तरह से तथ्य यह है कि के महत्व को समझ में नहीं …

7
मूल्यांकन करने के लिए लागत समारोह धीमा होने पर अनुकूलन
लागत कार्यों में स्थानीय मिनिमा खोजने के लिए धीरे-धीरे वंश और कई अन्य विधियां उपयोगी हैं। वे तब कुशल हो सकते हैं जब प्रत्येक बिंदु पर लागत फ़ंक्शन का त्वरित रूप से मूल्यांकन किया जा सकता है, चाहे संख्यात्मक रूप से या विश्लेषणात्मक रूप से। मेरे पास वह है जो …

13
यदि हम एक बड़े अध्ययन में अशक्त परिकल्पना को अस्वीकार करने में विफल रहते हैं, तो क्या यह अशक्तता का प्रमाण नहीं है?
नल की परिकल्पना महत्व परीक्षण की एक बुनियादी सीमा यह है कि यह एक शोधकर्ता को अशक्त ( स्रोत ) के पक्ष में सबूत इकट्ठा करने की अनुमति नहीं देता है ( स्रोत ) मुझे यह दावा कई स्थानों पर बार-बार दिखाई देता है, लेकिन मुझे इसके लिए औचित्य नहीं …

3
एक्सकॉन्ड जेली बीन कॉमिक को समझाएं: क्या यह मज़ेदार है?
मैं देखता हूं कि बीस में से एक बार वे कुल परीक्षण करते हैं, , इसलिए वे गलत तरीके से मानते हैं कि बीस परीक्षणों में से एक के दौरान, परिणाम महत्वपूर्ण है ( )।0.05 = 1 / 20पी &lt; 0.05p&lt;0.05p < 0.050.05 = 1 / 200.05=1/200.05 = 1/20 xkcd …

6
बार-बार होने वाली बायेसियन बहस कहां चली गई?
सांख्यिकीविदों और बेइज़ियन के बीच आंकड़ों की दुनिया को विभाजित किया गया था। इन दिनों ऐसा लगता है कि हर कोई दोनों का एक सा करता है। यह कैसे हो सकता है? यदि विभिन्न दृष्टिकोण अलग-अलग समस्याओं के लिए उपयुक्त हैं, तो आंकड़ों के संस्थापक पिताओं ने ऐसा क्यों नहीं …

2
ZCA वाइटनिंग और PCA वाइटनिंग में क्या अंतर है?
मैं ZCA वाइटनिंग और सामान्य श्वेतकरण के बारे में उलझन में हूं (जो कि पीसीए eigenvalval के वर्गमूल द्वारा प्रमुख घटकों को विभाजित करके प्राप्त किया जाता है)। जहाँ तक मुझे पता है, UxZCAwhite=UxPCAwhite,xZCAwhite=UxPCAwhite,\mathbf x_\mathrm{ZCAwhite} = \mathbf U \mathbf x_\mathrm{PCAwhite}, जहां PCA eigenvectors हैं।UU\mathbf U जेडसीए व्हाइटनिंग के उपयोग क्या …

4
फिशर सूचना और Cramer- राव बाध्य की सहज व्याख्या
मैं फिशर जानकारी के साथ सहज नहीं हूं, यह क्या उपाय करता है और यह कैसे सहायक है। इसके अलावा, यह क्रैमर-राव के साथ संबंध मेरे लिए स्पष्ट नहीं है। क्या कोई इन अवधारणाओं की सहज व्याख्या दे सकता है?

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.