सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

1
ग्लेमर अधिकतम संभावना को प्राप्त नहीं करता है (जैसा कि आगे सामान्य अनुकूलन लागू करके सत्यापित किया गया है)?
जीएलएमएम के MLE s को संख्यात्मक रूप से प्राप्त करना कठिन है और, व्यवहार में, मुझे पता है, हमें ब्रूट फोर्स ऑप्टिमाइज़ेशन (जैसे, सरल तरीके से उपयोग करना) का उपयोग नहीं करना चाहिए । लेकिन अपने स्वयं के शैक्षिक उद्देश्य के लिए, मैं यह सुनिश्चित करने के लिए कोशिश करना …

6
यदि दो द्विपद वितरण एक दूसरे से सांख्यिकीय रूप से भिन्न हैं तो परीक्षण करें
मेरे पास डेटा के तीन समूह हैं, प्रत्येक एक द्विपद वितरण (यानी प्रत्येक समूह में ऐसे तत्व हैं जो या तो सफलता या विफलता हैं)। मेरे पास सफलता की अनुमानित संभावना नहीं है, लेकिन इसके बजाय केवल प्रत्येक की सफलता दर पर भरोसा कर सकते हैं जो कि सही सफलता …

3
एसवीएम और लॉजिस्टिक रिग्रेशन की तुलना करना
क्या कोई कृपया मुझे कुछ अंतर्ज्ञान दे सकता है जब एसवीएम या एलआर को चुनना है? मैं दो के हाइपरप्लेन को सीखने के अनुकूलन मानदंड में अंतर के पीछे अंतरंगता को समझना चाहता हूं, जहां संबंधित उद्देश्य निम्नानुसार हैं: एसवीएम: निकटतम समर्थन वैक्टर के बीच के मार्जिन को अधिकतम करने …

6
कई श्रेणीबद्ध चर के साथ वर्गीकरण में सुधार करें
मैं 200,000+ नमूनों के साथ एक डेटासेट पर काम कर रहा हूं और प्रति नमूने लगभग 50 विशेषताएं: 10 निरंतर चर और अन्य ~ 40 श्रेणीबद्ध चर (देश, भाषा, वैज्ञानिक क्षेत्र आदि) हैं। इन श्रेणीबद्ध चरों के लिए, आपके पास 150 विभिन्न देशों, 50 भाषाओं, 50 वैज्ञानिक क्षेत्रों आदि के …

2
फैक्टर एनालिसिस सहसंयोजक को कैसे समझाता है जबकि पीसीए विचरण को स्पष्ट करता है?
यहाँ बिशप की "पैटर्न रिकॉग्निशन एंड मशीन लर्निंग" पुस्तक, खंड 12.2.4 "कारक विश्लेषण" से एक उद्धरण है: हाइलाइट किए गए भाग के अनुसार, कारक विश्लेषण मैट्रिक्स में चर के बीच कोवरियन को पकड़ता हैWWW । मुझे आश्चर्य है कि कैसे ? यहाँ मैं इसे कैसे समझ सकता हूँ। कहो मनाया …

2
आर में अर्ध-साइनसॉइडल मॉडल के लिए एक अच्छा फिट कैसे खोजें?
मैं यह मान लेना चाहता हूं कि बाल्टिक सागर की समुद्री सतह का तापमान साल दर साल एक ही है, और फिर एक फ़ंक्शन / रैखिक मॉडल के साथ इसका वर्णन करें। मेरे पास विचार केवल एक दशमलव संख्या (या num_months / 12) के रूप में इनपुट वर्ष का था …
37 r  regression  time-series  lm 

8
मुझे गणना करने में मदद करें कि मेरी शादी में कितने लोग आएंगे! क्या मैं प्रत्येक व्यक्ति को प्रतिशत बता सकता हूँ और उन्हें जोड़ सकता हूँ?
मैं अपनी शादी की योजना बना रहा हूं। मैं अनुमान लगाना चाहता हूं कि मेरी शादी में कितने लोग आएंगे। मैंने लोगों की एक सूची बनाई है और मौका है कि वे प्रतिशत में भाग लेंगे। उदाहरण के लिए Dad 100% Mom 100% Bob 50% Marc 10% Jacob 25% Joseph …

10
क्या आंकड़ों या मशीन सीखने के बारे में कोई अच्छी लोकप्रिय विज्ञान पुस्तक है?
चारों ओर वास्तव में अच्छी लोकप्रिय विज्ञान की पुस्तकों का एक गुच्छा है, जो वास्तविक विज्ञान के साथ-साथ इतिहास और वर्तमान सिद्धांतों के पीछे का कारण है, जबकि पढ़ने के लिए बेहद सुखद है। उदाहरण के लिए, जेम्स गेलिक द्वारा "कैओस" (अराजकता, भंगुरता, ग़ैर-बराबरी), स्टीफन हॉकिंग द्वारा "समय का संक्षिप्त …

4
गणित में एक मजबूत पृष्ठभूमि एमएल के लिए कुल अपेक्षित है?
मैं अपने खुद के कौशल को आगे बढ़ाना चाहता हूं और मैं हमेशा मशीन लर्निंग से मोहित रहा हूं। हालांकि, छह साल पहले मैंने इसका पीछा करने के बजाय कंप्यूटर विज्ञान के लिए पूरी तरह से असंबंधित डिग्री लेने का फैसला किया। मैं अब लगभग 8-10 वर्षों से सॉफ़्टवेयर और …

3
एसवीएम, ओवरफिटिंग, आयामीता का अभिशाप
मेरा डेटासेट छोटा है (120 नमूने), हालांकि सुविधाओं की संख्या बड़ी है (1000-200,000)। हालाँकि मैं सुविधाओं का सबसेट चुनने के लिए फीचर का चयन कर रहा हूं, फिर भी यह ओवरफिट हो सकता है। मेरा पहला सवाल यह है कि, एसवीएम ओवरफिटिंग को कैसे हैंडल करता है, अगर बिल्कुल भी। …

5
मैं एक नॉनलाइनियर एसोसिएशन का परीक्षण कैसे कर सकता हूं?
प्लॉट 1 के लिए, मैं एक्स और वाई के बीच के संबंध को एक साधारण सहसंबंध का परीक्षण कर सकता हूं। प्लॉट 2 के लिए, जहां संबंध अशुभ है फिर भी एक्स और वाई के बीच एक स्पष्ट संबंध है, मैं एसोसिएशन का परीक्षण कैसे कर सकता हूं और इसकी …

6
महत्व आकार परीक्षण महत्व के लिए परिकल्पना के रूप में
आज, क्रॉस वेलिडेटेड जर्नल क्लब में (आप वहां क्यों नहीं थे?), @Mbq ने पूछा: क्या आपको लगता है कि हम (आधुनिक डेटा वैज्ञानिक) जानते हैं कि महत्व क्या है? और यह हमारे परिणामों में हमारे विश्वास से कैसे संबंधित है? @ मिचेल ने उत्तर दिया कि कुछ (मेरे सहित) आमतौर …

6
बायसीयन बनाम प्रायिकता की व्याख्या
क्या कोई बायेसियन और प्रायिकतावादी दृष्टिकोण के बीच अंतर की संभावना का एक अच्छा हिस्सा दे सकता है? मैं जो कुछ समझता हूं: फ़्रीक्वॉज़र्स का दृष्टिकोण यह है कि डेटा एक विशिष्ट आवृत्ति / संभावना के साथ एक दोहराए जाने योग्य यादृच्छिक नमूना (रैंडम वेरिएबल) है (जिसे किसी घटना की …

10
अर्थशास्त्र डेटा के सबसे उपयोगी स्रोत क्या हैं?
इकोनॉमी में शोध करते समय, किसी को वास्तविक डेटा पर सैद्धांतिक निष्कर्षों को सत्यापित करने की आवश्यकता होती है। उपयोग करने और उद्धृत करने के लिए विश्वसनीय डेटा स्रोत क्या हैं? मुझे मुख्य रूप से उन स्रोतों में दिलचस्पी है जो विभिन्न सांख्यिकीय डेटा प्रदान करते हैं जैसे कि जीडीपी, …
37 references 

3
रूपांतरित चर के घनत्व के लिए सहज व्याख्या?
मान लीजिए कि pdf साथ एक यादृच्छिक चर है । फिर यादृच्छिक चर में पीडीएफ हैXXXfX(x)fX(x)f_X(x)Y=X2Y=X2Y=X^2 fY(y)={12y√(fX(y√)+fX(−y√))0y≥0y<0fY(y)={12y(fX(y)+fX(−y))y≥00y<0f_Y(y)=\begin{cases}\frac{1}{2\sqrt{y}}\left(f_X(\sqrt{y})+f_X(-\sqrt{y})\right) & y \ge 0 \\ 0 & y \lt 0\end{cases} मैं इसके पीछे कैलकुलस को समझता हूं। लेकिन मैं किसी ऐसे व्यक्ति के बारे में बताने का तरीका सोचने की कोशिश कर रहा …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.