सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

1
प्रतिगमन: परिवर्तनशील चर
परिवर्तनशील चर बनाते समय, क्या आपको एक ही परिवर्तन का उपयोग करना होगा? उदाहरण के लिए, क्या मैं अलग-अलग रूपांतरित चर चुन सकता हूं, जैसे: आज्ञा देना, आयु, रोजगार की लंबाई, निवास की लंबाई और आय।x1,x2,x3x1,x2,x3x_1,x_2,x_3 Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3) या, क्या आपको अपने परिवर्तनों के अनुरूप …

4
एक बड़े पर्याप्त नमूने के आकार के रूप में 30 का उपयोग करने के लिए किन संदर्भों का उल्लेख किया जाना चाहिए?
मैंने कई बार पढ़ा / सुना है कि कम से कम 30 इकाइयों के नमूने का आकार "बड़ा नमूना" माना जाता है (सामान्य अर्थ की धारणाएं आमतौर पर सीएलटी के कारण होती हैं, ...)। इसलिए, मेरे प्रयोगों में, मैं आमतौर पर 30 इकाइयों के नमूने उत्पन्न करता हूं। क्या आप …

3
दो सामान्य रूप से वितरित यादृच्छिक चर के बीच यूक्लिडियन दूरी का वितरण क्या है?
मान लें कि आपको दो ऑब्जेक्ट दिए गए हैं जिनके सटीक स्थान अज्ञात हैं, लेकिन ज्ञात मापदंडों के अनुसार सामान्य वितरण के अनुसार वितरित किए जाते हैं (जैसे और । हम यह मान सकते हैं कि इन दोनों द्विचर Normals, ऐसी है कि पदों एक वितरण पर द्वारा वर्णित हैं …

8
अगर पोइसन वितरण से नमूने लिए गए हैं तो मैं कैसे परीक्षण कर सकता हूं?
मुझे सामान्यता परीक्षणों का पता है, लेकिन मैं "पॉइसन-नेस" का परीक्षण कैसे करूँ? मेरे पास ~ 1000 गैर-नकारात्मक पूर्णांक का नमूना है, जो मुझे लगता है कि एक पॉइसन वितरण से लिया गया है, और मैं इसका परीक्षण करना चाहूंगा।

13
औसत आयु की तुलना में मध्ययुगीन आयु एक बेहतर आँकड़ा क्यों है?
अगर आप वुल्फराम अल्फा को देखें या यह विकिपीडिया पृष्ठ मध्ययुगीन देशों की सूची है स्पष्ट रूप से मध्ययुगीन युग की बात आती है तो यह पसंद का आँकड़ा है। मैं खुद को यह नहीं समझा पा रहा हूं कि अंकगणित का मतलब एक खराब आंकड़ा क्यों होगा। ऐसा क्यों …
41 mean  median 

4
शून्य सहसंबंध क्यों जरूरी स्वतंत्रता का अर्थ नहीं है
यदि दो चर में 0 संबंध हैं, तो वे आवश्यक रूप से स्वतंत्र क्यों नहीं हैं? क्या शून्य सहसंबंधित चर विशेष परिस्थितियों में स्वतंत्र हैं? यदि संभव हो तो, मैं एक सहज व्याख्या की तलाश कर रहा हूं, एक उच्च तकनीकी नहीं।

1
त्रुटि उपायों की व्याख्या कैसे करें?
मैं एक निश्चित डेटासेट के लिए वीका में वर्गीकृत कर रहा हूं और मैंने देखा है कि अगर मैं नाममात्र मूल्य की भविष्यवाणी करने की कोशिश कर रहा हूं तो आउटपुट विशेष रूप से सही और गलत तरीके से अनुमानित मूल्यों को दिखाता है। हालाँकि, अब मैं इसे संख्यात्मक विशेषता …

5
व्यावहारिक हाइपरपैरिमेट अनुकूलन: रैंडम बनाम ग्रिड खोज
मैं वर्तमान में बेंगियो और बर्गस्टा के रैंडम सर्च फॉर हाइपर-पैरामीटर ऑप्टिमाइज़ेशन के माध्यम से जा रहा हूं [1] जहां लेखक दावा करते हैं कि यादृच्छिक खोज लगभग समान प्रदर्शन प्राप्त करने में ग्रिड खोज से अधिक कुशल है। मेरा प्रश्न है: क्या यहाँ के लोग उस दावे से सहमत …

3
एक सामान्य और एक गाऊसी वितरण के बीच क्या अंतर है
क्या एक नॉर्मल और गॉसियन डिस्ट्रीब्यूशन के बीच गहरा अंतर है, मैंने कई पेपरों को बिना डिस्टिंक्शन के इस्तेमाल करते हुए देखा है, और मैं आमतौर पर उन्हें एक ही चीज के रूप में भी संदर्भित करता हूं। हालांकि, मेरे पीआई ने हाल ही में मुझे बताया कि एक सामान्य …

3
कैसे कर सकते हैं मैं calculate
मान लीजिए ϕ(⋅)ϕ(⋅)\phi(\cdot) और Φ(⋅)Φ(⋅)\Phi(\cdot) घनत्व समारोह और मानक सामान्य वितरण के वितरण समारोह कर रहे हैं। अभिन्न की गणना कैसे की जा सकती है: ∫∞−∞Φ(w−ab)ϕ(w)dw∫−∞∞Φ(w−ab)ϕ(w)dw\int^{\infty}_{-\infty}\Phi\left(\frac{w-a}{b}\right)\phi(w)\,\mathrm dw

9
एफ-माप मूल्यों की व्याख्या कैसे करें?
मैं जानना चाहता हूं कि एफ-माप मूल्यों के अंतर की व्याख्या कैसे करें। मुझे पता है कि एफ-माप सटीक और याद के बीच एक संतुलित साधन है, लेकिन मैं एफ-उपायों में अंतर के व्यावहारिक अर्थ के बारे में पूछ रहा हूं। उदाहरण के लिए, यदि एक क्लासिफायरियर C1 में 0.4 …

5
एक प्रतिगमन में सहसंयोजक को जोड़ने से भविष्यवाणी के स्कोर कैसे भिन्न होते हैं, और उन्हें बाद में कब पसंद किया जाता है?
मैं मानता हूं कि मैं प्रवृत्ति स्कोर और कारण विश्लेषण के लिए अपेक्षाकृत नया हूं। एक बात यह है कि एक नवागंतुक के रूप में मेरे लिए यह स्पष्ट नहीं है कि प्रवृत्ति स्कोर का उपयोग करते हुए "संतुलन" गणितीय रूप से भिन्न कैसे होता है जब हम एक प्रतिगमन …

1
Softmax_cross_entropy_with_logs सॉफ्टमैक्स_क्रॉस_एंट्रोपि_विथ_लॉग्स_v2 से कैसे अलग है?
विशेष रूप से, मुझे लगता है कि मैं इस कथन के बारे में आश्चर्यचकित हूं: TensorFlow के भविष्य के प्रमुख संस्करण ग्रेडिएंट्स को डिफ़ॉल्ट रूप से बैकप्रॉप पर लेबल इनपुट में प्रवाहित करने की अनुमति देंगे। जिसका उपयोग करने पर दिखाया जाता है tf.nn.softmax_cross_entropy_with_logits। एक ही संदेश में यह मेरे …

6
रैंडम फॉरेस्ट - ओवरफिटिंग से कैसे निपटें
मेरे पास एक कंप्यूटर विज्ञान पृष्ठभूमि है, लेकिन मैं इंटरनेट पर समस्याओं को हल करके खुद को डेटा विज्ञान सिखाने की कोशिश कर रहा हूं। मैं पिछले कुछ हफ्तों से इस समस्या पर काम कर रहा हूं (लगभग 900 पंक्तियाँ और 10 विशेषताएँ)। मैं शुरू में लॉजिस्टिक रिग्रेशन का उपयोग …

3
क्या सांख्यिकीय स्वतंत्रता का मतलब करणीय की कमी है?
दो यादृच्छिक चर A और B सांख्यिकीय रूप से स्वतंत्र हैं। इसका मतलब है कि प्रक्रिया के DAG में: और निश्चित रूप से । लेकिन क्या इसका यह भी मतलब है कि बी से ए तक कोई फ्रंट-डोर नहीं है?पी ( ए | बी ) = पी ( ए )(A⊥⊥B)(A⊥⊥B)(A …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.