सांख्यिकी और बिग डेटा binning

4

हिस्टोग्राम के आधार पर डेटा के अनुमानित वितरण का आकलन करना

मान लीजिए मैं देखना चाहता हूं कि क्या हिस्टोग्राम (यानी दाईं ओर तिरछी) के आधार पर मेरा डेटा घातीय है। मैं डेटा को कैसे समूह या बिन करता हूं, इसके आधार पर, मैं बेतहाशा अलग-अलग हिस्टोग्राम प्राप्त कर सकता हूं। हिस्टोग्राम का एक सेट बना देगा कि डेटा घातीय है। …

111 distributions data-visualization histogram binning

7

एक निरंतर भविष्यवक्ता चर को तोड़ने से क्या लाभ है?

मैं सोच रहा हूं कि एक मॉडल में उपयोग करने से पहले एक निरंतर भविष्य कहनेवाला चर लेने और इसे (जैसे, क्विंटलों में) तोड़ने का क्या मूल्य है। यह मुझे लगता है कि चर को कम करके हम जानकारी खो देते हैं। क्या यह सिर्फ इतना है कि हम गैर-रैखिक …

78 regression modeling continuous-data binning regression-strategies

3

हिस्टोग्राम से अधिक QQ- भूखंडों का उपयोग करने के लाभ

में इस टिप्पणी को , निक कॉक्स ने लिखा है: कक्षाओं में बायनिंग एक प्राचीन पद्धति है। हिस्टोग्राम्स उपयोगी हो सकते हैं, वहीं आधुनिक सांख्यिकीय सॉफ्टवेयर कच्चे डेटा के वितरण के लिए उपयुक्त होने के साथ-साथ इसे आसान भी बनाता है। बिनिंग सिर्फ विस्तार को दूर फेंकता है जो यह …

22 references histogram binning qq-plot

2

हमें कब / बिन निरंतर स्वतंत्र चर / सुविधाओं का विवेक करना चाहिए और कब नहीं करना चाहिए?

हमें कब / बिन स्वतंत्र चर / सुविधाओं का विवेक करना चाहिए और कब नहीं करना चाहिए? प्रश्न का उत्तर देने का मेरा प्रयास: सामान्य तौर पर, हमें बिन नहीं होना चाहिए, क्योंकि बिनिंग जानकारी खो देगा। बिनिंग वास्तव में मॉडल की स्वतंत्रता की डिग्री बढ़ा रहा है, इसलिए, बिनिंग …

21 machine-learning continuous-data feature-construction binning

2

फिट परीक्षण के ची-स्क्वायर अच्छाई पर डेटा-आधारित बिन सीमाओं का प्रभाव?

इस तरह की परिस्थितियों में ची-स्क्वायर की कम शक्ति के स्पष्ट मुद्दे को छोड़कर, डेटा को दूर करके अनिर्दिष्ट मापदंडों के साथ कुछ घनत्व के लिए परीक्षण के ची-स्क्वायर अच्छाई करने की कल्पना करें। संक्षिप्तता के लिए, मान लें कि अज्ञात माध्य के साथ एक घातांक वितरण और कहते हैं …

18 chi-squared goodness-of-fit binning

3

एक ही पैमाने पर दो हिस्टोग्राम लगाने का सबसे अच्छा तरीका?

मान लीजिए कि मेरे पास दो वितरण हैं जिनकी मैं विस्तार से तुलना करना चाहता हूं, अर्थात आकार, पैमाना और बदलाव आसानी से दिखाई देता है। ऐसा करने का एक अच्छा तरीका प्रत्येक वितरण के लिए एक हिस्टोग्राम करना है, उन्हें एक ही एक्स पैमाने पर रखना है, और दूसरे …

14 data-visualization histogram pdf binning

2

किसी दिए गए प्रतिक्रिया चर के संबंध में इष्टतम बायनिंग

मैं एक निरंतर प्रतिक्रिया (लक्ष्य) बाइनरी चर के संबंध में और एक पैरामीटर के रूप में अधिकतम अंतराल के साथ निरंतर चर की इष्टतम बीनिंग विधि (विवेक) की तलाश कर रहा हूं। उदाहरण: मेरे पास "ऊंचाई" (अंक निरंतर) और "has_back_pains" (बाइनरी) चर वाले लोगों की टिप्पणियों का एक सेट है। …

12 r dataset optimization discrete-data binning

5

बेम्स प्रमेय की व्याख्या सकारात्मक मैमोग्राफी परिणामों पर लागू होती है

मैं अपने सिर को लपेटने की कोशिश कर रहा हूं कि बेम्स प्रमेय के परिणाम को क्लासिक मैमोग्राम के उदाहरण पर लागू किया गया है, जिसमें मैमोग्राम का मोड़ एकदम सही है। अर्थात्, कैंसर की घटना:.01.01.01 एक सकारात्मक मेम्मोग्राम की संभावना, जिसे देखते हुए रोगी को कैंसर है:111 एक सकारात्मक …

11 bayesian bayes binning diagnosis

2

कैसे 'समझदारी से' बिन सॉर्ट किए गए डेटा का एक संग्रह?

मैं समझदारी से बिन एक छांटे हुए संग्रह की कोशिश कर रहा हूं। मेरे पास डेटा के टुकड़ों का एक संग्रह है । लेकिन मुझे पता है कि यह डेटा मी असमान आकार के डिब्बे में फिट बैठता है। मुझे नहीं पता कि डेटा को ठीक से फिट करने के …

11 clustering histogram binning

5

बिनिंग को हर कीमत पर क्यों टाला जाना चाहिए?

इसलिए मैंने कुछ पोस्ट पढ़ी हैं कि क्यों बिनिंग से हमेशा बचा जाना चाहिए। इस दावे के लिए एक लोकप्रिय संदर्भ यह लिंक है । मुख्य पलायन यह है कि बिनिंग पॉइंट्स (या कटपॉइंट्स) बल्कि मनमाने ढंग से और साथ ही सूचना के नुकसान के कारण होते हैं, और यह …

10 classification categorical-data continuous-data splines binning

2

आपसी जानकारी की गणना करते समय डिब्बे की संख्या

मैं पारस्परिक जानकारी का उपयोग करके दो चर, ए और बी के बीच संबंध को निर्धारित करना चाहता हूं। गणना करने का तरीका प्रेक्षणों को कम करके है (नीचे उदाहरण पायथन कोड देखें)। हालांकि, कौन से कारक निर्धारित करते हैं कि डिब्बे की संख्या क्या उचित है? मुझे जल्दी होने …

10 information-theory mutual-information binning

1

रेखीय प्रतिगमन श्रेणीगत चर "छिपा हुआ" मान

यह सिर्फ एक उदाहरण है कि मैं कई बार आया हूं, इसलिए मेरे पास कोई नमूना डेटा नहीं है। R में एक रैखिक प्रतिगमन मॉडल चलाना: a.lm = lm(Y ~ x1 + x2) x1एक सतत चर है। x2श्रेणीबद्ध है और इसके तीन मान हैं "उदा", "मध्यम" और "उच्च"। हालाँकि R …

10 r regression categorical-data regression-coefficients categorical-encoding machine-learning random-forest anova spss r self-study bootstrap monte-carlo r multiple-regression partitioning neural-networks normalization machine-learning svm kernel-trick self-study survival cox-model repeated-measures survey likert correlation variance sampling meta-analysis anova independence sample assumptions bayesian covariance r regression time-series mathematical-statistics graphical-model machine-learning linear-model kernel-trick linear-algebra self-study moments function correlation spss probability confidence-interval sampling mean population r generalized-linear-model prediction offset data-visualization clustering sas cart binning sas logistic causality regression self-study standard-error r distributions r regression time-series multiple-regression python chi-squared independence sample clustering data-mining rapidminer probability stochastic-processes clustering binary-data dimensionality-reduction svd correspondence-analysis data-visualization excel c# hypothesis-testing econometrics survey rating composite regression least-squares mcmc markov-process kullback-leibler convergence predictive-models r regression anova confidence-interval survival cox-model hazard normal-distribution autoregressive mixed-model r mixed-model sas hypothesis-testing mediation interaction

2

हिस्टोग्राम बिनिंग के लिए डून का सूत्र

मैं हिस्टोग्राम के लिए उपयोग करने के लिए डिब्बे की सबसे अच्छी संख्या का अनुमान लगाने के लिए विभिन्न एल्गोरिदम को लागू कर रहा हूं। मेरे द्वारा कार्यान्वित किए जाने वाले अधिकांश भाग "हिस्टोग्राम" पृष्ठ पर " डिब्बे की संख्या और चौड़ाई " * में वर्णित हैं । मैं Doane …

9 histogram binning

binning पर टैग किए गए जवाब