binary-data पर टैग किए गए जवाब

एक बाइनरी वैरिएबल दो में से एक मान लेता है, जिसे आमतौर पर "0" और "1" के रूप में कोडित किया जाता है।

9
2d बाइनरी मैट्रिक्स की एन्ट्रापी / सूचना / पैटर्न को मापना
मैं द्वि-आयामी बाइनरी मैट्रिक्स की एन्ट्रापी / सूचना घनत्व / पैटर्न-समानता को मापना चाहता हूं। मुझे स्पष्टीकरण के लिए कुछ तस्वीरें दिखाइए: इस प्रदर्शन में एक उच्च एंट्रॉपी होनी चाहिए: ए) इसमें मध्यम एन्ट्रापी होनी चाहिए: बी) ये चित्र, अंत में, सभी के पास शून्य-एन्ट्रापी होने चाहिए: सी) डी) इ) …

6
दृढ़ता से असंतुलित कक्षाओं के साथ द्विआधारी वर्गीकरण
मेरे पास (सुविधाओं, बाइनरी आउटपुट 0 या 1) के रूप में एक डेटा सेट है, लेकिन 1 बहुत कम ही होता है, इसलिए केवल हमेशा 0 की भविष्यवाणी करने से, मुझे 70% और 90% के बीच सटीकता मिलती है (विशेष डेटा के आधार पर मैं देखता हूं )। एमएल विधियां …

4
वर्गीकरण संभावना सीमा
मेरे पास सामान्य तौर पर वर्गीकरण के संबंध में एक प्रश्न है। च एक क्लासिफायरियर होने दें, जो कुछ डेटा डी को दिए गए संभावनाओं के एक सेट को आउटपुट करता है। आम तौर पर, कोई भी कहेगा: ठीक है, अगर पी (सी | डी)> 0.5, हम एक कक्षा 1 …

3
क्या दो बूलियन वैक्टर के बीच पियर्सन या स्पीयरमैन सहसंबंध की गणना करना सार्थक है?
दो बूलियन वैक्टर हैं, जिनमें 0 और 1 ही हैं। यदि मैं पियरसन या स्पीयरमैन सहसंबंध की गणना करता हूं, तो क्या वे सार्थक या उचित हैं?

3
क्या पीसीए बूलियन (बाइनरी) डेटा प्रकारों के लिए काम करेगा?
मैं उच्च आदेश प्रणालियों की गतिशीलता को कम करना चाहता हूं और अधिकांश कोवरियन को अधिमानतः 2 आयामी या 1 आयामी क्षेत्र पर कब्जा करना चाहता हूं। मैं समझता हूं कि यह प्रमुख घटक विश्लेषण के माध्यम से किया जा सकता है, और मैंने कई परिदृश्यों में पीसीए का उपयोग …

1
द्विआधारी डेटा पर प्रमुख घटक विश्लेषण या कारक विश्लेषण करना
मेरे पास बड़ी संख्या में हां / ना में कोई डेटासेट है। क्या मैं इस प्रकार के डेटा के लिए मुख्य घटकों (पीसीए) या किसी अन्य डेटा कटौती विश्लेषण (जैसे कारक विश्लेषण) का उपयोग कर सकता हूं? कृपया सलाह दें कि मैं SPSS का उपयोग करके ऐसा कैसे कर सकता …

1
क्या ऑर्डिनल या बाइनरी डेटा के लिए फैक्टर विश्लेषण या पीसीए है?
मैंने मुख्य घटक विश्लेषण (पीसीए), खोजपूर्ण कारक विश्लेषण (ईएफए), और पुष्टिकरण कारक विश्लेषण (सीएफए) को पूरा किया है, डेटा को समान पैमाने (5-स्तरीय प्रतिक्रियाओं: कोई नहीं, थोड़ा, कुछ, ..) के साथ एक निरंतर के रूप में माना जाता है। चर। फिर, लावन का उपयोग करते हुए, मैंने सीएफए को चर …

2
बाइनरी और निरंतर चर दोनों को एक साथ क्लस्टरिंग में कैसे उपयोग करें?
मुझे k- साधनों में बाइनरी चर (मान 0 और 1) का उपयोग करने की आवश्यकता है। लेकिन k- साधन केवल निरंतर चर के साथ काम करता है। मुझे पता है कि कुछ लोग अभी भी इन बाइनरी चर का उपयोग k- साधनों में इस तथ्य की अनदेखी करते हुए करते …

7
उदाहरण के लिए, लिंग को आमतौर पर 1/2 के बजाय 0/1 कोडित क्यों किया जाता है?
मैं डेटा विश्लेषण के लिए कोडिंग के तर्क को समझता हूं। नीचे मेरा प्रश्न एक विशिष्ट कोड के उपयोग पर है। क्या एक कारण है कि लिंग को अक्सर महिला के लिए 0 और पुरुष के लिए 1 के रूप में कोडित किया जाता है? इस कोडिंग को 'मानक' क्यों …

5
क्या आपको कभी भी बाइनरी वैरिएबल को मानकीकृत करना चाहिए?
मेरे पास सुविधाओं के एक सेट के साथ एक डेटा सेट है। उनमें से कुछ द्विआधारी (1=(1=(1= सक्रिय या निकाल दिए गए, 0=0=0= निष्क्रिय या निष्क्रिय) हैं, और बाकी वास्तविक मूल्यवान हैं, जैसे 4564.3424564.3424564.342 । मैं इस डेटा को एक मशीन लर्निंग एल्गोरिदम को खिलाना चाहता हूं, इसलिए मैं सभी …

3
एक मॉडल की अनुमानित संभावना के अंशांकन को विज़ुअलाइज़ करना
मान लीजिए मेरे पास एक पूर्वानुमान मॉडल है जो प्रत्येक उदाहरण के लिए, प्रत्येक वर्ग के लिए एक संभावना है। अब मैं पहचानता हूं कि ऐसे मॉडल का मूल्यांकन करने के कई तरीके हैं यदि मैं वर्गीकरण (सटीक, याद, आदि) के लिए उन संभावनाओं का उपयोग करना चाहता हूं। मैं …

3
एक द्विआधारी और एक सतत चर के बीच यादृच्छिक सहसंबंधित डेटा उत्पन्न करें
मैं दो चर उत्पन्न करना चाहता हूं। एक द्विआधारी परिणाम चर (सफलता / विफलता कहते हैं) और दूसरा वर्षों में आयु है। मैं चाहता हूं कि सफलता के साथ उम्र का सकारात्मक संबंध हो। उदाहरण के लिए उच्च आयु वर्ग में कम की तुलना में अधिक सफलताएं होनी चाहिए। आदर्श …

2
बाइनरी मैट्रिक्स को क्लस्टर करना
मेरे पास आयाम 250k x 100 की बाइनरी विशेषताओं का एक अर्ध-छोटा मैट्रिक्स है। प्रत्येक पंक्ति एक उपयोगकर्ता है और कॉलम कुछ उपयोगकर्ता व्यवहार के बाइनरी "टैग" हैं जैसे "पसंद_कैट"। user 1 2 3 4 5 ... ------------------------- A 1 0 1 0 1 B 0 1 0 1 0 …

2
बाइनरी डेटा के लिए समानता गुणांक: रसेल और राव पर जैकार्ड का चयन क्यों करें?
से सांख्यिकीय विज्ञान विश्वकोश मुझे लगता है कि यह देखते हुए समझ में दिचोतोमोउस (बाइनरी: 1 = वर्तमान; 0 = अनुपस्थित) विशेषताओं (चर), हम किसी भी दो वस्तुओं के लिए एक आपात तालिका फार्म कर सकते हैं मैं और जे एक नमूने की:पीपीp j 1 0 ------- 1 | a …

4
जैसे-जैसे पुनरावृत्तियों की संख्या बढ़ती है, धीरे-धीरे बूस्टिंग मशीन की सटीकता कम होती जाती है
मैं caretआर में पैकेज के माध्यम से ढाल बूस्टिंग मशीन एल्गोरिदम का प्रयोग कर रहा हूं । एक छोटे से कॉलेज प्रवेश डेटासेट का उपयोग करते हुए, मैंने निम्नलिखित कोड चलाया: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.