सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

4
कच्चे आंकड़ों के बजाय नमूना आंकड़ों को इनपुट करके आर में दो-नमूना टी-टेस्ट कैसे करें?
मान लीजिए कि हमारे पास नीचे दिए गए आँकड़े हैं gender mean sd n f 1.666667 0.5773503 3 m 4.500000 0.5773503 4 वास्तविक आंकड़ों के बजाय इस तरह के आंकड़ों का उपयोग करके आप दो-नमूना टी-टेस्ट कैसे करते हैं (यह देखने के लिए कि क्या किसी चर में पुरुषों और …
32 r  t-test 

6
संभावना वितरण एक समान होने पर एन्ट्रॉपी को अधिकतम क्यों किया जाता है?
मुझे पता है कि एन्ट्रापी एक प्रक्रिया / चर की यादृच्छिकता का माप है और इसे निम्नानुसार परिभाषित किया जा सकता है। रैंडम वेरिएबल सेट : - । मैकाय द्वारा एंट्रॉपी एंड इंफॉर्मेशन थ्योरी की पुस्तक में, वह Ch2 में यह कथन प्रदान करता हैX∈X∈X \inAAAH(X)=∑xi∈A−p(xi)log(p(xi))H(X)=∑xi∈A−p(xi)log⁡(p(xi))H(X)= \sum_{x_i \in A} -p(x_i) …

4
पोइसन वितरण के लिए आत्मविश्वास स्तर की गणना कैसे करें?
जानना चाहूंगा कि मैं अपने में कितना आश्वस्त हो सकता हूं । किसी को एक पॉइसन वितरण के लिए ऊपरी और निचले आत्मविश्वास का स्तर निर्धारित करने का तरीका पता है?λλ\lambda अवलोकन ( ) = 88nnn नमूना का मतलब ( ) = 47.18182λλ\lambda 95% आत्मविश्वास इसके लिए कैसा दिखेगा?

1
प्रतिगमन के लिए सीएनएन आर्किटेक्चर?
मैं एक प्रतिगमन समस्या पर काम कर रहा हूं जहां इनपुट एक छवि है, और लेबल 80 और 350 के बीच एक निरंतर मूल्य है। प्रतिक्रिया के बाद चित्र कुछ रसायनों के होते हैं। जो रंग निकलता है, वह किसी अन्य रसायन की एकाग्रता को इंगित करता है जिसे छोड़ …

5
LSTM इकाइयों बनाम कोशिकाओं को समझना
मैं कुछ समय से LSTM का अध्ययन कर रहा हूं। मैं एक उच्च स्तर पर समझता हूं कि सब कुछ कैसे काम करता है। हालाँकि, उन्हें Tensorflow का उपयोग करके लागू करने जा रहा है मैंने देखा है कि BasicLSTMCell को कई इकाइयों (यानी num_units) पैरामीटर की आवश्यकता होती है …

9
डीनिंग बेलमैन के समीकरण रीइनफोर्समेंट लर्निंग में
मैं " इन रिइनफोर्समेंट लर्निंग। एन इंट्रोडक्शन " में निम्नलिखित समीकरण देखता हूं , लेकिन मैंने नीचे नीले रंग में हाइलाइट किए गए चरण का पालन नहीं किया है। यह कदम वास्तव में कैसे प्राप्त होता है?

4
क्या एक परीक्षा का परिणाम एक द्विपद है?
यहाँ एक सरल सांख्यिकी प्रश्न है जो मुझे दिया गया था। मुझे यकीन नहीं है कि मैं इसे समझता हूं। एक्स = एक परीक्षा में एक्वायर्ड अंक की संख्या (बहुविकल्पी और एक सही उत्तर एक बिंदु है)। क्या एक्स द्विपदीय वितरित किया जाता है? प्रोफेसर का जवाब था: हां, क्योंकि …

2
डेटा - डेटा ड्रेजिंग की कल्पना करने के बाद एक सांख्यिकीय परीक्षण करना?
मैं इस प्रश्न को एक उदाहरण के माध्यम से प्रस्तावित करूंगा। मान लीजिए कि मेरे पास एक डेटा सेट है, जैसे कि बॉस्टन हाउसिंग प्राइस डेटा सेट, जिसमें मेरे पास निरंतर और श्रेणीबद्ध चर हैं। यहां, हमारे पास "गुणवत्ता" चर है, 1 से 10 तक, और बिक्री मूल्य। मैं डेटा …

2
लॉजिस्टिक रिग्रेशन: स्किटिट वर्सेस स्टैटस्मॉडल
मैं यह समझने की कोशिश कर रहा हूं कि इन दो पुस्तकालयों के लॉजिस्टिक प्रतिगमन से आउटपुट अलग-अलग परिणाम क्यों देता है। मैं UCLA आईडीआर ट्यूटोरियल के डेटासेट का उपयोग कर रहा हूं , और उसके admitआधार पर भविष्यवाणी कर रहा हूं । को श्रेणीबद्ध चर के रूप में माना …

1
संयुक्त विश्वास अंतराल की गणना के लिए गॉसियन सहसंबंध असमानता के परिणाम
क्वांटा मैगज़ीन के इस बहुत ही दिलचस्प लेख के अनुसार: "ए लॉन्ग-साइडेड प्रूफ़, फाउंड एंड ऑलमोस्ट लॉस्ट" - यह साबित हो चुका है कि एक वेक्टर दिया गया है जिसमें मल्टीवेरेट गौसियन डिस्ट्रीब्यूशन है। और अंतराल दिया मैं 1 , ... , मैं n चारों ओर की इसी घटकों के …

6
क्या पारसमणि वास्तव में अभी भी सोने का मानक होना चाहिए?
सिर्फ एक विचार: पर्सिमोनियस मॉडल हमेशा डिफॉल्ट गो-टू मॉडल चयन में रहा है, लेकिन यह दृष्टिकोण किस हद तक पुराना है? मुझे इस बात की उत्सुकता है कि पारसीमोनी के प्रति हमारी प्रवृत्ति अबकी और स्लाइड नियमों (या अधिक गंभीरता से, गैर-आधुनिक कंप्यूटर) के समय का अवशेष है। आज की …


3
स्ट्रिंग्स (शब्दों) की एक लंबी सूची को समानता समूहों में विभाजित करना
मुझे हाथ में निम्नलिखित समस्या है: मेरे पास शब्दों की एक बहुत लंबी सूची है, संभवतः नाम, उपनाम आदि, मुझे इस शब्द सूची को क्लस्टर करने की आवश्यकता है, जैसे कि समान शब्द, उदाहरण के लिए समान संपादन वाले शब्द (लेवेंसहाइट) दूरी दिखाई देती है। एक ही क्लस्टर। उदाहरण के …

3
पीसीए को पार करने के लिए टेन्सरफ्लो में एक ऑटोएन्कोडर का निर्माण
न्यूरल नेटवर्क्स के साथ डेटा की आयामीता को कम करने में हिंटन और सलाखुद्दीनोव , विज्ञान 2006 ने एक गहन ऑटोएन्कोडर के उपयोग के माध्यम से एक गैर-रैखिक पीसीए का प्रस्ताव किया। मैंने कई बार Tensorflow के साथ PCA autoencoder बनाने और प्रशिक्षित करने की कोशिश की है लेकिन मैं …

4
Winsorizing बनाम ट्रिमिंग डेटा के सापेक्ष गुण क्या हैं?
Winsorizing डेटा का अर्थ है कि प्रत्येक छोर से एक निश्चित प्रतिशत मान के साथ सेट किए गए डेटा के चरम मानों को बदलना , जबकि Trimming या Truncating में उन चरम मूल्यों को निकालना शामिल है । जब हमेशा माध्य या मानक विचलन जैसे आँकड़ों की गणना की जाती …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.