machine-learning पर टैग किए गए जवाब

मशीन लर्निंग एल्गोरिदम प्रशिक्षण डेटा का एक मॉडल बनाते हैं। "मशीन लर्निंग" शब्द अस्पष्ट रूप से परिभाषित है; इसमें सांख्यिकीय अधिगम, सुदृढीकरण अधिगम, अप्राप्य अधिगम, इत्यादि को भी शामिल किया जाता है।

5
आप कैसे तय करते हैं कि आपकी ट्रेन, सत्यापन और परीक्षण प्रतिशत क्या हैं?
प्रशिक्षण, सत्यापन और परीक्षण सेट में अपने लेबल किए गए डेटा को विभाजित करते समय, मैंने 50/25/25 से 85/5/10 तक सब कुछ सुना है। मुझे यकीन है कि यह इस बात पर निर्भर करता है कि आप अपने मॉडल का उपयोग कैसे करने जा रहे हैं और अपने सीखने के …

1
मशीन सीखने के लिए आंकड़े, कागजात शुरू करने के लिए?
मेरे पास कंप्यूटर प्रोग्रामिंग और प्राथमिक संख्या सिद्धांत में एक पृष्ठभूमि है, लेकिन कोई वास्तविक सांख्यिकी प्रशिक्षण नहीं है, और हाल ही में "खोज" किया है कि पूरी तकनीक की अद्भुत दुनिया वास्तव में एक सांख्यिकीय दुनिया है। ऐसा लगता है कि मैट्रिक्स कारक, मैट्रिक्स पूर्णता, उच्च आयामी टेनर्स, एम्बेडिंग, …

1
क्या P (X) और P (Y | X) के IID नमूनों के स्टोकेस्टिक क्रमिक वंश से P (Y | X) का मॉडल प्रशिक्षित किया जा सकता है?
जब कुछ डेटा सेट पर स्टोचैस्टिक ग्रेडिएंट वंश के माध्यम से एक मानकीकृत मॉडल (जैसे संभावना को अधिकतम करने के लिए) का प्रशिक्षण दिया जाता है, तो आमतौर पर यह माना जाता है कि प्रशिक्षण के नमूने प्रशिक्षण डेटा वितरण से तैयार किए गए हैं। इसलिए यदि लक्ष्य संयुक्त वितरण …

3
कम से कम मेमोरी का उपयोग करके प्रशिक्षण डेटा का सबसे कुशल तरीका क्या है?
यह मेरा प्रशिक्षण डेटा है: 200,000 उदाहरण x 10,000 सुविधाएँ। तो मेरा प्रशिक्षण डेटा मैट्रिक्स है - 200,000 x 10,000। मैंने प्रत्येक फ़िमेल को एक-एक करके (एक के बाद एक उदाहरण) सहेज कर मेमोरी मुद्दों के बिना एक सपाट फ़ाइल में इसे सहेजने में कामयाबी हासिल की, क्योंकि मैं प्रत्येक …

2
नियमितीकरण
नियमितीकरण करने के कई तरीके हैं - उदाहरण के लिए , एल 1 , और एल 2 मानक आधारित नियमितीकरण। फ्रेडमैन हस्ती और टिबरानी के अनुसार , सबसे अच्छा नियमितकर्ता समस्या पर निर्भर करता है: अर्थात् वास्तविक लक्ष्य फ़ंक्शन की प्रकृति, विशेष आधार का उपयोग, सिग्नल-टू-शोर अनुपात और नमूना आकार।एल0L0L_0एल1L1L_1एल2L2L_2 …

3
सांख्यिकीय महत्व का उपयोग करके दो अलग-अलग मॉडलों की सटीकता की तुलना कैसे करें
मैं समय श्रृंखला भविष्यवाणी पर काम कर रहा हूं। मेरे पास दो डेटा सेट डी 1 = { एक्स1, एक्स2, । । । । एक्सn}डी1={एक्स1,एक्स2,।।।।एक्सn}D1=\{x_1, x_2,....x_n\} और डी 2 = { एक्सn+ 1 , xn+ 2 , एक्सn+ 3 , । । । । , एक्सn+ के }डी2={एक्सn+1,एक्सn+2,एक्सn+3,।।।।,एक्सn+क}D2=\{x_n+1, x_n+2, x_n+3,...., …

3
टेक्स्ट दस्तावेज़ के लिए फीचर वेक्टर बनाने के लिए बिग्राम (एन-ग्राम) मॉडल का उपयोग करने के बारे में
टेक्स्ट माइनिंग के लिए फीचर निर्माण का एक पारंपरिक तरीका बैग-ऑफ-वर्ड्स दृष्टिकोण है, और किसी दिए गए टेक्स्ट डॉक्यूमेंट की विशेषता वाले वेक्टर की स्थापना के लिए tf-idf का उपयोग करके इसे बढ़ाया जा सकता है। वर्तमान में, मैं फ़ीचर वेक्टर के निर्माण के लिए द्वि-ग्राम भाषा मॉडल या (एन-ग्राम) …

1
फिशर गुठली से परे
कुछ समय के लिए, ऐसा लग रहा था कि फिशर कर्नेल लोकप्रिय हो सकते हैं, क्योंकि वे संभावित मॉडल से गुठली बनाने का एक तरीका प्रतीत हो रहे थे। हालांकि, मैंने शायद ही कभी उन्हें अभ्यास में इस्तेमाल करते देखा है, और मेरे पास यह अच्छा अधिकार है कि वे …

1
बहुत बड़ी समय-श्रृंखला डेटासेट से निपटना
मेरी पहुंच बहुत बड़े डेटासेट तक है। डेटा चार लोगों में से एक से संगीत अंश सुनने वाले एमईजी रिकॉर्डिंग से है। डेटा इस प्रकार है: 6 विषय 3 प्रायोगिक दोहराव (युग) 120 परीक्षण प्रति युग 275 MEG चैनलों से 500Hz (= 4000 नमूने) पर परीक्षण के अनुसार 8 सेकंड …

3
विशाल डेटासेट से सीखते समय दृष्टिकोण?
मूल रूप से, विशाल डेटासेट के खिलाफ सीखने के दो सामान्य तरीके हैं (जब आप समय / स्थान प्रतिबंधों का सामना करते हैं): धोखा :) - प्रशिक्षण के लिए सिर्फ एक "प्रबंधनीय" सबसेट का उपयोग करें। घटते रिटर्न के कानून की वजह से सटीकता की हानि नगण्य हो सकती है …

1
क्या MFCC एक पुनर्प्राप्ति प्रणाली के लिए संगीत का प्रतिनिधित्व करने का इष्टतम तरीका है?
एक सिग्नल प्रोसेसिंग तकनीक, मेल फ़्रीक्वेंसी सेफस्ट्रम , का उपयोग अक्सर मशीन लर्निंग कार्य में उपयोग के लिए एक संगीत टुकड़े से जानकारी निकालने के लिए किया जाता है। यह विधि एक अल्पकालिक बिजली स्पेक्ट्रम देती है, और गुणांक इनपुट के रूप में उपयोग किया जाता है। म्यूजिक रिट्रीवल सिस्टम …

8
पिछली खरीद से दिए गए डेटा के उपभोग्य उपभोग की भविष्यवाणी करने के लिए किस एल्गोरिदम का उपयोग किया जा सकता है?
माना जाता है कि एक साधारण लेकिन दिलचस्प समस्या के बारे में, मैं कुछ कोड लिखने के लिए उपभोग्य पूर्वानुमान लगा सकता हूं, जिनकी मुझे निकट भविष्य में अपनी पिछली खरीद का पूरा इतिहास देना होगा। मुझे यकीन है कि इस तरह की समस्या में कुछ अधिक सामान्य और अच्छी …

6
R- वर्ग की तुलना दो अलग-अलग रैंडम फ़ॉरेस्ट मॉडल से करें
मैं नमूनों की तुलना में अधिक भविष्यवक्ताओं के साथ "विस्तृत" डेटासेट में निरंतर परिणाम की व्याख्या करने की कोशिश करने के लिए एक यादृच्छिक वन मॉडल विकसित करने के लिए आर में यादृच्छिकतम पैकेज का उपयोग कर रहा हूं। विशेष रूप से, मैं एक आरएफ मॉडल फिटिंग कर रहा हूं, …

2
AUC का उपयोग करने का औचित्य?
विशेष रूप से मशीन लर्निंग साहित्य के कंप्यूटर-विज्ञान उन्मुख पक्ष में, एयूसी (रिसीवर ऑपरेटर विशेषता वक्र के तहत क्षेत्र) सहपाठियों के मूल्यांकन के लिए एक लोकप्रिय मानदंड है। एयूसी का उपयोग करने के लिए क्या औचित्य हैं? उदाहरण के लिए एक विशेष नुकसान फ़ंक्शन है जिसके लिए इष्टतम निर्णय सर्वश्रेष्ठ …

1
जब मॉडल की संभावना शून्य से काफी अधिक नहीं होती है तो महत्व (GAM) प्रतिगमन गुणांक
मैं आर पैकेज गैंल्स का उपयोग करके एक जीएएम -आधारित प्रतिगमन चला रहा हूं और डेटा का शून्य-फुलाया बीटा वितरण मान रहा हूं । मेरे पास अपने मॉडल में केवल एक ही व्याख्यात्मक चर है, इसलिए यह मूल रूप से है mymodel = gamlss(response ~ input, family=BEZI):। एल्गोरिथ्म मुझे माध्य …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.