machine-learning पर टैग किए गए जवाब

मशीन लर्निंग एल्गोरिदम प्रशिक्षण डेटा का एक मॉडल बनाते हैं। "मशीन लर्निंग" शब्द अस्पष्ट रूप से परिभाषित है; इसमें सांख्यिकीय अधिगम, सुदृढीकरण अधिगम, अप्राप्य अधिगम, इत्यादि को भी शामिल किया जाता है।

8
मल्टीस्कल्स-मल्टीलेबल वर्गीकरण के लिए सटीक / रिकॉल की गणना कैसे करें?
मैं सोच रहा हूं कि मल्टीस्केल्स मल्टीलेबल वर्गीकरण के लिए सटीक और रिकॉल उपायों की गणना कैसे करें, अर्थात वर्गीकरण जहां दो से अधिक लेबल हैं, और जहां प्रत्येक उदाहरण में कई लेबल हो सकते हैं?

7
यूक्लिडियन दूरी आमतौर पर विरल डेटा के लिए अच्छा नहीं है?
मैंने कहीं देखा है कि जब हम बहुआयामी और विरल डेटा होते हैं तो शास्त्रीय दूरी (जैसे यूक्लिडियन दूरी) कमजोर रूप से भेदभावपूर्ण हो जाती है। क्यों? क्या आपके पास दो विरल डेटा वैक्टर का उदाहरण है जहां यूक्लिडियन दूरी अच्छा प्रदर्शन नहीं करती है? इस मामले में हमें किस …

2
बंद-रूप बनाम ढाल वंश में प्रतिगमन मापदंडों के लिए समाधान
एंड्रयू एनजी के मशीन लर्निंग कोर्स में , वह रैखिक प्रतिगमन और लॉजिस्टिक रिग्रेशन का परिचय देता है, और दिखाता है कि कैसे ढाल वंश और न्यूटन की विधि का उपयोग करके मॉडल मापदंडों को फिट किया जाए। मुझे पता है कि ढाल सीखने की मशीन सीखने के कुछ अनुप्रयोगों …

8
मशीन सीखने वालों में खोजने के लिए कौशल कठिन?
ऐसा लगता है कि डेटा माइनिंग और मशीन लर्निंग इतनी लोकप्रिय हो गई है कि अब लगभग हर सीएस छात्र को क्लासिफायर, क्लस्टरिंग, स्टेटिस्टिकल एनएलपी ... आदि के बारे में पता है, इसलिए ऐसा लगता है कि आजकल डेटा माइनर्स ढूंढना कोई मुश्किल बात नहीं है। मेरा सवाल है: क्या …

1
क्रॉस सत्यापन, लर्निंग कर्व और अंतिम मूल्यांकन के लिए डेटासेट को कैसे विभाजित करें?
डेटासेट को विभाजित करने के लिए एक उपयुक्त रणनीति क्या है? मैं निम्नलिखित दृष्टिकोण पर प्रतिक्रिया के लिए पूछना (जैसे व्यक्तिगत मानकों के आधार पर नहीं test_sizeया n_iter, लेकिन अगर मैं इस्तेमाल किया X, y, X_train, y_train, X_test, और y_testउचित रूप से और अनुक्रम समझ में आता है तो): ( …

9
समय-श्रृंखला पर विसंगतियों का पता लगाने के लिए मुझे किस एल्गोरिथ्म का उपयोग करना चाहिए?
पृष्ठभूमि मैं नेटवर्क संचालन केंद्र में काम कर रहा हूं, हम कंप्यूटर सिस्टम और उनके प्रदर्शन की निगरानी करते हैं। मॉनिटर करने के लिए एक महत्वपूर्ण मैट्रिक्स वर्तमान में हमारे सर्वर से जुड़े विज़िटर के कई ग्राहक हैं। इसे दृश्यमान बनाने के लिए हम (ऑप्स टीम) ऐसे मेट्रिक्स को टाइम-सीरीज़ …

4
Xgboost पेड़ों के हाइपरपैरामीटर कैसे ट्यून करें?
मेरे पास एक वर्ग असंतुलित डेटा है और मैं xgboost का उपयोग करके बढ़े हुए ट्रेस के हाइपरपैरामीटर को ट्यून करना चाहता हूं। प्रशन क्या xgboost के लिए gridsearchcv या randomsearchcv के बराबर है? यदि नहीं, तो xgboost के मापदंडों को ट्यून करने के लिए अनुशंसित दृष्टिकोण क्या है?

6
2016 में वास्तव में पूर्वानुमानित मॉडलिंग के लिए परिवर्तनीय चयन की आवश्यकता है?
यह प्रश्न सीवी पर कुछ साल पहले पूछा गया है, यह 1 के प्रकाश में एक repost के लायक लगता है) परिमाण बेहतर कंप्यूटिंग प्रौद्योगिकी के आदेश (जैसे समानांतर कंप्यूटिंग, एचपीसी आदि) और 2) नई तकनीकों, जैसे [3]। पहला, कुछ संदर्भ। मान लेते हैं कि लक्ष्य परिकल्पना परीक्षण नहीं है, …

3
समय श्रृंखला विश्लेषण के लिए आवर्तक तंत्रिका नेटवर्क का उपयोग करने का उचित तरीका
आवर्तक तंत्रिका नेटवर्क इस तथ्य से "नियमित" लोगों से भिन्न होते हैं कि उनके पास "मेमोरी" परत है। इस परत के कारण, एन सी आर एनएन समय श्रृंखला मॉडलिंग में उपयोगी माना जाता है। हालांकि, मुझे यकीन नहीं है कि मैं सही तरीके से समझता हूं कि उनका उपयोग कैसे …

4
क्या पीसीए के लिए गॉसियन कर्नेल इतना जादुई बनाता है, और सामान्य तौर पर भी?
मैं गॉसियन और बहुपद गुठली के साथ कर्नेल पीसीए ( 1 , 2 , 3 ) के बारे में पढ़ रहा था । गाऊसी कर्नेल अलग-अलग किसी भी प्रकार के गैर-डेटा डेटा को असाधारण रूप से अच्छी तरह से अलग कैसे करता है? कृपया एक सहज ज्ञान युक्त विश्लेषण दें, …

3
एक तंत्रिका नेटवर्क और एक गहरी विश्वास नेटवर्क के बीच अंतर क्या है?
मुझे यह आभास हो रहा है कि जब लोग एक 'गहरे विश्वास' नेटवर्क का उल्लेख कर रहे हैं कि यह मूल रूप से एक तंत्रिका नेटवर्क है लेकिन बहुत बड़ा है। क्या यह सही है या एक गहरी विश्वास नेटवर्क का यह भी मतलब है कि एल्गोरिथ्म अपने आप में …

4
लॉजिस्टिक क्लासिफायर में सॉफ्टमैक्स बनाम सिग्मोइड फ़ंक्शन?
एक लॉजिस्टिक क्लासिफायरियर में फ़ंक्शन (सॉफ्टमैक्स बनाम सिग्मॉइड) का विकल्प क्या तय करता है? मान लीजिए कि 4 आउटपुट क्लास हैं। उपरोक्त फ़ंक्शन में से प्रत्येक प्रत्येक वर्ग की संभावनाओं को सही आउटपुट देता है। तो क्लासिफायर के लिए कौन सा लेना है?

2
केवल तीन विभाजन क्यों? (प्रशिक्षण, सत्यापन, परीक्षण)
जब आप एक बड़े डेटासेट के लिए मॉडल फिट करने की कोशिश कर रहे हैं, तो आम सलाह डेटा को तीन भागों में विभाजित करना है: प्रशिक्षण, सत्यापन और परीक्षण डेटासेट। ऐसा इसलिए है क्योंकि मॉडल में आमतौर पर मापदंडों के तीन "स्तर" होते हैं: पहला "पैरामीटर" मॉडल वर्ग (जैसे …

9
सामान्यीकरण और फीचर स्केलिंग कार्य कैसे और क्यों करते हैं?
मैं देख रहा हूं कि बहुत सारे मशीन लर्निंग एल्गोरिदम बेहतर तरीके से कैंसिलेशन और कोवरियन इक्वलाइजेशन के साथ काम करते हैं। उदाहरण के लिए, न्यूरल नेटवर्क तेजी से अभिसरण करते हैं, और के-मीन्स आमतौर पर पूर्व-संसाधित सुविधाओं के साथ बेहतर क्लस्टरिंग देते हैं। मैं इन पूर्व-प्रसंस्करण कदमों के पीछे …

8
मैं यह सुनिश्चित करने में कैसे मदद कर सकता हूं कि परीक्षण डेटा प्रशिक्षण डेटा में लीक नहीं होता है?
मान लें कि हमारे पास कोई व्यक्ति एक भविष्य कहनेवाला मॉडल का निर्माण कर रहा है, लेकिन यह आवश्यक नहीं है कि कोई व्यक्ति उचित सांख्यिकीय या मशीन सीखने के सिद्धांतों से अच्छी तरह वाकिफ हो। शायद हम उस व्यक्ति की मदद कर रहे हैं जैसे वे सीख रहे हैं, …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.