data-mining पर टैग किए गए जवाब

डेटा माइनिंग पहले अज्ञात पैटर्न को खोजने के लिए डेटाबेस संदर्भ में कृत्रिम बुद्धिमत्ता से तरीकों का उपयोग करता है। इस प्रकार, विधियां आमतौर पर अनसुनी की जाती हैं। यह बारीकी से संबंधित है, लेकिन मशीन सीखने के समान नहीं है। डेटा-माइनिंग के प्रमुख कार्य हैं क्लस्टर विश्लेषण, बाह्य नियमों का पता लगाना और खनन करना।

3
नकारात्मक द्विपद वितरण बनाम द्विपद वितरण
नकारात्मक द्विपद वितरण और द्विपद वितरण के बीच क्या अंतर है? मैंने ऑनलाइन पढ़ने की कोशिश की, और मैंने पाया कि ऋणात्मक द्विपद वितरण का उपयोग तब किया जाता है जब डेटा बिंदु असतत होते हैं, लेकिन मुझे लगता है कि द्विपद वितरण का उपयोग असतत डेटा बिंदुओं के लिए …

8
K- साधन (या उसके करीबी परिजन) केवल एक दूरी मैट्रिक्स के साथ क्लस्टरिंग करें, न कि पॉइंट-बाय-फीचर्स डेटा
मैं K- साधनों का प्रदर्शन उन वस्तुओं पर करना चाहता हूं जो मेरे पास हैं, लेकिन वस्तुओं को अंतरिक्ष में बिंदुओं के रूप में वर्णित नहीं किया जाता है, अर्थात objects x featuresडाटासेट द्वारा । हालांकि, मैं किसी भी दो वस्तुओं के बीच की दूरी की गणना करने में सक्षम …

5
डेटा खनन का नया क्रांतिकारी तरीका?
निम्नलिखित अंश श्वार्ज की हेज फंड मार्केट विज्ड्र्स (मई 2012) से है, जो लगातार सफल हेज फंड मैनेजर जाफरे वुड्रिफ के साथ एक साक्षात्कार है: प्रश्न के लिए: "डेटा माइनिंग में लोगों द्वारा किए गए कुछ सबसे खराब त्रुटियां क्या हैं?": बहुत सारे लोग सोचते हैं कि वे ठीक हैं …

3
बड़े डेटा के लिए पहला कदम (
मान लें कि आप प्रति दिन अरबों टिप्पणियों की धुन पर एक विशाल डेटा सेट का विश्लेषण कर रहे हैं, जहां प्रत्येक अवलोकन में कुछ हज़ार विरल और संभवतः निरर्थक संख्यात्मक और श्रेणीबद्ध चर हैं। मान लीजिए कि एक प्रतिगमन समस्या है, एक असंतुलित बाइनरी वर्गीकरण समस्या है, और एक …

4
क्या निर्णय के पेड़ लगभग हमेशा द्विआधारी पेड़ होते हैं?
लगभग हर निर्णय पेड़ उदाहरण मैं भर में आया है एक द्विआधारी पेड़ होने के लिए होता है। क्या यह बहुत सार्वभौमिक है? क्या अधिकांश मानक एल्गोरिदम (C4.5, CART, आदि) केवल बाइनरी पेड़ों का समर्थन करते हैं? मैं जो इकट्ठा करता हूं, उससे CHAID बाइनरी पेड़ों तक सीमित नहीं है, …

2
मॉडल चयन के बाद क्रॉस सत्यापन (त्रुटि सामान्यीकरण)
नोट: मामला n >> p है मैं सांख्यिकीय शिक्षण के तत्वों को पढ़ रहा हूं और क्रॉस वेलिडेशन करने के "सही" तरीके के बारे में विभिन्न उल्लेख हैं (जैसे पृष्ठ 60, पृष्ठ 245)। विशेष रूप से, मेरा सवाल यह है कि जब कोई मॉडल खोज की गई है तो के-गुना …

2
यदि k- साधन क्लस्टरिंग गाऊसी मिश्रण मॉडलिंग का एक रूप है, तो क्या इसका उपयोग तब किया जा सकता है जब डेटा सामान्य न हो?
मैं GMM के लिए EM एल्गोरिथ्म और GMM और k- साधनों के बीच संबंध पर बिशप पढ़ रहा हूं। इस पुस्तक में यह कहा गया है कि k- साधन GMM का एक कठिन संस्करण है। मैं सोच रहा हूँ कि इसका मतलब यह है कि अगर मैं जिस डेटा को …

4
कैसे पता करें कि डेटा रैखिक रूप से अलग है या नहीं?
डेटा में कई विशेषताएं हैं (जैसे 100) और उदाहरणों की संख्या 100,000 की तरह है। डेटा विरल है। मैं लॉजिस्टिक रिग्रेशन या svm का उपयोग करके डेटा को फिट करना चाहता हूं। मुझे कैसे पता चलेगा कि क्या विशेषताएं रैखिक या गैर-रैखिक हैं ताकि मैं कर्नेल ट्रिक का उपयोग कर …

2
गहरी शिक्षा कहाँ और क्यों चमकती है?
इन दिनों गहन सीखने के बारे में सभी मीडिया चर्चा और प्रचार के साथ, मैंने इसके बारे में कुछ प्राथमिक चीजें पढ़ीं। मैंने अभी पाया कि डेटा से पैटर्न सीखने के लिए यह सिर्फ एक और मशीन लर्निंग विधि है। लेकिन मेरा सवाल यह है: यह विधि कहां और क्यों …

2
StackExchange प्रश्नों के लिए "दिलचस्पता" फ़ंक्शन
मैं StackExchange साइटों के लिए डेटा-माइनिंग पैकेज को एक साथ रखने की कोशिश कर रहा हूं और विशेष रूप से, मैं "सबसे दिलचस्प" प्रश्नों को निर्धारित करने की कोशिश में फंस गया हूं। मैं प्रश्न स्कोर का उपयोग करना चाहूंगा, लेकिन विचारों की संख्या के कारण पूर्वाग्रह को हटा सकता …

1
दूर की निगरानी: पर्यवेक्षण, अर्ध-पर्यवेक्षण, या दोनों?
"दूर का पर्यवेक्षण" एक सीखने की योजना है जिसमें एक क्लासिफायरियर को एक कमजोर लेबल प्रशिक्षण सेट दिया जाता है (प्रशिक्षण डेटा स्वचालित रूप से हेयूरिस्टिक्स / नियमों के आधार पर लेबल किया जाता है)। मुझे लगता है कि दोनों पर्यवेक्षित शिक्षण, और अर्ध-पर्यवेक्षित शिक्षण में ऐसे "दूर के पर्यवेक्षण" …

2
बूस्टिंग: सीखने की दर को नियमितीकरण पैरामीटर क्यों कहा जाता है?
सीखने की दर पैरामीटर ( ) ढाल में सिकुड़ती बढ़ाने प्रत्येक नया आधार मॉडल -typically एक उथले tree- कि श्रृंखला में जोड़ा जाता है का योगदान। यह नाटकीय रूप से परीक्षण सेट सटीकता को बढ़ाने के लिए दिखाया गया था, जो कि छोटे कदमों के साथ समझ में आता है, …

3
डेटा खनन में एसोसिएशन के नियमों और निर्णय पेड़ों के बीच व्यावहारिक अंतर क्या है?
क्या इन दोनों तकनीकों के बीच व्यावहारिक अंतर का वास्तव में सरल वर्णन है? दोनों का उपयोग पर्यवेक्षित अधिगम के लिए किया जाता है (हालाँकि संघ के नियम भी अप्राप्त को संभाल सकते हैं)। दोनों का उपयोग भविष्यवाणी के लिए किया जा सकता है मैंने 'अच्छा' वर्णन के सबसे करीब …

6
प्रोग्रामर मशीन सीखने के क्षेत्र में तोड़ने के लिए देख रहे हैं
मैं एक सॉफ्टवेयर डेवलपर हूं (ज्यादातर .NET और पायथन 5 साल के अनुभव के बारे में)। मैं मशीन लर्निंग फील्ड में नौकरी पाने में मदद करने के लिए क्या कर सकता हूं या वास्तव में कुछ भी जो मुझे उस क्षेत्र में शुरू करने में मदद करेगा? क्या स्नातकोत्तर डिग्री …

6
डेटा माइनिंग और सांख्यिकीय विश्लेषण के बीच अंतर क्या है?
डेटा माइनिंग और सांख्यिकीय विश्लेषण के बीच अंतर क्या है? कुछ पृष्ठभूमि के लिए, मेरी सांख्यिकीय शिक्षा रही है, मुझे लगता है, बल्कि पारंपरिक। एक विशिष्ट प्रश्न प्रस्तुत किया गया है, अनुसंधान तैयार किया गया है, और उस प्रश्न पर कुछ अंतर्दृष्टि प्रदान करने के लिए डेटा एकत्र और विश्लेषण …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.