clustering पर टैग किए गए जवाब

क्लस्टर विश्लेषण डेटा के विभाजन में उनकी परस्पर समानता के अनुसार वस्तुओं के सबसेट में विभाजित करने का कार्य है, बिना इस तरह के क्लास लेबल जैसे ज्ञान का उपयोग किए बिना। [क्लस्टर-मानक-त्रुटियों और / या क्लस्टर-नमूनों को इस तरह टैग किया जाना चाहिए; उनके लिए "क्लस्टरिंग" टैग का उपयोग न करें।]

1
DBSCAN के लिए eps और minPts चुनने की दिनचर्या
DBSCAN कुछ साहित्य के अनुसार सबसे अधिक क्लस्टरिंग एल्गोरिथ्म का हवाला देता है और यह घनत्व के आधार पर मनमाने आकार के क्लस्टर पा सकता है। इसमें दो पैरामीटर eps (पड़ोस त्रिज्या के रूप में) और minPts (मूल बिंदु के रूप में एक बिंदु पर विचार करने के लिए न्यूनतम …

2
क्या आर में एक फ़ंक्शन है जो समूहों के केंद्रों को लेता है जो पाया गया था और क्लस्टर को एक नए डेटा सेट में असाइन करता है
मेरे पास एक बहुआयामी डेटा सेट के दो भाग हैं, चलो उन्हें कॉल करें trainऔर test। और मैं ट्रेन डेटा सेट के आधार पर एक मॉडल बनाना चाहता हूं और फिर परीक्षण डेटा सेट पर इसे मान्य करता हूं। समूहों की संख्या ज्ञात है। मैंने आर में क्लस्टरिंग के साधनों …
14 r  clustering  k-means 

4
k- साधन इनपुट में कस्टम दूरी मैट्रिक्स के साथ कार्यान्वयन
क्या कोई मुझे k- साधन के कार्यान्वयन के बारे में बता सकता है (यह बेहतर होगा अगर matlab में) इनपुट में दूरी मैट्रिक्स ले सकता है? मानक matlab कार्यान्वयन को इनपुट में अवलोकन मैट्रिक्स की आवश्यकता होती है और यह समानता माप को कस्टम रूप देना संभव नहीं है।

3
क्या मुझे वैरिएबल को चलाने की ज़रूरत है जो कि किमी चलाने से पहले सहसंबद्ध / संपुटित होते हैं?
मैं ग्राहकों के समूहों की पहचान करने के लिए किमी चला रहा हूं। समूहों की पहचान करने के लिए मेरे पास लगभग 100 चर हैं। इनमें से प्रत्येक चर किसी श्रेणी पर एक ग्राहक द्वारा खर्च के% का प्रतिनिधित्व करता है। इसलिए, यदि मेरे पास 100 श्रेणियां हैं, तो मेरे …

5
क्लस्टरिंग (k- साधन, या अन्यथा) न्यूनतम क्लस्टर आकार की बाधा के साथ
मुझे क्लस्टर (WSS) के समूह-योग को कम करने के लिए क्लस्टर्स में इकाइयों को क्लस्टर करने की आवश्यकता है , लेकिन मुझे यह सुनिश्चित करने की आवश्यकता है कि प्रत्येक क्लस्टर में कम से कम इकाइयां हों। किसी भी विचार अगर आर के क्लस्टरिंग कार्यों में से कोई एक न्यूनतम …
14 r  clustering 

5
मैं दूरी (यूक्लिडियन) को समानता स्कोर में कैसे बदल सकता हूं
मैं उपयोग कर रहा हूँ अर्थ है क्लस्टर स्पीकर की आवाज़ों का क्लस्टरिंग। जब मैं क्लस्टर किए गए स्पीकर डेटा के साथ एक उच्चारण की तुलना करता हूं जो मुझे मिलता है (यूक्लिडियन दूरी-आधारित) औसत विरूपण। यह दूरी सीमा में हो सकती है । मैं इस दूरी को समानता स्कोर …

1
समर्पण में अत्याधुनिक
रिकॉर्ड कटौती में अत्याधुनिक तरीके क्या हैं? Deduplication को कभी-कभी कहा भी जाता है: रिकॉर्ड लिंकेज, इकाई संकल्प, पहचान संकल्प, मर्ज / पर्ज। मैं CBLOCK के बारे में उदाहरण के लिए जानता हूं [1]। मैं सराहना करूंगा यदि उत्तर में मौजूदा सॉफ्टवेयर के संदर्भ भी शामिल हैं जो विधियों को …

3
क्लस्टर बिग डेटा आर में और नमूना प्रासंगिक है?
मैं डेटा साइंस में नया हूं और 200,000 पंक्तियों और 50 कॉलमों वाले डेटा सेट में क्लस्टर खोजने में समस्या है। चूँकि डेटा में संख्यात्मक और नाममात्र दोनों चर होते हैं, इसलिए K-Mean जैसे तरीके जो यूक्लिडियन दूरी माप का उपयोग करते हैं, एक उपयुक्त विकल्प नहीं लगता है। इसलिए …

5
अस्थायी डेटा के लिए उपयुक्त क्लस्टरिंग तकनीक?
मेरे पास गतिविधि आवृत्तियों का अस्थायी डेटा है। मैं डेटा में समूहों की पहचान करना चाहता हूं जो समान गतिविधि स्तरों के साथ अलग-अलग समय को इंगित करते हैं। आदर्श रूप से मैं समूहों की संख्या निर्दिष्ट किए बिना समूहों की पहचान करना चाहता हूं । उपयुक्त क्लस्टरिंग तकनीकें क्या …

4
डेटासेट के यादृच्छिक उपसमूह के माध्यम से K- साधन केंद्रों की शुरुआत?
अगर मेरे पास एक निश्चित डेटासेट है, तो उस डेटासेट के यादृच्छिक नमूनों के माध्यम से क्लस्टर केंद्रों को शुरू करना कितना स्मार्ट होगा? उदाहरण के लिए, मान लीजिए कि मुझे चाहिए 5 clusters। मैं मूल डेटासेट के बारे 5 random samplesमें कहता हूं size=20%। फिर मैं इन 5 यादृच्छिक …

2
क्लस्टर विश्लेषण परिणामों को मान्य करने के लिए सांख्यिकीय महत्व परीक्षण का उपयोग करना
मैं क्लस्टर विश्लेषण के परिणामों को मान्य करने के लिए सांख्यिकीय महत्व परीक्षण (एसएसटी) के उपयोग का सर्वेक्षण कर रहा हूं। मुझे इस विषय के आसपास कई पेपर मिले हैं, जैसे कि लियू, यूफेंग एट अल द्वारा " सांख्यिकीय सिगनी of उच्च-आयाम, कम-नमूना आकार डेटा के लिए क्लस्टरिंग का कैन …

2
क्लस्टरिंग परिणामों की तुलना को समझना
मैं समूहों में डेटा वर्गीकृत करने के साथ प्रयोग कर रहा हूं। मैं इस विषय पर काफी नया हूं, और कुछ विश्लेषणों के उत्पादन को समझने की कोशिश कर रहा हूं। क्विक-आर के उदाहरणों का उपयोग करते हुए , कई Rपैकेज सुझाए गए हैं। मैंने इनमें से दो पैकेज ( …
13 r  clustering 

1
लार्स बनाम लैस्सो के लिए वंश का समन्वय
लार्स का उपयोग करने के पेशेवरों और विपक्ष क्या हैं [1] बनाम एल -1-नियमित रैखिक प्रतिगमन फिटिंग के लिए समन्वित वंश का उपयोग करना? मुझे मुख्य रूप से प्रदर्शन के पहलुओं में दिलचस्पी है (मेरी समस्याएं Nसैकड़ों और हजारों की संख्या में हैं p। <20) हालांकि, किसी भी अन्य अंतर्दृष्टि …

4
क्या त्रिकोण संबंधी असमानता इन सह-संबंध आधारित दूरियों के लिए पूरी होती है?
पदानुक्रमिक क्लस्टरिंग के लिए मैं अक्सर दो रैंडम चर और : \ newcommand {\ Cor} {\ _ mathrm {Cor}} \ start "align " के बीच की दूरी को मापने के लिए निम्नलिखित दो "मैट्रिक्स" (वे बिल्कुल नहीं बोल रहा हूं) देखता हूं। d_1 (X, Y) & = 1- | \ …

4
जब आप किमी कोहनी क्लस्टरिंग के लिए कोई कोहनी बिंदु नहीं है तो आप क्या करते हैं
मैंने सीखा है कि जब कई समूहों को चुनते हैं, तो आपको कश्मीर के विभिन्न मूल्यों के लिए एक कोहनी बिंदु की तलाश करनी चाहिए। मैंने कश्मीर के मूल्यों को 1 से 10 तक के मूल्यों के लिए प्लॉट किया है, लेकिन मैं स्पष्ट नहीं देख रहा हूं कोहनी। इस …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.