यह प्रश्न " R में क्लस्टरिंग स्थानिक डेटा " के रूप में शुरू हुआ और अब DBSCAN प्रश्न पर चला गया है।
जैसा कि पहले सवाल के जवाब में मैंने DBSCAN के बारे में जानकारी खोजी और कुछ डॉक्स के बारे में पढ़ा। नए सवाल खड़े हो गए हैं।
DBSCAN को कुछ मापदंडों की आवश्यकता होती है, उनमें से एक "दूरी" है। जैसा कि मेरे डेटा तीन आयामी, देशांतर, अक्षांश और तापमान हैं, मुझे किस "दूरी" का उपयोग करना चाहिए? वह दूरी किस आयाम से संबंधित है? मुझे लगता है कि यह तापमान होना चाहिए। मैं आर के साथ ऐसी न्यूनतम दूरी कैसे पा सकता हूं?
एक और पैरामीटर क्लस्टर बनाने के लिए नीडेड बिंदुओं की न्यूनतम संख्या है। क्या उस संख्या को खोजने की कोई विधि है? दुर्भाग्य से मुझे नहीं मिला है।
Google की खोज करते हुए मैं अपने समान डेटासेट में dbscan का उपयोग करने के लिए R उदाहरण नहीं खोज सका, क्या आप इस तरह के उदाहरणों के साथ किसी भी वेबसाइट को जानते हैं? इसलिए मैं पढ़ सकता हूं और अपने मामले के अनुकूल होने का प्रयास कर सकता हूं।
आखिरी सवाल यह है कि डीबीएससीएएन के साथ मेरा पहला आर प्रयास (पूर्व सवालों के उचित जवाब के बिना) एक स्मृति समस्या का परिणाम है। आर का कहना है कि यह वेक्टर को आवंटित नहीं कर सकता है। मैं 779191 अंकों के साथ 4 किमी की दूरी वाले ग्रिड से शुरू करता हूं जो लगभग 300000 पंक्तियों में समाप्त होता है x 3 कॉलम (अक्षांश, देशांतर और तापमान) जब वैध एसएसटी अंक नहीं हटाते हैं। इस स्मृति समस्या को हल करने के लिए कोई संकेत। क्या यह मेरे कंप्यूटर पर या DBSCAN में ही निर्भर करता है?
धैर्य के लिए एक लंबा और शायद उबाऊ संदेश पढ़ने के लिए और आपकी मदद के लिए धन्यवाद।