GPS- आधारित रिपोर्ट से अज्ञात विश्व स्थानों की एक अज्ञात संख्या निर्धारित करें


9

मैं कुछ सॉफ़्टवेयर पर काम कर रहा हूं, जो कई जीपीएस-आधारित रिपोर्ट से वास्तविक दुनिया के स्थानों (फ़े स्पीड कैम) को निर्धारित करना चाहिए । किसी उपयोगकर्ता को किसी स्थान की रिपोर्ट करते समय ड्राइविंग की जाएगी, इस प्रकार यह रिपोर्ट बहुत गलत है। उस समस्या को हल करने के लिए मुझे उसी स्थान के बारे में रिपोर्ट क्लस्टर करनी होगी और एक औसत की गणना करनी होगी।

मेरा प्रश्न उन रिपोर्टों को कैसे क्लस्टर करना है, के बारे में है । मैंने एक्सपेक्टेशन-मैक्सिमाइज़ेशन एल्गोरिदम और के-मतलब क्लस्टरिंग के बारे में पढ़ा , लेकिन जैसा कि मैंने समझा था कि मुझे पहले से वास्तविक स्थानों की संख्या निर्धारित करने की आवश्यकता होगी।

क्या कोई अन्य एल्गोरिदम है, जिसे वास्तविक स्थानों की सटीक संख्या की आवश्यकता नहीं है, लेकिन इसके बजाय कुछ किनारे की स्थिति (न्यूनतम न्यूनतम दूरी) का उपयोग करें?

एक रिपोर्ट में देशांतर , अक्षांश और सटीकता (मीटर में) होती है। कोई नाम या कुछ और नहीं है जो डुप्लिकेट की पहचान करने के लिए इस्तेमाल किया जा सकता है।

एक और बाधा यह हो सकती है कि यह सामान्य होगा, कि वास्तविक विश्व स्थान के लिए केवल एक रिपोर्ट है। इससे आउटलेर्स को अच्छे डेटा से अलग करना मुश्किल हो जाता है।


1
मुझे यकीन नहीं है कि जब आप कहते हैं कि आपका क्या मतलब है "... जैसा कि मैंने समझा था कि मुझे वास्तविक स्थानों की संख्या पहले से निर्धारित करने की आवश्यकता होगी ..." यह मानते हुए कि मैंने आपको सही ढंग से समझा है, एल्गोरिदम में कुछ भी नहीं है जो स्वाभाविक रूप से आवश्यक है इस। क्या आप शायद रिपोर्ट की संख्या के आधार पर क्लस्टर घटकों की संख्या बढ़ाने की योजना बना रहे हैं?
पैट

1
दूसरा प्रश्न :)। यदि आपकी रिपोर्ट किसी ऐसे व्यक्ति से आ रही है जो चला रहा है, तो संभवतः उनके बीच स्थिति में महत्वपूर्ण बदलाव होने जा रहे हैं। क्या रिपोर्ट आपको एक टाइमस्टैम्प के साथ आती है जो आपको बताती है कि उन्हें कब लिया गया था?
पैट

2
हाय पैट। मैं ट्रैफिक जाम या स्पीड कैम के बारे में बात कर रहा हूं ताकि इसे और अधिक स्पष्ट किया जा सके। 1. k-mean क्लस्टरिंग में "k" क्लस्टर की संख्या के लिए खड़ा है। मेरे मामले में मेरे पास प्रत्येक स्थान के लिए एक क्लस्टर होगा, जबकि मुझे नहीं पता कि कितने अलग-अलग स्थान हैं। 2. हां, उनमें टाइमस्टैम्प भी शामिल है। लेकिन मुझे समझ नहीं आ रहा है कि क्यों महत्वपूर्ण होना चाहिए, क्योंकि मुझे केवल स्थिति की परवाह है।
क्रिश्चियन स्ट्रेम्पफर

1
1. आह, मैं देख रहा हूं। इसलिए आपके पास अज्ञात स्थान हैं, और प्रत्येक स्थान एक या अधिक रिपोर्ट जनरेट करता है। हालाँकि, आप सभी रिपोर्ट की एक धारा देख रहे हैं। देखी गई रिपोर्टों के आधार पर आप अनुमान लगाना चाहते हैं कि कितने स्थान हैं, और उनकी स्थिति क्या है। क्या मुझे मिल गया है? 2. मैं टाइमस्टैम्प के बारे में चिंता करता हूं क्योंकि आप कहते हैं कि रिपोर्ट देते समय उपयोगकर्ता ड्राइविंग करेगा । जैसे, जब तक कि रिपोर्ट बहुत जल्दी उत्तराधिकार में नहीं आती हैं, या गति बहुत कम है (संभव है, अगर यह ट्रैफिक जाम है) तो एक ही स्थान सड़क के बाद रिपोर्टों की एक रगड़ रेखा की तरह दिखाई देगा। टाइमस्टैम्प यहाँ मदद करने में सक्षम हो सकता है
पैट

1
1. हां, आपको मिल गया है। 2. यह एक मैनुअल कार्य है, इसलिए एक यात्रा के दौरान प्रति उपयोगकर्ता केवल एक बार सूचना दी जानी चाहिए। लेकिन आप सही हैं, मुझे डुप्लिकेट को संभालना होगा, जब कोई उपयोगकर्ता आकस्मिक रूप से दो बार क्लिक करता है, और तेजी से ड्राइविंग करते समय रिपोर्ट गलत होगी। इसलिए मैंने स्थानों के बीच न्यूनतम दूरी की बढ़त की स्थिति का उल्लेख किया। आइए ट्रैफिक जाम को अनदेखा करें, जो कुछ मील तक फैल सकता है, और मान लें कि कोई स्थान बहुत छोटा है।
क्रिश्चियन स्ट्रेम्पफर

जवाबों:


1

मुझे एक सॉफ्टवेयर मिला है जो शायद आपकी मदद कर सकता है। ऐसा लगता है कि किसी को भी यही समस्या थी कि आप और उन्होंने उसे इस फोरम में हल दिया था , इसलिए आपको आर्कगिस का उपयोग करने की आवश्यकता होगी, लेकिन यदि आप एक एल्गोरिथ्म की तलाश कर रहे हैं तो वे इस पेपर का सुझाव देते हैं । मुझे लगता है कि कागज एक विस्तृत शुरुआत है जो आपके एल्गोरिथ्म को अच्छी शुरुआत देता है।


2
क्योंकि सब जानकारी अपने संपर्कों में इस उत्तर रहता है, और लिंक अंत में सड़ांध करते हैं, कृपया कम से कम संक्षेपित मंच पदों और कागज सलाह देते हैं।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.