क्या GPS निर्देशांक (अक्षांश और देशांतर) का उपयोग रेखीय मॉडल में सुविधाओं के रूप में किया जा सकता है?


10

मेरे पास ऐसे डेटा सेट हैं जिनमें कई विशेषताएं हैं, जीपीएस निर्देशांक (अक्षांश और देशांतर)। मैं समस्याओं का पता लगाने के लिए इन डेटा सेटों का उपयोग करना चाहता हूं: (1) प्रारंभ और अंत बिंदुओं के बीच ड्राइव करने के लिए ईटीए कंप्यूटिंग; और (2) किसी विशेष बिंदु के लिए अपराध की मात्रा का अनुमान लगाना।

मैं एक रैखिक प्रतिगमन मॉडल का उपयोग करना चाहता हूं। हालांकि, क्या मैं इन जीपीएस निर्देशांक का उपयोग सीधे एक रैखिक मॉडल में कर सकता हूं?

अक्षांश और देशांतर के पास एक अध्यादेशीय संपत्ति नहीं है , जैसे कि किसी व्यक्ति की उम्र के साथ। उदाहरण के लिए, दो बिंदु (40.805996, -96.681473) और (41.226682, -95.986587) पर कोई सार्थक आदेश नहीं लगता है। वे अंतरिक्ष में सिर्फ बिंदु हैं। मैं उन्हें श्रेणीबद्ध यूएस ज़िप कोड के साथ बदलने और फिर एक-हॉट एन्कोडिंग करने के बारे में सोच रहा था , लेकिन इसके परिणामस्वरूप बहुत सारे चर होंगे।


1
क्या आपको उन्हें सीधे उपयोग करना है ? क्या आपने ज़ोनिंग टूल्स के बारे में सुना है, जैसे एस ओपेंशॉ द्वारा एज़पी एल्गोरिथ्म? यदि आप क्षेत्र अपेक्षाकृत सुसंगत हैं, तो आप अलग-अलग क्षेत्रों / क्षेत्रों को अलग करने के लिए मैन्युअल रूप से क्षेत्रों का परिसीमन कर सकते हैं।
मेफी

@Mephy: इसका मतलब है कि मैं अक्षांश / लंबे समय से ज़ोन में परिवर्तित करूँगा, है ना? लेकिन फिर मेरे पास ज़िप कोड के साथ सैकड़ों या हजारों श्रेणीबद्ध क्षेत्र होंगे। मुझे उन सभी को एक-एक हॉट-एनकोड करना होगा।
stackoverflowuser2010

इस बात पर निर्भर करता है कि आपने जोन कैसे काटे हैं। यदि आप "विषुवत रेखा के दक्षिण / भूमध्य रेखा के उत्तर में" चुनते हैं, तो यह केवल दो हैं। कई ज़ोनिंग एल्गोरिदम में मात्रा को परिभाषित करने के लिए कुछ हाइपर-पैरामीटर हैं जैसे कि ज़ोन की संख्या या न्यूनतम ज़ोन का आकार।
मेप्सी

मेरे पास एक ही मुद्दा है। मैं लोगों की स्थिति की भविष्यवाणी करना चाहता हूं। मैंने प्रशिक्षण डेटा में सभी जियोलोकेशन सुविधाओं को जियोहैश किया है। उसके बाद, लेबलडॉकर को श्रेणीबद्ध स्थान सुविधा को बदलने के लिए उपयोग किया जाता है। अंत में, परिणाम भयानक है। क्या स्थानिक भविष्यवाणी से निपटने के लिए कोई अच्छा विचार है?
बेरीस्टु

जवाबों:


5

आप उन्हें सीधे उपयोग नहीं कर सकते, क्योंकि यह संभावना नहीं है कि एक सच्चा रैखिक संबंध है जब तक कि आप "कितनी दूर पूर्व या उत्तर" की भविष्यवाणी करना चाहते हैं। जैसा कि टिप्पणियों में बताया गया है, आपको उन्हें ज़ोन में बदलने की आवश्यकता है। यदि आप इसे वास्तव में सरल रखना चाहते हैं, तो आप कम संख्या में संभावित समूहों के साथ kNN क्लस्टरिंग एल्गोरिथ्म का उपयोग कर सकते हैं और फिर प्रत्येक उदाहरण को क्लस्टर आईडी के साथ एक नई सुविधा प्रदान करते हैं, और फिर एक-गर्म एनकोड करते हैं।

आप इस बारे में भी पढ़ना चाह सकते हैं कि लोग पूरे मानचित्र में मूल्यों की भविष्यवाणी करने के लिए निर्देशांक को कैसे प्रक्षेपित करते हैं। पहला उदाहरण तापमान स्टेशनों के साथ है, लेकिन आप इसे अपराध के लिए "गर्म क्षेत्र" होने की कल्पना भी कर सकते हैं।

( DOCS )


2

आप अपने दिल की इच्छा जो भी कर सकते हैं, लेकिन जब तक आपका मॉडल तापमान या समय-अंतर की भविष्यवाणी नहीं करता है, मैं किसी भी अन्य लक्ष्य चर के साथ नहीं आ सकता है जो पूरी तरह से निर्देशांक पर निर्भर करता है।

आप शायद जो करना चाहते हैं, वह एक बाहरी डेटा स्रोत का उपयोग करें और अपने डेटा को देश / ज़िप कोड / जलवायु / अन्य भौगोलिक विशेषताओं के साथ समृद्ध करें जो आपके मॉडल को प्रदर्शन करने में मदद करेंगे।


0

जीपीएस निर्देशांक को सीधे जियोश में परिवर्तित किया जा सकता है । जियोहाश ने अंकों की संख्या के आधार पर पृथ्वी को अलग-अलग आकार के "बाल्टियों" में विभाजित किया है (छोटे जियोश कोड बड़े क्षेत्र बनाते हैं और छोटे क्षेत्रों के लिए लंबे कोड)।

एक जियोहैश एक एकल संख्या है जिसे एक मॉडल में एक सुविधा के रूप में इस्तेमाल किया जा सकता है।

Geohash केवल पूरी दुनिया पर लागू होता है, zipcodes नहीं।


एक geohasher का उत्पादन एक स्ट्रिंग है, एक भी संख्या नहीं है, है ना? और अगर जियोश एक स्ट्रिंग है, तो मुझे इसे एक-हॉट एन्कोड करना होगा, जिसके परिणामस्वरूप बहुत सारे वैरिएबल होंगे, जैसे कि एक-हॉट एन्कोडेड ज़िपकोड के साथ।
stackoverflowuser2010

एक जियोहैश एक एकल संख्या है, जो कि आधार 32 में एन्कोडेड है। 1-हॉट एनकोड का कोई कारण नहीं है। सटीक स्तर चुनें और संबंधित अंकों की संख्या का उपयोग करें।
ब्रायन स्पिरिंग

मैंने केवल जियोहेस के स्ट्रिंग प्रतिनिधित्व को देखा है। हालाँकि, भले ही जियोशेट्स को लंबे इंट के रूप में दर्शाया गया हो, लेकिन क्या उनके बीच कोई रैखिक संबंध है रैखिक मॉडल में उपयोग के लिए? यह बिल्कुल मेरे मूल प्रश्न का बिंदु है।
stackoverflowuser2010 20

जियोहेस के बीच संबंध थोड़ा जटिल है - en.wikipedia.org/wiki/Geohash#Design
ब्रायन

1
रैखिक और एक-गर्म एन्कोडिंग से परे सुविधा इंजीनियरिंग के कई तरीके हैं। उदाहरण के लिए, कर्नेल चाल या हेल्मर्ट परिवर्तन।
ब्रायन स्पाइरिंग ऑक्ट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.