मेरे पास ऐसे डेटा सेट हैं जिनमें कई विशेषताएं हैं, जीपीएस निर्देशांक (अक्षांश और देशांतर)। मैं समस्याओं का पता लगाने के लिए इन डेटा सेटों का उपयोग करना चाहता हूं: (1) प्रारंभ और अंत बिंदुओं के बीच ड्राइव करने के लिए ईटीए कंप्यूटिंग; और (2) किसी विशेष बिंदु के लिए अपराध की मात्रा का अनुमान लगाना।
मैं एक रैखिक प्रतिगमन मॉडल का उपयोग करना चाहता हूं। हालांकि, क्या मैं इन जीपीएस निर्देशांक का उपयोग सीधे एक रैखिक मॉडल में कर सकता हूं?
अक्षांश और देशांतर के पास एक अध्यादेशीय संपत्ति नहीं है , जैसे कि किसी व्यक्ति की उम्र के साथ। उदाहरण के लिए, दो बिंदु (40.805996, -96.681473) और (41.226682, -95.986587) पर कोई सार्थक आदेश नहीं लगता है। वे अंतरिक्ष में सिर्फ बिंदु हैं। मैं उन्हें श्रेणीबद्ध यूएस ज़िप कोड के साथ बदलने और फिर एक-हॉट एन्कोडिंग करने के बारे में सोच रहा था , लेकिन इसके परिणामस्वरूप बहुत सारे चर होंगे।