एक बेंचमार्क जीपीएस प्रक्षेपवक्र डेटा-सेट की आवश्यकता है?


13

मैं एक बेंचमार्क जीपीएस डेटा सेट की तलाश कर रहा हूं, जो अनुसंधान उद्देश्यों के लिए मुफ्त में उपलब्ध है। मैंने Microsoft रिसर्च से GeoLife GPS Trajectories डेटासेट पाया है लेकिन मुझे यह थोड़ा अधूरा लगता है।

मुझे किसी व्यक्ति की GPS गतिविधि डेटा की आवश्यकता होती है, जैसे कि (अक्षांश, देशांतर, तिथि) ट्यूपल्स, कम से कम कई महीनों तक ट्रैक किया जाता है, अधिमानतः लगातार। मैं यह भी चाहूंगा कि रिकॉर्डिंग गैर-विरल हो; प्रत्येक रिकॉर्ड के बीच अधिकतम 1 मिनट।

अगर आप मुझे इस तरह के विश्वसनीय डेटा-सेट की ओर इंगित कर सकते हैं तो मैं वास्तव में इसकी सराहना करूँगा।


2
क्या यह डेटासेट किसी इंसान का है? (जिस तरह से आप अब तक सब कुछ कर रहे हैं, उसका मतलब है हाँ, लेकिन मुझे नहीं लगता कि यह स्पष्ट रूप से कहा गया है।)
दान एस।

जवाबों:


17

मुझे लगता है कि आपका सबसे अच्छा मौका खुद को ट्रैक करने का होगा। यदि विचार आपको परेशान करता है, तो यही कारण है कि आपको ऐसा डेटा कहीं भी सार्वजनिक नहीं मिलेगा।


6

सबसे अच्छा मैं सोच सकता हूँ कि OpenStreetMap से उपलब्ध जीपीएस निशान है। वे निरंतर नहीं होने जा रहे हैं, लेकिन उनमें से एक बड़ी संख्या है।

OSM वेबसाइट पर "GPS Traces" का चयन करें कि किसी विशेष क्षेत्र के लिए क्या उपलब्ध है।


2
मेरा मानना ​​है कि यह वह उत्तर है जो आप उत्तर में याद करते हैं: blog.openstreetmap.org/2012/04/01/bulk-gps-point-data
Drar Atariah

4

मैं अपनी सांस नहीं रोक पाती। इस तरह की सटीकता पर डेटा एक विशाल उपक्रम होगा और इसमें बहुत अधिक गोपनीयता के निहितार्थ होंगे (भले ही केवल एक व्यक्ति के लिए 30 दिनों के लिए जिसमें 43,200 डेटा बिंदु शामिल हों (यदि हर मिनट दर्ज किया गया हो), और निस्संदेह वहां घर की पहचान होगी)।

यदि आपकी रुचि ऐसे प्रश्नों से जुड़ी है, जो इस तरह की सलाह देते हैं, तो यह मदद नहीं करेगा। लेकिन अगर आपकी एकमात्र दिलचस्पी किसी प्रकार की विश्लेषणात्मक रणनीति में है, तो इस तरह के बड़े पैमाने पर डेटा को संभालने के लिए आपको उस पैमाने पर डेटा का अनुकरण करने में सक्षम होना चाहिए जो आपके उद्देश्य हैं। डेटा का अनुकरण करने के लिए मैं आपको आर सांख्यिकीय कार्यक्रम, और स्पैटस्टैट और विशेष रूप से ट्रिप पैकेज (साथ ही आर में सभी स्थानिक मॉड्यूल ) पर एक नज़र डालने का सुझाव दूंगा

मुझे संदेह होगा कि पशु ट्रैकिंग डेटा ऐसे छोटे अंतराल में डेटा बिंदुओं के लिए आपकी आवश्यकताओं को पूरा करेगा। मैं उन कुछ लेखों को सूचीबद्ध कर सकता हूं जिन्हें मैंने पढ़ा है कि मानव गतिविधि पैटर्न का अनुमान लगाने के लिए सेल फोन डेटा का उपयोग करें, लेकिन मैंने जो भी पढ़ा है वह लंबे समय तक कहीं भी नहीं आएगा या व्यक्तियों की गतिविधि को मापता है।


4

एक विकल्प एक अनुबंध का मसौदा तैयार करना और बहुत से लोगों को किराए पर लेना है। उन्हें रीडिंग लेने के लिए कॉन्फ़िगर की गई GPS इकाइयाँ प्रदान करें जो आपको आवश्यक डेटा प्रदान करने के लिए, अनुबंध को अंतिम करने के लिए पर्याप्त बैटरी और निर्देश (रात को अपलोड करने के लिए इस केबल के साथ प्लग करें, मुझे यह फ़ाइल ईमेल करें, आदि)

आपको निश्चित रूप से अनुबंध में लिखना होगा कि आप डेटा के वितरण को कैसे प्रतिबंधित करेंगे और इसे संरक्षित करने के लिए इसे अज्ञात करेंगे (शायद व्यक्ति द्वारा इंगित किए गए अंकों के आसपास अपवर्जन का लगभग आधा मील का त्रिज्या प्रदान करना), और आप भी हो सकते हैं नुकसान के खिलाफ बीमा खरीदने पर विचार करें। यदि लोगों की गतिविधि के निशान सार्वजनिक हो गए, तो वे इस तरह की जानकारी से भर जाएंगे, जैसे "मैं हर सुबह 7:00 बजे काम पर निकल जाता हूं और हर रात 19:00 बजे घर आता हूं", और एक भूखंड एक विशाल तारांकन जैसा दिखेगा। उनके घर पर "8:00 और 18:00 के बीच इस जगह को लूटो।" आप देख सकते हैं कि आपको गोपनीयता और सुरक्षा के बारे में चिंतित होने की आवश्यकता क्यों है।

यदि आप इसके बारे में सोचते हैं, तो आप कुछ बहुत महंगे डेटा के लिए पूछ रहे हैं। और एक सांख्यिकीय बड़े पर्याप्त सेट के बिना, यह संदिग्ध मूल्य का होने जा रहा है। एक निर्माण कार्यकर्ता (प्रत्येक पूर्ण भवन के बाद एक नया दोहराव वाला आवागमन), एक डाक वाहक (एक बहुत ही दोहरावदार और बहुत नागिन मार्ग), एक कार्यालय कार्यकर्ता (ज्यादातर दोहरावदार प्रत्यक्ष मार्ग) और टो ट्रक के बीच अलग-अलग निशान होंगे। ड्राइवर (नए मार्गों को लगातार।) सामाजिक आर्थिक स्थिति निशान को प्रभावित कर सकती है: निम्न आय सार्वजनिक पारगमन लाइनों का अधिक पालन कर सकती है और कम यात्रा कर सकती है। स्कूल-आयु वर्ग के बच्चों के माता-पिता के काम के बाद मील की दूरी पर औसत उच्चतर हो सकता है। उस व्यक्ति का उल्लेख नहीं करना चाहिए जो Google स्ट्रीट व्यू कारों को चलाता है।

उन निशानों में से किसी के भी किसी भी सार्थक तरीके से किसी अन्य को अंतर करने की संभावना नहीं है।

अद्वितीय शैलियों की संख्या परिमित होने की संभावना है, लेकिन इतनी अधिक है कि प्राप्त करने के लिए एक महत्वपूर्ण बजट की आवश्यकता होती है। और यह सिर्फ एक शहर में होगा।

यदि आप अपने लक्ष्यों को बेहतर तरीके से परिभाषित करते हैं, तो आप डेटा का एक छोटा (सस्ता) सेट प्राप्त करने में सक्षम हो सकते हैं। यदि आप विभिन्न प्रकार के पैटर्न को निर्धारित करने का प्रयास कर रहे हैं, तो शायद आप विभिन्न शहरों में लोगों की एक विस्तृत श्रृंखला का नमूना लें। यदि आप यह पता लगाने की कोशिश कर रहे हैं कि बड़े पैमाने पर पारगमन से, या कम्यूटर रेल कॉरिडोर बनाने में कौन लाभान्वित होगा, तो आप संभवतः उस क्षेत्र के आसपास के विभिन्न रोडवेज पर कारों की गिनती करना बेहतर समझते हैं, जिनकी आप सेवा करने और सर्वेक्षण करने की योजना बना रहे हैं।


2

मैं उस सटीक प्रकार के डेटासेट की भी तलाश कर रहा हूं जिसे आप देख रहे हैं। दुर्भाग्य से, अभी तक मुझे एक भी नहीं मिला है। जियोलाइफ डेटा के बावजूद, मैंने पाया एक और स्रोत CRAWDAD है । साइट में सैन फ्रांसिस्को कैब्स और न्यूयॉर्क पैदल यात्रियों से जीपीएस लॉग है। दुर्भाग्य से, NYC पैदल चलने वालों के लिए वे केवल लैट / लोन के बजाय सापेक्ष निर्देशांक प्रदान करते हैं।


2

ऐसे कई शोध विषय हैं जहां प्रश्न का उत्तर देने के लिए आवश्यक डेटा नैतिक कारणों से अनुपलब्ध हैं, और इन सीमाओं को पार करने वाले प्रयोगों से भविष्य में प्रतिबंध लग सकते हैं, जैसा कि मिलग्राम प्रयोग के मामले में था । अभी हाल ही में, AOL को गोपनीयता संबंधी चिंताओं के कारण खोज प्रश्नों का एक समूह खींचना पड़ा और ईमेल आदतों पर हमारे पास एकमात्र विश्वसनीय डाटासेट एनरॉन परीक्षण से आया ।

इस तरह के प्रक्षेपवक्र डाटासेट पाने के लिए पूरी तरह से तकनीकी रूप से संभव है, तो यह गोपनीयता के निहितार्थ के कारण व्यावहारिक नहीं हो सकता है। जैसा कि अन्य उत्तरों ने उल्लेख किया है, रिश्तेदार डेटासेट, व्यक्तियों पर एकत्रीकरण, या गोपनीयता के मुद्दे से बचते हुए, आपके प्रश्न को संबोधित करने के लिए सिमुलेशन सभी बेहतर हो सकते हैं।



2

खुला PFLOW परियोजना प्रदान करता है:

शहरी क्षेत्रों में आम लोगों के लिए खुले डेटासेट

टोक्यो महानगरीय क्षेत्र उपलब्ध है और चुकोय महानगरीय क्षेत्र तैयारी के तहत लगता है।

विवरण हाल के प्रकाशन में पाया जा सकता है:

टेकहिरो काशीयामा, यानबो पैंग, योशीहाइड सेकीमोटो, ओपन पीएफएलओडब्ल्यू: शहरी क्षेत्रों में आम लोगों के लिए एक खुले डेटासेट का निर्माण और मूल्यांकन, ट्रांसपोर्टेशन रिसर्च पार्ट सी: इमर्जिंग टेक्नोलॉजीज (2017) वॉल्यूम 85, पृष्ठ 249-267।


टी-ड्राइव प्रक्षेपवक्र डाटासेट हाल ही में पाया गया है। यह प्रावधान:

10,357 टैक्सियों का एक सप्ताह का अनुमान। इस डेटासेट में कुल अंकों की संख्या लगभग 15 मिलियन है और प्रक्षेपवक्र की कुल दूरी 9 मिलियन किलोमीटर तक है।


हालांकि मानव आंदोलनों के बारे में नहीं, लिक्विड रोबोटिक्स कंपनी अपने PacX चुनौती से दिलचस्प डेटासेट उपलब्ध कराती है । प्रशांत महासागर के माध्यम से नौकायन करने वाले चार रोबोट ग्लाइडरों के स्थान और पर्यावरण सेंसर रीडिंग के बारे में डेटा डाउनलोड के लिए उपलब्ध हैं । WIRED और इस वार्ता के माध्यम से ब्लॉग पर (वास्तव में अच्छा) प्रोजेक्ट के बारे में अधिक जानकारी ।


गोपनीयता के मुद्दों से निपटने का एक अन्य विकल्प पशु ट्रैकिंग डेटा का उपयोग करना होगा। मुझे लगता है कि डेटा सुरक्षा यहां एक समस्या से कम होगी। एक लाभ के रूप में, आप अभी भी वास्तविक विश्व आंदोलन डेटा के साथ अपने सॉफ़्टवेयर / विधियों का परीक्षण करने में सक्षम हो सकते हैं। नुकसान यह हो सकता है कि यदि आपके आवेदन को 'मानवीय विशिष्ट' आंदोलनों की आवश्यकता है - तो वे आपके उद्देश्य के अनुकूल नहीं हो सकते।

मूवमेंटबैंक या DRYAD वेबसाइटों पर नज़र डालें कि क्या उनका कुछ डेटा आपके प्रोजेक्ट में फिट हो सकता है।


Iphone डेटा, ने उल्लेख के रूप में मैथ्यू , आप पर एक नज़र हो सकता था crowdflow और openpaths परियोजनाओं। शायद उनके माध्यम से सोमदत्त को मानने का कोई तरीका है? अद्यतन: दोनों लिंक अब मृत लग रहे हैं।


फिर भी एक अन्य विकल्प क्रिस व्हॉन्ग के एनवाईसी टैक्सी डेटा का स्थानिक हिस्सा है । वे केवल पिक अप और ड्रॉप ऑफ लोकेशन प्रदान करते हैं, हालांकि वॉल्यूम (11 जीबी!) और प्रासंगिक जानकारी (किराया, यात्री, आदि) उन्हें वास्तव में आकर्षक बनाते हैं (वैकल्पिक डाउनलोड , डेटा द्वारा उठाए गए गोपनीयता चिंताओं के बारे में अधिक जानकारी )।


उर्विका देमेसर ने अपने हालिया पत्र पर Human एनालिसिस ऑफ ह्यूमन मोबिलिटी फ्रॉम वालंटियर मूवमेंट डेटा एंड कॉन्टेक्चुअल इन्फॉर्मेशन ’वादों पर लिखा है:

इस पेपर से जुड़े स्वेच्छा से जीपीएस ट्रैजेटरी का एक मुफ्त डेटा सेट भी उपलब्ध होगा। बने रहें।

( अधिक जानकारी )

अपडेट: कागज का उल्लेख है पर है कि डेटा उपलब्ध हो जाएगा crawdad ने उल्लेख किया @ejel लेकिन मैं havent वहाँ यह पाया।


एक अन्य विकल्प हो सकता है कि आप स्वयं सिंथेटिक सिंथेटिक तैयार करें । अगर आपको वैन डिजक जे (2018) के हालिया पेपर पर कुछ प्रेरणा की आवश्यकता है , तो मल्टीपल मूविंग विंडो कंप्यूटर, एनवायरनमेंट और अर्बन सिस्टम्स ( लिंक ) के साथ जीपीएस-डेटा से एक्टिविटी-ट्रैवल पॉइंट्स की पहचान करना । अधिक विवरण कागज के परिशिष्ट और कोड में दिए गए हैं और उदाहरण डेटासेट जीथब पर उपलब्ध हैं ।


1

ताहिना अभियान (Google धरती ब्लॉग) http://www.tahinaexpedition.com/map पिछले साल के अधिकांश वर्षों के लिए चारों ओर नौकायन किया जा रहा है।

KML को http://maps.google.com/maps/ms?source=embed&hl=en&geocode=&ie=UTF8&t=k&msa=0&output=nl&msid=10300318182134016767464670ab348ba9fa7b1f [ संसाधित किया जा सकता है ]


@ मैपरेज़ - धन्यवाद मैपरेज़, लेकिन मुझे जो चाहिए वह थोड़ा अलग है। मैं दिन-ब-दिन, मिनट-दर-मिनट एक व्यक्ति के जीपीएस बिंदुओं को जमीन पर रखना चाहता हूं। दैनिक दिनचर्या वाला व्यक्ति (कुछ हद तक एक दिनचर्या) - जैसे उठता है, काम पर जाता है, वहां घंटों बिताता है, खरीदारी करता है, घर आता है, दोहराता है।
मूरत

1

लोग उस डेटा को घड़ी के चारों ओर मुफ्त में Google को प्रदान करते हैं। इसे अक्षांश कहा जाता है। हो सकता है कि वे इसे उतनी ही उदारता से साझा करेंगे जितना उनके उपयोगकर्ताओं ने इसे उनके साथ साझा किया है।


1
मुझे निश्चित रूप से उम्मीद है कि वे नहीं करेंगे। मुझे पूरा यकीन है कि उन्हें @ मूरत के आवेदन के लिए आवश्यक स्तर पर कोई डेटा जारी करने की अनुमति नहीं होगी।
UnderDark
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.