स्मार्टफोन डेटा सेट समस्या का उपयोग करके मानव गतिविधि मान्यता


9

मैं इस समुदाय के लिए नया हूं और उम्मीद है कि मेरा प्रश्न यहां पर अच्छी तरह से फिट होगा। मेरे स्नातक डेटा एनालिटिक्स पाठ्यक्रम के हिस्से के रूप में, मैं स्मार्टफोन डेटा सेट का उपयोग करके मानव गतिविधि मान्यता पर परियोजना करने का चयन करता हूं। जहाँ तक मुझे चिंता है कि यह विषय मशीन लर्निंग और सपोर्ट वेक्टर मशीनों से संबंधित है। मैं अभी तक इस तकनीक से अच्छी तरह परिचित नहीं हूँ इसलिए मुझे कुछ मदद की आवश्यकता होगी।

मैंने इस परियोजना विचार का पालन करने का फैसला किया है http://www.inf.ed.ac.uk/teaching/courses/dme/2014/datasets.html (शीर्ष पर पहला प्रोजेक्ट) परियोजना का लक्ष्य यह निर्धारित करता है कि कोई व्यक्ति कौन सी गतिविधि है एक स्मार्टफोन (सैमसंग गैलेक्सी एस II) द्वारा दर्ज किए गए डेटा से (जैसे, वॉकिंग, वॉकिंग_यूपीएसएएआरएस, वॉकिंग_डाउस्ट एआईआरएस, साइटिंग, स्टेंडिंग, लाइंग) में उलझा हुआ। अपने एम्बेडेड एक्सेलेरोमीटर और जाइरोस्कोप का उपयोग करते हुए, डेटा में 50 -Hz की निरंतर दर पर 3-अक्षीय रैखिक त्वरण और 3-अक्षीय कोणीय वेग शामिल हैं।

सभी डेटा सेट एक फ़ोल्डर में कुछ विवरण और सुविधा लेबल के साथ दिए गए हैं। डेटा को 'परीक्षण' और 'ट्रेन' फ़ाइलों के लिए विभाजित किया गया है जिसमें डेटा इस प्रारूप में दर्शाया गया है:

  2.5717778e-001 -2.3285230e-002 -1.4653762e-002 -9.3840400e-001 -9.2009078e-001 -6.6768331e-001 -9.5250112e-001 -9.2524867e-001 -6.7430222e-001 -8.9408755e-001 -5.5457721e-001 -4.6622295e-001  7.1720847e-001  6.3550240e-001  7.8949666e-001 -8.7776423e-001 -9.9776606e-001 -9.9841381e-001 -9.3434525e-001 -9.7566897e-001 -9.4982365e-001 -8.3047780e-001 -1.6808416e-001 -3.7899553e-001  2.4621698e-001  5.2120364e-001 -4.8779311e-001  4.8228047e-001 -4.5462113e-002  2.1195505e-001 -1.3489443e-001  1.3085848e-001 -1.4176313e-002 -1.0597085e-001  7.3544013e-002 -1.7151642e-001  4.0062978e-002  7.6988933e-002 -4.9054573e-001 -7.0900265e-001

और यह केवल एक बहुत छोटा सा नमूना है जिसमें फ़ाइल सम्‍मिलित है।

मैं वास्तव में नहीं जानता कि यह डेटा क्या दर्शाता है और इसकी व्याख्या कैसे की जा सकती है। इसके अलावा, डेटा के विश्लेषण, वर्गीकरण और क्लस्टरिंग के लिए, मुझे किन उपकरणों का उपयोग करने की आवश्यकता होगी? क्या कोई तरीका है जो मैं इस डेटा को शामिल किए गए लेबल के साथ एक्सेल में डाल सकता हूं और उदाहरण के लिए नमूना डेटा निकालने और इस पर काम करने के लिए आर या अजगर का उपयोग करता हूं?

किसी भी संकेत / सुझाव बहुत सराहना की जाएगी।

जवाबों:


8

डेटा सेट परिभाषाएँ यहाँ पृष्ठ पर हैं:

सबसे नीचे सूचना दें

या आप ZIP फ़ोल्डर के अंदर गतिविधि_लैबल्स नाम की फ़ाइल देख सकते हैं, जिसमें आपके कॉलम के अंदर हेडिंग है, सुनिश्चित करें कि आप README को ध्यान से पढ़ें, इसमें कुछ अच्छी जानकारी है। आप आसानी .csvसे read.csvकमांड का उपयोग करके आर में एक फ़ाइल ला सकते हैं ।

उदाहरण के लिए यदि आप नाम रखते हैं तो आप samsungdataR को खोल सकते हैं और इस कमांड को चला सकते हैं:

data <- read.csv("directory/where/file/is/located/samsungdata.csv", header = TRUE)

या यदि आप आर में पहले से ही काम कर रहे डायरेक्टरी के अंदर हैं तो आप बस निम्नलिखित चला सकते हैं

data <- read.csv("samsungdata.csv", header = TRUE)

जहां dataआप अपने डेटा सेट पर कॉल करने के लिए नाम बदल सकते हैं।


समझा। मैंने README फाइल का अध्ययन किया, हालाँकि मैं अभी भी यह पता नहीं लगा सका हूँ कि यह स्वयं का डेटा कैसे पढ़ा जा सकता है। उदाहरण के लिए, ट्रेन / X_train.txt'file प्रशिक्षण सेट का प्रतिनिधित्व करता है (मैंने पोस्ट में दिखाया गया नमूना डेटा इस फ़ाइल से आता है)।
जकुबी

मुझे ऐसा लगता है कि डेटा सेट अधिक विस्तृत है, प्रति पंक्ति 561 चर हैं जो कि सुविधाओं के अंदर सूचीबद्ध हैं। टेक्स्ट फ़ाइल। मेरा मानना ​​है कि आप जिसका जिक्र कर रहे हैं।
MCP_infiltrator

इसलिए 'फीचर्स' फाइल से प्रत्येक वेरिएबल 'x-test.txt' फाइल के प्रत्येक कॉलम से मेल खाता है, या क्या मैं गलत हूं?
जकुबी

इसी तरह मैं इसे ले रहा हूं। README से जो मैं इकट्ठा कर सकता था, वह यह है कि फ़ाइल में क्या है।
MCP_infiltrator

@ जक़ुबी हाँ। features.txtफ़ाइल में 561 पंक्तियाँ / चर नाम हैं , और फ़ाइल में 561 कॉलम X_train.txt, प्रत्येक चर के लिए एक है।
मार्को 13

5

यह इस तरह दिखता है (या बहुत समान डेटा सेट) का उपयोग कर कोर्टेरा पाठ्यक्रमों के लिए किया जाता है। इस डेटासेट को साफ करना डेटा को प्राप्त करने और साफ करने के लिए कार्य है , लेकिन इसका उपयोग एक्सप्लोरेटरी डेटा विश्लेषण के लिए केस स्टडी के लिए भी किया जाता है । इस मामले के अध्ययन से वीडियो ईडीए कोर्स-वेयर के सप्ताह 4 के वीडियो में उपलब्ध है। यह इस डेटा के साथ शुरुआत करने में आपकी मदद कर सकता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.