data-cleaning पर टैग किए गए जवाब

4
आर में असंगत प्रारूप के डेटा की सफाई?
मैं अक्सर गन्दा सर्वेक्षण डेटा के साथ काम करता हूं जिसके लिए किसी भी आंकड़े को पूरा करने से पहले बहुत अधिक सफाई की आवश्यकता होती है। मैं एक्सेल में यह "मैन्युअल रूप से" करता था, कभी-कभी एक्सेल फ़ार्मुलों का उपयोग करके, और कभी-कभी प्रविष्टियों को एक-एक करके जाँचता था। …
16 r  data-cleaning 

1
समर्पण में अत्याधुनिक
रिकॉर्ड कटौती में अत्याधुनिक तरीके क्या हैं? Deduplication को कभी-कभी कहा भी जाता है: रिकॉर्ड लिंकेज, इकाई संकल्प, पहचान संकल्प, मर्ज / पर्ज। मैं CBLOCK के बारे में उदाहरण के लिए जानता हूं [1]। मैं सराहना करूंगा यदि उत्तर में मौजूदा सॉफ्टवेयर के संदर्भ भी शामिल हैं जो विधियों को …

3
Reshape / पुनर्गठन डेटा का सबसे अच्छा तरीका क्या है?
मैं एक प्रयोगशाला (स्वयंसेवक) के लिए एक अनुसंधान सहायक हूं। मुझे और एक छोटे समूह को एक बड़े अध्ययन से खींचे गए डेटा के एक सेट के लिए डेटा विश्लेषण का काम सौंपा गया है। दुर्भाग्य से डेटा को किसी प्रकार के ऑनलाइन ऐप के साथ इकट्ठा किया गया था, …
12 r  excel  data-cleaning 

3
स्वचालित डेटा सफाई
एक आम समस्या है एमएल डेटा की खराब गुणवत्ता: फीचर वैल्यू में त्रुटियां, मिसकॉलिफाइड इंस्टेंस आदि। इस समस्या को संबोधित करने का एक तरीका मैन्युअल रूप से डेटा और जांच के माध्यम से जाना है, लेकिन क्या अन्य तकनीकें हैं? (मुझे यकीन है कि वहाँ हैं!) कौन से बेहतर हैं …

2
वास्तविक डेटा से "डेमो" डेटा बनाना: बिना किसी गड़बड़ी के भेस
(मुझे कोई वास्तविक विचार नहीं है कि मुझे इस बारे में क्या पता होना चाहिए क्योंकि मैं कोई सांख्यिकीविद् नहीं हूं और मुझे नहीं पता कि यह किस क्षेत्र में आता है। अधिक उपयुक्त टैग जोड़ने के लिए स्वतंत्र महसूस करें।) मैं एक कंपनी के लिए काम करता हूं जो …
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.