यूनिक्स वातावरण में विभिन्न रूपों में पाठ को पार्स करने के लिए कुछ उत्कृष्ट उपकरण हैं। हालांकि, देर से, डेटा पारंपरिक (ऐतिहासिक) प्रारूपों (सीएसवी, टीएसवी, रिकॉर्ड-आधारित या कुछ अन्य सीमांकित-आधारित) में नहीं है, यह पहले हुआ करता था। इन दिनों XML / JSON जैसे संरचित स्वरूपों में डेटा का आदान-प्रदान किया जाता है।
मुझे पता है कि कुछ अच्छे उपकरण हैं जैसे कि sed, awk और Perl जो लगभग किसी भी प्रकार के डेटा को बाहर चबा सकते हैं। हालांकि, इस तरह के संरचित आंकड़ों के साथ काम करने के लिए, अक्सर किसी को एक पूरा कार्यक्रम लिखना पड़ता है, और, जानकारी निकालने के लिए उपलब्ध थोड़ा समय दिया जाता है, किसी को बैठना पड़ता है और जो कोई भी प्रश्न करना चाहता है उसके पूरे तर्क का पता लगा सकता है। इसे नीचे प्रोग्राम करें। कभी-कभी यह ठीक नहीं है - मूल रूप से क्योंकि उन फ़ाइलों से निकाली गई जानकारी आगे के काम के लिए इनपुट के रूप में कार्य करती है; उचित समाधान की खोज करने और उसे कोड करने में लगने वाले समय के कारण भी। डेटा को खोजने, क्वेरी और डंप करने के लिए पर्याप्त स्विच के साथ कमांड लाइन टूल की आवश्यकता होती है।
मैं ऐसे टूल की तलाश कर रहा हूं जो XML / JSON या संरचित डेटा के अन्य रूपों को लेते हैं और इसे अन्य प्रारूपों जैसे csv, आदि में डंप करते हैं, ताकि वहां से कोई भी अन्य कमांड का उपयोग कर सके ताकि कोई भी जानकारी प्राप्त कर सके।
क्या कोई कमांड लाइन उपयोगिताओं हैं जो आप जानते हैं कि इस तरह की नौकरी क्या है? क्या इसके लिए पहले से ही awk / पर्ल स्क्रिप्ट उपलब्ध हैं?
jq
: खोल में JSON को पार्स करने के लिए एक अच्छा उपकरण है stedolan.github.io/jq