text-processing पर टैग किए गए जवाब

कार्यक्रमों, लिपियों आदि द्वारा पाठ की हेरफेर या जाँच।

2
कमांड लाइन उपयोगिताओं का उपयोग करके UNIX में पार्सिंग XML, JSON और नए डेटा फ़ाइल स्वरूप
यूनिक्स वातावरण में विभिन्न रूपों में पाठ को पार्स करने के लिए कुछ उत्कृष्ट उपकरण हैं। हालांकि, देर से, डेटा पारंपरिक (ऐतिहासिक) प्रारूपों (सीएसवी, टीएसवी, रिकॉर्ड-आधारित या कुछ अन्य सीमांकित-आधारित) में नहीं है, यह पहले हुआ करता था। इन दिनों XML / JSON जैसे संरचित स्वरूपों में डेटा का आदान-प्रदान …

3
एक कमांड से आउटपुट के साथ दो काम करना
मेरे पास एक कार्यक्रम है texcountजो मेरे LaTeX दस्तावेज़ में शब्दों की संख्या को आउटपुट करता है। मैं भी इस के उत्पादन को पाइप कर सकता हूं sedताकि newlines TeX लाइनब्रेक बना सके और इसे एक फाइल पर लिख सकूं जिसे मैं अपने अंतिम दस्तावेज में शामिल कर सकता हूं। …


2
एक मैच के आसपास के पात्रों grep
मैं एक विशाल डेटाबेस डंप के भीतर एक खोजने और बदलने के लिए देख रहा हूं, और यह वह नहीं कर रहा है जो मुझे लगता है कि होना चाहिए। मैं फ़ाइल में अपने लक्ष्य स्ट्रिंग के लिए grep करना चाहता हूं, और फिर आसपास के 8 वर्ण या तो …

3
केवल एक कॉलम को छाँटें, शेष कॉलमों को अछूता रखते हुए
अन्य स्तंभों को प्रभावित किए बिना (संख्यात्मक रूप से) एक विशिष्ट कॉलम को किसी पाठ स्तंभ में कैसे सॉर्ट किया जाता है (भले ही वे सॉर्ट किए गए हों या अनसोल्ड हों)? अन्य थ्रेड्स पर मुझे -sतर्क मिला , लेकिन यह अन्य स्तंभों को क्रमबद्ध करता है। अवलोकन $ cat …

6
कमांड आउटपुट द्वारा फ़ाइल के पहले कॉलम को बदलें
इस प्रश्न से यूनिक्स का उपयोग करके कॉलम को कॉपी और बदलें मैंने एक समाधान बनाने की कोशिश की है जो केवल इस फ़ाइल से काम करता है: 20070101 10.2317 79.1638 6.0 26.7 20.9 0.8 14.0 98.6 20070102 10.2317 79.1638 5.6 26.5 20.8 1.9 13.6 98.0 20070103 10.2317 79.1638 7.5 …

7
निरंतरता लाइनों के साथ grep
मैं कैसे कर सकते हैं grep/ awk/ sedएक फ़ाइल कुछ पैटर्न की तलाश में, और पूरे लाइन (यदि मिलान किया लाइन के साथ समाप्त होता है निरंतरता लाइनों सहित प्रिंट \? फ़ाइल foo.txtमें शामिल हैं: something whatever thisXXX line \ has a continuation line blahblah a \ multipleXXX \ continuation …

1
.Csv फ़ाइल से जानकारी लें और इसे निश्चित पैटर्न के बाद जोड़ें
मैं इस छात्र की जानकारी के साथ काम कर रहा हूँ: name: Romeo e_mail: letsrock@hotmail.com Room: 0/48 street: 1/0/48 name: April e_mail: thebestmonth@hotmail.com Room: 0/4 street: 1/0/4 name: Julian e_mail: julian688@gmail.com Room: 0/2 street: 1/0/2 name: Charles e_mail: charlesuniv@yahoo.com Room: 0/1 street: 1/0/1 name: Chris e_mail: todoras@hotmail.com Room: 0/42 street: …

4
शेल स्क्रिप्ट में एक फ़ील्ड से '-' की किसी भी घटना को निकालें
नीचे मेरी सीएसवी फ़ाइल है, मैं रिटेलर_ड फील्ड से - की सभी घटनाओं को हटाकर नया सीएसवी बनाना चाहता हूं। >IPAY_USER_ID,RETAILER_ID,CUST_FIRST_NAME,CUST_LAST_NAME,CUST_MIDDLE_NAME,ACTIVATION_ACTOR_ID,DATE_OF_BIRTH,GENDER,EMAIL_ID,MOBILE_NO,CUSTOMER_CATEGORY,CUST_STATUS,WALLET_TYPE,MOBILE_CIRCLE,MPIN_EXPRY_DATE,R_MOD_ID,R_MOD_TIME,R_CRE_ID,CREATION_DATE,CREATION_TIME,RETAILER_UPGRADE_REG_DATE,RETAILER_UPGRADE_REG_TIME,DEDUP2_DATE,DEDUP2_TIME,DATA_ENRICHMENT_DATE,DATA_ENRICHMENT_TIME,BLACKLIST_DATE,BLACKLIST_TIME,DEDUP3_DATE,DEDUP3_TIME,KYCN_P_Registration_Mode,CHANNEL,TD_PD_STATUS,DEFAULT_MPIN_CHANGED_OR_NOT,UPGRADE_CHANNEL,UPGRADE_STATUS,LAST_TXN_DATE,KYCF_CONVERSION_DATE,KYCF_CONVERSION_TIME,NOMINEE_NAME,RELATION_CODE,BALANCE,SEEDING AUTHORISATION ID 22909943,--,RAL,WAL,,0,08/jan/1997,,RjhL@GMAIL.COM,9923,,ACTIVE,NOKYC,RJ,2025-08-27 21:19:30,22909943,2015-11-05 17:21:17,22909943,2015-08-27,21:19:30,,,,,,,2015-11-05,17:21:17,,,SELF,WEB,,-,,PENDING,2015-08-27 21:19:30,,,,,0,

2
फ़ील्ड और रिकॉर्ड विभाजकों को संशोधित करके awk के साथ पार्स करना
मेरे पास एक फाइल है जो इस प्रकार है: ------------------------------------------------------------------------------------------------------------------------------------------------------------------ 49515 23/6/2014 SL B .OO 2500.00 R ROY 4561235 BEING THE T.E PAID ------------------------------------------------------------------------------------------------------------------------------------------------------------------- 23495 26/7/2014 CL A 2300.00 .00 S DAS 2334167 BEING THE MONEY RECOVERED --------------------------------------------------------------------------------------------------------------------------------------------------------------------- मेरा वांछित आउटपुट निम्नानुसार है: 49515 23/6/2014 SL B .00 2500.00 R …

1
पायथन: टेक्स्टफाइल में लाइनों को पीछे की ओर ले जाएं
एक पाठ फ़ाइल की कल्पना करें जिसमें यादृच्छिक पाठ और दो अद्वितीय मार्कर शामिल हैं 01 text text text 02 text text text 03 __DELETE_THIS_FIRST__ 04 text text text 05 text text text 06 text text text 07 text text text 08 __DELETE_THIS_LINE_SECOND__ 09 a few 10 interesting 11 lines …

4
किसी वर्ण में किसी स्थान पर किसी वर्ण को प्रतिस्थापित करना
मेरे पास फाइल इस प्रकार है और कॉमा को दूसरी स्थिति में बदलना होगा जैसे # 1K,1,,,,,,,,,,,0.10000000E+00,0.2837726134152E+08,0.6756896377655E+02 1K,2,,,,,,,,,,,0.10000000E+00,0.2837950666514E+08,0.6757007624345E+02 1K,3,,,,,,,,,,,0.10000000E+00,0.2837975330813E+08,0.6756827852038E+02 1K,8,,,,,,,,,,,0.10000000E+00,0.2610685746631E+08,0.1832495587770E+03 1K,9,,,,,,,,,,,0.10000000E+00,0.2610716318002E+08,0.1836118051089E+03 1K10,,,,,,,,,,,0.10000000E+00,0.2609596327361E+08,0.1822385749588E+03 1K11,,,,,,,,,,,0.10000000E+00,0.2610713453046E+08,0.1841214115744E+03 1K12,,,,,,,,,,,0.10000000E+00,0.2610673990054E+08,0.1846882770826E+03 1K18,,,,,,,,,,,0.10000000E+00,0.2610076439025E+08,0.1854595804085E+03 मैंने यह कोशिश की, लेकिन अल्पविराम से पहले वर्णों को हटाना: sed 's/^\(.\{2\}\),/\#/' input_file प्राप्त परिणाम: #1,,,,,,,,,,,0.10000000E+00,0.2837726134152E+08,0.6756896377655E+02 #2,,,,,,,,,,,0.10000000E+00,0.2837950666514E+08,0.6757007624345E+02 #3,,,,,,,,,,,0.10000000E+00,0.2837975330813E+08,0.6756827852038E+02 #8,,,,,,,,,,,0.10000000E+00,0.2610685746631E+08,0.1832495587770E+03 #9,,,,,,,,,,,0.10000000E+00,0.2610716318002E+08,0.1836118051089E+03 1K10,,,,,,,,,,,0.10000000E+00,0.2609596327361E+08,0.1822385749588E+03 1K11,,,,,,,,,,,0.10000000E+00,0.2610713453046E+08,0.1841214115744E+03 1K12,,,,,,,,,,,0.10000000E+00,0.2610673990054E+08,0.1846882770826E+03 1K18,,,,,,,,,,,0.10000000E+00,0.2610076439025E+08,0.1854595804085E+03 …

3
फ़ाइल के प्रारूप को बदले बिना कई पंक्तियों के साथ एक पंक्ति को जोड़ने के लिए sed कमांड [बंद]
मैं नीचे xml फ़ाइल है cat example.xml <?xml version="1.0" encoding="UTF-8"?> <TestConfig xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"> <Text> <Checking state="BOOT" /> <function name="configure" type="test" username="user1" num="1" Mode="NA" Type="OPEN" txt="NA-TO" TextType="guest" who="BANANNA"/> <function name="configure" type="test" username="user2" num="2" Mode="YA" Type="DYNAMIC-WEP" txt="NA-TO" TextType="employee" who="BANANNA" /> <function name="configure" type="test" username="user3" num="3" Mode="YA" Type="DYNAMIC-WEP" txt="NA-TO" TextType="employee" who="BANANNA"/> <function name="configure" type="test" …

2
Col2 से col1 में स्ट्रिंग मान घटाएं और col2 को आबाद करें
मेरे पास एक डेटा फ़ाइल है जो इस तरह दिखती है: MASTER APP SET STATUS max_mstr_ref max_mstr_ref_horizon_biz pp_script true max_mstr_ref max_mstr_ref_horizon_biz pp_scrpt_1 false max_retl_len max_retl_len_bddm_biz px_script true min_min_ref min_min_ref_HZ_Null ap_script_2 false ... मुझे स्तंभ 2 में दोहराए गए उपसर्ग मानों को निकालने की आवश्यकता है (उदाहरण max_mstr_refके लिए max_retl_len, min_min_refऔर …
-1 text-processing  awk  sed  tr 

1
दो मानों की जाँच करें, यदि ओवरलैप है तो उनके स्कोर की जाँच करें और किसी अन्य फ़ाइल में उच्चतम स्कोर के साथ प्रिंट करें
मेरे पास एक फ़ाइल है, जिसमें से मुझे प्रत्येक क्वेरी लेनी है और Alt_from और Alt_to मानों की जांच करनी है। यदि Alt_from और Alt_to के मान ओवरलैप करते हैं, तो उच्चतम स्कोर के साथ पंक्ति की जांच करें और इसे गैर-अतिव्यापी मूल्यों के साथ एक फ़ाइल में प्रिंट करें। …
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.