एक पाठ फ़ाइल में, मैं ,
(कॉमा) को हटाना चाहता हूं और "
(उद्धरण) (केवल अगर दोहरे उद्धरणों में कॉमा द्वारा अलग किए गए नंबर हैं)।
56,72,"12,34,54",x,y,"foo,a,b,bar"
अपेक्षित ouput
56,72,123454,x,y,"foo,a,b,bar"
नोट: मैं उपरोक्त लाइन को एक उदाहरण के रूप में दिखाता हूं। मेरी पाठ फ़ाइल में ऊपर की तरह कई पंक्तियाँ हैं और दोहरे उद्धरण चिह्नों के भीतर मौजूद अल्पविराम द्वारा अलग किए गए अंक अलग-अलग होने चाहिए। अर्थात्,
56,72,"12,34,54",x,y,"foo,a,b,bar"
56,92,"12,34",x,y,"foo,a,b,bar"
56,72,"12,34,54,78,76,54,67",x,y,"foo,a,b,bar"
56,72,x,y,"foo,a,b,bar","12,34,54"
56,72,x,y,"foo,a,b,bar","12,34,54","45,57,84,92","bar,foo"
अपेक्षित उत्पादन:
56,72,123454,x,y,"foo,a,b,bar"
56,92,1234,x,y,"foo,a,b,bar"
56,72,12345478765467,x,y,"foo,a,b,bar"
56,72,x,y,"foo,a,b,bar",123454
56,72,x,y,"foo,a,b,bar",123454,45578492,"bar,foo"
वहाँ एक n
नंबर की संख्या अल्पविराम के द्वारा अलग दोहरे उद्धरण चिह्नों के भीतर प्रस्तुत करते हैं। और दोहरे उद्धरणों को भी छोड़ दें जिनमें वर्ण हैं जैसे कि यह है।
मुझे sed
टेक्स्ट प्रोसेसिंग टूल पसंद है। यदि आप इसके sed
लिए कोई समाधान पोस्ट करते हैं तो मुझे खुशी है ।
foo
और bar
) अल्पविराम के साथ हटा दिए जाते हैं। इसके अलावा, कुछ उद्धरण गायब हो जाते हैं जहां अन्य रहते हैं। यह उल्लेख नहीं है कि बीच में अल्पविराम a
और b
साथ ही रहते हैं। क्या इनका कोई पैटर्न है?
56,72,"12,34,54",x,y,"foo,a,b,bar"
करने के लिए56,72,123454,x,y,"a,b"
,foo
औरbar
है गायब हो जाते हैं। क्या यह आपका वांछित आउटपुट है?