CSV फ़ाइल प्रारूप पूरी तरह से मानकीकृत नहीं है यहां तक कि RFC4180 भी मौजूद है
(यह मानक केवल पाठ-आधारित क्षेत्रों की हैंडलिंग को निर्दिष्ट करता है)।
RFC4180 आवश्यकताएँ:
- MS-DOS- शैली रेखाएँ जो (CR / LF) वर्णों (अंतिम पंक्ति के लिए वैकल्पिक) के साथ समाप्त होती हैं।
- एक वैकल्पिक हेडर रिकॉर्ड (यह पता लगाने का कोई निश्चित तरीका नहीं है कि क्या यह मौजूद है, इसलिए आयात करते समय देखभाल की आवश्यकता है)।
- प्रत्येक रिकॉर्ड "चाहिए" में समान संख्या में अल्पविराम से अलग किए गए फ़ील्ड हैं।
- किसी भी क्षेत्र को उद्धृत किया जा सकता है (दोहरे उद्धरण चिह्नों के साथ)।
- लाइन-ब्रेक, डबल-उद्धरण और / या अल्पविराम वाले फ़ील्ड को उद्धृत किया जाना चाहिए। (यदि वे नहीं हैं, तो फ़ाइल को सही ढंग से संसाधित करना असंभव होगा)।
- एक क्षेत्र में एक (डबल) उद्धरण चरित्र को दो (डबल) उद्धरण वर्णों द्वारा दर्शाया जाना चाहिए।
अपने प्रश्न पर वापस जाएं:
मेरे पास उदाहरण के लिए ईमेल पतों की अल्पविराम से अलग की गई सूची है
friend1@example.xyz, friend2@example.xyz, friend3@example.xyz
लेकिन मुझे इसे उचित CSV प्रारूप में बदलने की आवश्यकता होगी। तो रिक्त स्थान की जगह, मुझे लगता है
रिक्त स्थान हटाने के लिए:
- Ctrl+ दबाएं H।
- क्षेत्र के
Find what
प्रकार में[ \t]+
- खेत
Replace with
खाली होना चाहिए।
- में
Search mode
खंड स्विच रेडियो बटन को regular expression
और बटन हिटReplace All
जब आपने रिक्त स्थान से पाठ साफ़ किया, तो आप कॉलम डेटा को उद्धरण में संलग्न करना चाह सकते हैं:
- Ctrl+ दबाएं H।
- क्षेत्र के
Find what
प्रकार में([^,\r\n]+)
- क्षेत्र के
Replace with
प्रकार में\"\1\"
- में
Search mode
खंड स्विच रेडियो बटन को regular expression
और बटन हिटReplace All
नोट: यह (उद्धरण में आसपास का डेटा) डॉस / विंडोज प्रारूप में सहेजे गए पाठ पर लागू होता है, यदि आप लिनक्स से डेटा संसाधित करते हैं, तो \r
फ़ॉर्म Find what
फ़ील्ड हटा दें ।