CSV फ़ाइल प्रारूप पूरी तरह से मानकीकृत नहीं है यहां तक कि RFC4180 भी मौजूद है
(यह मानक केवल पाठ-आधारित क्षेत्रों की हैंडलिंग को निर्दिष्ट करता है)।
RFC4180 आवश्यकताएँ:
- MS-DOS- शैली रेखाएँ जो (CR / LF) वर्णों (अंतिम पंक्ति के लिए वैकल्पिक) के साथ समाप्त होती हैं।
- एक वैकल्पिक हेडर रिकॉर्ड (यह पता लगाने का कोई निश्चित तरीका नहीं है कि क्या यह मौजूद है, इसलिए आयात करते समय देखभाल की आवश्यकता है)।
- प्रत्येक रिकॉर्ड "चाहिए" में समान संख्या में अल्पविराम से अलग किए गए फ़ील्ड हैं।
- किसी भी क्षेत्र को उद्धृत किया जा सकता है (दोहरे उद्धरण चिह्नों के साथ)।
- लाइन-ब्रेक, डबल-उद्धरण और / या अल्पविराम वाले फ़ील्ड को उद्धृत किया जाना चाहिए। (यदि वे नहीं हैं, तो फ़ाइल को सही ढंग से संसाधित करना असंभव होगा)।
- एक क्षेत्र में एक (डबल) उद्धरण चरित्र को दो (डबल) उद्धरण वर्णों द्वारा दर्शाया जाना चाहिए।
अपने प्रश्न पर वापस जाएं:
मेरे पास उदाहरण के लिए ईमेल पतों की अल्पविराम से अलग की गई सूची है
friend1@example.xyz, friend2@example.xyz, friend3@example.xyz
लेकिन मुझे इसे उचित CSV प्रारूप में बदलने की आवश्यकता होगी। तो रिक्त स्थान की जगह, मुझे लगता है
रिक्त स्थान हटाने के लिए:
- Ctrl+ दबाएं H।
- क्षेत्र के
Find whatप्रकार में[ \t]+
- खेत
Replace withखाली होना चाहिए।
- में
Search modeखंड स्विच रेडियो बटन को regular expression
और बटन हिटReplace All
जब आपने रिक्त स्थान से पाठ साफ़ किया, तो आप कॉलम डेटा को उद्धरण में संलग्न करना चाह सकते हैं:
- Ctrl+ दबाएं H।
- क्षेत्र के
Find whatप्रकार में([^,\r\n]+)
- क्षेत्र के
Replace withप्रकार में\"\1\"
- में
Search modeखंड स्विच रेडियो बटन को regular expression
और बटन हिटReplace All
नोट: यह (उद्धरण में आसपास का डेटा) डॉस / विंडोज प्रारूप में सहेजे गए पाठ पर लागू होता है, यदि आप लिनक्स से डेटा संसाधित करते हैं, तो \rफ़ॉर्म Find whatफ़ील्ड हटा दें ।