मैं अपने एक उत्पाद की कई लॉग फ़ाइलों पर डेटा सेट बनाने की कोशिश कर रहा हूं।
विभिन्न लॉग फ़ाइलों का अपना लेआउट और अपनी सामग्री है; मैंने उन्हें सफलतापूर्वक एक साथ समूहीकृत किया, केवल एक कदम शेष ...
वास्तव में, लॉग "संदेश" सबसे अच्छी जानकारी है। मेरे पास उन सभी संदेशों की व्यापक सूची नहीं है, और यह उन पर आधारित हार्ड कोड के लिए एक बुरा विचार है क्योंकि वह सूची हर दिन बदल सकती है।
मैं क्या करना चाहूंगा कि इंडेंटिफिकेशन टेक्स्ट को वैल्यू टेक्स्ट से अलग किया जाए (उदाहरण के लिए: "लोडेड फाइल एक्सएक्सएक्स" बन जाता है (पहचान: "लोडेड फाइल", वैल्यू: "एक्सएक्सएक्स"))। दुर्भाग्य से, यह उदाहरण सरल है, और वास्तविक दुनिया में विभिन्न लेआउट और कभी-कभी कई मूल्य हैं।
मैं स्ट्रिंग गुठली का उपयोग करने के बारे में सोच रहा था, लेकिन यह क्लस्टरिंग के लिए अभिप्रेत है ... और क्लैस्टिंगिंग यहां लागू नहीं है (मुझे विभिन्न प्रकार के संदेशों और अंतिम रूप से संख्या की जानकारी नहीं है, यह बहुत अधिक होगा)।
क्या तुम्हारे पास कोई विचार है?
आपकी सहायता के लिए धन्यवाद।
पुनश्च: जो लोग प्रोग्राम करते हैं, उनके लिए यह समझना आसान हो सकता है। मान लें कि कोड में लॉग इन प्रिंटफ ("ब्लाब्ला% s", "xxx") के रूप में है -> मैं "ब्लाब्ला" और "xxx" अलग करना चाहूंगा