हमारे कार्य के सर्वर लॉग का विश्लेषण करने के लिए मुझे यह कार्य सौंपा गया था जिसमें अपवाद लॉग, डेटाबेस लॉग इवेंट लॉग आदि शामिल हैं। मैं मशीन सीखने के लिए नया हूं, हम लोचदार खोज और स्पार्क्स एमएललिब (या प्रिडिक्शनियो) के साथ स्पार्क का उपयोग करते हैं। वांछित का एक उदाहरण। परिणाम का अनुमान लगाने में सक्षम होने में सक्षम होगा कि लॉग लॉग के आधार पर भविष्यवाणी करने में सक्षम होने के लिए कि कौन सा उपयोगकर्ता अगले अपवाद का कारण बनता है और जिस पर (और आवेदन के अनुकूलन में सुधार करने के लिए अन्य सामान का गुच्छा और सुविधा)।
मैं सफलतापूर्वक ElasticSearch से डेटा को स्पार्क में निगलना और DataFrames बनाने और आवश्यक डेटा को मैप करने में सक्षम रहा हूं। मैं यह जानना चाहूंगा कि मैं अपने कार्यान्वयन के मशीन लर्निंग पहलू से कैसे संपर्क कर सकता हूं। मैं उन लेखों और पत्रों के माध्यम से आया हूं, जो डेटा प्रीप्रोसेसिंग के बारे में बात करते हैं, डेटा मॉडल को प्रशिक्षित करते हैं और लेबल बनाते हैं और फिर भविष्यवाणियां बनाते हैं।
मेरे पास जो सवाल हैं
मैं एग्जिट लॉग डेटा को संख्यात्मक वैक्टर में बदलने के लिए कैसे संपर्क कर सकता हूं, जिसे प्रशिक्षित करने के लिए डेटासेट का उपयोग किया जा सकता है।
मैं अपने डेटासेट को प्रशिक्षित करने के लिए क्या एल्गोरिदम का उपयोग करता हूं (सीमित ज्ञान के साथ मैंने पिछले कुछ दिनों को इकट्ठा किया है, मैं सोच रहा था कि रैखिक प्रतिगमन को लागू करने के लिए मुक्केबाज़ी करें, कृपया सुझाव दें कि कौन सा कार्यान्वयन सबसे अच्छा होगा)
इस समस्या से कैसे संपर्क करें, इस बारे में सुझाव की तलाश कर रहे हैं।
धन्यवाद।