मैं वर्तमान में जीनोमिक्स के लिए एक लॉजिस्टिक रिग्रेशन मॉडल पर काम कर रहा हूं। इनपुट क्षेत्रों में से एक मैं एक कोवरिएट के रूप में शामिल करना चाहता हूं genes
। लगभग 24,000 ज्ञात जीन हैं। कम्प्यूटेशनल जीव विज्ञान में परिवर्तनशीलता के इस स्तर के साथ कई विशेषताएं हैं और सैकड़ों हजारों नमूनों की आवश्यकता है।
- अगर मैं
LabelEncoder()
उन 24K जीन - और फिर
OneHotEncoder()
उन्हें ...
क्या २४,००० कॉलम मेरे केर प्रशिक्षण समय को २.२ गीगाहर्ट्ज़ क्वाड-कोर आई? सीपीयू के लिए अनुचित बनाने जा रहे हैं?
यदि हां, तो क्या एन्कोडिंग के लिए एक अलग दृष्टिकोण है जो मैं इसके साथ ले जा सकता हूं?
क्या मुझे किसी तरह अपने मॉडल की एक परत इस सुविधा के लिए समर्पित करने की कोशिश करनी चाहिए?
क्या इसका मतलब मुझे 24K इनपुट नोड्स की आवश्यकता है?