किसी दिए गए सिस्टम को मॉडल करने के लिए आनुवंशिक एल्गोरिथम के लिए उचित संख्या में पैरामीटर का चयन कैसे किया जा सकता है?
उदाहरण के लिए, मान लें कि आप कारों के उत्पादन का अनुकूलन करना चाहते हैं, और आपके पास 1,000 विभिन्न कर्मचारियों में से प्रत्येक के लिए विभिन्न कार्यों में प्रति घंटा दक्षता के 1,000 माप हैं। तो, आपके पास 1,000,000 डेटा पॉइंट हैं। इनमें से अधिकांश आपके कारखाने की समग्र दक्षता से कमजोर रूप से संबद्ध होने की संभावना रखते हैं, लेकिन इतनी कमजोर नहीं कि आप कह सकें कि वे सांख्यिकीय विश्वास के साथ अप्रासंगिक हैं। आप अपने GA के इनपुट लेने के बारे में कैसे जाना है ताकि आपके पास आज़ादी की 1,000,000+ डिग्री न हो, जिसके परिणामस्वरूप बहुत धीमी गति से अभिसरण या कोई अभिसरण न हो?
विशेष रूप से, वे एल्गोरिदम क्या हैं जिनका उपयोग पूर्व-चयन या चुनिंदा सुविधाओं को समाप्त करने के लिए किया जा सकता है?
एक दृष्टिकोण मैं अपने आप को इस परिदृश्य में इस्तेमाल किया है पैरामीटर चयन खुद विकसित करने के लिए, तो मैं जैसे माता-पिता हो सकता है है {a,b,c}
, {b,d,e,q,x,y,z}
, और इतने पर। फिर मैं बच्चों को फीचर जोड़ने या छोड़ने के लिए म्यूट करूंगा। यह कुछ दर्जन सुविधाओं के लिए अच्छी तरह से काम करता है। लेकिन समस्या यह है कि अगर बड़ी संख्या में आजादी है तो यह अक्षम है। उस स्थिति में, आप 10^n
संयोजन देख रहे हैं (ऊपर दिए गए उदाहरण में 10^1,000,000
), जो किसी भी प्रकार के उपयोगी प्रदर्शन को प्राप्त करने के लिए महत्वपूर्ण सुविधाओं के कुछ पूर्व फ़िल्टरिंग बनाता है।