परिणाम का अनुकूलन करने के लिए एक गहरी शिक्षण एल्गोरिथ्म

मैं गहरी सीखने के लिए काफी नया हूं लेकिन मुझे लगता है कि मैंने इसका उपयोग शुरू करने के लिए सिर्फ सही वास्तविक दुनिया की स्थिति पाई। समस्या यह है कि मैंने परिणामों का अनुमान लगाने के लिए केवल ऐसे एल्गोरिदम का उपयोग किया है। मेरी नई परियोजना के लिए, मुझे परिणामों को अनुकूलित करने के लिए मशीन को खिलाने के लिए जानकारी की आवश्यकता है। क्या कोई संक्षेप में बता सकता है कि मुझे कैसे आगे बढ़ना चाहिए? मैं फँस गया हूँ।

यहाँ स्थिति है:

मेरे पास एक ऐसी मशीन है जो लकड़ी के विभिन्न स्तरों के साथ लकड़ी की तख्तियां लेती है और इसे कट लिस्ट में दिए गए ब्लॉक्स में काटना पड़ता है। यह मशीन हमेशा उच्चतम स्कोर का चयन करेगी, जो किसी दिए गए तख्ती से प्राप्त कर सकता है। स्कोर प्रत्येक ब्लॉक के गुणा करके प्राप्त कर रहा है क्षेत्र अपने द्वारा multiplicator । जिस एल्गोरिथ्म का मैं निर्माण करना चाहता हूं, उस मशीन को कट सूची में सूचीबद्ध प्रत्येक ब्लॉक के लिए एक गुणक देना होगा । इस मशीन से सभी भौतिक आउटपुट को जरूरत पड़ने तक रोबोट द्वारा अलमारियों पर स्टॉक किया जाएगा। काटने की मशीन को एक तख़्ती के कुछ हिस्सों को डाउनग्रेड करने की अनुमति दी जाती है यदि यह उच्च स्कोर तक पहुंचने में मदद करता है।

मान को मशीन के लिए एक प्रोत्साहन के रूप में कार्य करना पड़ता है जिससे मुझे बहुत अधिक लकड़ी अपग्रेड किए बिना ब्लॉक की आवश्यकता होती है।

ऑप्टिमाइज़ेशन गोल्स

सुनिश्चित करें कि प्रत्येक ब्लॉक उस समय तक स्टॉक में है, जब तक उसकी आवश्यकता न हो, लेकिन बिना कारण के जल्दी नहीं
संभव के रूप में लकड़ी के छोटे क्षेत्र के रूप में डाउनग्रेड (कुछ प्रजातियां बहुत महंगी हैं)

INPUT NODES

समय से पहले इस ब्लॉक की जरूरत है
इस ब्लॉक के लिए लकड़ी का ग्रेड
इस ब्लॉक की राशि की जरूरत है
ब्लॉक का क्षेत्र (हो सकता है)

ALGORITHM को दिए गए फीडबैक

अग्रिम में समय की मात्रा है कि ब्लॉक तैयार था (जितना संभव हो उतना कम होना चाहिए)
लकड़ी का क्षेत्र डाउनग्रेडेड * ग्रेड की संख्या छोड़ दी गई

निर्यात किया आंकड़े

एक गुणक जो उस ब्लॉक को दूसरों के सापेक्ष अपनी प्राथमिकता देगा

जानकारी के लिए मुझे पता है कि बच्चे को जन्म दिया है

लकड़ी की प्रत्येक प्रजाति के लिए प्रत्येक ग्रेड का औसत अनुपात

मुझे अब तक जो पता चला है, उसे आउटपुट नोड बनाने के लिए मुझे केवल एक मूल्य में स्मोक करने के लिए मेरी प्रतिक्रिया की आवश्यकता हो सकती है। समस्या यह है कि मैं यह नहीं समझ सकता कि इस एल्गोरिथ्म को एक गुणक निर्धारित करने के लिए कैसे बनाया जाए । क्या मैं गहरी शिक्षा के माध्यम से इसे हल करने की कोशिश में गलत हूं?

deep-learning

— फ्रैंक मलेनफ़ैंट
स्रोत

यह वास्तव में एक दिलचस्प सवाल है! ऐ में आपका स्वागत है।

— ड्यूकझोउ

मैंने अधिक स्पष्टता के लिए प्रश्न को संपादित करने की स्वतंत्रता ली। निश्चित नहीं था कि क्या करना है: "मूल्य प्रति सेमी will जो उस ब्लॉक को दूसरों के सापेक्ष एक इष्टतम प्राथमिकता देगा" क्या आपका मतलब है कि अन्य ब्लॉक के सापेक्ष इसकी प्राथमिकता के संबंध में ब्लॉक को एक इष्टतम मूल्य देना है?

— ड्यूकझोउ

@DukeZhou मशीन का एल्गोरिथ्म "स्कोर" बनाने के लिए ब्लॉक के कुल 2D क्षेत्र (चौड़ाई x लंबाई) द्वारा अनुकूलन करने की कोशिश कर रहे मूल्य को गुणा करता है और अधिकतम अंक प्राप्त करने के लिए प्रत्येक तख्ती को काटता है। यदि मैं एल्गोरिथ्म में ब्लॉक के क्षेत्र को मानता हूं, तो मैं स्कोर निर्धारित कर सकता हूं और फिर इसे क्षेत्र से विभाजित कर सकता हूं। सब सब में, मुख्य ध्यान यह सुनिश्चित करने में है कि उच्चतम स्कोर उच्चतम आवश्यकता से मेल खाता है ताकि मशीन का लक्ष्य हमारे जैसा ही हो।

— फ्रैंक मैलेनफैंट

@DukeZhou क्षमा करें यदि यह उतना स्पष्ट नहीं है जितना कि यह, अंग्रेजी मेरी दूसरी भाषा है।

— फ्रैंक मैलेनफैंट

@ ड्यूकज़ो यहाँ। मैंने इसे गुणक शब्द के साथ बदल दिया और इसके उपयोग के बारे में कुछ अतिरिक्त जानकारी दी।

— फ्रैंक मैलेनफ़ैंट 20

प्रतिगमन कार्यों के लिए गहन सीखने वाले मॉडल को प्रशिक्षित करना काफी कठिन है, इसलिए मैं उनके साथ शुरू नहीं करने का सुझाव दूंगा। इसके बजाय मैं नीचे दिए गए दृष्टिकोणों में से एक के साथ शुरू करूंगा और हो सकता है कि बाद में गहन शिक्षण का उपयोग करने का प्रयास करूं।

समस्या का एक शास्त्रीय दृष्टिकोण आपके अनुकूलन सॉफ्टवेयर का विश्लेषण करने के लिए हो सकता है और यह संभवतः आपको कुछ नियतात्मक एल्गोरिथ्म तक ले जाएगा।

आपके अनुकूलन सॉफ्टवेयर को ब्लैक बॉक्स के रूप में मानने के लिए अलग-अलग दृष्टिकोण हो सकते हैं - इसे विविध प्रकार के इनपुट दें, उन चर पर ध्यान दें, जिनमें आप रुचि रखते हैं (निष्पादन समय, परिणाम काटने, आदि) और उस पर किसी प्रकार या प्रतिसाद को फिट करने का प्रयास करें। ।

एक विकल्प कुरोश के विचार का पालन करना है और इसे शास्त्रीय अनुकूलन समस्या के रूप में तैयार करना है।

यदि आप मशीन लर्निंग टूल्स का उपयोग करना पसंद करते हैं, तो मैं सुझाव दूंगा कि आप एक साधारण मॉडल की तरह रेखीय प्रतिगमन के साथ शुरुआत करें ताकि यह सत्यापित किया जा सके कि आपके द्वारा उपयोग किए जा सकने वाले डेटा में कोई संकेत नहीं है। बाद में आप और अधिक शक्तिशाली एल्गोरिदम देख सकते हैं जैसे कि xgboost, प्रतिगमन पेड़, आदि।

— ginge
स्रोत