क्यू-क्यू के नाम पर अक्षर Q को क्यों चुना गया?
अधिकांश पत्रों को एक संक्षिप्त नाम के रूप में चुना जाता है, जैसे कि नीति के लिए खड़ा होता है और मूल्य के लिए खड़ा होता है। लेकिन मुझे नहीं लगता कि Q किसी शब्द का संक्षिप्त नाम है।वी
क्यू-क्यू के नाम पर अक्षर Q को क्यों चुना गया?
अधिकांश पत्रों को एक संक्षिप्त नाम के रूप में चुना जाता है, जैसे कि नीति के लिए खड़ा होता है और मूल्य के लिए खड़ा होता है। लेकिन मुझे नहीं लगता कि Q किसी शब्द का संक्षिप्त नाम है।वी
जवाबों:
मैं हर किसी को निराश करने के लिए माफी चाहता हूं, लेकिन क्यू किसी भी चीज के लिए खड़ा नहीं है :)
वाटकिंस द्वारा 1989 में अपनी पीएचडी थीसिस में क्यू-लर्निंग प्रस्तावित किया गया था , देखें p.96। उस पृष्ठ पर समीकरण में प्रत्येक चरण में निश्चित तरीके से अद्यतन किया जाता है। क्यू किसी दिए गए राज्य में कार्रवाई से अपेक्षित वापसी है, पी .४६ पर क्यू की परिभाषा देखें। वापसी एक आर्थिक या खेल सिद्धांत अर्थ में होती है, अर्थात रियायती संभाव्य भारित पुरस्कार, एक फ़ंक्शन से वापसी की तरह कंप्यूटर विज्ञान शब्द नहीं।
ध्यान दें, कैसे उन्होंने पहले ही P को प्रायिकता और R को इनाम के लिए इस्तेमाल किया था, इसलिए उन्होंने वापसी के लिए Q को पकड़ लिया। बस। अक्षर Q के चुनाव का कोई गहरा अर्थ नहीं है।
क्यू-लर्निंग को इसलिए कहा जाता है क्योंकि यह क्यू मूल्यों का उपयोग करता है ताकि यह अनुमान लगा सके। हमेशा की तरह सीखने नियम, है और यह स्पष्ट होना चाहिए कि इसे क्यू-लर्निंग क्यों कहा जाता है।
लेकिन मेरे विचार में वास्तविक प्रश्न यह है कि क्यू-लर्निंग को ऐसा क्यों कहा जाता है। हालांकि इसका संतोषजनक उत्तर नहीं मिलता है, इस लिंक में उल्लेख किया गया है कि एंड्रयू बार्टो , जो कि आधुनिक सुदृढीकरण सीखने के संस्थापकों में से एक है, का मानना है कि क्वालिटी के लिए खड़ा है, इसे इसलिए कहा जाता है क्योंकि यह वर्णन करता है कि एक हाथ को खींचने का परिणाम कितना अच्छा है हो।