नकारात्मक सुदृढीकरण: किसी वस्तु को कैसे बदला जाए?


18

मेरा बीज़ शेफर्ड अब 9 महीने का हो गया है, हमने एक व्यक्तिगत ट्रेनर के साथ कुछ व्यवहार शिक्षा कक्षाओं का पालन किया है और सब कुछ बहुत अच्छा हुआ। इससे पहले कि वह चाहता था और अब कुत्ते, वह सिर्फ अच्छा सुनता है!

प्रशिक्षक के सुझाव के अनुसार, कुछ व्यवहारों को सकारात्मक रूप से सुदृढ़ किया गया, और कुछ को नकारात्मक रूप से। अब हम जो समस्या रख रहे हैं वह उन व्यवहारों के साथ है जिन्हें हमने नकारात्मक रूप से प्रबलित किया है। हम एक ध्वनि बनाने के लिए एक धातु के बक्से का उपयोग कर रहे हैं, कुत्ते इसे नफरत करता है और पालन करता है। यह हमेशा एक "नहीं" के बाद दूसरी मंजूरी के रूप में उपयोग किया जाता है। सब कुछ पूरी तरह से काम करता है, और अब हमें बॉक्स का उपयोग करने की आवश्यकता नहीं है क्योंकि वह सही ढंग से व्यवहार करता है।

समस्या यह है कि हमें लगता है कि हमें बॉक्स को किसी और चीज़ से बदलना होगा क्योंकि अब उसे पता चला है कि अगर हमारे पास बॉक्स नहीं है, तो कोई आवाज़ नहीं होगी और इसलिए वह अवांछित व्यवहार में संलग्न है। यह एक समस्या के रूप में शुरू हो रहा है क्योंकि हमें अब हर जगह बॉक्स ले जाने की आवश्यकता है, क्योंकि अगर हमारे पास यह नहीं है तो वह प्रांतीय का उपयोग करेगा।

क्या कोई ऐसा तरीका है जिससे हम बॉक्स को अपने शरीर या किसी चीज़ से बदल सकते हैं?

नोट: उन्हें एक महीने पहले ही डिस्क्स किया गया है और वह हमें थोड़ा कम ब्रेक दे रहे हैं लेकिन फिर भी यह तब होता है जब हमारे पास बॉक्स नहीं होता है।

धन्यवाद


1
संभवत: आपको अपने प्रशिक्षक से यह प्रश्न पूछना चाहिए, लेकिन एक बार नकारात्मक सुदृढीकरण (धातु के बक्से) ने उसके अवांछित व्यवहार पर अंकुश लगाने का काम किया, तो क्या अब आपको अच्छे व्यवहार पर लगाम नहीं लगानी चाहिए? एक उदाहरण के रूप में, अगर मेरा कुत्ता सोफे पर जा रहा है, तो मैं उसे निराश करने के लिए धातु के डिब्बे को हिला सकता हूं (और फिर जब वह सीखता है कि वह सोफे पर जा रहा है तो वह अवांछित था, मैं (2) प्रशंसा और उदारता से व्यवहार करना चाहता था जब भी वह फर्श पर सोफे के पास या इसी तरह रखी।
स्टीव डी

1
:) मुझे लगता है कि कुत्ते कैसे उन चीजों को खुद से सीख सकते हैं, कुछ अवलोकन के बाद ... "कोई बॉक्स नहीं, हे, मैं जो चाहूं वह कर सकता हूं!" :) :) :)
woliveirajr

जवाबों:


10

जब भी ऑपरेशनल कंडीशनिंग पर चर्चा की जाती है तो यह उसी भाषा को बोलने में मदद करती है:

  • सुदृढीकरण: आवृत्ति को बढ़ाने के लिए डिज़ाइन की गई क्रिया
  • सजा: एक व्यवहार की आवृत्ति को कम करने के लिए डिज़ाइन की गई कार्रवाई
  • सकारात्मक: एक उत्तेजना की उपस्थिति
  • नकारात्मक: एक उत्तेजना की अनुपस्थिति

ये शब्द चार अलग-अलग संयोजन बना सकते हैं ( NB: कोष्ठक में उदाहरण उदाहरण हैं, सलाह नहीं !)

  • सकारात्मक सुदृढीकरण: व्यवहार की आवृत्ति को बढ़ाने के लिए एक उत्तेजना पेश करें (उदाहरण के लिए जब कुत्ता आदेश पर बैठता है तो एक उपचार दें)
  • नकारात्मक सुदृढीकरण: व्यवहार की आवृत्ति को बढ़ाने के लिए एक उत्तेजना को निकालें (जैसे कि कुत्ते के भौंकने के बाद मेलमैन चला जाता है)
  • सकारात्मक सजा: व्यवहार की आवृत्ति को कम करने के लिए एक उत्तेजना पेश करें (जैसे कि जब यह कालीन पर पेशाब किया जाता है तो कुत्ते को मारें)
  • नकारात्मक सजा: व्यवहार की आवृत्ति को कम करने के लिए एक उत्तेजना को दूर करें (जैसे जब कुत्ते आप पर कूदता है तो कमरे को छोड़ दें)

व्यवहार में, ये गड़बड़ हो सकते हैं। उदाहरण के लिए, आप बॉक्स के साथ शोर कर रहे हैं, एक उत्तेजना है जिसे किसी व्यवहार की आवृत्ति को कम करने के लिए डिज़ाइन किया गया है, इसलिए यह तकनीकी रूप से सकारात्मक सजा का एक उदाहरण है, लेकिन अगर आप एक बार कुत्ते को सही व्यवहार करने से रोकते हैं, तो आप एक उत्तेजना को भी दूर कर सकते हैं। सही व्यवहार की आवृत्ति में वृद्धि, हे presto !, नकारात्मक सुदृढीकरण।

लेकिन यह निर्धारित करता है कि आपके कुत्ते को प्रदर्शन करने के लिए एक सही व्यवहार है। आप निर्दिष्ट नहीं करते हैं कि अवांछित व्यवहार क्या है, या यदि कोई इच्छित वैकल्पिक व्यवहार है जिसे आप सुदृढ़ करने का प्रयास कर रहे हैं। यदि आप सभी शोर के साथ उसे कुछ करने से रोकने की कोशिश कर रहे हैं, तो आप नकारात्मक सुदृढीकरण के बजाय सजा प्रदान कर रहे हैं।

किसी भी मामले में, आपकी समस्या का हिस्सा शायद यह है कि आप केवल प्राथमिक रीइन्फोर्सर्स और पनिशर्स का उपयोग कर रहे हैं , यानी कि कुत्ते को सीखने की आवश्यकता नहीं है। भोजन, उदाहरण के लिए, एक प्राथमिक प्रबलन है। कुत्ते को पता है कि खाना अच्छी चीज है, बिना इसे सीखे। विस्तार से, शोर एक प्राथमिक दंडक है, क्योंकि यह कुत्ते को सुनने के लिए असुविधाजनक है। इसके विपरीत द्वितीयक पुष्टिकर और दंडक, वे हैं जो कुत्ते ने सीखे हैं।

क्लासिक उदाहरण पावलोव की घंटी है कि वह हर बार वह कुत्ते को भोजन के साथ प्रदान करेगा। एक प्रोत्साहन के साथ एक प्राथमिक रिफ़रन्सर बाँधने से, स्टिमुलस एक द्वितीयक पुष्टाहार के रूप में कार्य करना शुरू कर सकता है। यही है, कुत्ता सीखता है कि घंटी भोजन के आगमन का संकेत देती है और तदनुसार प्रतिक्रिया करेगी।

आप उल्लेख करते हैं कि आप "नहीं" शब्द का उपयोग करते हैं (उम्मीद है कि एक कठोर आवाज में, कुत्ते अपने कुत्ते को शोर के साथ-साथ, शोर के साथ कहते समय, समझदार स्वर में बहुत अच्छे लगते हैं)। "नहीं" को एक माध्यमिक दंडक के रूप में कार्य करना चाहिए, उसी तरह प्रशंसा द्वितीयक पुष्टाहार का काम कर सकती है। लेकिन आप शायद वास्तविक शोर को धीरे-धीरे चरणबद्ध करने में विफल रहे, कभी-कभी केवल "नहीं" कहने से शुरू करें लेकिन शोर न करें।

समस्या यह है कि, अब तक, आपके कुत्ते ने इस तथ्य पर उठाया है कि "नो" जिसके चारों ओर कोई बॉक्स नहीं है, जिसका अर्थ है कि कोई प्राथमिक दंडक नहीं है, अर्थात दोनों संबंधित नहीं हैं, और वह, इसलिए, जब वह चारों ओर नहीं है तो उसे बचा लिया जाता है।

मेरा सुझाव है कि आप वास्तविक व्यवहार (विवरणों) का वर्णन करने के लिए एक नया प्रश्न खोलें, जिसे आप हतोत्साहित करना चाहते हैं, और हम बेहतर तरीके से आपके कुत्ते को प्राप्त करने के लिए अपने कुत्ते को प्राप्त करने के लिए परिचालक स्थिति के पूरे स्पेक्ट्रम का उपयोग करने में मदद कर सकते हैं। करने के लिए।


5

@ThomasH एक उत्कृष्ट उत्तर है और बहुत सटीक तरीके से द्वितीयक दंडकों का उपयोग करने के प्रश्न को छूता है।

यहाँ मैं समस्या के दो पहलुओं पर कुछ टिप्पणियाँ जोड़ रहा हूँ।

गलत व्यवहार को दंडित करें बनाम सही व्यवहार को सुदृढ़ करें

यहां तक ​​कि अगर "सिद्धांत" "प्रबलक पक्ष" और "दंडक पक्ष" पर समान काम करता है और प्रभाव उतना ही प्रभावी हो सकता है, हमें यह नहीं भूलना चाहिए कि एक व्यवहार को दबाने से कुत्ते को यह नहीं सिखाया जाता है कि इसके बजाय क्या करना है और मुख्य रूप से ध्यान केंद्रित करना प्रशिक्षण का "नहीं" हिस्सा micromanagement की ओर जाता है : आपको लगातार कुत्ते को सिखाने की ज़रूरत है कि उसे क्या नहीं करना चाहिए। यहां तक ​​कि अगर कुत्ता सीखता है कि उसे किसी दिए गए स्थिति में एक्स नहीं करना चाहिए, तो वह अभी भी वाई, जेड, आदि प्रदर्शन करने के लिए स्वतंत्र है। यदि आप उसे डब्ल्यू करने के लिए सकारात्मक रूप से सिखाते हैं (इसके बजाय उसे मजबूत करें) तो शायद यह किसी तरह का दुष्चक्र बंद हो जाएगा और सबको खुश करो।

परिवर्तनीय दर सुदृढीकरण / सजा

@ThomasH ने सेकेंडरी रीइंफोर्मर या सजा की अवधारणा को समझाया।

ध्यान में रखने वाला एक पहलू यह है कि, प्राथमिक रीइंफोर्म्स / पनिशमेंट के विपरीत, द्वितीयक को वैरिएबल शेड्यूल का उपयोग करके (एक तरह से या दूसरे तरीके से) पुरस्कृत किया जाना है ।

भोजन एक प्राथमिक पुष्टाहार है। हर बार कुत्ते को भोजन का एक टुकड़ा मिलता है जिसे वह प्रबलित होता है।

लेकिन "हाँ" या एक क्लिक जैसे कीवर्ड एक सेकेंडरी रीइन्फोर्मर बन सकते हैं। यह एक बाद के प्राथमिक प्रबलन से जुड़ा हुआ है। मुख्य बिंदु यह है कि यह काम करता है क्योंकि कुत्ते ने सीखा कि प्राथमिक रीइंफोर्मर द्वारा द्वितीयक पुष्टाहार को पुरस्कृत किया जाता है। यह जानने के बाद, लिंक को वास्तविक पुरस्कारों के साथ बनाए रखना होगा। शुरुआत में (प्रशिक्षण के दौरान) इनाम हर बार आएगा, फिर इसे एक चर अनुसूची के साथ पुरस्कृत किया जा सकता है। वैरिएबल शेड्यूल वास्तव में लिंक को मजबूत कर रहा है क्योंकि प्राथमिक इनाम आने पर कुत्ते अनुमान नहीं लगा सकते हैं।

ध्यान दें कि यह आम तौर पर तृतीयक प्रबलकों पर लागू होता है : क्यू "सिट" वास्तव में एक रीइन्फ़ॉर्मर है, क्योंकि इससे एक और रीइन्फ़ॉर्मर (उदाहरण के लिए एक क्लिक) हो सकता है जो तब वास्तविक इनाम का कारण बनता है।

हम आम तौर पर प्राथमिक रीइंफोर्सेर (उदाहरण के लिए खाद्य इनाम) से सेकेंडरी रीन्फोर्पर (क्लिक) को अलग नहीं करते हैं। यह दोनों के बीच की कड़ी को मजबूत रखता है, और क्यू (तृतीयक प्रबलक) और क्लिक के बीच परिवर्तनीय दर लागू होती है।

हालाँकि सजा के मामले में आपके पास वास्तविक "तृतीयक सजा" नहीं है, इसलिए "सुदृढीकरण" (इस मामले में सजा के रूप में समझा गया) की परिवर्तनीय दर आपकी द्वितीयक सजा ("नहीं") और वास्तविक सजा के बीच है ( डिब्बा)।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.