मछली पकड़ने की समस्या


10

मान लीजिए आप सुबह 8 बजे- 8 बजे से पास की झील में मछली पकड़ने जाना चाहते हैं। ओवरफिशिंग के कारण, एक कानून बनाया गया है जो कहता है कि आप प्रति दिन केवल एक मछली पकड़ सकते हैं। जब आप एक मछली को पकड़ते हैं, तो आप इसे या तो रखने के लिए चुन सकते हैं (और इस तरह उस मछली के साथ घर जा सकते हैं), या इसे वापस झील में फेंक दें और मछली पकड़ना जारी रखें (लेकिन बाद में एक छोटी मछली, या कोई मछली के साथ बसने का जोखिम)। आप जितना संभव हो उतनी बड़ी मछली पकड़ना चाहते हैं; विशेष रूप से, आप अपने द्वारा घर लाई गई मछलियों के अपेक्षित द्रव्यमान को अधिकतम करना चाहते हैं।

औपचारिक रूप से, हम इस समस्या को निम्नानुसार सेट कर सकते हैं: मछली को एक निश्चित दर पर पकड़ा जाता है (इसलिए, आपकी अगली मछली को पकड़ने में लगने वाला समय एक ज्ञात घातीय वितरण का अनुसरण करता है), और पकड़ी गई मछली का आकार कुछ (ज्ञात भी) वितरण करता है। । हम कुछ निर्णय प्रक्रिया चाहते हैं, जो आपके द्वारा अभी-अभी पकड़ी गई मछली के वर्तमान समय और आकार को देखते हुए तय करती है कि मछली को रखना है या वापस फेंकना है।

तो सवाल यह है कि यह निर्णय कैसे किया जाना चाहिए? क्या मछली पकड़ने को रोकने के लिए निर्णय लेने का कुछ सरल (या जटिल) तरीका है? मुझे लगता है कि समस्या निर्धारित करने के बराबर है, एक निश्चित समय टी के लिए, एक इष्टतम फिशर मछली की क्या उम्मीद है अगर वे समय पर शुरू करेंगे; इष्टतम निर्णय प्रक्रिया एक मछली को रखेगी यदि और केवल अगर मछली उस अपेक्षित द्रव्यमान से भारी हो। लेकिन ऐसा लगता है कि सेल्फ रेफ़रेंशियल; हम एक इष्टतम फिशर के रूप में इष्टतम मछली पकड़ने की रणनीति को परिभाषित कर रहे हैं, और मुझे यकीन नहीं है कि आगे कैसे बढ़ना है।


5
विकिपीडिया पर सचिव समस्या की जाँच करें - विशेष रूप से सबसे अच्छा विकल्प के 1 / ई-कानून पर अनुभाग।
याकूब 30'18

2
मुझे लगता है कि यहां एक महत्वपूर्ण अंतर यह है कि यह माना जाता है कि हम जानते हैं कि सब कुछ कैसे वितरित किया जाता है, जबकि उस समाधान की कुंजी यह है कि वह पहले 1 / ई आवेदकों का उपयोग सिर्फ उस ज्ञान को प्राप्त करने और एक अच्छी सीमा को परिभाषित करने के लिए करता है। मुझे लगता है कि एक समान विचार यहाँ काफी काम नहीं कर सका। आप कल्पना कर सकते हैं कि केवल वितरण से एक सीमा प्राप्त की जा सकती है, लेकिन मुझे नहीं लगता कि इसे ठीक किया जाना चाहिए; मुझे लगता है कि समय के साथ सीमा घटनी चाहिए, क्योंकि आपके पास बेहतर / किसी भी मछली को पकड़ने के लिए कम और कम समय है।
b2coutts

1
@soakley ने ओलोनी के जवाब पर मेरी प्रतिक्रिया भी देखी; प्रतीक्षा का (अपेक्षित) मूल्य न केवल इस बात पर निर्भर करता है कि आपको भविष्य में कौन-कौन से कैच मिलेंगे, लेकिन उनमें से कौन सा आपकी रणनीति को वास्तव में पकड़ लेगा। इसलिए मुझे लगता है कि इस सवाल का एक अजीब आत्म-संदर्भ पहलू भी है।
b2coutts

1
वह फ़ंक्शन या मान क्या है जिसे हम ऑप्टिमाइज़ करने का प्रयास करते हैं? यही है, हम जोखिम और लाभ का वजन कैसे करते हैं? क्या एक विधि है जो पकड़ी गई मछली के आकार के अपेक्षा मूल्य को अधिकतम करती है? क्या हम सिर्फ एक दिन या कई दिनों तक मछली पकड़ रहे हैं, और बाद के मामले में दिन कैसे सहसंबद्ध हैं?
सेक्सटस एम्पिरिकस

1
हम वितरण को जानते हैं ... क्या यह केवल वितरण के प्रकार को संदर्भित करता है, या क्या वितरण मापदंडों को भी शामिल करता है?
सेक्टस एम्पिरिकस

जवाबों:


4

Let Poisson प्रक्रिया की दर को निरूपित करते हैं और जहां मछली के आकार के वितरण का संचयी वितरण कार्य करते हैं।λS(x)=1F(x)F(x)

चलो दिन के अंत को निरूपित करते हैं और , , को अंतराल में अपेक्षित पकड़ को दर्शाते हैं यदि हम इष्टतम रणनीति का उपयोग करते हुए प्राप्त करते हैं। स्पष्ट रूप से । इसके अलावा, अगर हम का आकार एक मछली पकड़ने समय में हम इसे रखने के लिए और बंद मछली पकड़ने चाहिए, अगर यह बड़ा तो है । तो यह हमारा निर्णय नियम है। इस प्रकार, प्रक्रिया का एहसास और वास्तविक निर्णय (ग्रीन पॉइंट) निम्नानुसार लग सकता है:t=0g(t)t0(t,0)g(0)=0xtg(t)

यहां छवि विवरण दर्ज करें

स्टोकेस्टिक डायनेमिक प्रोग्रामिंग से विचारों का उपयोग करते हुए निरंतर समय में काम करना, समय में पीछे की तरफ में परिवर्तन एक साधारण अंतर समीकरण द्वारा वर्णित है। एक infinitesimal समय अंतराल । संभावना है कि हम इस समय अंतराल में आकार की एक मछली पकड़ते हैं, अन्यथा हमारा अपेक्षित पकड़ ।g(t)(tdt,t)X>g(t)

λdtS(g(t)),
g(t)

के लिए एक सूत्र का उपयोग मतलब अवशिष्ट जीवन , एक मछली की तुलना में बड़ा की उम्मीद आकार के रूप में g(t)

E(X|X>g(t))=g(t)+1S(g(t))g(t)S(x)dx.

इसलिए, कुल अपेक्षा के कानून का उपयोग करते हुए, अंतराल में अपेक्षित पकड़ बन जाता है (tdt,0)

g(tdt)=[λdtS(g(t))][g(t)+1S(g(t))g(t)S(x)dx]+[1λdtS(g(t)]g(t).

पुनर्व्यवस्थित करने पर, हम पाते हैं कि संतुष्ट करता है नोट कैसे दिन के अंत की ओर दर के उत्पाद के बराबर दर और मछली के आकार का मतलब है जो हम पर दर्शाते हैं उस बिंदु को किसी भी मछली को रखना सबसे अच्छा होगा जिसे हम पकड़ सकते हैं।g(t)

(1)dgdt=λg(t)S(x)dx.
g(t)λ0S(x)dx

उदाहरण 1 : मान लीजिए कि मछली का आकार ऐसा है कि । समीकरण (1) तब जो एक अलग अंतर समीकरण है, को सरल करता है। सीमा शर्त ऊपर का उपयोग करना, समाधान है के लिए चित्रा ऊपर में के लिए दिखाया गया । निम्नलिखित कोड सैद्धांतिक माध्य साथ सिमुलेशन के आधार पर गणना की गई इस रणनीति का उपयोग करते हुए औसत पकड़ की तुलना करता है ।Xexp(α)S(x)=eαx

dgdt=λαeαg(t)
g(t)=1αln(1λt),
t0α=λ=1g(12)

g <- function(t,lambda, rate) {
  1/rate*log(1-lambda*t)
}
catch <- function(daylength=12, lambda=1, rfn=runif, gfn=g, ...) {
  n <- rpois(1,daylength*lambda)
  starttime <- -daylength
  arrivaltimes <- sort(runif(n,starttime,0))
  X <- rfn(n,...)
  j <- match(TRUE, X > gfn(arrivaltimes,lambda,...))
  if (is.na(j))
    0
  else
    X[j]
}
nsim <- 1e+5
catches <- rep(0,nsim)
for (i in 1:nsim)
  catches[i] <- catch(gfn=g,rfn=rexp,rate=1,lambda=1)
> mean(catches)
[1] 2.55802
> g(-12,1,1)
[1] 2.564949

उदाहरण 2: यदि एक समान व्युत्पत्ति को (1) के समाधान की ओर ले जाता है । ध्यान दें कि कैसे अधिकतम मछली के आकार को ।XU(0,1)

g(t)=111λt/2
g(t)t


3
यह स्पष्ट नहीं है कि अगर आप ऐसी मछली पकड़ते हैं, जिसका आकार से अधिक है, तो रुकने की रणनीति इष्टतम है। यह रोकने के लिए और अधिक समझ में आता है अगर मछली का आकार अपेक्षित मछली के आकार से अधिक हो । g(t)(t,0)
एलेक्स आर।

1
इससे पहले कि आपके पास सबसे बड़ी मछली चुनने का मौका हो, आप मछली पकड़ना बंद कर देंगे। मछली का अपेक्षित आकार है जिसे आप अंतराल में पकड़े रखने का निर्णय लेते हैं । यह निर्णय नियम भी है, समय पर , मछली पकड़ने को रोकें यदि आप से बड़ी मछली पकड़ते हैं । ( टी , 0 ) टी जी ( टी )g(t)(t,0)tg(t)
जरले टफ्टो

1
@AlexR। मैंने उम्मीद की अधिकतम मछली आकार का उपयोग करके उदाहरण 2 के लिए एक सिमुलेशन की कोशिश की। यह करीब है लेकिन कम अच्छा काम किया है। अधिकतम की अपेक्षा में मछली शामिल है जिसे उठाया नहीं जाएगा (जो कि से कम हो )। अधिकतम की इस उम्मीद के साथ, आप उस क्षण तक इंतजार करने के लिए अधिक इच्छुक हैं, जब आप एक बहुत ही लाभदायक पकड़ लेते हैं। यह आपको अधिक बार बड़ी मछली देता है, लेकिन अधिक छोटी मछली की कीमत पर, या कोई भी नहीं। जी'(टी)
g(t)=1eλt1λt
g(t)
सेक्सटस एम्पिरिकस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.