स्टोचस्टिक ग्रेजुएशन वंशज स्टोचैस्टिक अप्रोचेशन से पहले है जैसा कि रॉबिन्स और मोनरो ने अपने पेपर, ए स्टोचस्टिक एप्रिसिएशन मेथड में बताया है । केफेर और वोल्फोवित्ज़ ने बाद में अपने पेपर, स्टोचैस्टिक एस्टीमेशन ऑफ़ द मैक्स ऑफ़ अ रिग्रेशन फंक्शन को प्रकाशित कियाजो कि स्टोचैस्टिक एप्रिसिएशन (यानी स्टोचस्टिक ग्रेडिएंट डिसेंट) के एमएल वेरिएंट से परिचित लोगों के लिए अधिक पहचानने योग्य है, जैसा कि टिप्पणियों में मार्क स्टोन ने बताया है। 60 के दशक में उस शिरा के साथ बहुत सारे शोध हुए हैं - ड्वॉर्त्ज़की, पॉवेल, ब्लम ने सभी प्रकाशित परिणाम प्रकाशित किए हैं जो आज हम प्रदान करते हैं। यह रॉबिंस और मोनरो पद्धति से कीफर वोल्फोवित्ज़ विधि से प्राप्त करने के लिए एक अपेक्षाकृत छोटी छलांग है, और फिर स्टोचैस्टिक ग्रेडिएंट डिसेंट (प्रतिगमन समस्याओं के लिए) को प्राप्त करने के लिए समस्या का केवल एक पुनरावर्तन है। उपरोक्त पत्रों को व्यापक रूप से स्टोचैस्टिक ग्रेडिएंट डिसेंट के एंटेकेडेंट्स के रूप में उद्धृत किया जाता है, जैसा कि नोकेडल, बोटाउ और कर्टिस द्वारा इस समीक्षा पत्र में उल्लेख किया गया है , जो मशीन लर्निंग के दृष्टिकोण से एक संक्षिप्त ऐतिहासिक परिप्रेक्ष्य प्रदान करता है।
मुझे विश्वास है कि कुशनेर और यिन ने अपनी पुस्तक स्टोचैस्टिक एप्रिसिएशन एंड रिकर्सिव अल्गोरिद्म एंड एप्लीकेशन में सुझाव दिया है कि इस धारणा को नियंत्रण सिद्धांत में 40 के दशक में इस्तेमाल किया गया था, लेकिन मुझे याद नहीं है कि उनके पास कोई उद्धरण था या यदि वह था उपाख्यान, और न ही मुझे इसकी पुष्टि करने के लिए उनकी पुस्तक तक पहुंच है।
हर्बर्ट रॉबिन्स और सटन मोनरो ए स्टोचैस्टिक अप्रोचमेंट विधि
द एनल्स ऑफ मैथमेटिकल स्टैटिस्टिक्स, वॉल्यूम। 22, नंबर 3. (सिपाही, 1951), पीपी। 400-407।
जे। किफ़र और जे। वोल्फोवित्ज़ स्टोचैस्टिक अनुमान ऑफ़ द मैक्स ऑफ़ ए रिग्रेशन फंक्शन एन। गणित। सांख्यिकीविद। खंड 23, संख्या 3 (1952), 462-466
लियोन बोटौ और फ्रैंक ई। कर्टिस और जॉर्ज नोकेडल ऑप्टिमाइज़ेशन मेथड्स फॉर लार्ज-स्केल मशीन लर्निंग , टेक्निकल रिपोर्ट, अर्क्सिव: 1606.04838