ऑनलाइन ढाल उपयोगी होने के कारण बड़े पैमाने पर अनुप्रयोगों के लिए है। किसी भी मामले में, अब पुस्तकालय हैं जो इसे लागू करते हैं ताकि आपको इसे प्रोग्राम करने की आवश्यकता न हो। यह सीखने का एक अच्छा तरीका है कि चीजें कैसे काम करती हैं।
बड़े पैमाने पर मशीन सीखने को पहले एक इंजीनियरिंग समस्या के रूप में संपर्क किया गया था। उदाहरण के लिए, एक बड़े प्रशिक्षण सेट का लाभ उठाने के लिए, हम एक ज्ञात मशीन लर्निंग एल्गोरिदम को चलाने के लिए एक समानांतर कंप्यूटर का उपयोग कर सकते हैं या एक ज्ञात मशीन लर्निंग उद्देश्य फ़ंक्शन को अनुकूलित करने के लिए अधिक उन्नत संख्यात्मक तरीकों को अनुकूलित कर सकते हैं। इस तरह के दृष्टिकोण अपील की धारणा पर निर्भर करते हैं कि कोई मशीन सीखने की समस्या के कम्प्यूटेशनल पहलुओं से सांख्यिकीय पहलुओं को कम कर सकता है।
यह काम दिखाता है कि यह धारणा गलत है, और इसे देने से सीखने की क्षमता बहुत अधिक प्रभावी हो जाती है। एक नया सैद्धांतिक ढांचा सीखने के एल्गोरिदम पर अनुमानित अनुकूलन के प्रभाव को ध्यान में रखता है।
विश्लेषण छोटे पैमाने पर और बड़े पैमाने पर सीखने की समस्याओं के मामले के लिए अलग-अलग ट्रेडऑफ़ दिखाता है। छोटे पैमाने पर सीखने की समस्याएं सामान्य सन्निकटन-आकलन ट्रेडऑफ के अधीन हैं। बड़े पैमाने पर सीखने की समस्याएं एक गुणात्मक रूप से अलग-अलग ट्रेडऑफ़ के अधीन हैं, जिसमें गैर-तुच्छ तरीकों से अंतर्निहित अनुकूलन एल्गोरिदम की कम्प्यूटेशनल जटिलता शामिल है। उदाहरण के लिए, स्टोचस्टिक ग्रेडिएंट डिसेंट (SGD) एल्गोरिदम औसत दर्जे का अनुकूलन एल्गोरिदम प्रतीत होता है और फिर भी बड़े पैमाने पर सीखने की समस्याओं पर बहुत अच्छा प्रदर्शन करने के लिए दिखाया जाता है।