ऑनलाइन, स्केलेबल सांख्यिकीय तरीके


12

यह कुशल ऑनलाइन रैखिक प्रतिगमन से प्रेरित था , जो मुझे बहुत दिलचस्प लगा। क्या कोई ऐसे ग्रंथ या संसाधन हैं जो बड़े पैमाने पर सांख्यिकीय कंप्यूटिंग के लिए समर्पित हैं, जिनके द्वारा डेटासेट के साथ कंप्यूटिंग मुख्य मेमोरी में फिट होने के लिए बहुत बड़ी है, और शायद बहुत प्रभावी ढंग से सदस्यता के लिए विविध है। उदाहरण के लिए, क्या ऑनलाइन फैशन में मिश्रित प्रभाव मॉडल फिट करना संभव है? क्या किसी ने MLE के लिए मानक 2 क्रम अनुकूलन तकनीकों को 1 आदेश, SGD- प्रकार की तकनीकों के साथ बदलने के प्रभावों पर ध्यान दिया है?


मुझे लगता है कि जवाब हां है"। बेशक, यहाँ परिभाषाओं का एक मुद्दा है। एक व्यक्ति जो "बड़े पैमाने पर" मानता है वह कभी-कभी दूसरे से बहुत अलग होता है। मेरी धारणा यह है कि, उदाहरण के लिए, कई शैक्षणिक शोधकर्ता नेटफ्लिक्स डेटासेट "बड़े पैमाने" पर विचार करते हैं, जबकि कई औद्योगिक सेटिंग्स में इसे "दंड" माना जाएगा। जैसा कि अनुमान तकनीक है, आमतौर पर बहुत बड़े डेटा के साथ, कम्प्यूटेशनल दक्षता सांख्यिकीय दक्षता को ट्रम्प करती है। उदाहरण के लिए, क्षणों की विधि, कई मामलों में, (लगभग) और साथ ही इन सेटिंग्स में MLE का प्रदर्शन करेगी और गणना करने में बहुत आसान हो सकती है
कार्डिनल

2
तुम भी आधुनिक बड़े पैमाने पर डेटा सेट (MMDS) के लिए एल्गोरिदम पर कार्यशाला देख सकते हैं। यह युवा है, लेकिन सांख्यिकी, इंजीनियरिंग और कंप्यूटर विज्ञान के साथ-साथ शिक्षा और उद्योग के बीच इंटरफेस में वक्ताओं का एक बहुत प्रभावशाली सेट खींचता है।
कार्डिनल

यह केवल कुछ दशक है क्योंकि ज्यादातर डेटासेट मुख्य मेमोरी में फिट होने के लिए बहुत बड़े थे, और प्रारंभिक सांख्यिकीय कार्यक्रमों में इस्तेमाल किए गए एल्गोरिदम की पसंद ने इसे प्रतिबिंबित किया। हालांकि इस तरह के कार्यक्रमों में मिश्रित-प्रभाव वाले मॉडल के लिए सुविधाएं नहीं थीं।
onestop

क्या आप डेटा सेट के लिए आंकड़ों की गणना करने में सक्षम हैं? उदाहरण के लिए डेटा आइटम का योग, या औसत?
probabilityislogic

जवाबों:


5

आप याहू पर जॉन लैंगफोर्ड से, वोवपाल वैबिट प्रोजेक्ट में नज़र आ सकते हैं ! अनुसंधान । यह एक ऑनलाइन शिक्षार्थी है जो कुछ नुकसान कार्यों पर विशेष रूप से ढाल वंश करता है। VW में कुछ हत्यारे विशेषताएं हैं:

  • उबंटू को तुच्छ रूप से स्थापित करता है, "सुडो एप्ट-इंस्टॉल्ड वाउपाल-वाबिट" के साथ।
  • गंभीर रूप से विशाल स्थान के लिए हैशिंग ट्रिक का उपयोग करता है ।
  • फ़ीचर-विशिष्ट अनुकूली वज़न।
  • सबसे महत्वपूर्ण बात यह है कि परियोजना पर एक सक्रिय मेलिंग सूची और समुदाय प्लगिंग है।

Bianchi और Lugosi पुस्तक भविष्यवाणी, सीखना और खेल ऑनलाइन सीखने के लिए एक ठोस, सैद्धांतिक आधार देता है। एक भारी पढ़ा, लेकिन इसके लायक!

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.