मैं हाल ही में बड़े डेटा सेट के साथ काम कर रहा हूं और स्ट्रीमिंग विधियों के बहुत सारे पेपर पाए गए हैं। कुछ नाम है:
- अनुवर्ती नियमित नेता और मिरर डीसेंट: समतुल्यता सिद्धांत और L1 नियमितीकरण ( http://jmlr.org/proceedings/papers/v15/mcmahan11b/mcmahan11b.pdf )
- स्ट्रीमिंग लर्निंग: एक-पास एसवीएम ( http://www.umiacs.umd.edu/~hal/docs/daume09onepass.pdf )
- पेगासोस: एसवीएम के लिए अनुमानित अनुमानित उप-ग्रैडिएंट शेवर http://ttic.uchicago.edu/~nati/Publications/PegasosMPB.pdf
- या यहाँ: क्या SVM एक बार में एक उदाहरण को सीख सकता है?
- रैंडम फ़ॉरेस्ट स्ट्रीमिंग ( http://research.cs.queensu.ca/home/cords2/ideas07.pp )
हालाँकि, मैं इस बारे में कोई दस्तावेज़ीकरण नहीं कर पाया कि वे एक दूसरे से तुलना कैसे करते हैं। मैंने पढ़ा हर लेख अलग-अलग डेटा सेट पर प्रयोग चलाने लगता है।
मुझे पता है कि सोफिया-एमएल, वोवपाल वैबिट के बारे में, लेकिन वे मौजूदा तरीकों की भारी मात्रा की तुलना में बहुत कम तरीकों को लागू करते हैं!
क्या कम सामान्य एल्गोरिदम पर्याप्त प्रदर्शन नहीं कर रहे हैं? क्या कोई पेपर संभव के रूप में कई तरीकों की समीक्षा करने की कोशिश कर रहा है?