2
बड़े डेटासेट के लिए कुशल आयामी कमी
मेरे पास ~ 1M पंक्तियों और ~ 500K विरल विशेषताओं वाला एक डेटासेट है। मैं 1K-5K सघन सुविधाओं के क्रम में कहीं न कहीं आयामीता कम करना चाहता हूं। sklearn.decomposition.PCAविरल डेटा पर काम नहीं करता है, और मैं का उपयोग करने की कोशिश की है, sklearn.decomposition.TruncatedSVDलेकिन बहुत जल्दी एक स्मृति …