स्वतंत्र घटक विश्लेषण में अनुरोध करने के लिए घटकों की संख्या के बारे में एक प्राथमिकताओं के बारे में अनुमान नहीं होने पर, मैं चयन प्रक्रिया को स्वचालित करना चाहता हूं। मुझे लगता है कि एक उचित मानदंड वह संख्या हो सकती है जो गणना किए गए घटकों के बीच सहसंबंध के लिए वैश्विक सबूत को कम करता है। यहाँ इस दृष्टिकोण का छद्म कोड है:
for each candidate number of components, n:
run ICA specifying n as requested number of components
for each pair (c1,c2) of resulting components:
compute a model, m1: lm(c1 ~ 1)
compute a model, m2: lm(c1 ~ c2)
compute log likelihood ratio ( AIC(m2)-AIC(m1) ) representing the relative likelihood of a correlation between c1 & c2
compute mean log likelihood ratio across pairs
Choose the final number of components as that which minimizes the mean log likelihood of component relatedness
मुझे लगता है कि यह स्वचालित रूप से "सही" घटकों की संख्या से बड़े उम्मीदवारों को दंडित करना चाहिए क्योंकि ऐसे उम्मीदवारों से उत्पन्न ICAs को कई अनुमानित घटकों में एकल सच्चे घटकों से जानकारी वितरित करने के लिए मजबूर किया जाना चाहिए, घटकों के जोड़े में सहसंबंध के औसत प्रमाण को बढ़ाते हैं।
इसका कोई मतलब भी है क्या? यदि ऐसा है, तो क्या ऊपर सुझाए गए लॉग लॉग लाइबिलिटी दृष्टिकोण की तुलना में अनुमानित घटकों में संबंधितता का एक समग्र मीट्रिक प्राप्त करने का एक तेज़ तरीका है (जो कि कम्प्यूटेशनल रूप से धीमी गति से हो सकता है)? यदि यह दृष्टिकोण समझ में नहीं आता है, तो एक अच्छी वैकल्पिक प्रक्रिया क्या दिख सकती है?