जब आप एक वर्गीकरण संदर्भ में दिलचस्प भविष्यवक्ताओं को अलग करना चाहते हैं, तो छोटे नमूना नैदानिक अध्ययनों में रैंडम फ़ॉरेस्ट या दंडित प्रतिगमन (एल 1 या एल 2 दंड के साथ, या एक संयोजन) जैसी मशीन सीखने की तकनीक को लागू करने के बारे में आप क्या सोचते हैं? यह मॉडल चयन के बारे में सवाल नहीं है, और न ही मैं चर प्रभाव / महत्व के इष्टतम अनुमानों के बारे में पूछ रहा हूं। मैं मजबूत इंट्रेंस करने की योजना नहीं बनाता, लेकिन सिर्फ मल्टीवेरिएट मॉडलिंग का उपयोग करता हूं, इसलिए एक समय में ब्याज के परिणाम के खिलाफ प्रत्येक भविष्यवक्ता का परीक्षण करने से बचना चाहिए, और उनके अंतर्संबंधों को ध्यान में रखना चाहिए।
मैं बस सोच रहा था कि क्या इस तरह के दृष्टिकोण को इस विशेष चरम मामले में पहले से ही लागू किया गया था, 20-30 विषयों को 10-15 स्पष्ट या निरंतर चर पर डेटा के साथ कहें। ऐसा नहीं है कि वास्तव में मामले और मैं इस समस्या यहां कक्षाएं हम समझाने की कोशिश (जो अक्सर अच्छी तरह से नहीं संतुलित कर रहे हैं) की संख्या से संबंधित है लगता है, और (बहुत) छोटे एन। मैं जैव सूचना विज्ञान के संदर्भ में इस विषय पर विशाल साहित्य से अवगत हूं, लेकिन मैंने बायोमेडिकल अध्ययन से संबंधित किसी भी संदर्भ को मनोचिकित्सीय रूप से मापा फेनोटाइप्स (जैसे कि न्यूरोपैकिकोलॉजिकल प्रश्नावली) में नहीं पाया।
प्रासंगिक कागजात के लिए कोई संकेत या संकेत?
अपडेट करें
मैं इस तरह के डेटा का विश्लेषण करने के लिए किसी भी अन्य समाधान के लिए खुला हूं, जैसे कि C4.5 एल्गोरिथ्म या इसके डेरिवेटिव, एसोसिएशन के नियम तरीके, और पर्यवेक्षित या अर्ध-पर्यवेक्षित वर्गीकरण के लिए कोई डेटा खनन तकनीक।