मैंने इसे कभी भी सीधे उपयोग नहीं किया, इसलिए मैं केवल कुछ कागजात और उस तकनीक के बारे में सामान्य विचार साझा कर सकता हूं (जो मुख्य रूप से आपके प्रश्न 1 और 3 को संबोधित करते हैं)।
मुख्य रूप से आनुवांशिक अध्ययनों (2-6) से मेरी समझ के बारे में मेरी सामान्य समझ जहां हम जीनों के समूहों और व्यक्तियों के समूह के लिए चाहते हैं: संक्षेप में, हम एक साथ जीन अभिव्यक्ति के समान प्रोफ़ाइल साझा करने वाले समूहों के नमूने देख रहे हैं (यह संबंधित हो सकता है उदाहरण के लिए रोग जीन ) और जीन प्रोफाइलिंग के इस पैटर्न में योगदान देने वाले जीन। जैविक "बड़े पैमाने पर" डेटासेट के लिए कला की स्थिति का एक सर्वेक्षण पर्दालोस की स्लाइड्स में पाया जा रहा है , बीक्लस्टेरिंग । ध्यान दें कि माइक्रोएरे डेटा के अनुप्रयोगों के साथ एक आर पैकेज, बाइक्लस्ट है ।
वास्तव में, मेरा प्रारंभिक विचार नैदानिक निदान के लिए इस पद्धति को लागू करना था, क्योंकि यह एक से अधिक क्लस्टर में सुविधाओं या चर को डालने की अनुमति देता है, जो कि एक सेमेियोलॉजिकल दृष्टिकोण से दिलचस्प है क्योंकि लक्षण जो क्लस्टर एक साथ सिंड्रोम को परिभाषित करने की अनुमति देते हैं , लेकिन कुछ लक्षण हो सकते हैं विभिन्न रोगों में ओवरलैप। Cramer et al।, Comorbidity: एक नेटवर्क परिप्रेक्ष्य (व्यवहार और मस्तिष्क विज्ञान 2010, 33, 137-193) में एक अच्छी चर्चा हो सकती है ।
कुछ हद तक संबंधित तकनीक सहयोगी फ़िल्टरिंग है । Su और Khoshgoftaar ( आर्टिफिशियल इंटेलिजेंस में एडवांस , 2009) द्वारा एक अच्छी समीक्षा उपलब्ध कराई गई थी : एक सर्वेक्षण की सहयोगी फ़िल्टरिंग तकनीक । अन्य संदर्भ अंत में सूचीबद्ध हैं। हो सकता है कि बाज़ार-टोकरी समस्या में उदाहरण के तौर पर बार-बार आईटमसेट का विश्लेषण भी इससे जुड़ा हो, लेकिन मैंने कभी इसकी जाँच नहीं की। सह-क्लस्टरिंग का एक और उदाहरण है, जब हम एक साथ शब्द और दस्तावेजों को एक साथ जोड़ना चाहते हैं, जैसे कि टेक्स्ट माइनिंग, जैसे ढिल्लन (2001)। द्विदलीय वर्णक्रमीय ग्राफ विभाजन का उपयोग करते हुए दस्तावेजों और शब्दों को सह-क्लस्टर करना । प्रोक। KDD , पीपी। 269-274।
कुछ सामान्य संदर्भों के बारे में, यहां बहुत विस्तृत सूची नहीं है, जो मुझे आशा है कि आपको उपयोगी लग सकती है:
- जैन, एके (2010)। डेटा क्लस्टरिंग: K- साधनों से परे 50 साल । पैटर्न मान्यता पत्र , 31 , 651-666
- कार्मोना-साज़ एट अल। (2006)। गैर-चिकनी गैर-नकारात्मक मैट्रिक्स फैक्टर द्वारा जीन अभिव्यक्ति डेटा की बाइक्लस्टरिंग । बीएमसी जैव सूचना विज्ञान , 7 , 78।
- Prelic एट अल। (2006)। जीन अभिव्यक्ति डेटा के लिए बायसलरिंग विधियों की एक व्यवस्थित तुलना और मूल्यांकन । जैव सूचना विज्ञान , 22 (9) , 1122-1129। www.tik.ee.ethz.ch/sop/bimax
- DiMaggio एट अल। (2008)। सिस्टम बायोलॉजी में डेटा मैट्रिसेस के इष्टतम पुन: आदेश के माध्यम से पीछा करना: कठोर तरीके और तुलनात्मक अध्ययन । बीएमसी जैव सूचना विज्ञान , 9 , 458।
- संतामरिया एट अल। (2008)। बाइकोवर्लापर: बाइक्लस्टर विज़ुअलाइज़ेशन के लिए एक उपकरण । जैव सूचना विज्ञान , 24 (9) , 1212-1213।
- मेडिरा, एससी और ओलिवेरा, एएल (2004) बायोलॉस्टर एल्गोरिदम बायोलॉजिकल डेटा विश्लेषण के लिए: एक सर्वेक्षण । IEEE ट्रांस। कंप्यूटर। बॉय। Bioinform। , 1 , 24–45।
- बडेआ, एल। (2009)। ओवरलैपिंग बिक्ल्स्टर्स के लिए सामान्यीकृत क्लस्टरग्राम । IJCAI
- सिमोनॉइडिस, पी। (2006)। निकटतम-बिक्लेस्टर्स सहयोगात्मक फ़िल्टरिंग । WEBKDD