शुरू हो रहा है biclustering से


9

मैं biclusters पर कुछ आकस्मिक इंटरनेट अनुसंधान कर रहा है। (मैंने विकी लेख को कई बार पढ़ा है।) अब तक, ऐसा लगता है जैसे कुछ परिभाषाएँ या मानक शब्दावली हैं।

  1. मैं सोच रहा था कि क्या कोई मानक कागजात या किताबें थीं जो कोई भी व्यक्ति जो कि बिक्ल्स्टर्स खोजने के लिए एल्गोरिदम में रुचि रखता है, को पढ़ना चाहिए।

  2. क्या यह कहना संभव है कि क्षेत्र में कला की स्थिति क्या है? मुझे जेनेटिक एल्गोरिदम का उपयोग करते हुए बाइक्लेस्टर्स को खोजने की धारणा द्वारा साज़िश की गई थी, इसलिए मैं उस दृष्टिकोण पर टिप्पणियों की सराहना करूंगा, विशेष रूप से अन्य दृष्टिकोणों के संदर्भ में।

  3. आमतौर पर क्लस्टरिंग में, लक्ष्य डेटा-सेट को उन समूहों में विभाजित करना है जहां प्रत्येक तत्व कुछ समूह में होता है। क्या बाइसिकलर एल्गोरिदम भी किसी विशेष समूह में सभी तत्वों को रखना चाहते हैं?

जवाबों:


16

मैंने इसे कभी भी सीधे उपयोग नहीं किया, इसलिए मैं केवल कुछ कागजात और उस तकनीक के बारे में सामान्य विचार साझा कर सकता हूं (जो मुख्य रूप से आपके प्रश्न 1 और 3 को संबोधित करते हैं)।

मुख्य रूप से आनुवांशिक अध्ययनों (2-6) से मेरी समझ के बारे में मेरी सामान्य समझ जहां हम जीनों के समूहों और व्यक्तियों के समूह के लिए चाहते हैं: संक्षेप में, हम एक साथ जीन अभिव्यक्ति के समान प्रोफ़ाइल साझा करने वाले समूहों के नमूने देख रहे हैं (यह संबंधित हो सकता है उदाहरण के लिए रोग जीन ) और जीन प्रोफाइलिंग के इस पैटर्न में योगदान देने वाले जीन। जैविक "बड़े पैमाने पर" डेटासेट के लिए कला की स्थिति का एक सर्वेक्षण पर्दालोस की स्लाइड्स में पाया जा रहा है , बीक्लस्टेरिंग । ध्यान दें कि माइक्रोएरे डेटा के अनुप्रयोगों के साथ एक आर पैकेज, बाइक्लस्ट है

वास्तव में, मेरा प्रारंभिक विचार नैदानिक ​​निदान के लिए इस पद्धति को लागू करना था, क्योंकि यह एक से अधिक क्लस्टर में सुविधाओं या चर को डालने की अनुमति देता है, जो कि एक सेमेियोलॉजिकल दृष्टिकोण से दिलचस्प है क्योंकि लक्षण जो क्लस्टर एक साथ सिंड्रोम को परिभाषित करने की अनुमति देते हैं , लेकिन कुछ लक्षण हो सकते हैं विभिन्न रोगों में ओवरलैप। Cramer et al।, Comorbidity: एक नेटवर्क परिप्रेक्ष्य (व्यवहार और मस्तिष्क विज्ञान 2010, 33, 137-193) में एक अच्छी चर्चा हो सकती है ।

कुछ हद तक संबंधित तकनीक सहयोगी फ़िल्टरिंग है । Su और Khoshgoftaar ( आर्टिफिशियल इंटेलिजेंस में एडवांस , 2009) द्वारा एक अच्छी समीक्षा उपलब्ध कराई गई थी : एक सर्वेक्षण की सहयोगी फ़िल्टरिंग तकनीक । अन्य संदर्भ अंत में सूचीबद्ध हैं। हो सकता है कि बाज़ार-टोकरी समस्या में उदाहरण के तौर पर बार-बार आईटमसेट का विश्लेषण भी इससे जुड़ा हो, लेकिन मैंने कभी इसकी जाँच नहीं की। सह-क्लस्टरिंग का एक और उदाहरण है, जब हम एक साथ शब्द और दस्तावेजों को एक साथ जोड़ना चाहते हैं, जैसे कि टेक्स्ट माइनिंग, जैसे ढिल्लन (2001)। द्विदलीय वर्णक्रमीय ग्राफ विभाजन का उपयोग करते हुए दस्तावेजों और शब्दों को सह-क्लस्टर करनाप्रोक। KDD , पीपी। 269-274।

कुछ सामान्य संदर्भों के बारे में, यहां बहुत विस्तृत सूची नहीं है, जो मुझे आशा है कि आपको उपयोगी लग सकती है:

  1. जैन, एके (2010)। डेटा क्लस्टरिंग: K- साधनों से परे 50 सालपैटर्न मान्यता पत्र , 31 , 651-666
  2. कार्मोना-साज़ एट अल। (2006)। गैर-चिकनी गैर-नकारात्मक मैट्रिक्स फैक्टर द्वारा जीन अभिव्यक्ति डेटा की बाइक्लस्टरिंगबीएमसी जैव सूचना विज्ञान , 7 , 78।
  3. Prelic एट अल। (2006)। जीन अभिव्यक्ति डेटा के लिए बायसलरिंग विधियों की एक व्यवस्थित तुलना और मूल्यांकनजैव सूचना विज्ञान , 22 (9) , 1122-1129। www.tik.ee.ethz.ch/sop/bimax
  4. DiMaggio एट अल। (2008)। सिस्टम बायोलॉजी में डेटा मैट्रिसेस के इष्टतम पुन: आदेश के माध्यम से पीछा करना: कठोर तरीके और तुलनात्मक अध्ययनबीएमसी जैव सूचना विज्ञान , 9 , 458।
  5. संतामरिया एट अल। (2008)। बाइकोवर्लापर: बाइक्लस्टर विज़ुअलाइज़ेशन के लिए एक उपकरणजैव सूचना विज्ञान , 24 (9) , 1212-1213।
  6. मेडिरा, एससी और ओलिवेरा, एएल (2004) बायोलॉस्टर एल्गोरिदम बायोलॉजिकल डेटा विश्लेषण के लिए: एक सर्वेक्षणIEEE ट्रांस। कंप्यूटर। बॉय। Bioinform। , 1 , 24–45।
  7. बडेआ, एल। (2009)। ओवरलैपिंग बिक्ल्स्टर्स के लिए सामान्यीकृत क्लस्टरग्राम । IJCAI
  8. सिमोनॉइडिस, पी। (2006)। निकटतम-बिक्लेस्टर्स सहयोगात्मक फ़िल्टरिंग । WEBKDD

1
बहुत बढ़िया जवाब। अगर मेरे पास एक और वोट होता, तो मैं फिर से इस जवाब के लिए वोट करता।
हेनरी बी।

@chl Pardalos स्लाइड्स की पहली लिंक मृत प्रतीत होती है। क्या किसी को वैकल्पिक स्थान का पता है?
एरिक

@ एरिक स्लाइड्स से अधिकांश सामग्री को एक ही लेखक द्वारा आंशिक 0-1 प्रोग्रामिंग के माध्यम से लगातार बिकुलिंग में पाया जा सकता है । (मैंने मृत लिंक की मेरी कॉपी के साथ स्लाइड की सामग्री की जांच की।)
15:15

4

यहाँ एक अच्छा सर्वेक्षण / समीक्षा है:

स्टानिस्लाव बिजीगिन, ओलेग प्रोकोपेयेव, और पैनोस एम। पर्डालोस। डाटा माइनिंग में लापरवाही । कंप्यूटर और संचालन अनुसंधान, 35 (9): 2964-2987, सितंबर 2008।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.