सहसंबंधित मैट्रिक्स का SVD एडिटिव होना चाहिए लेकिन ऐसा प्रतीत नहीं होता है


29

मैं सिर्फ निम्नलिखित पेपर में किए गए दावे को दोहराने की कोशिश कर रहा हूं , जो जीन एक्सप्रेशन डेटा से संबंधित सहसंबंधी बिकलस्टर्स ढूंढ रहा है , जो है:

प्रस्ताव 4. अगर । तो हमारे पास हैं:एक्समैंजम्मू=आरमैंसीजम्मूटी

मैं। यदि एडिटिव मॉडल के साथ एक सही बाइक्लेस्टर है, तो कॉलम पर सहसंबंध के साथ एक सही बाइक्लेस्टर है; ii। यदि एडिटिव मॉडल के साथ एक सही बाइक्लेस्टर है, तो पंक्तियों पर सहसंबंध के साथ एक सही बाइक्लेस्टर है; iii। यदि और दोनों एडिटिव मॉडल के साथ परफेक्ट हैं, तो एक परफेक्ट कॉरेलिटेड बाइक्लेस्टर है।आरमैंएक्समैंजम्मू
सीजम्मूएक्समैंजम्मू
आरमैंसीजम्मूएक्समैंजम्मू

इन प्रस्तावों को आसानी से साबित किया जा सकता है ...

... लेकिन निश्चित रूप से, वे इसे साबित नहीं करते हैं।

मैं पेपर प्लस आधार + कस्टम आर कोड में कुछ सरल उदाहरणों का उपयोग कर रहा हूं यह देखने के लिए कि क्या मैं इस प्रस्ताव को प्रदर्शित कर सकता हूं।

corbic <- matrix(c(0,4,-4,2,2,-2,6,0,4,-8,16,-2,-2,10,-14,4), ncol=4)

(तालिका 1 एफ से)

कुछ कस्टम कोड मानक X = फॉर्म को में बदलने के लिए जैसा कि कागज में वर्णित है:यूवीटीएक्स=आरसीटी

svdToRC <- function(x, ignoreRank = FALSE, r = length(x$d), zerothresh=1e-9) {
#convert standard SVD decomposed matrices UEV' to RC' form
#x -> output of svd(M)
#r -> rank of matrix (defaults to length of singular values vector)
            # but really is the number of non-zero singular values
#ignoreRank -> return the full decomposition (ignore zero singular values)
#zerothresh -> how small is zero?

    R <- with(x, t(t(u) * sqrt(d)))
    C <- with(x, t(t(v) * sqrt(d)))

    if (!ignoreRank) {
        ind <- which(x$d >= zerothresh)
    } else {
        ind <- 1:r
    }

    return(list(R=as.matrix(R[,ind]), C=as.matrix(C[,ind])))
}

इस फ़ंक्शन को डेटासेट में लागू करें:

 > svdToRC(svd(corbic))
$R
           [,1]       [,2]
[1,]  0.8727254 -0.9497284
[2,] -2.5789775 -1.1784221
[3,]  4.3244283 -0.7210346
[4,] -0.8531261 -1.0640752

$C
          [,1]       [,2]
[1,] -1.092343 -1.0037767
[2,]  1.223860 -0.9812343
[3,]  3.540063 -0.9586919
[4,] -3.408546 -1.0263191

जब तक मैं मतिभ्रम नहीं कर रहा हूं, तब तक यह मैट्रिस एडिटिव नहीं है, भले ही कॉर्बिक पंक्तियों और स्तंभों के बीच सही सहसंबंध प्रदर्शित करता है। यह अजीब लगता है कि वे जो उदाहरण प्रदान करते हैं वह उस संपत्ति को प्रदर्शित करता है जो उन्होंने कहा था कि ... जब तक मैं किसी प्रकार के पूर्व या बाद के परिवर्तन को नहीं भूल रहा हूँ - परिवर्तन परिवर्तन कदम?


3
नमस्ते, zzk: यह संक्षेप में यहाँ सही बाइकलर की परिभाषा देने में मदद कर सकता है क्योंकि (ए) हर कोई कागज का उपयोग करने में सक्षम नहीं हो सकता है और (बी) इसका मतलब यह हो सकता है कि सामान्यता के आधार पर विभिन्न चीजों के एक जोड़े को ग्रहण किया जा सकता है।
कार्डिनल

1
मूल रूप से, मैट्रिक्स के सभी पंक्तियों और स्तंभों बनाम स्तंभों के बीच
युग्मक

3
मैं उलझन में हूं। ऐसा नहीं 4iiiकहता P(R), P(C), additivity => P(X)? (मैं संक्षिप्त कर रहा हूं " Yजैसा कि एक आदर्श बाइक्लस्टर है" P(Y))। ऐसा लगता है कि आप दूसरी दिशा में जा रहे हैं, उम्मीद है कि अन्य स्थितियों से सकारात्मकता बढ़ेगी। कृपया अधिक बताएं।
स्टम्पी जो पीट

स्टम्पी - मैं आर एंड सी में संवेदनशीलता की उम्मीद कर रहा हूं क्योंकि मुझे पता है कि मैं जिस मैट्रिक्स (आपूर्ति) को करता हूं, वह सही सहसंबंध को प्रदर्शित करता है - इसका सही बाइक्लेस्टर जैसा कि पेपर में ही दिया गया है।
zzk

6
मैं अभी भी सोच रहा हूं कि आप गलत दिशा में जा रहे हैं। 4iii यह नहीं कहता है कि अगर Xपूरी तरह से सहसंबंधित बाइक्लेस्टर है Rऔर Cवह additive होगा। निहितार्थ दूसरी दिशा में जाता है। अब, मैं मानता हूं कि यह अजीब है कि वे जो उदाहरण देते हैं, वह उन प्रमेयों के साथ नहीं लगता है जो इसके बगल में हैं। शायद कुछ अन्य जानकारी है जो आप प्रदान कर सकते हैं? क्या कोई और प्रमेय है जो दूसरी दिशा में जाता है?
स्टम्पी जो पीट

जवाबों:


2

ध्यान दें कि इस लेख में 'बाइक्लेस्टर' एक मैट्रिक्स के सबसेट को संदर्भित करता है, "पंक्तियों का एक सबसेट जो स्तंभों के सबसेट के समान व्यवहार को प्रदर्शित करता है, या इसके विपरीत।" आमतौर पर डेटा माइनिंग एल्गोरिदम में बाइक्लेस्टर्स की पहचान की जाती है। लेखक एक नए 'सहसंबद्ध बाइक्लेस्टर मॉडल' को प्रस्तुत कर रहे हैं, जो इन सबसेट्स की पहचान करने के लिए उपयोग किए गए पिछले मॉडल से अलग है। मैं आनुवांशिकी के बारे में कुछ नहीं जानता, लेकिन यहाँ भ्रम बहुत स्पष्ट है और दो स्रोतों से आता है:

1. 'योगात्मक' शब्द का प्रयोग

इस पत्र में ऐसा कुछ भी नहीं है जिसका तात्पर्य यह है कि फ़ंक्शन के आउटपुट में दिए गए दो मैट्रिसेस 'एडिटिव' होने चाहिए, यदि 'एडिटिव' द्वारा, एडिटिव इन्वर्स होता है, जिसका अर्थ ओपी से है। लेखक इस अर्थ में योगात्मक शब्द का उपयोग नहीं कर रहे हैं। वे एक additive मॉडल के साथ एक बाइक्लेस्टर प्राप्त करने का उल्लेख कर रहे हैं, "जहां प्रत्येक पंक्ति या स्तंभ को दूसरी पंक्ति या स्तंभ में एक निरंतर जोड़कर प्राप्त किया जा सकता है।"

2. प्रपोज़ करना 4.3

आरमैंसीजम्मूएक्समैंजम्मूएक्समैंजम्मूआरमैंसीजम्मूआरमैंसीजम्मू विपरीत additive होना चाहिए या कि वे एक additive मॉडल के साथ फिट होने में सक्षम होना चाहिए।

* इसके अलावा, उदाहरण डेटा प्रश्न में चर्चा किए गए प्रस्ताव की तुलना में कागज के एक पूरी तरह से अलग अनुभाग से आता है।


[अब तक] हमारी वेबसाइट पर सबसे अधिक अनुत्तरित अनुत्तरित प्रश्न को देखने के लिए यह बहुत अच्छा है! +1 भले ही मैंने कागज नहीं पढ़ा है और यह प्रतिज्ञा नहीं कर सकता कि आपने जो लिखा है वह सही है; लेकिन यह उचित प्रतीत होता है।
अमीबा का कहना है कि मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.