अनुपात का विश्लेषण करें


13

मेरे पास कई अनुपात वाले डेटासेट हैं जो 1. तक जोड़ते हैं। मुझे इन अनुपातों के परिवर्तन में एक ढाल के साथ दिलचस्पी है (उदाहरण डेटा के लिए नीचे देखें)।

gradient <- 1:99
A1 <- gradient * 0.005
A2 <- gradient * 0.004
A3 <- 1 - (A1 + A2)

df <- data.frame(gradient = gradient,
                 A1 = A1,
                 A2 = A2,
                 A3 = A3)

require(ggplot2)
require(reshape2)
dfm <- melt(df, id = "gradient")
ggplot(dfm, aes(x = gradient, y = value, fill = variable)) +
  geom_area()

यहाँ छवि विवरण दर्ज करें

अतिरिक्त जानकारी: यह जरूरी नहीं कि रैखिक होना चाहिए, मैंने ऐसा केवल उदाहरण की सहजता के लिए किया। मूल गणना जिसमें से इन अनुपातों की गणना की जाती है, वे भी उपलब्ध हैं। वास्तविक डेटासेट में 1 (जैसे B1, B2 & B3, C1 से C4, आदि) तक अधिक चर शामिल हैं - इसलिए एक बहुभिन्नरूपी समाधान के लिए एक संकेत भी उपयोगी होगा ... लेकिन अब के लिए मैं अविभाज्य पर चिपकूंगा आंकड़ों का पक्ष।

प्रश्न: कोई इस तरह के डेटा का विश्लेषण कैसे कर सकता है? मैंने थोड़ा बहुत पढ़ा है, और शायद एक बहुराष्ट्रीय मॉडल या एक चमक अनुकूल है? - अगर मैं 3 (या 2) गलियों को चलाता हूं, तो मैं उस बाधा को कैसे शामिल कर सकता हूं जो अनुमानित मान 1 तक है? मैं केवल इस तरह के डेटा को प्लॉट नहीं करना चाहता, मैं विश्लेषण जैसी गहरी प्रतिगमन भी करना चाहता हूं। मैं अधिमानतः आर का उपयोग करना चाहता हूं - मैं आर में यह कैसे कर सकता हूं?


proprcsplineस्टाटा में कमांड वह हो सकता है जिसे आप ढूंढ रहे हैं (मुझे पता है कि आप इसका उपयोग करना चाहते हैं R, लेकिन शायद यह एक शुरुआती बिंदु हो सकता है): प्रोप्रैस्पलाइन एक प्रतिबंधित क्यूबिक स्लाइन की गणना करती है, जो कि yvar xvar के प्रत्येक श्रेणी में टिप्पणियों के अनुपात में चिकनी है, और उन्हें एक खड़ी क्षेत्र साजिश के रूप में रेखांकन करता है। वैकल्पिक रूप से, इन चिकनी अनुपातों को नियंत्रण चर (cvars) के एक सेट के लिए समायोजित किया जा सकता है।
बोस्कोविच

क्या आप इस बारे में विस्तार से बता सकते हैं कि "रुचि" का अर्थ क्या है? क्या आप केवल ग्रेडिएंट के खिलाफ अनुपात की साजिश करना चाहते हैं? या क्या आपके मन में गहरा विश्लेषण है? यदि हां, तो इसकी प्रकृति क्या है - आप इन आंकड़ों से क्या उम्मीद करते हैं? इसके अलावा, क्या आपके पास मूल गणना उपलब्ध है (जो अच्छा होगा) या केवल अनुपात? क्या आप थोड़ा और कह सकते हैं कि इन आंकड़ों में क्या है और वे कैसे एकत्र किए जाते हैं?
whuber

1
@whuber: मैं इस डेटा के साथ एक गहन विश्लेषण करना चाहता हूं। मेरी परिकल्पना है कि अनुपात ढाल के साथ बदल जाएगा। काउंट्स भी उपलब्ध हैं।
ईडी

1
लगता है जैसे आपके पास कंपोजिटल डेटा है। मैं इसके बारे में बहुत कुछ नहीं जानता, लेकिन एचिसन का काम शुरू करने की जगह है। CRAN पर एक पैकेज, रचनाएँ हैं।
हारून ने स्टैक ओवरफ्लो

जवाबों:


13

एक आयाम में, यह बीटा प्रतिगमन के साथ एक नौकरी की तरह लगता है (चर फैलाव के साथ या बिना)। यह बीटा-वितरित निर्भर चर के साथ एक प्रतिगमन मॉडल है, स्वाभाविक रूप से 0-1 विवश है। एक आर पैकेज बिटारेग है और इसके उपयोग का वर्णन करने वाला एक पेपर यहाँ है
दो से अधिक अनुपातों के लिए बीटा वितरण का सामान्य विस्तार डिरिचलेट रिग्रेशन की ओर जाता है। एक R पैकेज DirichletReg उपलब्ध है, उदाहरण के लिए यहां वर्णित है

असली रचना डेटा के लिए लॉगिट लिंक और मल्टीओमोनियल लॉजिस्टिक रिग्रेशन का उपयोग न करने के कुछ कारण हैं, ज्यादातर यह कि वे किस तरह की मजबूत धारणाओं के साथ काम करते हैं। हालांकि, अगर आपके डेटा कर रहे हैं सब वास्तव में सामान्यीकृत मायने रखता है (प्रचुरता?), उन मान्यताओं सही हो सकता है और पीटर के सुझाव शायद जाने का रास्ता होगा।


लिंक के लिए धन्यवाद, मैं उन पर एक नज़र डालूंगा। DirichletReg होनहार लग रही है! उदाहरण के लिए अपने लिंक की स्लाइड 3: "यदि एक निश्चित cateogory में जवाब देने की 'संभावना' विकल्पों में फैली हुई है, तो एक Dirichlet दृष्टिकोण अधिक जानकारीपूर्ण है।" । क्योंकि मुझे नहीं पता था कि यह कैसे करना चाहिए, क्योंकि यह विकल्प अद्वितीय होने की आवश्यकता नहीं है। इसके अलावा चित्रमय
पुनरुत्थान का

ग्राफिक्स के लिए आपको R फ़ंक्शन स्पलाइनप्लॉट और सीडीपीलॉट मददगार लग सकते हैं। वास्तव में अगर तुम सिर्फ फिट लाइनों चाहता था और फिर आप कर सकते थे शायद समाक्ष प्रतिगमन मशीनरी का एक बहुत जरूरत नहीं थी cdplot आप प्रासंगिक घटता (यह केवल है देने के घनत्व के नीचे)
conjugateprior

क्षमा करें, मेरा मतलब ऊपर स्पाइनप्लॉट टाइप करना था , जाहिर है।
कंजुगेटपायर

ध्यान दें कि DirichletReg पैकेज अब है क्रैन पर उपलब्ध है, और एक शब्दचित्र प्रकाशित किया गया है।
6

4

मुझे यकीन नहीं है कि आप क्या पता लगाने की कोशिश कर रहे हैं, लेकिन स्वतंत्र चर के रूप में ढाल के साथ एक बहुराष्ट्रीय लॉजिस्टिक प्रतिगमन के बारे में क्या?

R में, ऐसा करने का एक तरीका है, mlogit लाइब्रेरी में mlogit फ़ंक्शन। इस विगनेट को देखें

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.