मुझे दृश्य डेटा विश्लेषण के लिए एक जटिल ग्राफिक्स बनाने की आवश्यकता है। मेरे पास 2 चर हैं और बड़ी संख्या में मामले (> 1000) हैं। उदाहरण के लिए (संख्या 100 है यदि फैलाव को कम "सामान्य" बनाने के लिए):
x <- rnorm(100,mean=95,sd=50)
y <- rnorm(100,mean=35,sd=20)
d <- data.frame(x=x,y=y)
1) मुझे बिंदु आकार के साथ कच्चे डेटा को प्लॉट करने की आवश्यकता है, जो संयोगों की सापेक्ष आवृत्ति है, इसलिए plot(x,y)
यह एक विकल्प नहीं है - मुझे बिंदु आकार की आवश्यकता है। इसे प्राप्त करने के लिए क्या किया जाना चाहिए?
2) उसी भूखंड पर मुझे 95% विश्वास अंतराल दीर्घवृत्त और सहसंबंध के परिवर्तन का प्रतिनिधित्व करने की आवश्यकता है (इसे सही तरीके से कैसे नाम दें पता नहीं) - कुछ इस तरह:
library(corrgram)
corrgram(d, order=TRUE, lower.panel=panel.ellipse, upper.panel=panel.pts)
लेकिन एक भूखंड पर दोनों रेखांकन के साथ।
3) अंत में, मैं इस सब के शीर्ष पर एक परिणामी लाइनर प्रतिगमन मॉडल तैयार करने की आवश्यकता है:
r<-lm(y~x, data=d)
abline(r,col=2,lwd=2)
लेकिन त्रुटि सीमा के साथ ... QQ- प्लॉट पर कुछ इस तरह:
लेकिन फिटिंग त्रुटियों के लिए, यदि यह संभव है।
तो सवाल यह है:
एक ग्राफ पर यह सब कैसे प्राप्त करें?