मैं ऊपर दिए गए जवाब से थोड़ा भ्रमित था, इसलिए मैं इसे एक और शॉट दूंगा। मुझे लगता है कि प्रश्न वास्तव में 'शास्त्रीय' रैखिक प्रतिगमन के बारे में नहीं है बल्कि उस विशेष स्रोत की शैली के बारे में है। शास्त्रीय प्रतिगमन भाग पर:
हालांकि, अपने आप में रैखिकता धारणा हमारे मॉडल पर कोई संरचना नहीं डालती है
यह बिल्कुल सही है। आप ने कहा है के रूप में, के साथ-साथ रैखिक संबंध को मारने और से पूरी तरह से स्वतंत्र कुछ जोड़ सकते हैं एक्स ताकि हम सभी पर किसी भी मॉडल की गणना नहीं कर सकते।εएक्स
क्या ग्रीन मैला हो रहा है? वह वास्तव में लिखा जाना चाहिए था: E(y|X)=Xβ
मैं पहले प्रश्न का उत्तर नहीं देना चाहता, लेकिन मुझे उन मान्यताओं का योग करने दीजिए, जिनकी आपको सामान्य रेखीय प्रतिगमन की आवश्यकता है:
आइए हम मान लें कि आप का पालन (आप दिए गए हैं) डेटा बिंदुओं और y मैं ∈ आर के लिए मैं = 1 , । । । , एन । आपको यह मानने की आवश्यकता है कि आपके द्वारा देखे गए डेटा ( x i , y i ) स्वतंत्र रूप से, समान रूप से वितरित यादृच्छिक चर ( X i , Y i ) से आते हैं जैसे कि ...xi∈Rdyi∈Ri=1,...,n(xi,yi)(Xi,Yi)
वहां मौजूद एक निश्चित (स्वतंत्र ) बीटा ∈ आर डी ऐसी है कि वाई मैं = बीटा एक्स मैं + ε मैं सभी के लिए मैं और यादृच्छिक परिवर्तनीय ε मैं कि इस तरह के हैंiβ∈RdYi=βXi+ϵiiϵi
अच्छी तरह से और के रूप में आईआईडी रहे ε मैं के रूप में वितरित किया जाता है एन ( 0 , σ ) ( σ से स्वतंत्र होना चाहिए मैं के रूप में अच्छी तरह से)ϵiϵiN(0,σ)σमैं
के लिए और वाई = ( Y 1 , । । । , वाई एन ) चर एक्स , वाई एक आम घनत्व, यानी एक यादृच्छिक चर राशि ( एक्स , वाई ) एक है घनत्व f X , Yएक्स=(X1,...,Xn)Y=(Y1,...,Yn)X,Y(X,Y)fX,Y
अब आप सामान्य पथ को चला सकते हैं और गणना कर सकते हैं
fY|X(y|x)=fY,X(y,x)/fX(x)=(12πd−−−√)nexp(−∑ni=1(yi−βxi)22σ)
ताकि मशीन सीखने (त्रुटि कार्यों का कम से कम) और संभाव्यता सिद्धांत (संभावना की अधिकतमता) के बीच सामान्य 'द्वैत' द्वारा आप अधिकतम में β जो वास्तव में, आप हमेशा की तरह "RMSE" सामान देता है।−logfY|X(y|x)β
अब जैसा कि कहा गया है: यदि आप जिस पुस्तक का उद्धरण दे रहे हैं, उसका लेखक इस बिंदु को बनाना चाहता है (जो आपको करना है यदि आप मूल सेटअप में 'सर्वोत्तम संभव' प्रतिगमन रेखा की गणना करने में सक्षम होना चाहते हैं), तो हाँ, उसे अवश्य करना चाहिए की normalicity पर यह धारणा बनाने किताब में कहीं।ϵ
अब अलग संभावनाएं हैं:
वह इस धारणा को किताब में नहीं लिखते हैं। फिर यह पुस्तक में एक त्रुटि है।
उन्होंने कहा कि जैसे 'जब भी मैं लिखने के लिए एक' वैश्विक 'टिप्पणी के रूप में उसे लिख करता है तो ε आईआईडी सामान्य रूप से मतलब शून्य के साथ वितरित कर रहे हैं जब तक अन्यथा न कहा गया'। तब IMHO यह खराब शैली है क्योंकि यह बिल्कुल भ्रम का कारण बनता है जो आपको अभी लगता है। यही कारण है कि मैं हर प्रमेय में कुछ संक्षिप्त रूप में मान्यताओं को लिखता हूं । तभी हर बिल्डिंग ब्लॉक को अपने आप में सफाई से देखा जा सकता है।+ϵϵ
- वह इसे आपके द्वारा उद्धृत किए जा रहे भाग के करीब लिखता है और आपने / हमने अभी इसे नोटिस नहीं किया है (एक संभावना :-))
हालांकि, एक सख्त गणितीय अर्थ में, सामान्य त्रुटि कुछ विहित है (उच्चतम एन्ट्रापी के साथ वितरण [एक बार विचरण तय हो जाने के बाद], इसलिए, सबसे मजबूत मॉडल का निर्माण) ताकि कुछ लेखक इस धारणा को छोड़ दें, लेकिन फिर भी उपयोग न करें । औपचारिक रूप से, आप बिल्कुल सही हैं: वे "गलत तरीके" से गणित का उपयोग कर रहे हैं। जब भी वे घनत्व लिए समीकरण के साथ आना चाहते हैं | एक्स तो ऊपर कहा गया है के रूप में वे जानने की जरूरत ε बहुत अच्छी तरह से, अन्यथा आप बस इसे हर senseful समीकरण में चारों ओर उड़ के गुण होते हैं कि आप को लिखने के लिए प्रयास करें।fY|Xϵ