सांख्यिकी, रैखिक बीजगणित और मशीन सीखने में शास्त्रीय अंकन क्या हैं? और इन संकेतनों के बीच क्या संबंध हैं?


26

जब हम कोई पुस्तक पढ़ते हैं, तो सूचनाओं को समझना सामग्री को समझने में बहुत महत्वपूर्ण भूमिका निभाता है। दुर्भाग्य से, विभिन्न समुदायों के मॉडल और अनुकूलन समस्या पर सूत्रीकरण के लिए अलग-अलग संकेतन सम्मेलन हैं। क्या कोई भी कुछ सूत्र संकेतन यहाँ प्रस्तुत कर सकता है और संभावित कारण बता सकता है?

मैं यहां एक उदाहरण दूंगा: रेखीय बीजगणित साहित्य में, क्लासिक पुस्तक है रेखीय बीजगणित का परिचय । पुस्तक में सबसे अधिक उपयोग की गई संकेतन है

Ax=b

कहाँ एक है गुणांक मैट्रिक्स , है चर हल किया जा करने के लिए और पर एक वेक्टर है समीकरण के दाईं ओर । पुस्तक इस संकेतन को चुनने का कारण है रैखिक बीजगणित का मुख्य लक्ष्य एक रैखिक प्रणाली को हल करना है और यह पता लगाना है कि वेक्टर क्या है । ऐसे सूत्रीकरण को देखते हुए ओएलएस अनुकूलन समस्या हैx xAxbx

minimizex  Axb2

साक्षरता या मशीन लर्निंग में (बुक एलीमेंट ऑफ़ स्टैटिस्टिकल लर्निंग से ) लोग एक ही चीज़ का प्रतिनिधित्व करने के लिए विभिन्न संकेतन का उपयोग करते हैं:

Xβ=y

कहाँ X है डेटा मैट्रिक्स , β है गुणांक या वजन सीखने सीखना पड़ता , y प्रतिक्रिया है। कारण लोगों के लिए उपयोग इस वजह से सांख्यिकी या मशीन सीखने समुदाय के लोगों है संचालित डेटा है, तो डेटा और प्रतिक्रिया उन्हें सबसे दिलचस्प बात कर रहे हैं, जहां वे का उपयोग X और y प्रतिनिधित्व करने के लिए।

अब हम देख सकते हैं कि सभी संभावित भ्रम हो सकते हैं: A पहले समीकरण में दूसरे समीकरण में एक्स के समान Xहै। और दूसरे समीकरण में X को हल करने की आवश्यकता नहीं है। इसके अलावा शर्तों के लिए: A रेखीय बीजगणित में गुणांक मैट्रिक्स है, लेकिन यह आंकड़ों में डेटा है। β को "गुणांक" भी कहा जाता है।

इसके अलावा, मैंने Xβ=y का उल्लेख किया है जो मशीन लर्निंग में लोगों द्वारा व्यापक रूप से उपयोग नहीं किया जाता है, लोग आधे वेक्टरकृत संस्करण का उपयोग करते हैं जो सभी डेटा बिंदुओं पर सारांशित करते हैं। जैसे कि

miniL(yi,f(xi))

मुझे लगता है कि इसका कारण यह है कि स्टोकेस्टिक क्रमिक वंश और अन्य विभिन्न नुकसान कार्यों के बारे में बात करते समय यह अच्छा है। इसके अलावा, संक्षिप्त मैट्रिक्स नोटेशन रैखिक प्रतिगमन की तुलना में अन्य समस्याओं के लिए गायब हो जाता है।

लॉजिस्टिक रिग्रेशन के लिए मैट्रिक्स नोटेशन

क्या कोई भी नोटिस अलग-अलग साहित्य को पार कर सकता है? मुझे आशा है कि इस प्रश्न के स्मार्ट उत्तर का उपयोग विभिन्न साहित्य को पार करने वाली पुस्तकों को पढ़ने वाले लोगों के लिए एक अच्छे संदर्भ के रूप में किया जा सकता है।

कृपया मेरे उदाहरण और द्वारा सीमित न करें । कई अन्य हैं। जैसे किएक्स β = वाईAx=bXβ=y

दो अलग-अलग लॉजिस्टिक लॉस फॉर्मेशन / नोटेशन क्यों हैं?


5
संकेतन वास्तव में बाहरी रूप से सत्य के कुछ प्रकार के रूप में मौजूद नहीं है। यह एक भाषा है, इसलिए यह स्वाभाविक रूप से प्रासंगिक है और पुनर्वित्त के लिए है। अगर मैं x * b लिखूं और इसका मतलब है कि मैट्रिक्स x डॉट उत्पाद वेक्टर b, यह सिर्फ बोल्ड है या नहीं।
साइकोरैक्स का कहना है

3
मैं कहूंगा कि और में बराबर संकेतन है। बस चर के नाम बदल गए हैं। सामान्य तौर पर, आपको चर का नामकरण कागज से कागज तक, यहां तक ​​कि एक क्षेत्र के भीतर भी नहीं मिलेगा। एक्स β = वाईAx=bXβ=y
user20160

6
वर्तमान में, इसमें 10 अपवोट, 150 विचार हैं; यह एक मूल्यवान और उपयोगी धागा प्रतीत होता है। इसके अलावा, यह एक उत्कीर्ण जवाब है; इसलिए मुझे नहीं लगता कि इसका उत्तर दिया जाना बहुत व्यापक है।
गंग -

3
मैं @gung से सहमत हूं, समुदाय को स्पष्ट रूप से इस सवाल में कुछ दिलचस्पी है। मैंने फिर से खोलने के लिए नामांकित किया।
मैथ्यू ड्र्यू

1
मुझे लगता है कि यह एक नियमित q के लिए बहुत व्यापक है। - लेकिन जैसा कि यह पहले से ही CW और कुछ लोकप्रिय है, मैंने अपना वोट फिर से चार में खोलने के लिए जोड़ा है।
Scortchi - को पुनः स्थापित मोनिका

जवाबों:


18

शायद एक संबंधित प्रश्न है, "विभिन्न भाषाओं में प्रयुक्त शब्द क्या हैं, और इन शब्दों के बीच क्या संबंध हैं?"

संकेतन भाषा की तरह कुछ अर्थों में है:

  • कुछ शब्दों के क्षेत्र विशिष्ट अर्थ होते हैं; कुछ शब्दों को मोटे तौर पर समझा जाता है।
  • जैसे शक्तिशाली राष्ट्रों ने अपनी भाषा का प्रसार किया, सफल क्षेत्र और प्रभावशाली शोधकर्ताओं ने अपनी धारणा को फैलाया।
  • भाषा समय के साथ विकसित होती है: भाषा में ऐतिहासिक उत्पत्ति और आधुनिक प्रभाव का मिश्रण होता है।

आपका विशिष्ट प्रश्न ...

  • मैं आपके इस विवाद से असहमत हूं कि दोनों "पूरी तरह से अलग संकेतन" का अनुसरण करते हैं। दोनों और मैट्रिक को निरूपित करने के लिए बड़े अक्षरों का उपयोग करते हैं। वे नहीं कर रहे हैं कि अलग।एक एक्स = Xβ=yAx=b
  • मशीन लर्निंग अत्यधिक आँकड़ों से संबंधित है, एक बड़ा और परिपक्व क्षेत्र। डेटा मैट्रिक्स का प्रतिनिधित्व करने के लिए का उपयोग करना निश्चित रूप से पालन करने के लिए सबसे पठनीय, सबसे मानक सम्मेलन है। जबकि रैखिक प्रणालियों को हल करने के लिए मानक है, लेकिन ऐसा नहीं है कि आँकड़े करने वाले लोग सामान्य समीकरण लिखते हैं। यदि आप ऐसा करने की कोशिश करते हैं तो आप अपने दर्शकों को अधिक भ्रमित पाएंगे। जब रोम में...एक्स = बीXAx=b
  • कुछ अर्थों में, आपके संशोधित प्रश्न का दिल है, " डेटा का प्रतिनिधित्व करने के लिए पत्र का उपयोग करके आंकड़ों की ऐतिहासिक उत्पत्ति और अज्ञात चर का प्रतिनिधित्व करने के लिए पत्र का उपयोग करने के लिए क्या हैं?" βxβ
    • यह सांख्यिकीय इतिहासकारों के लिए एक सवाल है! संक्षेप में खोज करने पर, मुझे प्रभावशाली ब्रिटिश सांख्यिकीविद् और कैम्ब्रिज अकादमिक उडनी यूल ने सांख्यिकी के सिद्धांत (1911) के अपने परिचय में डेटा का प्रतिनिधित्व करने के लिए का उपयोग किया । उन्होंने एक प्रतिगमन समीकरण को रूप में लिखा , जिसमें न्यूनतम वर्ग का उद्देश्य न्यूनतम रूप में , और समाधान । यह कम से कम तब तक वापस चला जाता है ...एक्स 1 = एक + एक्स 2 Σ ( x 1 - एक - बी एक्स 2 ) 2 12 = Σ एक्स 1 एक्स 2xx1=a+bx2(x1abx2)2b12=x1x2x22
    • इससे भी अधिक प्रभावशाली आरए फिशर ने आश्रित चर के लिए और स्वतंत्र चर के लिए 1925 में अपनी पुस्तक सांख्यिकीय तरीके रिसर्च वर्कर्स के लिए किया । (जानकारी के साथ लिंक प्रदान करने के लिए @ नोक्स कॉक्स को हैट टिप।)x yx

अच्छी धारणा अच्छी भाषा की तरह है। जब भी संभव हो फील्ड विशिष्ट शब्दजाल से बचें। उच्च बीबीसी अंग्रेजी के गणित के समकक्ष में लिखें, वह भाषा जो अंग्रेजी बोलने वाले अधिकांश लोगों के लिए समझ में आती है। जब भी संभव हो, संकेतन का उपयोग करते हुए लिखना चाहिए जो स्पष्ट है और जिसे मोटे तौर पर समझा जाता है।


1
आंकड़ों का यह शौकिया इतिहासकार एक पांडित्यपूर्ण सुधार की आपूर्ति कर सकता है कि यूल कभी प्रोफेसर नहीं था ... अधिक दिलचस्प बात यह है कि jeff560.tripod.com/stat.html पर एक प्रासंगिक वेबसाइट है, सिवाय इसके कि यह वर्तमान में नीचे दिखाई देती है।
निक कॉक्स

2
math.hawaii.edu/~tom/history/stat.html एक प्रति प्रतीत होता है। व्यवस्थित रूप से कन्वेंशन जैसे कि पैरामीटर्स के लिए ग्रीक और वैरिएबल के लिए रोमन मैं काफी हद तक आरए फिशर की वजह से समझता हूं, लेकिन कई -आउट जैसे उदाहरण हैं नमूना ची-स्क्वायर स्टेटिस्टिक शो के लुप्त होने के कोई संकेत नहीं हैं। χ2
निक कॉक्स

@NickCox शानदार लिंक jeff560.tripod.com/stat.html (मेरे लिए ...) जो यूल और आरए फिशर का संदर्भ देता है! प्रतिगमन की प्रारंभिक गणितीय उत्पत्ति स्पष्ट रूप से गॉस और लाप्लास से पहले वापस चली जाती है, लेकिन मेरी पूरी शौकिया खोज में, वे अलग-अलग संकेतन का उपयोग करते दिखाई दिए।
मैथ्यू गन

jeff560.tripod.com/stat.html जैसा कि मैं लिखता हूं कि यह 2014 का अपडेट है; www.math.hawaii.edu/~tom/history/stat.html 2007 के संस्करण की एक प्रति है।
निक कॉक्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.