मशीन लर्निंग में, सब्सक्रिप्शन के बजाय सुपरस्क्रिप्ट का उपयोग क्यों किया जाता है?


20

मैं कोर्टर के माध्यम से मशीन लर्निंग पर एंड्रयू एनजी का कोर्स कर रहा हूं । समीकरणों के लिए, सब्सक्रिप्शन के बजाय सुपरस्क्रिप्ट का उपयोग किया जाता है। उदाहरण के लिए, बजाय निम्नलिखित समीकरण का उपयोग किया जाता है : x ix(i)xi

J(θ0,θ1)=12mi=1m(hθ(x(i))y(i))2

जाहिर है, यह आम बात है। मेरा सवाल यह है कि सब्सक्राइबर्स के बजाय सुपरस्क्रिप्ट्स का उपयोग क्यों करें? प्रतिरूपण के लिए पहले से ही सुपरस्क्रिप्ट का उपयोग किया जाता है। मुझे लगता है कि लघुगणक मौजूद हैं या नहीं, इस पर ध्यान देकर सुपरस्क्रिप्ट और प्रतिपादक उपयोग के मामलों के बीच अंतर कर सकते हैं, लेकिन यह अभी भी भ्रामक लगता है।


4
मुझे संदेह है कि यह शायद इसलिए है क्योंकि कुछ कंप्यूटर विज्ञान के लोग मानक गणितीय संकेतन में पारंगत नहीं हैं, और इसलिए अपने स्वयं के संकेतन बनाते हैं। एक्चुअरिज़ कभी-कभी ऐसा भी करते हैं, और जब आप अधिक जटिल अवधारणाओं को प्राप्त करते हैं तो निराशा होती है।
21

5
क्या iडेटा सेट आकार, या वेक्टर के तत्वों पर अनुक्रमण है x? यदि पूर्व, यह पूरी तरह से मानक है। यदि बाद वाला, वह पूरी तरह से गैर-मानक है। और सुपरस्क्रिप्ट का उपयोग करने का कारण यह है क्योंकि कभी-कभी आप सबस्क्रिप्ट का उपयोग करके वेक्टर के तत्व को संदर्भित करना चाहते हैं।
रेक्स केर

4
@ क्रोनाएंटे लोल नहीं, यह इसलिए है क्योंकि सब्सक्रिप्शन पहले से ही इंडेक्सिंग वैक्टर के लिए लिया जाता है।
नील जी

4
@ क्रोकिन्टे यह बल्कि प्रकल्पित है। कंट्रोवरिएंट वैक्टर / आइंस्टीन नोटेशन के बारे में क्या ?
विस्डेन

4
@rocinante मुझे यह रेखांकित करने में दूसरों को प्रतिध्वनित करना है कि आपका शब्द दुर्भाग्यपूर्ण है। हम सभी को यह मानने की प्रवृत्ति है कि स्थानीय और मानक के रूप में परिचित क्या है।
निक कॉक्स

जवाबों:


26

अगर एक वेक्टर तो के , अर्थात लिए एक मानक संकेतन हैएक्स आर एम एक्स मैं मैं एक्स एक्स = ( एक्स 1 , एक्स 2 , ... , एक्स मीटर ) आर एमxxRmxiiएक्स

x=(x1,x2,,xm)Rm.

यदि आपके पास ऐसे वैक्टर का संग्रह है , तो आप -th वेक्टर को कैसे निरूपित करेंगे ? आप नहीं लिख सकते , इसका अन्य मानक अर्थ है। इसलिए कभी-कभी लोग लिखते हैं और मुझे विश्वास है कि एंड्रयू एनजी ऐसा क्यों करता है।i x i x ( i )nixix(i)

अर्थात

एक्स(1)=(एक्स1(1),एक्स2(1),...,एक्स(1))आरएक्स(2)=(एक्स1(2),एक्स2(2),...,एक्स(2))आर...एक्स(n)=(एक्स1(n),एक्स2(n),...,एक्स(n))आर

मैं असहमत नहीं हूं, लेकिन अक्सर का उपयोग किया जाता है, अर्थात बार-बार माप के लिए। एक्समैंजे
क्लिफ एबी

1
हां, लेकिन मेरे x ( i ) j के बराबर है ; x ( i ) के बराबर क्या होगा ? xijxj(i)x(i)
अमीबा का कहना है कि मोनिका

1
हाँ, यह एक फायदा है। मुझे लगता है कि मैंकभी कभी प्रयोग किया जाता है, लेकिन इस के साथ भ्रमित किया जा सकता है Σ n j = 1 एक्स मैं j / मीएक्समैंΣजे=1nएक्समैंजे/
क्लिफ एबी

1
यदि आप मैट्रिसेस से अधिक पुनरावृति करना चाहते हैं तो ऐसा करने के लिए सबसे सहज तरीका लगता है। इसलिए वैक्टर से मैट्रीज की ओर बढ़ते समय संकेतन सुसंगत रहता है। एक्सn(मैं)
josh

2
@ जेएबी हां, यह संकेतन को और अधिक स्पष्ट करने के लिए है (जैसा कि आप कहते हैं "टाइप करें")। पाठ्यक्रम से एक का उपयोग करने के लिए सहमत कर सकते हैं के लिए मैं मई के वेक्टर और एक्स मैं जे के लिए जे के मई के तत्व मैं मई के वेक्टर। विभिन्न सम्मेलन संभव हैं, यह उनमें से सिर्फ एक है। मैं यह भी नहीं कह रहा हूं कि यह सबसे अच्छा है, बस इसके पीछे तर्क को स्पष्ट करना है। xiixijji
अमीबा का कहना है कि मोनिका

11

सुपर स्क्रिप्ट का उपयोग जैसा कि आपने कहा है कि मेरा मानना ​​है कि मशीन लर्निंग साहित्य में बहुत आम नहीं है। मुझे पुष्टि करने के लिए Ng के पाठ्यक्रम नोट्स की समीक्षा करनी होगी, लेकिन अगर वह उस उपयोग को वहां रख रहा है, तो मैं कहूंगा कि वह इस अंकन के प्रसार का मूल होगा। यह एक संभावना है। किसी भी तरह से, बहुत निर्दयी नहीं होने के लिए, लेकिन मुझे नहीं लगता कि कई ऑनलाइन पाठ्यक्रम के छात्र मशीन लर्निंग पर साहित्य प्रकाशित कर रहे हैं, इसलिए वास्तविक साहित्य में यह अंकन बहुत आम नहीं है। आखिरकार, ये मशीन लर्निंग में परिचयात्मक पाठ्यक्रम हैं, पीएचडी स्तर के पाठ्यक्रम नहीं।

सुपर लिपियों के साथ जो बहुत आम है वह सुपर स्क्रिप्ट्स का उपयोग करके एल्गोरिथ्म के पुनरावृत्ति को निरूपित करना है। उदाहरण के लिए, आप न्यूटन की विधि के अनुसार इसे लिख सकते हैं

θ(t+1)=θ(t)H(θ(t))1θ(t)

जहां हेस्सियन और है θ ( टी ) ढाल है।H(θ(t))θ(t)

(... हाँ, यह हेसियन मैट्रिक्स के व्युत्क्रम के कारण न्यूटन की विधि को लागू करने का सबसे अच्छा तरीका नहीं है ...)

इधर, के मूल्य का प्रतिनिधित्व करता θ में टी टी एच यात्रा। यह सुपर लिपियों का सबसे आम (लेकिन निश्चित रूप से न केवल) उपयोग है जिससे मैं परिचित हूं।θ(t)θtth

EDIT: स्पष्ट करने के लिए, मूल प्रश्न में, यह सुझाव दिया गया था कि एमएल संकेतन में, सांख्यिकी के x i संकेतन के बराबर था । मेरे जवाब में, मैं बताता हूं कि यह वास्तव में एमएल साहित्य में प्रचलित नहीं है। यह सच है। हालांकि, @amoeba द्वारा उठाई बाहर के रूप में, वहाँ डेटा के लिए एमएल साहित्य में सुपरस्क्रिप्ट अंकन के बहुत सारे है, लेकिन इन मामलों में एक्स ( मैं ) आम तौर पर इसका मतलब यह नहीं कि मैं टी की एक एकल वेक्टर अवलोकन एक्सx(i)xix(i)ithx


1
पुनरावृत्ति गणना के लिए कोष्ठक / ब्रैकेटेड सुपरस्क्रिप्ट के उपयोग के साथ टकराव (एक संकेतन जो क्षेत्रों की एक विस्तृत श्रृंखला में आम उपयोग में है) वास्तव में महत्वपूर्ण बात है।
Glen_b-

2
यह आमतौर पर प्रशिक्षण सेट में नमूने के सूचकांक को इंगित करने के लिए भी उपयोग किया जाता है, जो कि पुनरावृत्ति की तरह है, लेकिन बिल्कुल समान नहीं है क्योंकि आप आमतौर पर अपने प्रशिक्षण सेट के माध्यम से कई बार पुनरावृत्ति करते हैं।
रेक्स केर

3
मैं भी देखा है यात्रा मायने रखता है सबस्क्रिप्ट (का उपयोग करते हुए उल्लेख किया ) (साथ ही साथ लाइन में एक ( n + 1 ) = एक ( एन ) + 1 )। यही कारण है कि, कुछ विशिष्ट संकेतन का उपयोग करते समय, मैं आमतौर पर शुरू में कुछ करने के लिए (उदाहरण के लिए "निम्नलिखित श्रृंखला में, ब्ला ब्ला ब्ला" और फिर गणित लगाता हूं)। इस प्रकार, जो भी संकेतन उपयोग में है, पाठकों को (उम्मीद है) संभावित अस्पष्ट मामलों के लिए अर्थ का अनुमान लगा सकते हैं बजाय इसके कि वे उन सम्मेलनों के आधार पर अनुमान लगा सकें जो वे जानते हैं। an+1=an+1a(n+1)=a(n)+1
जाब

1
मैं @JAB से सहमत हूं। अधिक सामान्यतः, मुझे नहीं लगता कि यह उन लोगों के लिए जघन्य है जो गणितीय उपचारों में सॉफ्टवेयर से नोटेशन उधार लेने के लिए लिख रहे होंगे और कोड का उपयोग करेंगे। उदाहरण के लिए, और विवादास्पद रूप से, गणना करने वाले लोग स्वच्छ संकेतन जैसे कि का उपयोग करके कई गणितीय समूहों से आगे निकल जाते हैं, जिनका मूल्यांकन 1 के रूप में किया जाता है, यदि सत्य और 0 यदि असत्य हैं, तो अनावश्यक औपचारिकता जैसे I ( x > 0) के बजाय ) ; यहाँ मैं केवल डोनाल्ड नथ के पीछे चल रहा हूँ। (x>0)I(x>0)
निक कॉक्स

जब भी प्रायिकता की बात आती है, तो @ नैककॉक्स मैं आम तौर पर केवल फॉर्म देखता हूं ; अन्यथा, x > 0 केवल एक असमानता बाधा है। जब गणितीय समीकरणों की बात आती है, तो वे या तो टुकड़े के प्रतिनिधित्व में टूट जाते हैं या वे समीकरण को एक असमानता के रूप में दर्शाते हैं, अन्यथा ऐसा करने से अस्पष्टता उत्पन्न होती है। (यह गणित में कैसे = के समान है या तो या अधिकांश प्रोग्रामिंग भाषाओं में अधिक सूक्ष्म है ; यह एक वास्तविक असाइनमेंट या समानता की जांच के बजाय एक बाधा या परिभाषा का परिचय देता है।)I(x>0)x>0====
JAB

4

प्रतिरूपण के लिए पहले से ही सुपरस्क्रिप्ट का उपयोग किया जाता है।

गणित में क्षेत्र के आधार पर बाएँ और दाएँ का उपयोग किया जाता है। पसंद हमेशा ऐतिहासिक विरासत होती है, इससे ज्यादा कुछ नहीं। जो भी पहली बार मैदान में उतरे, उन्होंने उप- या सुपरस्क्रिप्ट के उपयोग का सम्मेलन निर्धारित किया।

दो उदाहरण। डेरिवेटिव्स को दर्शाने के लिए सुपरस्क्रिप्ट का उपयोग किया जाता है: (एक्स)(n)

में टेन्सर बीजगणित दोनों सुपर और सबस्क्रिप्ट की तरह एक ही बात के लिए भारी इस्तेमाल कर रहे हैं हो सकता है मैं पंक्तियों और जे कॉलम। यह काफी स्पष्ट है: T k i = R j i C k jआरमैंमैंमैंजेटीमैं=आरमैंजेसीजे

इसके अलावा, मैं भौतिकी में अक्षरों (प्रिस्क्रिप्शन) से पहले स्क्रिप्ट का उपयोग करना याद करता हूं, उदाहरण के लिए i j B l k । मुझे लगता है कि यह दसियों के साथ था।jiBkl

इसलिए, Ng द्वारा सुपरस्क्रिप्ट्स का चुनाव विशुद्ध रूप से ऐतिहासिक भी है। उपयोग करने या न करने का कोई वास्तविक कारण नहीं है, या उन्हें सदस्यता के लिए पसंद करते हैं। दरअसल, मेरा मानना ​​है कि यहां एमएल लोग टेंसन नोटेशन का इस्तेमाल कर रहे हैं। वे निश्चित रूप से विषय में पारंगत हैं, उदाहरण के लिए इस पेपर को देखें ।


1
अपनी बात के लिए एक और उदाहरण: आइंस्टीन नोटेशन
नील जी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.