loss-functions पर टैग किए गए जवाब

एक फ़ंक्शन एक मॉडल के अनुसार मनाया डेटा और अनुमानित मूल्यों के बीच अंतर को निर्धारित करने के लिए उपयोग किया जाता है। नुकसान कार्यों का न्यूनतमकरण मॉडल के मापदंडों का अनुमान लगाने का एक तरीका है।

2
K- साधनों को ढाल वंश का उपयोग करके अनुकूलित क्यों नहीं किया जाता है?
मुझे पता है कि k- साधन आमतौर पर एक्सपेक्टेशन मैक्सिमाइजेशन का उपयोग करके अनुकूलित किया जाता है । हालाँकि हम इसके नुकसान फ़ंक्शन को उसी तरह से अनुकूलित कर सकते हैं जिस तरह से हम किसी अन्य को अनुकूलित करते हैं! मुझे कुछ कागजात मिले जो वास्तव में बड़े पैमाने …

2
शोर लेबल के साथ वर्गीकरण?
मैं वर्गीकरण के लिए एक तंत्रिका नेटवर्क को प्रशिक्षित करने की कोशिश कर रहा हूं, लेकिन मेरे पास जो लेबल हैं वे शोरगुल हैं (लगभग 30% लेबल गलत हैं)। क्रॉस-एन्ट्रापी नुकसान वास्तव में काम करता है, लेकिन मैं सोच रहा था कि क्या इस मामले में कोई विकल्प अधिक प्रभावी …

1
पूर्वाग्रह-विघटन अपघटन
बिशप के पैटर्न मान्यता और मशीन लर्निंग की धारा 3.2 में , वह पूर्वाग्रह-विघटन अपघटन पर चर्चा करता है, जिसमें कहा गया है कि एक चुकता नुकसान फ़ंक्शन के लिए, अपेक्षित नुकसान एक स्क्वैयर बायस टर्म में विघटित हो सकता है (जो वर्णन करता है कि अब तक औसत पूर्वानुमान …

1
0-1 नुकसान के लिए भोला बेयर्स क्लासिफायरियर क्यों है?
अनुभवहीन Bayes वर्गीकारक वर्गीकारक जो प्रदान करती है आइटम है xxx एक वर्ग के लिए CCC पीछे अधिकतम के आधार पर P(C|x)P(C|x)P(C|x) वर्ग की सदस्यता के लिए, और मानता है कि वस्तुओं की सुविधाओं से स्वतंत्र हैं। 0-1 नुकसान वह नुकसान है जो किसी भी मिस-वर्गीकरण को "1" का नुकसान …

2
क्यों 0-1 नुकसान समारोह अचूक है?
इयान गुडफेलो की डीप लर्निंग किताब में, यह लिखा है कि कभी-कभी, नुकसान समारोह जिसे हम वास्तव में परवाह करते हैं (कहते हैं, वर्गीकरण त्रुटि) वह नहीं है जिसे कुशलता से अनुकूलित किया जा सकता है। उदाहरण के लिए, अनुमानित 0-1 नुकसान को कम करना आमतौर पर एक रेखीय क्लासिफायरियर …

2
क्रॉस एन्ट्रापी लॉस फ़ंक्शन की विभिन्न परिभाषाएं
मैंने न्यूरल नेटवर्क्स के साथ तंत्रिका नेटवर्क के बारे में सीखना शुरू कर दिया है। डॉट कॉम ट्यूटोरियल। तीसरे अध्याय में विशेष रूप से क्रॉस एन्ट्रापी फ़ंक्शन के बारे में एक अनुभाग है, और क्रॉस एन्ट्रापी नुकसान को परिभाषित करता है: C=−1n∑x∑j(yjlnaLj+(1−yj)ln(1−aLj))C=−1n∑x∑j(yjln⁡ajL+(1−yj)ln⁡(1−ajL))C = -\frac{1}{n} \sum\limits_x \sum\limits_j (y_j \ln a^L_j + …

1
लॉजिस्टिक लॉस फंक्शन के लिए ग्रेडिएंट
मैं इस एक से संबंधित एक प्रश्न पूछूंगा । मुझे यहाँ xgboost के लिए कस्टम लॉस फंक्शन लिखने का एक उदाहरण मिला : loglossobj <- function(preds, dtrain) { # dtrain is the internal format of the training data # We extract the labels from the training data labels <- getinfo(dtrain, …

5
सीएनएन में फेस / नॉन-फेस डिटेक्शन में बाइनरी डिटेक्शन के लिए मुझे किस नुकसान का उपयोग करना चाहिए?
मैं फेस / नॉन-फेस बाइनरी डिटेक्शन को प्रशिक्षित करने के लिए डीप लर्निंग का उपयोग करना चाहता हूं, मुझे किस नुकसान का उपयोग करना चाहिए, मुझे लगता है कि यह सिग्मोइडक्रॉसइंटरप्रॉपली या हिंग-लॉस है । क्या यह सही है, लेकिन मुझे भी आश्चर्य है कि मुझे सॉफ्टमैक्स का उपयोग करना …

1
नुकसान के कार्य का दूसरा क्रम सन्निकटन (गहरी शिक्षा पुस्तक, 7.33)
गुडफेलो की (2016) पुस्तक में गहन अध्ययन पर, उन्होंने L2 नियमितीकरण ( https://www.deeplearningbook.org/contents/ अनियमितization.html पृष्ठ 247) पर शीघ्र रोक लगाने की बात की । लागत समारोह का द्विघात अनुमान है:jjj J^(θ)=J(w∗)+12(w−w∗)TH(w−w∗)J^(θ)=J(w∗)+12(w−w∗)TH(w−w∗)\hat{J}(\theta)=J(w^*)+\frac{1}{2}(w-w^*)^TH(w-w^*) जहां हेसियन मैट्रिक्स (Eq। 7.33) है। क्या यह बीच का शब्द याद आ रहा है? टेलर विस्तार होना चाहिए: …

3
उच्च परिशुद्धता या उच्च रिकॉल बाइनरी क्लासिफायरफ़ायर प्राप्त करने के लिए किसी व्यक्ति को किस हानि कार्य का उपयोग करना चाहिए?
मैं वस्तुओं का एक डिटेक्टर बनाने की कोशिश कर रहा हूं जो बहुत कम (छवियों में) होता है, एक स्लाइडिंग / रिसाइज्ड विंडो में लागू सीएनएन बाइनरी क्लासिफायरियर का उपयोग करने की योजना है। मैंने संतुलित 1: 1 पॉजिटिव-निगेटिव ट्रेनिंग और टेस्ट सेट का निर्माण किया है (क्या इस तरह …

1
स्किकिट बिनोमियल डिविज़न लॉस फंक्शन
यह स्कैडिट ग्रैडिएंटबॉस्टिंग का द्विपद अवमूल्यन हानि कार्य है, def __call__(self, y, pred, sample_weight=None): """Compute the deviance (= 2 * negative log-likelihood). """ # logaddexp(0, v) == log(1.0 + exp(v)) pred = pred.ravel() if sample_weight is None: return -2.0 * np.mean((y * pred) - np.logaddexp(0.0, pred)) else: return (-2.0 / …

2
प्रतिशत हानि के कार्य
समस्या का हल: minmE[|m−X|]minmE[|m−X|] \min_{m} \; E[|m-X|] एक्स के माध्यिका के रूप में अच्छी तरह से जाना जाता है XXX, लेकिन नुकसान का प्रतिशत अन्य प्रतिशत के लिए कैसा दिखता है? Ex: X का 25 वाँ प्रतिशतक इसका समाधान है: minmE[L(m,X)]minmE[L(m,X)] \min_{m} \; E[ L(m,X) ] इस मामले में एल …

3
एमएपी के लिए एक समाधान है
मैं एक ऑनलाइन पाठ्यक्रम में इन स्लाइड्स (स्लाइड # 16 & # 17) पर आया हूं । प्रशिक्षक यह समझाने की कोशिश कर रहा था कि अधिकतम पोस्टीरियर एस्टीमेट (एमएपी) वास्तव में समाधान , जहां the है असली पैरामीटर।θ *ल ( θ ) = मैं[ Θ ≠ θ*]L(θ)=I[θ≠θ∗]L(\theta) = \mathcal{I}[\theta …

1
एक seq2seq RNN मॉडल को स्कोर करने के लिए मुझे किस हानि कार्य का उपयोग करना चाहिए?
मैं चो 2014 पेपर के माध्यम से काम कर रहा हूं जिसने seq2seq मॉडलिंग के लिए एनकोडर-डिकोडर आर्किटेक्चर पेश किया। कागज में, वे दिए गए आउटपुट इनपुट की संभावना (या यह नकारात्मक-लॉग-संभावना) का उपयोग करते हैं, लंबाई इनपुट और लंबाई आउटपुट के लिए नुकसान फ़ंक्शन के रूप में :एम वाई …

1
एक अनुमानक जो स्क्वेयर्ड बायस की एक भारित राशि को कम करता है और विचरण निर्णय सिद्धांत में फिट होता है?
ठीक है - मेरा मूल संदेश एक प्रतिक्रिया प्राप्त करने में विफल रहा; इसलिए, मुझे प्रश्न को एक अलग तरीके से रखना चाहिए। मैं एक निर्णय सिद्धांत से परिप्रेक्ष्य की मेरी समझ की व्याख्या करके शुरू करूंगा। मेरे पास कोई औपचारिक प्रशिक्षण नहीं है और यह मुझे आश्चर्यचकित नहीं करेगा …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.