distance-functions पर टैग किए गए जवाब

डिस्टेंस फ़ंक्शंस एक सेट के सदस्यों के बीच या वस्तुओं के बीच की दूरी की धारणा को निर्धारित करने के लिए उपयोग किए जाने वाले कार्यों को संदर्भित करते हैं।

8
यूक्लिडियन दूरी उच्च आयामों में एक अच्छी मीट्रिक क्यों नहीं है?
मैंने पढ़ा कि 'यूक्लिडियन दूरी उच्च आयामों में एक अच्छी दूरी नहीं है'। मुझे लगता है कि इस कथन का आयामीता के अभिशाप से कुछ लेना देना है, लेकिन वास्तव में क्या? इसके अलावा, 'उच्च आयाम' क्या है? मैं 100 विशेषताओं के साथ यूक्लिडियन दूरी का उपयोग करते हुए पदानुक्रमिक …

6
एक क्लस्टरिंग विधि का चयन
समान मामलों को समूह में सेट किए गए डेटा पर क्लस्टर विश्लेषण का उपयोग करते समय, किसी को बड़ी संख्या में क्लस्टरिंग विधियों और दूरी के उपायों के बीच चयन करने की आवश्यकता होती है। कभी-कभी, एक विकल्प दूसरे को प्रभावित कर सकता है, लेकिन तरीकों के कई संभावित संयोजन …

6
K- साधन क्लस्टरिंग एल्गोरिदम केवल यूक्लिडियन दूरी मीट्रिक का उपयोग क्यों करता है?
क्या दक्षता या कार्यक्षमता के संदर्भ में एक विशिष्ट उद्देश्य है कि k- साधन एल्गोरिथ्म उदाहरण के लिए cosine (डिस) समानता का उपयोग दूरी मीट्रिक के रूप में क्यों नहीं करता है, लेकिन केवल यूक्लिडियन मानदंड का उपयोग कर सकता है? सामान्य तौर पर, जब यूक्लिडियन की तुलना में अन्य …

3
दो सामान्य रूप से वितरित यादृच्छिक चर के बीच यूक्लिडियन दूरी का वितरण क्या है?
मान लें कि आपको दो ऑब्जेक्ट दिए गए हैं जिनके सटीक स्थान अज्ञात हैं, लेकिन ज्ञात मापदंडों के अनुसार सामान्य वितरण के अनुसार वितरित किए जाते हैं (जैसे और । हम यह मान सकते हैं कि इन दोनों द्विचर Normals, ऐसी है कि पदों एक वितरण पर द्वारा वर्णित हैं …

2
कुल्बैक-लिब्लर बनाम कोलमोगोरोव-स्मिरनोव दूरी
मैं देख सकता हूं कि कुल्बैक-लिब्लर बनाम कोलमोगोरोव-स्मिरनोव दूरी उपायों के बीच बहुत सारे औपचारिक अंतर हैं। हालांकि, दोनों का उपयोग वितरण के बीच की दूरी को मापने के लिए किया जाता है। क्या एक विशिष्ट स्थिति है जहां एक को दूसरे के बजाय इस्तेमाल किया जाना चाहिए? ऐसा करने …

2
मिश्रित प्रकार के डेटा के साथ पदानुक्रमिक क्लस्टरिंग - किस दूरी / समानता का उपयोग करना है?
मेरे डेटासेट में हमारे पास निरंतर और स्वाभाविक रूप से दोनों प्रकार के असतत चर हैं। मैं जानना चाहता हूं कि क्या हम दोनों प्रकार के चर का उपयोग करके पदानुक्रमिक क्लस्टरिंग कर सकते हैं। और यदि हाँ, तो क्या दूरी नापना उचित है?

1
विभिन्न दूरी और विधियों द्वारा प्राप्त पदानुक्रमित क्लस्टरिंग डेंड्रोग्राम की तुलना करना
[प्रारंभिक शीर्षक "पदानुक्रमित पेड़ों के लिए समानता का मापन" बाद में इस विषय को बेहतर ढंग से प्रतिबिंबित करने के लिए @ttnphns द्वारा बदल दिया गया था] मैं रोगी रिकॉर्ड्स (जैसे http://www.biomedcentral.com/1471-2105/5/126/figure/F1?highres=y ) के डेटाफ़्रेम पर कई श्रेणीबद्ध क्लस्टर विश्लेषण कर रहा हूं । मैं पेड़ के अंतिम समूहों / …

5
दो बहुभिन्नरूपी वितरणों के बीच "दूरी" को मापना
मैं कुछ अच्छी शब्दावली की तलाश कर रहा हूं जो यह बताने के लिए कि मैं क्या करने की कोशिश कर रहा हूं, संसाधनों की तलाश करना आसान बनाता है। तो, मान लीजिए कि मेरे पास A और B के दो-दो क्लस्टर हैं, प्रत्येक दो मानों, X और Y से …

2
क्या दो वितरणों के बीच हेलिंगर दूरी का एक निष्पक्ष अनुमानक है?
एक सेटिंग में जहां कोई देखता है को घनत्व साथ एक वितरण से वितरित किया , मुझे आश्चर्य है कि अगर घनत्व , अर्थात् लिए एक और वितरण के लिए Hellinger दूरी का एक निष्पक्ष अनुमानक ( आधार पर ) है।X1,…,XnX1,…,XnX_1,\ldots,X_nfffXiXiX_if0f0f_0H(f,f0)={1−∫Xf(x)f0(x)−−−−−−−−√dx}1/2.H(f,f0)={1−∫Xf(x)f0(x)dx}1/2. \mathfrak{H}(f,f_0) = \left\{ 1 - \int_\mathcal{X} \sqrt{f(x)f_0(x)} \text{d}x \right\}^{1/2}\,.

1
भारित यूक्लिडियन दूरी का उपयोग कब करें और उपयोग करने के लिए भार कैसे निर्धारित करें?
मेरे पास डेटा का एक सेट है जहां प्रत्येक डेटा में nnn अलग-अलग उपाय होते हैं। प्रत्येक उपाय के लिए, मेरे पास एक बेंचमार्क मूल्य है। मैं जानना चाहता हूं कि प्रत्येक डेटा बेंचमार्क मान के कितना करीब है। मैंने इस तरह भारित यूक्लिडियन दूरी का उपयोग करने के बारे …

3
क्या पदानुक्रमित क्लस्टरिंग में वार्ड के इंटर-क्लस्टर लिंकेज के साथ मैनहट्टन की दूरी का उपयोग करना ठीक है?
मैं समय श्रृंखला डेटा का विश्लेषण करने के लिए पदानुक्रमित क्लस्टरिंग का उपयोग कर रहा हूं। मेरा कोड मैथेमेटिका फ़ंक्शन का उपयोग करके लागू किया गया है DirectAgglomerate[...], जो निम्नलिखित इनपुट दिए गए पदानुक्रमित समूहों को उत्पन्न करता है: एक दूरी मैट्रिक्स डी इंटर-क्लस्टर लिंकेज निर्धारित करने के लिए उपयोग …

1
क्लस्टरिंग: क्या मुझे जेन्सेन-शैनन डायवर्जेंस या इसके वर्ग का उपयोग करना चाहिए?
मैं एफर्टिनिटी प्रॉपेगोरिथम एल्गोरिथ्म का उपयोग करके प्रायिकता के वितरण को रोक रहा हूं, और मेरी दूरी मीट्रिक के रूप में जेन्सेन-शैनन डाइवर्जेंस का उपयोग करने की है। क्या जेएसडी को दूरी, या जेएसडी वर्ग के रूप में उपयोग करना सही है? क्यों? एक या दूसरे को चुनने से क्या …

3
या
क्या कोई L 2 की बजाय क्लस्टरिंग के लिए या L .5 मेट्रिक्स का उपयोग करता है ? अग्रवाल एट अल।, उच्च आयामी अंतरिक्ष में दूरी मैट्रिक्स के आश्चर्यजनक व्यवहार पर (2001 में) कहा किL1L1L_1L.5L.5L_.5L2L2L_2 लगातार अधिक बेहतर है तोउच्च आयामी डेटा खनन अनुप्रयोगों के लिएयूक्लिडियन दूरी मीट्रिक एल 2L1L1L_1L2L2L_2 …

3
यूक्लिडियन दूरी स्कोर और समानता
मैं सिर्फ कलेक्टिव इंटेलिजेंस (टोबी सेगरान की किताब) के साथ काम कर रहा हूं और यूक्लिडियन दूरी के स्कोर पर आया हूं। पुस्तक में लेखक दिखाता है कि दो अनुशंसा सरणियों (यानी बीच समानता की गणना कैसे करें ।व्यक्ति × फिल्म ↦ स्कोर )person×movie↦score)\textrm{person} \times \textrm{movie} \mapsto \textrm{score}) वह दो …

1
PROC मिश्रित और l / lmer के बीच अंतर R- स्वतंत्रता की डिग्री में
नोट: यह प्रश्न एक रिपॉजिट है, क्योंकि मेरे पिछले प्रश्न को कानूनी कारणों से हटाना पड़ा था। आर में पैकेज lmeसे फ़ंक्शन के साथ एसएएस से PROC MIXED की तुलना करते समय nlme, मैंने कुछ अंतर भ्रामक मतभेदों पर ठोकर खाई। विशेष रूप से, विभिन्न परीक्षणों में स्वतंत्रता की डिग्री …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.