पी- बॉल से एकसमान शोर उत्पन्न करें (( )


11

मैं एक फ़ंक्शन लिखने की कोशिश कर रहा हूं जो समान रूप से वितरित शोर उत्पन्न करता है जो आयामों के पी-नोर्मल बॉल से आता है :n

||x||pr

मुझे हलकों ( ) ( http://mathworld.wolfram.com/DiskPointPicking.html ) के लिए संभावित समाधान मिल गए हैं , हालांकि मुझे विभिन्न मूल्यों के लिए इसे विस्तारित करने में परेशानी है ।p=2p

मैंने इसे एक समान वितरण से सिर्फ एक यादृच्छिक नमूना खींचकर, और दिए गए अवरोध को पूरा नहीं करने पर फिर से तैयार करने की कोशिश की है। हालाँकि यह एक बदसूरत समाधान होने के अलावा उच्च आयामों के लिए भी कम्प्यूटेशनल रूप से प्रभावी है।


1
उत्तर यहां यूक्लिडियन दूरी (पी = 2) का उपयोग करके n आयामों के साथ एक क्षेत्र के लिए पाया जा सकता है। math.stackexchange.com/questions/87230/ ... मैं अभी भी निश्चित नहीं हूं कि विभिन्न पी-मानदंडों के लिए इसका उपयोग कैसे किया जा सकता है, क्या मैं कर सकता हूं बस दूरी के लिए एक अलग संबंध में इस्तेमाल यूक्लिडियन दूरी को बदल दें?
ताके दे हन

2
बहुत सारे कागज़ात हैं, लेकिन अधिकांश पेवाल के पीछे हैं: link.springer.com/article/10.1007/s00184-011-0360-x या google.com/…
kjetil b halvorsen

3
क्या मात्रा मीट्रिक के संबंध में "वर्दी"? आखिरकार, यदि आप एक -बॉल का उपयोग कर रहे हैं, तो यूक्लिडियन की मात्रा क्यों होगी ? p
whuber

@ जब भी मुझे ईमानदारी से यकीन है कि यह स्पष्ट रूप से असाइनमेंट में नहीं बताया गया है, लेकिन मैं किसी भी अन्य मीट्रिक इस मामले में मनमाना लगता है के बाद से पी-आदर्श में उम्मीद करेंगे।
ताके दे हन

1
समस्या मशीन लर्निंग असाइनमेंट से आती है; "समस्या 204 आयामों में दो-स्तरीय वर्गीकरण की समस्या है। छोटे लेबल वाले प्रशिक्षण सेट में प्रति वर्ग 50 नमूनों का आकार होता है। अनलिस्टेड डेटा 20,000 अतिरिक्त नमूने प्रदान करता है। इन नमूनों में किसी प्रकार का भ्रष्टाचार हुआ है।" इस भ्रष्टाचार के बारे में हमारे पास केवल अतिरिक्त जानकारी है, यह है कि यह additive एकसमान शोर है और यह शोर एक निश्चित पी- से आता है, , जहां और त्रिज्या दोनों अज्ञात हैं। " मुझे अनलिस्टेड डेटा पर सबसे कम त्रुटि दर प्राप्त करने की आवश्यकता है। पी आर||x||prpr
ताके दे हन

जवाबों:


5

मुझे kjetil b halvorsen ( https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=758215 ) द्वारा सुझाए गए एक पेपर में पूरा हल मिला । मुझे ईमानदारी से इसके पीछे के गणित को समझने में परेशानी है, लेकिन अंतिम एल्गोरिथ्म काफी सरल है। यदि हमारे पास आयाम हैं, तो एक त्रिज्या और मानदंड :आर पीnrp

1) स्वतंत्र रैंडम असली स्केलर्स , जहां ) उत्पन्न करता है, सामान्यीकृत गौशाला वितरण (एक अलग शक्ति के साथ है प्रतिपादक सिर्फ बजाय )ε मैं = ˉ जी ( 1 / पी , पी ) ˉ जी ( μ , σ 2 ) - | x | पी पी = nεi=G¯(1/p,p)G¯(μ,σ2)e|x|pp=2

2) घटकों के वेक्टर का निर्माण करें , जहां स्वतंत्र यादृच्छिक संकेत हैंs iε i s ixsiεisi

3) उत्पन्न , जहां एक यादृच्छिक चर समान रूप से अंतराल में वितरित किया जाता है [0, 1]। wz=w1/nw

4) वापसीy=rzx||x||p


2
पूर्णता के लिए, क्या आप बता सकते हैं कि आपके उत्तर में क्या है ? G
स्टीफन लॉरेंट

इसे अपडेट किया गया है
ताके डे हन

2
जी सामान्यीकृत गौसियन वितरण है (घातांक में एक अलग शक्ति के साथ सिर्फ बजाय )। यह वेक्टर लिए वितरण को बनाएगा , जो कई स्वतंत्र सामान्यीकृत गाऊसी वितरित चर , जो कि p- मान पर निर्भर एकल pdfs का उत्पाद है। पी = 2 एक्स एक्स मैं( एक्स ) α - | x | पी पीe|x|pp=2xxi
f(x)e|x|pp
Sextus Empiricus

@MartijnWeterings बहुत बहुत धन्यवाद, इसे अपडेट किया गया है।
ताके दे हन

धन्यवाद। जानकारी के लिए, आर पैकेज pgnorm में इस वितरण का एक नमूना है ।
स्टीफन लॉरेंट

3

समरूप रूप से वितरित बहुभिन्नरूपी चर का उपयोग करना

Taeke एक लेख के लिए एक लिंक प्रदान करता है जिसे नीचे दिया गया पाठ विशेष रूप से 2-मानक और 1-मानक मामलों की व्याख्या करके अधिक सहज बनाता है।

2-मानकx2r

नमूना दिशा

आप इस परिणाम का उपयोग कर सकते हैं http://mathworld.wolfram.com/HyperspherePointPicking.html

एक बहुभिन्नरूपी गौसियन वितरित चर (पहचान सहसंयोजक मैट्रिक्स के साथ) केवल दूरी या वर्गों के योग पर निर्भर करता है।X

f(X1,X2,...,Xn)=1in12πe12xi2=12πe121inxi2

इस प्रकार समान रूप से n- आयामी-हाइपरस्फेयर की सतह पर वितरित किया जाता है।XX2


नमूना दूरी

पूरा करने के लिए आपको केवल दूरी का नमूना लेना होगा, एक गोले में सजातीय वितरण को एक गेंद में एक सजातीय वितरण में बदलने के लिए। (जो डिस्क पॉइंट पिकिंग के लिए आपके लिंक किए गए उदाहरण के समान है या कम है)

यदि आप बस एक समान वितरण के रूप में नमूना लेंगे तो आपके पास केंद्र के पास एक अपेक्षाकृत उच्च घनत्व होगा ( रूप में वॉल्यूम तराजू) इसलिए अंक का एक अंश एक वॉल्यूम में समाप्त होगा , जो अधिक घना है केंद्र के पास और इसका मतलब एक समान वितरण नहीं होगा)आर एन आर आर एन एनrrnrrn

यदि इसके बजाय आप एक समान वितरण से सैंपल किए गए वेरिएबल की रूट का उपयोग करते हैं , तो आपको एक समान वितरण मिलता है।n

1-मानकx1r

दिशा

इस मामले में आप गाऊसी वितरण के बजाय लाप्लास वितरण से नमूना लेते हैं और 1-मानक से विभाजित करते हैं। समान रूप से n आयामी 1-नोर्म क्षेत्र पर वितरित किया जाता है।एक्सXX|X|1

मेरे पास कोई औपचारिक सबूत नहीं है, बस अंतर्ज्ञान है

(चूँकि पीडीएफ स्थिति से स्वतंत्र है, आप किसी भी असीम क्षेत्र / आयतन के लिए समान 1-मान के साथ समान प्रायिकता अपेक्षा करेंगे और जब आप इसे इकाई सतह पर समाप्‍त करेंगे तो )f ( x ) d Af(x)dVf(x)dA

लेकिन सिमुलेशन के साथ परीक्षण अच्छा लग रहा है।

सिमुलेशन 20000 मूल्यों को समान रूप से वितरित उठा

library(rmutil)
x <- abs(rlaplace(20000))
y <- abs(rlaplace(20000))
z <- abs(rlaplace(20000))
rn <- abs(x)+abs(y)+abs(z)

xi <- (x/rn)
yi <- (y/rn)
zi <- (z/rn)
plot(sqrt(0.5)*(xi-yi),
     sqrt((0.5-0.5*(xi+yi))^2+zi^2),
     pc=21,bg=rgb(0,0,0,0.02), col=rgb(0,0,0,0),cex=1)

दूरी

दूरी 2-मानक मामले के साथ समान है (वॉल्यूम अभी भी रूप में तराजू है )।rn

पी-मानदंडxpr

इस मामले में, यदि आप एक ही सिद्धांत का पालन करना चाहते हैं, तो आपको (I hypothesize) के साथ वितरण से नमूना लेने की आवश्यकता होगी । ये सामान्यीकृत सामान्य वितरण हैं और संभवतः ताइके द्वारा उल्लिखित वितरण से संबंधित हैं। जी ( )f(x)e|x|pG()


1
क्या आप इस बारे में विस्तार से बता सकते हैं कि आप यूनिट वैक्टर को कैसे समान रूप से वितरित करते हैं? BTW, मेरा मानना ​​है कि आप वीं जड़ लेना चाहते हैं । p
whuber

1
आपकी मदद के लिए धन्यवाद, मुझे यहां पूरा समाधान मिला: ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=758215 )। मुझे ईमानदारी से इसके पीछे के गणित को समझने में परेशानी है, लेकिन अंतिम एल्गोरिथ्म काफी सरल है। अगर हमारे पास आयाम हैं, तो एक त्रिज्या और मानदंड : 1) n इंडिपेंडेंट रैंडम रियल स्केलर्स E_i = G (1 / p, p) 2) उत्पन्न करते हैं, घटकों के वेक्टर x का निर्माण करते हैं s_i * E_i, जहां__ स्वतंत्र यादृच्छिक संकेत हैं 3) उत्पन्न , जहां एक यादृच्छिक चर समान रूप से अंतराल में वितरित किया जाता है [0, 1]। 4) वापसीr p z = w 1 / n w y = r z xnrpz=w1/nwy=rzx||x||p
Taeke de Haan
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.