यह कैसे साबित किया जाए


9

मैं असमानता को स्थापित करने की कोशिश कर रहा हूं

|Ti|=|XiX¯|Sn1n

कहाँ पे X¯नमूना माध्य है और नमूना मानक विचलन है, जो ।SS=i=1n(XiX¯)2n1

यह देखना आसान है कि और so लेकिन मैं जो खोज रहा हूं, वह बहुत करीब नहीं है और न ही यह एक उपयोगी बाध्य है। मैंने काऊची-श्वार्ज़ और त्रिकोण असमानताओं के साथ प्रयोग किया है, लेकिन कहीं नहीं गया है। एक सूक्ष्म कदम होना चाहिए कि मैं कहीं गायब हूं। मैं कुछ मदद की सराहना करता हूं, धन्यवाद।i=1nTi2=n1|Ti|<n1

जवाबों:


10

यह सैमुएलसन की असमानता है और इसे इसकी आवश्यकता है संकेत। यदि आप विकिपीडिया संस्करण लेते हैं और इसे फिर से काम करते हैंn1 की परिभाषा S, आप पाएंगे कि यह बन जाता है

|XiX¯|Sn1n

यह पुस्तक में एक सख्त असमानता के रूप में दिया गया है, लेकिन मैंने इसे तय किया है, धन्यवाद।
जॉनके

5

नियमित प्रक्रियाओं के माध्यम से समस्या को सरल बनाने के बाद, इसे एक दोहरे न्यूनतमकरण कार्यक्रम में परिवर्तित करके हल किया जा सकता है, जिसका प्राथमिक प्रमाण एक प्रसिद्ध उत्तर है। शायद यह दोहराव प्रश्न में संदर्भित "सूक्ष्म कदम" है। असमानता को अधिकतम यांत्रिक तरीके से अधिकतम करके स्थापित किया जा सकता है|Ti| लैगरेंज मल्टीप्लायरों के माध्यम से

सबसे पहले, मैं कम से कम वर्गों की ज्यामिति के आधार पर अधिक सुरुचिपूर्ण समाधान प्रदान करता हूं। इसके लिए कोई प्रारंभिक सरलीकरण की आवश्यकता नहीं है और यह परिणाम में प्रत्यक्ष अंतर्ज्ञान प्रदान करते हुए लगभग तत्काल है। जैसा कि सवाल में सुझाव दिया गया है, समस्या कॉची-श्वार्ज असमानता को कम करती है।


ज्यामितीय समाधान

विचार करें x=(X1,X2,,Xn) एक के रूप में nसामान्य डॉट उत्पाद के साथ यूक्लिडियन अंतरिक्ष में आयामी वेक्टर। चलोy=(0,0,,0,1,0,,0) बनो ith आधार वेक्टर और 1=(1,1,...,1)। लिखोएक्स^ तथा y^ के orthogonal अनुमानों के लिए एक्स तथा y के ऑर्थोगोनल पूरक में 1। (सांख्यिकीय शब्दावली में, वे साधनों के संबंध में अवशिष्ट हैं।) फिर, तब सेएक्समैं-एक्स¯=एक्स^y तथा एस=||एक्स^||/n-1,

|टीमैं|=n-1|एक्स^y|||एक्स^||=n-1|एक्स^y^|||एक्स^||

का घटक है y^ में एक्स^दिशा। कॉची-श्वार्ज़ द्वारा, यह ठीक उसी समय अधिकतम होता हैएक्स^ के समानांतर है y^=(-1,-1,...,-1,n-1,-1,-1,...,-1)/n, जिसके लिए

टीमैं=±n-1y^y^||y^||=±n-1||y^||=±n-1n,
QED।

संयोग से, यह समाधान उन सभी मामलों की एक विस्तृत विशेषता प्रदान करता है जहां |टीमैं| अधिकतम है: वे सभी फॉर्म के हैं

x=σy^+μ1=σ(1,1,,1,n1,1,1,,1)+μ(1,1,,1)

सभी वास्तविक के लिए μ,σ

यह विश्लेषण उस मामले में आसानी से सामान्य हो जाता है जहां {1}रजिस्टरों के किसी भी सेट द्वारा प्रतिस्थापित किया जाता है। जाहिर है की अधिकतमTi के अवशिष्ट की लंबाई के आनुपातिक है y, ||y^||


सरलीकरण

चूंकि Ti स्थान और पैमाने के परिवर्तन के तहत अपरिवर्तनीय है, हम मान सकते हैं कि सामान्यता का कोई नुकसान नहीं है कि Xi शून्य और उनके वर्ग के योग n1। इससे पहचान होती है|Ti| साथ में |Xi|, जबसे S (माध्य वर्ग) है 1। इसे अधिकतम करना अधिकतम करने के लिए समान है|Ti|2=Ti2=Xi2। लेने से कोई व्यापकता नहीं खोतीi=1, या तो, के बाद से Xi विनिमेय हैं।


दोहरे सूत्रीकरण के माध्यम से समाधान

के मान को ठीक करने के लिए एक दोहरी समस्या है X12 और शेष के मूल्यों को पूछें Xj,j1वर्गों की राशि को कम करने के लिए आवश्यक हैंj=1nXj2 मान लीजिये j=1nXj=0। चूंकिX1 दिया जाता है, यह कम से कम समस्या है j=2nXj2 मान लीजिये j=2nXj=X1

इसका समाधान कई तरह से आसानी से मिल जाता है। सबसे प्राथमिक में से एक लिखना है

Xj=X1n1+εj, j=2,3,,n

for which j=2nεj=0. Expanding the objective function and using this sum-to-zero identity to simplify it produces

j=2nXj2=j=2n(X1n1+εj)2=(X1n1)22X1n1εj+εj2=Constant+εj2,

immediately showing the unique solution is εj=0 for all j. For this solution,

(n1)S2=X12+(n1)(X1n1)2=(1+1n1)X12=nn1X12

and

|Ti|=|X1|S=|X1|n(n1)2X12=n1n,

QED.


Solution via machinery

Return to the simplified program we began with:

Maximize X12

subject to

i=1nXi=0 and i=1nXi2(n1)=0.

The method of Lagrange multipliers (which is almost purely mechanical and straightforward) equates a nontrivial linear combination of the gradients of these three functions to zero:

(0,0,,0)=λ1D(X12)+λ2D(i=1nXi)+λ3D(i=1nXi2(n1)).

Component by component, these n equations are

0=2λ1X1+λ2+2λ3X10=λ2+2λ3X20=0=λ2+2λ3Xn.

The last n1 of them imply either X2=X3==Xn=λ2/(2λ3) or λ2=λ3=0. (We may rule out the latter case because then the first equation implies λ1=0, trivializing the linear combination.) The sum-to-zero constraint produces X1=(n1)X2. The sum-of-squares constraint provides the two solutions

X1=±n1n; X2=X3==Xn=1n.

They both yield

|Ti|=|X1||±n1n|=n1n.

Thank you for your addendum, geometry is very powerful and of all three solutions it is the most intuitive to me.
JohnK

0

The inequality as stated is true. It is quite clear intuitively that we get the most difficult case for the inequality (that is, maximizing the left hannd side for given S2) by choosing one value, say x1 as large as possible while having all the others equal. Let us look at an example with such configuration:

n=4,x1=x2=x3=0,x4=4,x¯=1,S2=4,
now |xix¯|S={12 or 32 depending on i, while the given upper limit is equal to 412=1.5 which is just enough. That idea can be completed to a proof.

EDIT

We will now prove the claim, as hinted above. First, for any given vector x=(x1,x2,,xn) in this problem, we can replace it with xx¯ without changing either side of the inequality above. So, in the following let us assume that x¯=0. We can also by relabelling assume that x1 is largest. Then, by choosing first x1>0 and then x2=x3==xn=x1n1 we can check by simple algebra that we have equality in the claimed inequality. So, it is sharp.

Then, define the (convex) region R by

R={xR:x¯=0,(xix¯)2/(n1)S2}
for a given positive constant S2. Note that R is the intersection of a hyperplane with a sphere centered at the origin, so is a sphere in (n1)-space. Our problem can now be formulated as
maxxRmaxi|xi|
since an x maximizing that will be the most difficult case for the inequality. This is a problem of finding the maximum of a convex function over a convex set, which in general are difficult problems (minimums are easy!). But, in this case the convex region is a sphere centered on the origin, and the function we want to maximize is the absolute value of the coordinates. It is obvious that that maximum is found at the boundary sphere of R, and by taking |x1| maximal, our first test case is forced.

@JohnK you can delete your comments now, the post is corrected
kjetil b halvorsen

Although this answer shows that the inequality (assuming it is true, which it is) is tight, it isn't evident how that single calculation could be "completed to a proof." Could you provide some indication of how that would be done?
whuber

Will, but tomorrow, now I have to prepare tomorrows class.
kjetil b halvorsen

Thank you--I appreciate your careful formulation of the problem. But your "proof" seems to come to the statement that "it is obvious that." You could always apply Lagrange multipliers to finish the job, but it would be nice to see an approach that (a) actually is a proof and (b) provides insight.
whuber

2
@whuber If you have the time, I would appreciate it if you can post your Lagrange multipliers solution. I think the inequality overall is not as famous as it should be.
JohnK
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.