मेरा डेटा किस वितरण का अनुसरण करता है?


31

हम कहते हैं कि मेरे पास 1000 घटक हैं और मैं इस बात पर डेटा एकत्र कर रहा हूं कि ये कितनी बार असफलता का कारण बनते हैं और हर बार असफलता को स्वीकार करने के बाद, मैं इस बात पर भी नजर रख रहा हूं कि समस्या को ठीक करने में मेरी टीम को कितना समय लगा। संक्षेप में, मैं इन 1000 घटकों में से प्रत्येक के लिए मरम्मत के लिए समय (सेकंड में) रिकॉर्ड कर रहा हूं। इस प्रश्न के अंत में डेटा दिया गया है।

मैंने इन सभी मूल्यों को लिया और पैकेज descdistसे उपयोग करके R में एक Cullen और Frey ग्राफ़ को आकर्षित किया fitdistrplus। मेरी आशा यह समझने की थी कि क्या मरम्मत का समय किसी विशेष वितरण का अनुसरण करता है। यहां boot=500बूटस्ट्रैप्ड मान प्राप्त करने की साजिश है :

यहां छवि विवरण दर्ज करें

मैं देखता हूं कि यह कथानक मुझे बता रहा है कि अवलोकन बीटा वितरण (या शायद नहीं, किस मामले में, क्या खुलासा कर रहा है?) में आता है, अब यह देखते हुए कि मैं एक सिस्टम आर्किटेक्ट हूं और एक सांख्यिकीविद् नहीं, यह साजिश क्या है? ? (मैं इन परिणामों के पीछे एक व्यावहारिक वास्तविक दुनिया अंतर्ज्ञान की तलाश कर रहा हूं)।

संपादित करें:

QQplot qqPlotपैकेज में फ़ंक्शन का उपयोग करते हुए car। मैंने पहले fitdistrफ़ंक्शन का उपयोग करके आकार और पैमाने के मापदंडों का अनुमान लगाया ।

> fitdistr(Data$Duration, "weibull")
      shape          scale    
  3.783365e-01   5.273310e+03 
 (6.657644e-03) (3.396456e+02)

फिर, मैंने यह किया:

qqPlot(LB$Duration, distribution="weibull", shape=3.783365e-01, scale=5.273310e+03)

यहां छवि विवरण दर्ज करें

संपादित करें 2:

एक Lognormal QQplot के साथ अद्यतन करना।

यहां छवि विवरण दर्ज करें

यहाँ मेरा डेटा है:

c(1528L, 285L, 87138L, 302L, 115L, 416L, 8940L, 19438L, 165820L, 
540L, 1653L, 1527L, 974L, 12999L, 226L, 190L, 306L, 189L, 138542L, 
3049L, 129067L, 21806L, 456L, 22745L, 198L, 44568L, 29355L, 17163L, 
294L, 4218L, 3672L, 10100L, 290L, 8341L, 128L, 11263L, 1495243L, 
1699L, 247L, 249L, 300L, 351L, 608L, 186684L, 524026L, 1392L, 
396L, 298L, 1063L, 11102L, 6684L, 6546L, 289L, 465L, 261L, 175L, 
356L, 61652L, 236L, 74795L, 64982L, 294L, 95221L, 322L, 38892L, 
2146L, 59347L, 2118L, 310801L, 277964L, 205679L, 5980L, 66102L, 
36495L, 580277L, 27600L, 509L, 21795L, 21795L, 301L, 617L, 331L, 
250L, 123501L, 144L, 347L, 121443L, 211L, 232L, 445783L, 9715L, 
10308L, 1921L, 178L, 168L, 291L, 6915L, 6735L, 1008478L, 274L, 
20L, 3287L, 591208L, 797L, 586L, 170613L, 938L, 3121L, 249L, 
1497L, 24L, 1407L, 1217L, 1323L, 272L, 443L, 49466L, 323L, 323L, 
784L, 900L, 26814L, 2452L, 214713L, 3668L, 325L, 20439L, 12304L, 
261L, 137L, 379L, 2273L, 274L, 17760L, 920699L, 13L, 485644L, 
1243L, 226L, 20388L, 584L, 17695L, 1477L, 242L, 280L, 253L, 17964L, 
7073L, 308L, 260692L, 155L, 58136L, 16644L, 29353L, 543L, 276L, 
2328L, 254L, 1392L, 272L, 480L, 219L, 60L, 2285L, 2676L, 256L, 
234L, 1240L, 219714L, 102174L, 258L, 266L, 33043L, 530L, 6334L, 
94047L, 293L, 536L, 48557L, 4141L, 39079L, 23259L, 2235L, 17673L, 
28268L, 112L, 64824L, 127992L, 5291L, 51693L, 762L, 1070735L, 
179L, 189L, 157L, 157L, 122L, 1045L, 1317L, 186L, 57901L, 456126L, 
674L, 2375L, 1782L, 257L, 23L, 248L, 216L, 114L, 11662L, 107890L, 
203022L, 513L, 2549L, 146L, 53331L, 1690L, 10752L, 1648611L, 
148L, 611L, 198L, 443L, 10061L, 720L, 10L, 24L, 220L, 38L, 453L, 
10066L, 115774L, 97713L, 7234L, 773L, 90154L, 151L, 1560L, 222L, 
51558L, 214L, 948L, 208L, 1127L, 221L, 169L, 1528L, 78959L, 61566L, 
88049L, 780L, 6196L, 633L, 214L, 2547L, 19088L, 119L, 561L, 112L, 
17557L, 101086L, 244L, 257L, 94483L, 6189L, 236L, 248L, 966L, 
117L, 333L, 278L, 553L, 568L, 356L, 731L, 25258L, 127931L, 7735L, 
112717L, 395L, 12960L, 11383L, 16L, 229067L, 259076L, 311L, 366L, 
2696L, 7265L, 259076L, 3551L, 7782L, 4256L, 87121L, 4971L, 4706L, 
245L, 34457L, 4971L, 4706L, 245L, 34457L, 258L, 36071L, 301L, 
2214L, 2231L, 247L, 537L, 301L, 2214L, 230L, 1076L, 1881L, 266L, 
4371L, 88304L, 50056L, 50056L, 232L, 186336L, 48200L, 112L, 48200L, 
48200L, 6236L, 82158L, 6236L, 82158L, 1331L, 713L, 89106L, 46315L, 
220L, 5634L, 170601L, 588L, 1063L, 2282L, 247L, 804L, 125L, 5507L, 
1271L, 2567L, 441L, 6623L, 64781L, 1545L, 240L, 2921L, 777L, 
697L, 2018L, 24064L, 199L, 183L, 297L, 9010L, 16304L, 930L, 6522L, 
5717L, 17L, 20L, 364418L, 58246L, 7976L, 304L, 4814L, 307L, 487L, 
292016L, 6972L, 15L, 40922L, 471L, 2342L, 2248L, 23L, 2434L, 
23342L, 807L, 21L, 345568L, 324L, 188L, 184L, 191L, 188L, 198L, 
195L, 187L, 185L, 33968L, 1375L, 121L, 56872L, 35970L, 929L, 
151L, 5526L, 156L, 2687L, 4870L, 26939L, 180L, 14623L, 265L, 
261L, 30501L, 5435L, 9849L, 5496L, 1753L, 847L, 265L, 280L, 1840L, 
1107L, 2174L, 18907L, 14762L, 3450L, 9648L, 1080L, 45L, 6453L, 
136351L, 521L, 715L, 668L, 14550L, 1381L, 13294L, 13100L, 6354L, 
6319L, 84837L, 84726L, 84702L, 2126L, 36L, 572L, 1448L, 215L, 
12L, 7105L, 758L, 4694L, 29369L, 7579L, 709L, 121L, 781L, 1391L, 
2166L, 160403L, 674L, 1933L, 320L, 1628L, 2346L, 2955L, 204852L, 
206277L, 2408L, 2162L, 312L, 280L, 243L, 84050L, 830L, 290L, 
10490L, 119392L, 182960L, 261791L, 92L, 415L, 144L, 2006L, 1172L, 
1886L, 233L, 36123L, 7855L, 554L, 234L, 2292L, 21L, 132L, 142L, 
3848L, 3847L, 3965L, 3431L, 2465L, 1717L, 3952L, 854L, 854L, 
834L, 14608L, 172L, 7885L, 75303L, 535L, 443347L, 5478L, 782L, 
9066L, 6733L, 568L, 611L, 533L, 1022L, 334L, 21628L, 295362L, 
34L, 486L, 279L, 2530L, 504L, 525L, 367L, 293L, 258L, 1854L, 
209L, 152L, 1139L, 398L, 3275L, 284178L, 284127L, 826L, 751L, 
1814L, 398L, 1517L, 255L, 13745L, 43L, 1463L, 385L, 64L, 5279L, 
885L, 1193L, 190L, 451L, 1093L, 322L, 453L, 680L, 452L, 677L, 
295L, 120L, 12184L, 250L, 1165L, 476L, 211L, 4437L, 7310L, 778L, 
260L, 855L, 353L, 97L, 34L, 87L, 137L, 101L, 416L, 130L, 148L, 
832L, 187L, 291L, 4050L, 14569L, 271L, 1968L, 6553L, 2535L, 227L, 
202L, 647L, 266L, 2681L, 106L, 158L, 257L, 234L, 1726L, 34L, 
465L, 436L, 245L, 245L, 2790L, 104L, 1283L, 44416L, 142L, 13617L, 
232L, 171L, 221L, 719L, 176L, 5838L, 37488L, 12214L, 3780L, 5556L, 
5368L, 106L, 246L, 101L, 158L, 10743L, 5L, 46478L, 5286L, 9866L, 
32593L, 174L, 298L, 19617L, 19350L, 230L, 78449L, 78414L, 78413L, 
78413L, 6260L, 6260L, 209L, 2552L, 522L, 178L, 140L, 173046L, 
299L, 265L, 132360L, 132252L, 4821L, 4755L, 197L, 567L, 113L, 
30314L, 7006L, 10L, 30L, 55281L, 8263L, 8244L, 8142L, 568L, 1592L, 
1750L, 628L, 60304L, 212553L, 51393L, 222L, 13471L, 3423L, 306L, 
325L, 2650L, 74796L, 37807L, 103751L, 6924L, 6727L, 667L, 657L, 
752L, 546L, 1860L, 230L, 217L, 1422L, 347L, 341055L, 4510L, 4398L, 
179670L, 796L, 1210L, 2579L, 250L, 273L, 407L, 192049L, 236L, 
96084L, 5808L, 7546L, 10646L, 197L, 188L, 19L, 167877L, 200509L, 
429L, 632L, 495L, 471L, 2578L, 251L, 198L, 175L, 19161L, 289L, 
20718L, 201L, 937L, 283L, 4829L, 4776L, 5949L, 856907L, 2747L, 
2761L, 3150L, 3142L, 68031L, 187666L, 255211L, 255231L, 6581L, 
392991L, 858L, 115L, 141L, 85629L, 125433L, 6850L, 6684L, 23L, 
529L, 562L, 216L, 1450L, 838L, 3335L, 1446L, 178L, 130101L, 239L, 
1838L, 286L, 289L, 68974L, 757L, 764L, 218L, 207L, 3485L, 16597L, 
236L, 1387L, 2121L, 2122L, 957L, 199899L, 409803L, 367877L, 1650L, 
116710L, 5662L, 12497L, 613889L, 10182L, 260L, 9654L, 422947L, 
294L, 284L, 996L, 1444L, 2373L, 308L, 1522L, 288L, 937L, 291L, 
93L, 17629L, 5151L, 184L, 161L, 3273L, 1090L, 179840L, 1294L, 
922L, 826L, 725L, 252L, 715L, 6116L, 259L, 6171L, 198L, 5610L, 
5679L, 862L, 332L, 1324L, 536L, 98737L, 316L, 5608L, 5526L, 404L, 
255L, 251L, 14067L, 3360L, 3623L, 8920L, 288L, 447L, 453L, 1604687L, 
115L, 127L, 127L, 2398L, 2396L, 2396L, 2398L, 2396L, 2397L, 154L, 
154L, 154L, 154L, 887L, 636L, 227L, 227L, 354L, 7150L, 30227L, 
546013L, 545979L, 251L, 171647L, 252L, 583L, 593L, 10222L, 2660L, 
1864L, 2884L, 1577L, 1304L, 337L, 2642L, 2462L, 280L, 284L, 3463L, 
288L, 288L, 540L, 287L, 526L, 721L, 1015L, 74071L, 6338L, 1590L, 
582L, 765L, 291L, 983L, 158L, 625L, 581L, 350L, 6896L, 13567L, 
20261L, 4781L, 1025L, 722L, 721L, 1618L, 1799L, 987L, 6373L, 
733L, 5648L, 987L, 1010L, 985L, 920L, 920L, 4696L, 1154L, 1132L, 
927L, 4546L, 692L, 702L, 301L, 305L, 316L, 313L, 801L, 788L, 
14624L, 14624L, 9778L, 9778L, 9778L, 9778L, 757L, 275L, 1480L, 
610L, 68495L, 1152L, 1155L, 323L, 312L, 303L, 298L, 1641L, 1607L, 
1645L, 616L, 1002L, 1034L, 1022L, 1030L, 1030L, 1027L, 1027L, 
934L, 960L, 47L, 44L, 1935L, 1925L, 43L, 47L, 1933L, 1898L, 938L, 
830L, 286L, 287L, 807L, 807L, 741L, 628L, 482L, 500L, 480L, 431L, 
287L, 298L, 227L, 968L, 961L, 943L, 932L, 704L, 420L, 548L, 3612L, 
1723L, 780L, 337L, 780L, 527L, 528L, 499L, 679L, 308L, 1104L, 
314L, 1607L, 990L, 1156L, 562L, 299L, 16L, 20L, 287L, 581L, 1710L, 
1859L, 988L, 962L, 834L, 1138L, 363L, 294L, 2678L, 362L, 539L, 
295L, 996L, 977L, 988L, 39L, 762L, 579L, 595L, 405L, 1001L, 1002L, 
555L, 1102L, 54L, 1283L, 347L, 1384L, 603L, 307L, 306L, 302L, 
302L, 288L, 288L, 286L, 292L, 529L, 56844L, 1986L, 503L, 751L, 
3977L, 367L, 4817L, 4631L, 4609L, 4579L, 937L, 402L, 257L, 570L, 
1156L, 3297L, 3948L, 4527L, 3119L, 15227L, 3893L, 538L, 802L, 
5128L, 595L, 522L, 1346L, 449L, 443L, 323L, 372L, 369L, 307L, 
246L, 260L, 342L, 283L, 963L, 751L, 108L, 280L, 320L, 287L, 285L, 
283L, 529L, 536L, 298L, 29427L, 29413L, 761L, 249L, 255L, 304L, 
297L, 256L, 119L, 288L, 564L, 234L, 226L, 530L, 766L, 223L, 5858L, 
5568L, 481L, 462L, 8692L, 498L, 330L, 7604L, 15L, 121738L, 121833L, 
826L, 760L, 208937L, 1598L, 1166L, 446L, 85598L, 513L, 84897L, 
50239L, 308L, 1351L, 283L, 7100L, 7101L, 321L, 1019L, 287L, 253L, 
634L, 629L, 628L, 678L, 1391L, 1147L, 853L, 287L, 1174L, 287L, 
197145L, 197116L, 147L, 147L, 712L, 274L, 283L, 907L, 434L, 1164L, 
30L, 599L, 577L, 315L, 1423L, 1250L, 30L, 1502L, 296L, 348L, 
617L, 339L, 328L, 123L, 338L, 332L, 47133L, 288L, 340L, 1524L, 
1049L, 1072L, 1031L, 1059L, 1038L, 989L, 52L, 54L, 986L, 46L, 
1202L, 1272L, 43L, 785L, 761L, 16924L, 289L, 264L, 453L, 365L, 
356L, 280L, 16520L, 281L, 255L, 244L, 642L, 1003L, 951L, 921L, 
1011L, 45L, 932L, 973L, 39L, 40L, 159L, 566L, 49L, 1161L, 50L, 
200L, 215L, 361L, 377L, 980L, 935L, 882L, 281L, 280L, 1025L, 
319L, 690L, 284L, 271L, 276L, 286L, 371L, 324L, 304L, 311L, 341L, 
603L, 11566L, 270L, 286L, 342L, 326L, 11018L, 282L, 271L, 286L, 
586L, 604L, 750L, 608L, 523L, 506L, 3303L, 1079797L, 1079811L, 
530L, 2631L, 882L, 628L, 30L, 11905L, 12966L, 390995L, 322353L, 
1763L, 1755L, 709L, 713L, 365L, 351L, 205L, 393L, 284L, 39417L, 
320L, 322L, 8039L, 995L, 625L, 785L, 298L, 518L, 467L, 1050L, 
329L, 141345L, 55566L, 40318L, 287L, 220L, 309346L, 220L, 215314L, 
304L, 296L, 4301L, 4311L, 1543L, 1549L, 2876L, 2894L, 287L, 290L, 
215L, 605L, 577L, 254L, 1330L, 1863L, 140L, 328L, 284L, 291L, 
283L, 1701L, 1696L, 519L, 499L, 2440007L, 289L, 294L, 311L, 324L, 
4793L, 4808L, 249L, 205L, 219L, 638L, 2653L, 2648L, 351L, 323L, 
1056L, 327L, 794L, 1491L, 284L, 289L, 220L, 765L, 565L, 808L, 
832L, 772L, 41668L, 42307L, 6843L, 6612L, 6598L, 241164L, 531L, 
554L, 1246L, 459L, 971504L, 805L, 2615L, 2290L, 2086L, 2063L, 
2685L, 2704L, 275L, 461L, 458L, 317L, 889L, 335L, 974L, 959L, 
253142L, 257L, 250L, 282L, 293L, 666L, 4991L, 287L, 588L, 555L, 
3585L, 3195L, 481L, 2405L, 135266L, 571L, 1805L, 365L, 340L, 
232L, 224L, 298L, 3682L, 3677L, 577L, 571L, 288L, 297L, 293L, 
291L, 256L, 214L, 1257L, 1271L, 65471L, 65471L, 65476L, 65476L, 
4680L, 4675L, 339L, 329L, 284L, 288L, 4859L, 4851L, 2534L, 24222L, 
330684L, 330684L, 2116L, 282L, 412L, 429L, 2324L, 1978L, 502L, 
286L, 943149L, 256L, 288L, 286L, 1098L, 1125L, 442L, 240L, 182L, 
2617L, 1068L, 25204L, 170L, 418L, 1867L, 8989L, 1804L, 1240L, 
6610L, 1237L, 1750L, 1565L, 1565L, 3662L, 1803L, 218L, 172L, 
780L, 1418L, 2390L, 7514L, 23214L, 1464L, 1060L, 1503L, 308802L, 
308357L, 21691L, 298817L, 289875L, 4442L, 289284L, 235L, 456L, 
676L, 897L, 289109L, 1865L, 288030L, 287899L, 287767L, 287635L, 
286639L, 286509L, 286157L, 1427L, 2958L, 4340L, 5646L, 282469L, 
7016L, 279353L, 278568L, 316L, 558L, 3501L, 1630L, 278443L, 1360L, 
828L, 1089L, 278430L, 278299L, 278169L, 278035L, 277671L, 277541L, 
277400L, 277277L, 276567L, 285L, 555L, 834L, 1084L, 1355L, 5249L, 
14776L, 1441L, 755L, 755L, 70418L, 3135L, 1026L, 1497L, 949663L, 
68L, 526058L, 1692L, 150L, 48370L, 4207L, 4088L, 197551L, 197109L, 
196891L, 196634L, 2960L, 194319L, 194037L, 3008L, 3927L, 178762L, 
178567L, 403L, 178124L, 2590L, 177405L, 177179L, 301L, 328L, 
390685L, 390683L, 575L, 1049L, 819L, 367L, 289L, 277L, 390L, 
301L, 318L, 3806L, 3778L, 3699L, 3691L)

7
वह आरेख आपको यह नहीं बताता है कि आपका वितरण बीटा है। यह कहता है कि तिरछापन और कुर्तोसिस एक बीटा के अनुरूप हैं - यह आसानी से तार्किक हो सकता है, उदाहरण के लिए, लेकिन यह वास्तव में उस आरेख नाम के वितरण में से कोई भी नहीं है ।
Glen_b -Reinstate मोनिका

@Glen_b: धन्यवाद। मैं बस lognormal के लिए एक qqplot के रूप में अच्छी तरह से शामिल है, लेकिन यह भी एक अच्छा फिट नहीं लगता है। क्या आपके द्वारा सुझाए गए कुछ और हैं? मैंने अपने डेटा को प्रश्न में शामिल किया।
लीजेंड

4
मुझे उत्सुकता है कि आप इसे "कुलेन फ्रे" कथानक क्यों कहते हैं, जब इसे 1909 में रिहंद द्वारा पेश किया गया था (और बाद की पीढ़ियों के लिए अच्छी तरह से जाना जाता है), 90 साल पहले कुलेन और फ्रे ने एक साथ कुछ भी लिखा था! वितरण के पियर्सन प्रणाली पर विकिपीडिया लेख देखें ।
whuber

3
हम एक्शन में स्टिगलर लॉ ऑफ एपॉलेमी देख रहे हैं । :-)
whuber

3
@ व्ह्यूअर इट्स ए कलन एंड फ्रे प्लॉट, न कि रिहंद का दृश्य पियर्सन स्पेस। इसमें विशिष्ट रूप से अलग-अलग विशेषताएं हैं, जैसे कि वर्धित मानों का चित्रण, समान वितरण का ओवरले, इत्यादि, आदि यह रिहंद के ग्राफ़ पर बनाता है, लेकिन विज्ञान में सब कुछ इससे पहले कुछ बनाता है (और हम नहीं चाहते हैं) आग और पहिया के मूल, अज्ञात अन्वेषकों के लिए सब कुछ विशेषता ...)।
हैक-आर

जवाबों:


34

बात यह है कि वास्तविक डेटा किसी भी विशेष वितरण का पालन नहीं कर सकता है जिसे आप नाम दे सकते हैं ... और वास्तव में अगर यह किया गया तो आश्चर्य होगा।

इसलिए जब मैं एक दर्जन संभावनाओं को नाम दे सकता था, तो इन टिप्पणियों को उत्पन्न करने वाली वास्तविक प्रक्रिया शायद कुछ भी नहीं होगी जो मैं या तो सुझाव दे सकता था। जैसा कि नमूना आकार बढ़ता है, आप संभवतः किसी भी प्रसिद्ध वितरण को अस्वीकार करने में सक्षम होंगे।

पैरामीट्रिक वितरण अक्सर एक उपयोगी कल्पना है, न कि एक संपूर्ण विवरण।

चलो कम से कम लॉग-डेटा को देखते हैं, पहले एक सामान्य qqplot में और फिर कर्नेल घनत्व के अनुमान के रूप में यह देखने के लिए कि यह कैसे दिखता है:

qnnorm लॉग (x)

ध्यान दें कि एक क्यूक्यू भूखंड में इस तरह से किया गया है, ढलान के सबसे सपाट खंड हैं जहां आप चोटियों को देखते हैं। यह 6 के पास एक चोटी का एक स्पष्ट सुझाव है और लगभग 12.3 है। लॉग का कर्नेल घनत्व अनुमान एक ही बात दिखाता है:

कर्नेल घनत्व का अनुमान

दोनों ही मामलों में, संकेत है कि लॉग टाइम का वितरण सही तिरछा है, लेकिन यह स्पष्ट रूप से एकरूपता नहीं है। स्पष्ट रूप से मुख्य चोटी 5 मिनट के निशान के आसपास है। यह हो सकता है कि लॉग-टाइम घनत्व में एक दूसरी छोटी चोटी है, जो संभवतः 60 घंटों के क्षेत्र में कहीं दिखाई देती है। शायद मरम्मत के दो बहुत गुणात्मक रूप से भिन्न "प्रकार" हैं, और आपका वितरण दो प्रकारों के मिश्रण को दर्शा रहा है। या बस हो सकता है कि एक बार एक मरम्मत कार्य के पूरे दिन में हिट हो जाए, यह सिर्फ एक लंबा समय लेने के लिए जाता है (यानी, सिर्फ एक हफ्ते में एक चोटी को प्रतिबिंबित करने के बजाय, यह सिर्फ एक दिन में एक विरोधी शिखर को प्रतिबिंबित कर सकता है - एक बार आपको मरम्मत के लिए एक दिन से अधिक समय लगता है, नौकरियां 'धीमा' हो जाती हैं)।

यहां तक ​​कि समय के लॉग का लॉग कुछ सही तिरछा है। आइए एक मजबूत परिवर्तन को देखें, जहां दूसरी चोटी बिल्कुल स्पष्ट है - समय की चौथी जड़ का उलटा:

-1 / (x ^ 0.25) का हिस्ट

चिह्नित लाइनें 5 मिनट (नीला) और 60 घंटे (धराशायी हरे) पर हैं; जैसा कि आप देख रहे हैं, 5 मिनट के नीचे एक चोटी है और 60 घंटे से ऊपर कहीं और है। ध्यान दें कि ऊपरी "शिखर" लगभग 95 वें प्रतिशत पर है और जरूरी नहीं कि अनियंत्रित वितरण में एक चोटी के करीब हो।

10 और 20 मिनट के बीच एक व्यापक शिखर के साथ 7.5 मिनट के आसपास एक और डुबकी का सुझाव भी है, जो उस क्षेत्र में 'राउंड अप' करने के लिए बहुत मामूली प्रवृत्ति का सुझाव दे सकता है (ऐसा नहीं है कि जरूरी कुछ भी अनहोनी चल रही है; भले ही कोई डुबकी न हो; / अंतर्निहित नौकरी के समय में चोटी, यह कुछ मिनटों से अधिक समय तक एक अखंड अवधि में ध्यान केंद्रित करने की मानव क्षमता के कार्य के रूप में सरल भी हो सकता है।)

यह मुझे एक दो-घटक (दो शिखर) की तरह दिखता है या हो सकता है कि दाएं-तिरछा वितरण के तीन घटक मिश्रण प्रक्रिया का यथोचित वर्णन करेंगे, लेकिन एक पूर्ण विवरण नहीं होगा।

पैकेज logsplineलॉग (समय) में चार चोटियों को लेने के लिए लगता है:

logpsine प्लॉट

30, 270, 900 और 270K सेकंड (30s, 4.5m, 15m और 75h) के पास चोटियों के साथ।

अन्य परिवर्तनों के साथ लॉगस्पलाइन का उपयोग करना आम तौर पर 4 चोटियों को ढूंढता है लेकिन थोड़े अलग केंद्रों के साथ (जब मूल इकाइयों में अनुवाद किया जाता है); परिवर्तनों के साथ यह अपेक्षित है।


2
+1 यह मेरी जानकारी की सोने की खान है। मैं आपके द्वारा लिखी गई हर चीज को पचाने की कोशिश कर रहा हूं और अब तक इसने मुझे सिखाया है कि वास्तव में इस प्रकार की समस्याओं से कैसे निपटना है। मजबूत परिवर्तन का क्या मतलब है? क्या मैं पूछ सकता हूँ कि तुम कैसे आए? क्या यह अनुभव के साथ है या इस तरह के गैर-पारंपरिक परिवर्तन को चुनने का एक अधिक औपचारिक तरीका है? यदि यह आँकड़े समुदाय में सामान्य ज्ञान है तो कृपया मेरी अज्ञानता को क्षमा करें। लेकिन मैं शुक्रगुजार रहूंगा अगर आप मुझे इस तरह के "जासूसी" काम को सीखने के लिए एक अच्छे संदर्भ में इंगित कर सकते हैं जो मुझे बहुत अच्छा लगता है।
लीजेंड

3
EDA का उचित संदर्भ: Tukey, JW (1977)। खोजपूर्ण डेटा विश्लेषण । एडिसन-वेस्ले, पढ़ना, एमए।
Glen_b -Reinstate मोनिका

3
जैसा कि ऊपर दिए गए उत्तर में बताया गया है, आप मिश्रण वितरण को फिट करने का प्रयास कर सकते हैं। यहां एक पेपर है जो हवा की गति के लिए इन संकरों का उपयोग करता है - मुझे लगता है कि कुछ वितरण 3 अन्य वितरणों के संयोजन हैं। journal-ijeee.com/content/3/1/27
rbatt

2
एक मिश्रण के लिए यह पता लगाने की बात है कि आप कितने घटक चाहते हैं, आप किस मिश्रण या वितरण का मिश्रण लेने जा रहे हैं (जो कि मूल रूप से आपके बारे में पोस्ट किया गया है), और फिर आप घटकों के मापदंडों की पहचान कैसे करेंगे और घटक अनुपात। कई पैकेज हैं जो उन कार्यों में मदद कर सकते हैं; यहाँ उनमें से एक पर एक पेपर (पीडीएफ) है। कुछ मिश्रण-मॉडलिंग पैकेजों का उल्लेख क्लस्टर विश्लेषण और परिमित मिश्रण मॉडलिंग टास्क व्यू में किया गया है ... (ctd)
Glen_b -Reinstate Monica

1
(ctd) ... एक और उदाहरण पैकेज है रिबमिक्स । ऊपर दिया गया मेरा खुद का विश्लेषण सरल खोजपूर्ण दृष्टिकोणों पर आधारित था, लेकिन जैसा कि यह वर्तमान में है, अभी तक पूरी तरह से पहचान मिश्रण मॉडल नहीं है; यह बताता है कि 4-घटक मिश्रण की आवश्यकता हो सकती है। मेरे उत्तर का अंतिम भाग - लॉग-स्पलाइन वाला भाग जटिल घनत्व वाले मॉडलिंग के लिए एक अलग (गैर-समरूप) दृष्टिकोण है।
Glen_b -Reinstate मोनिका

12

निरंकुश फ़ंक्शन के पास प्लॉट किए गए अनुमान से जुड़ी सटीकता की भावना प्राप्त करने के लिए आपके वितरण को बूटस्ट्रैप करने का एक विकल्प है। आप कोशिश कर सकते हैं कि

descdist(time_to_repair, boot=1000)

मेरा अनुमान है कि आपका डेटा केवल बीटा वितरण से अधिक के अनुरूप है।

सामान्य तौर पर, बीटा वितरण निरंतर अनुपात या संभाव्यता का वितरण है। उदाहरण के लिए, टी-टेस्ट से पी-वैल्यू का वितरण एक बीटा डिस्ट्रीब्यूशन का कुछ विशिष्ट मामला होगा, जो इस बात पर निर्भर करता है कि अशक्त परिकल्पना सही है और आपके विश्लेषण की शक्ति कितनी है।

मुझे लगता है कि मरम्मत के लिए आपके समय का वितरण वास्तव में बीटा होगा इसकी संभावना बहुत कम है। ध्यान दें कि ग्राफ़ केवल आपके डेटा के तिरछा और कुर्तोसिस की तुलना निर्दिष्ट वितरण से कर रहा है। बीटा 0 और 1 से बंधा है; मैं शर्त लगा सकता हूँ कि आपका डेटा नहीं है, लेकिन वह ग्राफ़ उस तथ्य की जाँच नहीं कर रहा है।

दूसरी ओर, वीबुल वितरण अंतराल समय के लिए आम है। आकृति को नेत्रहीन करने से (अनिश्चितता को नापने के लिए बूटमैंट्स के बिना), मुझे संदेह है कि आपका डेटा एक वेदुल के अनुरूप है।

आप यह भी जांच सकते हैं कि क्या आप डेटा वेइबुल हैं, मेरा मानना ​​है कि क्यूक-प्लॉट बनाने के लिए कार पैकेज से qqPlot का उपयोग करना ।


2
+1 धन्यवाद। उस समय जब मैं आपके उत्तर को समझ रहा हूं, मैंने अपने प्रश्न bootstrapको descdistफ़ंक्शन में 500 के सेट पैरामीटर के साथ अपडेट किया है। और हाँ, आप सही हैं कि मेरे मूल्य [0,1] में नहीं हैं। क्या कोई तरीका है जो मैं इस ग्राफ का उपयोग करके उस तथ्य (वेइबुल से संबंधित) को दिखा सकता हूं? मैं शीघ्र ही QQPlot के साथ अपने प्रश्न को अपडेट करने का प्रयास करूंगा।
किंवदंती

बस पैकेज qqPlotसे मेरे प्रश्न को अपडेट किया car
लीजेंड

हममम। खैर, क्यूक-प्लॉट ऐसा नहीं लगता है कि वीबुल वितरण एक अच्छा फिट है।
गूँग - मोनिका

1
और lognormal वितरण के लिए एक और। क्या आप किसी भी पूर्व-प्रसंस्करण की अनुशंसा करते हैं जो मुझे डेटा के साथ करना चाहिए? या क्या सबसे अच्छा फिट होने का अनुमान लगाने का एक बेहतर तरीका है? मैं अभी भी सोच रहा हूं कि मैं अपने संदर्भ में कुलेन / फ्रे के ग्राफ का उपयोग कैसे कर सकता हूं।
लीजेंड

साथ ही, मेरे प्रश्न को उस डेटा के साथ अद्यतन किया है जिसका मैं अंत में उपयोग कर रहा हूं।
लीजेंड

3

क्या यह लायक है, गणितज्ञ के FindDistribution दिनचर्या का उपयोग करते हुए, लघुगणक बहुत ही सामान्य दो वितरणों का मिश्रण है,

यहां छवि विवरण दर्ज करें

एक्स=ln(डेटा)

(एक्स)=0.0585522-.३३,७८१(एक्स-11.7025)2+0.229776-0.245814(एक्स-६.६६,८६४)2

मिश्रण वितरण बनाने के लिए 3 वितरणों का उपयोग करना यह हो सकता है

यहां छवि विवरण दर्ज करें

(एक्स)=0.560456 लाप्लास(५.८५,५३२,.५९,२९६)+0.312384 lognormal(२.०८,३३८,0.122309)+.१२,७१६ साधारण(11.6327,१.०२,०११),
{0.472592-१.६८,६४६(५.८५,५३२-एक्स)+0.0497292-0.480476(एक्स-11.6327)2एक्स00.472592-१.६८,६४६(५.८५,५३२-एक्स)+0.0497292-0.480476(एक्स-11.6327)2+१.०१,८९३एक्स-33.4238(ln(एक्स)-२.०८,३३८)20<एक्स<५.८५,५३२0.472592-१.६८,६४६(एक्स-५.८५,५३२)+0.0497292-0.480476(एक्स-11.6327)2+१.०१,८९३एक्स-33.4238(ln(एक्स)-२.०८,३३८)2अन्यथा

कई अन्य संभावनाएं हैं। उदाहरण के लिए, 1/10 को तीन सामान्य वितरण फिटिंगवेंडेटा की शक्ति। मैथेमेटिका कोड के लिए, इस लिंक के अनुसार आगे के तरीके हैं ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.