फूरियर / त्रिकोणमितीय प्रक्षेप


9

पृष्ठभूमि

एपस्टीन (1991) के एक पेपर में: मासिक साधनों से दैनिक जलवायु संबंधी मूल्यों को प्राप्त करने पर , आवधिक और सम-स्पंदित मूल्यों के लिए फूरियर प्रक्षेप की गणना के लिए सूत्रीकरण और एक एल्गोरिथ्म दिया जाता है।

कागज में, लक्ष्य मासिक साधनों से प्रक्षेप द्वारा दैनिक मूल्यों को प्राप्त करना है ।

संक्षेप में, यह माना जाता है कि अज्ञात दैनिक मूल्यों को हार्मोनिक घटकों के योग द्वारा दर्शाया जा सकता है:

y(टी)=0+Σजे[जेक्योंकि(2πजेटी/12)+जेपाप(2πजेटी/12)]
कागज़ पर टी (समय) महीनों में व्यक्त किया जाता है।

कुछ परिचलन के बाद, यह दिखाया गया है कि शब्दों की गणना निम्न द्वारा की जा सकती है:

0=ΣटीYटी/12जे=[(πजे/12)/पाप(πजे/12)]×Σटी[Yटीक्योंकि(2πजेटी/12)/6]       जे=1,...,5जे=[(πजे/12)/पाप(πजे/12)]×Σटी[Yटीपाप(2πजेटी/12)/6]       जे=1,...,56=[(πजे/12)/पाप(πजे/12)]×Σटी[Yटीक्योंकि(πटी)/12]6=0
कहाँ पे Yटी मासिक साधन का अर्थ है और टी माह।

हरजल्लाह (1995) इस aproach को इस प्रकार संक्षेप में प्रस्तुत करता है: "डेटा के वर्णक्रमीय गुणांक में शून्य जोड़कर और परिणामी विस्तारित गुणांक के व्युत्क्रम फूरियर रूपांतरण का प्रदर्शन करके प्रक्षेप को अंजाम दिया जाता है। विधि फूरियर गुणांक के लिए एक आयताकार फिल्टर लगाने के बराबर है। । "


प्रशन

मेरा लक्ष्य दैनिक डेटा प्राप्त करने के लिए साप्ताहिक साधनों के प्रक्षेप के लिए उपरोक्त पद्धति का उपयोग करना है ( मेरे पिछले प्रश्न देखें )। सारांश में, मेरे पास गणना डेटा के 835 साप्ताहिक साधन हैं (प्रश्न के तल पर उदाहरण डेटासेट देखें)। ऊपर बताए गए दृष्टिकोण को लागू करने से पहले कुछ चीजें हैं जो मुझे समझ में नहीं आती हैं:

  1. मेरी स्थिति (मासिक मानों के बजाय साप्ताहिक) के लिए सूत्रों को कैसे बदलना होगा?
  2. समय कैसे हो सकता है टीव्यक्त किया जाए? मेंने सोचाटी/835 (या टी/n साथ में n सामान्य रूप से डेटा बिंदु), क्या यह सही है?
  3. लेखक 7 शब्दों की गणना क्यों करता है (अर्थात 0जे6)? मुझे कितने शब्दों पर विचार करना होगा?
  4. मैं समझता हूं कि प्रश्न शायद एक प्रतिगमन दृष्टिकोण का उपयोग करके और प्रक्षेप के लिए भविष्यवाणियों का उपयोग करके हल किया जा सकता है (निक के लिए धन्यवाद)। फिर भी, कुछ चीजें मेरे लिए अस्पष्ट हैं: प्रतिगमन में हार्मोनिक्स की कितनी शर्तें शामिल होनी चाहिए? और मुझे किस अवधि में लेना चाहिए? यह सुनिश्चित करने के लिए प्रतिगमन कैसे किया जा सकता है कि साप्ताहिक साधन संरक्षित हैं (जैसा कि मैं डेटा के लिए सटीक हार्मोनिक फिट नहीं चाहता हूं)?

प्रतिगमन दृष्टिकोण (जो इस पेपर में भी समझाया गया है ) का उपयोग करते हुए , मैं डेटा () के लिए एक सटीक हार्मोनिक फिट प्राप्त करने में कामयाब रहाजे मेरे उदाहरण के माध्यम से चलेंगे 1,...,417, इसलिए मैंने 417 शब्द फिट किए)। इस दृष्टिकोण को कैसे बदला जा सकता है - अगर संभव हो तो - साप्ताहिक साधनों के संरक्षण को प्राप्त करने के लिए? शायद प्रत्येक प्रतिगमन अवधि में सुधार कारक लागू करने से?

सटीक हार्मोनिक फिट की साजिश है:

सटीक हार्मोनिक फिट

संपादित करें

सिग्नल पैकेज और interp1फ़ंक्शन का उपयोग करते हुए , यहां नीचे दिए गए उदाहरण डेटा सेट का उपयोग करके मैं क्या करने में कामयाब रहा हूं (@noumenal के लिए बहुत धन्यवाद)। मेरे q=7पास साप्ताहिक डेटा है जैसे मैं उपयोग करता हूं :

# Set up the time scale

daily.ts <- seq(from=as.Date("1995-01-01"), to=as.Date("2010-12-31"), by="day")

# Set up data frame 

ts.frame <- data.frame(daily.ts=daily.ts, wdayno=as.POSIXlt(daily.ts)$wday,
                       yearday = 1:5844,
                       no.influ.cases=NA)

# Add the data from the example dataset called "my.dat"

ts.frame$no.influ.cases[ts.frame$wdayno==3] <- my.dat$case

# Interpolation

case.interp1 <- interp1(x=ts.frame$yearday[!is.na(ts.frame$no.influ.case)],y=(ts.frame$no.influ.cases[!is.na(ts.frame$no.influ.case)]),xi=ts.frame$yearday, method = c("cubic"))

# Plot subset for better interpretation
par(bg="white", cex=1.2, las=1)
plot((ts.frame$no.influ.cases)~ts.frame$yearday, pch=20,
     col=grey(0.4),
     cex=1, las=1,xlim=c(0,400), xlab="Day", ylab="Influenza cases")
lines(case.interp1, col="steelblue", lwd=1)

Cubicinterpo

यहां दो समस्याएं हैं:

  1. वक्र "बहुत अच्छा" फिट लगता है: यह हर बिंदु से गुजरता है
  2. साप्ताहिक साधनों का संरक्षण नहीं किया जाता है

उदाहरण डाटासेट

structure(list(date = structure(c(9134, 9141, 9148, 9155, 9162, 
9169, 9176, 9183, 9190, 9197, 9204, 9211, 9218, 9225, 9232, 9239, 
9246, 9253, 9260, 9267, 9274, 9281, 9288, 9295, 9302, 9309, 9316, 
9323, 9330, 9337, 9344, 9351, 9358, 9365, 9372, 9379, 9386, 9393, 
9400, 9407, 9414, 9421, 9428, 9435, 9442, 9449, 9456, 9463, 9470, 
9477, 9484, 9491, 9498, 9505, 9512, 9519, 9526, 9533, 9540, 9547, 
9554, 9561, 9568, 9575, 9582, 9589, 9596, 9603, 9610, 9617, 9624, 
9631, 9638, 9645, 9652, 9659, 9666, 9673, 9680, 9687, 9694, 9701, 
9708, 9715, 9722, 9729, 9736, 9743, 9750, 9757, 9764, 9771, 9778, 
9785, 9792, 9799, 9806, 9813, 9820, 9827, 9834, 9841, 9848, 9855, 
9862, 9869, 9876, 9883, 9890, 9897, 9904, 9911, 9918, 9925, 9932, 
9939, 9946, 9953, 9960, 9967, 9974, 9981, 9988, 9995, 10002, 
10009, 10016, 10023, 10030, 10037, 10044, 10051, 10058, 10065, 
10072, 10079, 10086, 10093, 10100, 10107, 10114, 10121, 10128, 
10135, 10142, 10149, 10156, 10163, 10170, 10177, 10184, 10191, 
10198, 10205, 10212, 10219, 10226, 10233, 10240, 10247, 10254, 
10261, 10268, 10275, 10282, 10289, 10296, 10303, 10310, 10317, 
10324, 10331, 10338, 10345, 10352, 10359, 10366, 10373, 10380, 
10387, 10394, 10401, 10408, 10415, 10422, 10429, 10436, 10443, 
10450, 10457, 10464, 10471, 10478, 10485, 10492, 10499, 10506, 
10513, 10520, 10527, 10534, 10541, 10548, 10555, 10562, 10569, 
10576, 10583, 10590, 10597, 10604, 10611, 10618, 10625, 10632, 
10639, 10646, 10653, 10660, 10667, 10674, 10681, 10688, 10695, 
10702, 10709, 10716, 10723, 10730, 10737, 10744, 10751, 10758, 
10765, 10772, 10779, 10786, 10793, 10800, 10807, 10814, 10821, 
10828, 10835, 10842, 10849, 10856, 10863, 10870, 10877, 10884, 
10891, 10898, 10905, 10912, 10919, 10926, 10933, 10940, 10947, 
10954, 10961, 10968, 10975, 10982, 10989, 10996, 11003, 11010, 
11017, 11024, 11031, 11038, 11045, 11052, 11059, 11066, 11073, 
11080, 11087, 11094, 11101, 11108, 11115, 11122, 11129, 11136, 
11143, 11150, 11157, 11164, 11171, 11178, 11185, 11192, 11199, 
11206, 11213, 11220, 11227, 11234, 11241, 11248, 11255, 11262, 
11269, 11276, 11283, 11290, 11297, 11304, 11311, 11318, 11325, 
11332, 11339, 11346, 11353, 11360, 11367, 11374, 11381, 11388, 
11395, 11402, 11409, 11416, 11423, 11430, 11437, 11444, 11451, 
11458, 11465, 11472, 11479, 11486, 11493, 11500, 11507, 11514, 
11521, 11528, 11535, 11542, 11549, 11556, 11563, 11570, 11577, 
11584, 11591, 11598, 11605, 11612, 11619, 11626, 11633, 11640, 
11647, 11654, 11661, 11668, 11675, 11682, 11689, 11696, 11703, 
11710, 11717, 11724, 11731, 11738, 11745, 11752, 11759, 11766, 
11773, 11780, 11787, 11794, 11801, 11808, 11815, 11822, 11829, 
11836, 11843, 11850, 11857, 11864, 11871, 11878, 11885, 11892, 
11899, 11906, 11913, 11920, 11927, 11934, 11941, 11948, 11955, 
11962, 11969, 11976, 11983, 11990, 11997, 12004, 12011, 12018, 
12025, 12032, 12039, 12046, 12053, 12060, 12067, 12074, 12081, 
12088, 12095, 12102, 12109, 12116, 12123, 12130, 12137, 12144, 
12151, 12158, 12165, 12172, 12179, 12186, 12193, 12200, 12207, 
12214, 12221, 12228, 12235, 12242, 12249, 12256, 12263, 12270, 
12277, 12284, 12291, 12298, 12305, 12312, 12319, 12326, 12333, 
12340, 12347, 12354, 12361, 12368, 12375, 12382, 12389, 12396, 
12403, 12410, 12417, 12424, 12431, 12438, 12445, 12452, 12459, 
12466, 12473, 12480, 12487, 12494, 12501, 12508, 12515, 12522, 
12529, 12536, 12543, 12550, 12557, 12564, 12571, 12578, 12585, 
12592, 12599, 12606, 12613, 12620, 12627, 12634, 12641, 12648, 
12655, 12662, 12669, 12676, 12683, 12690, 12697, 12704, 12711, 
12718, 12725, 12732, 12739, 12746, 12753, 12760, 12767, 12774, 
12781, 12788, 12795, 12802, 12809, 12816, 12823, 12830, 12837, 
12844, 12851, 12858, 12865, 12872, 12879, 12886, 12893, 12900, 
12907, 12914, 12921, 12928, 12935, 12942, 12949, 12956, 12963, 
12970, 12977, 12984, 12991, 12998, 13005, 13012, 13019, 13026, 
13033, 13040, 13047, 13054, 13061, 13068, 13075, 13082, 13089, 
13096, 13103, 13110, 13117, 13124, 13131, 13138, 13145, 13152, 
13159, 13166, 13173, 13180, 13187, 13194, 13201, 13208, 13215, 
13222, 13229, 13236, 13243, 13250, 13257, 13264, 13271, 13278, 
13285, 13292, 13299, 13306, 13313, 13320, 13327, 13334, 13341, 
13348, 13355, 13362, 13369, 13376, 13383, 13390, 13397, 13404, 
13411, 13418, 13425, 13432, 13439, 13446, 13453, 13460, 13467, 
13474, 13481, 13488, 13495, 13502, 13509, 13516, 13523, 13530, 
13537, 13544, 13551, 13558, 13565, 13572, 13579, 13586, 13593, 
13600, 13607, 13614, 13621, 13628, 13635, 13642, 13649, 13656, 
13663, 13670, 13677, 13684, 13691, 13698, 13705, 13712, 13719, 
13726, 13733, 13740, 13747, 13754, 13761, 13768, 13775, 13782, 
13789, 13796, 13803, 13810, 13817, 13824, 13831, 13838, 13845, 
13852, 13859, 13866, 13873, 13880, 13887, 13894, 13901, 13908, 
13915, 13922, 13929, 13936, 13943, 13950, 13957, 13964, 13971, 
13978, 13985, 13992, 13999, 14006, 14013, 14020, 14027, 14034, 
14041, 14048, 14055, 14062, 14069, 14076, 14083, 14090, 14097, 
14104, 14111, 14118, 14125, 14132, 14139, 14146, 14153, 14160, 
14167, 14174, 14181, 14188, 14195, 14202, 14209, 14216, 14223, 
14230, 14237, 14244, 14251, 14258, 14265, 14272, 14279, 14286, 
14293, 14300, 14307, 14314, 14321, 14328, 14335, 14342, 14349, 
14356, 14363, 14370, 14377, 14384, 14391, 14398, 14405, 14412, 
14419, 14426, 14433, 14440, 14447, 14454, 14461, 14468, 14475, 
14482, 14489, 14496, 14503, 14510, 14517, 14524, 14531, 14538, 
14545, 14552, 14559, 14566, 14573, 14580, 14587, 14594, 14601, 
14608, 14615, 14622, 14629, 14636, 14643, 14650, 14657, 14664, 
14671, 14678, 14685, 14692, 14699, 14706, 14713, 14720, 14727, 
14734, 14741, 14748, 14755, 14762, 14769, 14776, 14783, 14790, 
14797, 14804, 14811, 14818, 14825, 14832, 14839, 14846, 14853, 
14860, 14867, 14874, 14881, 14888, 14895, 14902, 14909, 14916, 
14923, 14930, 14937, 14944, 14951, 14958, 14965, 14972), class = "Date"), 
    cases = c(168L, 199L, 214L, 230L, 267L, 373L, 387L, 443L, 
    579L, 821L, 1229L, 1014L, 831L, 648L, 257L, 203L, 137L, 78L, 
    82L, 69L, 45L, 51L, 45L, 63L, 55L, 54L, 52L, 27L, 24L, 12L, 
    10L, 22L, 42L, 32L, 52L, 82L, 95L, 91L, 104L, 143L, 114L, 
    100L, 83L, 113L, 145L, 175L, 222L, 258L, 384L, 755L, 976L, 
    879L, 846L, 1004L, 801L, 799L, 680L, 530L, 410L, 302L, 288L, 
    234L, 269L, 245L, 240L, 176L, 188L, 128L, 96L, 59L, 63L, 
    44L, 52L, 39L, 50L, 36L, 40L, 48L, 32L, 39L, 28L, 29L, 16L, 
    20L, 25L, 25L, 48L, 57L, 76L, 117L, 107L, 91L, 90L, 83L, 
    76L, 86L, 104L, 101L, 116L, 120L, 185L, 290L, 537L, 485L, 
    561L, 1142L, 1213L, 1235L, 1085L, 1052L, 987L, 918L, 746L, 
    620L, 396L, 280L, 214L, 148L, 148L, 94L, 107L, 69L, 55L, 
    69L, 47L, 43L, 49L, 30L, 42L, 51L, 41L, 39L, 40L, 38L, 22L, 
    37L, 26L, 40L, 56L, 54L, 74L, 99L, 114L, 114L, 120L, 114L, 
    123L, 131L, 170L, 147L, 163L, 163L, 160L, 158L, 163L, 124L, 
    115L, 176L, 171L, 214L, 320L, 507L, 902L, 1190L, 1272L, 1282L, 
    1146L, 896L, 597L, 434L, 216L, 141L, 101L, 86L, 65L, 55L, 
    35L, 49L, 29L, 55L, 53L, 57L, 34L, 43L, 42L, 13L, 17L, 20L, 
    27L, 36L, 47L, 64L, 77L, 82L, 82L, 95L, 107L, 96L, 106L, 
    93L, 114L, 102L, 116L, 128L, 123L, 212L, 203L, 165L, 267L, 
    550L, 761L, 998L, 1308L, 1613L, 1704L, 1669L, 1296L, 975L, 
    600L, 337L, 259L, 145L, 91L, 70L, 79L, 63L, 58L, 51L, 53L, 
    39L, 49L, 33L, 47L, 56L, 32L, 43L, 47L, 19L, 32L, 18L, 34L, 
    39L, 63L, 57L, 55L, 69L, 76L, 103L, 99L, 108L, 131L, 113L, 
    106L, 122L, 138L, 136L, 175L, 207L, 324L, 499L, 985L, 1674L, 
    1753L, 1419L, 1105L, 821L, 466L, 274L, 180L, 143L, 82L, 101L, 
    72L, 55L, 71L, 50L, 33L, 26L, 25L, 27L, 21L, 24L, 24L, 20L, 
    18L, 18L, 25L, 23L, 13L, 10L, 16L, 9L, 12L, 16L, 25L, 31L, 
    36L, 40L, 36L, 47L, 32L, 46L, 75L, 63L, 49L, 90L, 83L, 101L, 
    78L, 79L, 98L, 131L, 83L, 122L, 179L, 334L, 544L, 656L, 718L, 
    570L, 323L, 220L, 194L, 125L, 95L, 77L, 46L, 42L, 29L, 35L, 
    21L, 29L, 16L, 14L, 19L, 15L, 19L, 18L, 21L, 10L, 14L, 7L, 
    7L, 5L, 9L, 14L, 11L, 18L, 22L, 39L, 36L, 46L, 44L, 37L, 
    30L, 39L, 37L, 45L, 71L, 59L, 57L, 80L, 68L, 88L, 72L, 74L, 
    208L, 357L, 621L, 839L, 964L, 835L, 735L, 651L, 400L, 292L, 
    198L, 85L, 64L, 41L, 40L, 23L, 18L, 14L, 22L, 9L, 19L, 8L, 
    14L, 12L, 15L, 14L, 4L, 6L, 7L, 7L, 8L, 13L, 10L, 19L, 17L, 
    20L, 22L, 40L, 37L, 45L, 34L, 26L, 35L, 67L, 49L, 77L, 82L, 
    80L, 104L, 88L, 49L, 73L, 113L, 142L, 152L, 206L, 293L, 513L, 
    657L, 919L, 930L, 793L, 603L, 323L, 202L, 112L, 55L, 31L, 
    27L, 15L, 15L, 6L, 13L, 21L, 10L, 11L, 9L, 8L, 11L, 7L, 5L, 
    1L, 4L, 7L, 2L, 6L, 12L, 14L, 21L, 29L, 32L, 26L, 22L, 44L, 
    39L, 47L, 44L, 93L, 145L, 289L, 456L, 685L, 548L, 687L, 773L, 
    575L, 355L, 248L, 179L, 129L, 122L, 103L, 72L, 72L, 36L, 
    26L, 31L, 12L, 14L, 14L, 14L, 7L, 8L, 2L, 7L, 8L, 9L, 26L, 
    10L, 13L, 13L, 5L, 5L, 3L, 6L, 1L, 10L, 6L, 7L, 17L, 12L, 
    21L, 32L, 29L, 18L, 22L, 24L, 38L, 52L, 53L, 73L, 49L, 52L, 
    70L, 77L, 95L, 135L, 163L, 303L, 473L, 823L, 1126L, 1052L, 
    794L, 459L, 314L, 252L, 111L, 55L, 35L, 14L, 30L, 21L, 16L, 
    9L, 11L, 6L, 6L, 8L, 9L, 9L, 10L, 15L, 15L, 11L, 6L, 3L, 
    8L, 4L, 7L, 7L, 13L, 10L, 23L, 24L, 36L, 25L, 34L, 37L, 46L, 
    39L, 37L, 55L, 65L, 54L, 60L, 82L, 55L, 53L, 61L, 52L, 75L, 
    92L, 121L, 170L, 199L, 231L, 259L, 331L, 357L, 262L, 154L, 
    77L, 34L, 41L, 21L, 17L, 16L, 7L, 15L, 11L, 7L, 5L, 6L, 13L, 
    7L, 6L, 8L, 7L, 1L, 11L, 9L, 3L, 9L, 9L, 8L, 15L, 19L, 16L, 
    10L, 12L, 26L, 35L, 35L, 41L, 34L, 30L, 36L, 43L, 23L, 55L, 
    107L, 141L, 217L, 381L, 736L, 782L, 663L, 398L, 182L, 137L, 
    79L, 28L, 26L, 16L, 14L, 8L, 4L, 4L, 6L, 6L, 11L, 4L, 5L, 
    7L, 7L, 6L, 8L, 2L, 3L, 3L, 1L, 1L, 3L, 3L, 2L, 8L, 8L, 11L, 
    10L, 11L, 8L, 24L, 25L, 25L, 33L, 36L, 51L, 61L, 74L, 92L, 
    89L, 123L, 402L, 602L, 524L, 494L, 406L, 344L, 329L, 225L, 
    136L, 136L, 84L, 55L, 55L, 42L, 19L, 28L, 8L, 7L, 2L, 7L, 
    6L, 4L, 3L, 5L, 3L, 3L, 0L, 1L, 2L, 3L, 2L, 1L, 2L, 2L, 9L, 
    4L, 9L, 10L, 18L, 15L, 13L, 12L, 10L, 19L, 15L, 22L, 23L, 
    34L, 43L, 53L, 47L, 57L, 328L, 552L, 787L, 736L, 578L, 374L, 
    228L, 161L, 121L, 96L, 58L, 50L, 37L, 14L, 9L, 6L, 15L, 12L, 
    9L, 1L, 6L, 4L, 7L, 7L, 3L, 6L, 9L, 15L, 22L, 28L, 34L, 62L, 
    54L, 75L, 65L, 58L, 57L, 60L, 37L, 47L, 60L, 89L, 90L, 193L, 
    364L, 553L, 543L, 676L, 550L, 403L, 252L, 140L, 125L, 99L, 
    63L, 63L, 76L, 85L, 68L, 67L, 38L, 25L, 24L, 11L, 9L, 9L, 
    4L, 8L, 4L, 6L, 5L, 2L, 6L, 4L, 4L, 1L, 5L, 4L, 1L, 2L, 2L, 
    2L, 2L, 3L, 4L, 4L, 7L, 5L, 2L, 10L, 11L, 17L, 11L, 16L, 
    15L, 11L, 12L, 21L, 20L, 25L, 46L, 51L, 90L, 123L)), .Names = c("date", 
"cases"), row.names = c(NA, -835L), class = "data.frame")

2
पुराने साहित्य अक्सर इस तरह की चीज़ के लिए रोकोको जटिलता के सूत्रों में प्रसन्न होते हैं। व्यवहार में मैं एक प्रतिगमन समस्या के रूप में इस पर सोचने के लिए पीछे की ओर झुक जाता हूं ताकि प्रक्षेपित मान केवल प्रतिगमन से अनुमानित मान हैं। उदाहरण के लिए देखें आंकड़े ।stackexchange.com/questions/60500/ … मुख्य सिद्धांत यह है कि मुख्य चक्र प्रति वर्ष एक बार दोहराता है।
निक कॉक्स

1
व्यवहार में आप डेटा के लिए एक बहुत करीब चाहते हैं क्योंकि आप स्थानीय चौरसाई चाहते हैं। इसके लिए कई फूरियर जोड़े की आवश्यकता हो सकती है, लेकिन बहुत ही कम रिटर्न सेट करना होता है, ताकि प्रत्येक नई जोड़ी जल्द ही बहुत कम जोड़े। आपको बस इसे चूसना है और देखना है। सब कुछ प्लॉट करने से यह स्पष्ट हो जाता है।
निक कॉक्स

1
मैंने आपके डेटा के साथ इसे संक्षेप में आज़माया (स्टाटा का उपयोग करके, आर नहीं)। संक्षेप में, हालांकि आपके डेटा में चिह्नित मौसमी है यह इस दृष्टिकोण के लिए पर्याप्त रूप से नियमित रूप से काम करने के लिए पर्याप्त नहीं है: उदाहरण के लिए, न केवल चोटियों का समय बहुत भिन्न होता है, बल्कि चरम पर मामलों की संख्या भी होती है; कुछ वर्षों में लेकिन सभी नहीं कैलेंडर वर्ष के अंत में एक माध्यमिक शिखर है। इसके अलावा, मौसम की लंबी अवधि के रुझान के साथ मिश्रित होता है। मेरा अनुमान है कि दैनिक मामलों को प्राप्त करने के लिए आपको कुछ कड़ाई से स्थानीय प्रक्षेप का सहारा लेना चाहिए या साप्ताहिक श्रृंखला के सात-विस्तार का विस्तार करना चाहिए।
निक कॉक्स

1
नियंत्रण प्रणाली इंजीनियरिंग में Nyquist मानदंड नमूना दर के लिए एक मंजिल के रूप में उपयोग किया जाता है। यह आपके डेटा में दो बार से अधिक आवृत्ति पर नमूना कहता है। व्यवहार में यह 5x से ऊपर के नमूने के लिए अधिक परंपरागत है जिसे आप हल करने की उम्मीद करते हैं। यदि आपका इनपुट साप्ताहिक डेटा है, तो Nyquist का सुझाव है कि उच्चतम रिज़ॉल्व करने योग्य आवृत्ति 2 सप्ताह के आदेश पर है। यह बेहतर हो सकता है यदि आपके पास नमूना और बट्रेस को माध्य की सूचना देने के लिए अन्य साप्ताहिक आंकड़े हों। en.wikipedia.org/wiki/Nyquist-Shannon_sampling_theorem
EngrStudent

+1 उत्कृष्ट प्रश्न! क्या आप किसी भी संयोग से जानते हैं कि शोर में संकेत का पता कैसे लगाया जाता है (अधिमानतः आर में), बशर्ते आपके पास कई वितरण हैं, जहां शोर एक गाऊसी है और संकेत एक गाऊसी प्लस और दूसरा हिस्सा है? मैंने कई पैकेज और फ़ंक्शंस (सिग्नल, एफएफटी (), आदि) और यहां तक ​​कि डेटा के साथ खेला, फूरियर ट्रांसफॉर्मेशन और यहां तक ​​कि एंट्रॉपी उपायों को लागू करने की कोशिश की, लेकिन अब तक कोई फायदा नहीं हुआ। मैं एक प्रश्न का उत्तर देने की कोशिश कर रहा था (मेरी नहीं) और रास्ते में कुछ नया सीखने की कोशिश कर रहा हूं, क्योंकि मुझे यह विषय काफी रोचक लग रहा है।
०१:४० बजे असेम्बली बेलीख

जवाबों:


4

मैं फूरियर ट्रांसफॉर्म पर कोई विशेषज्ञ नहीं हूं, लेकिन ...

एपस्टीन की कुल नमूना सीमा एक मासिक नमूना दर के साथ 24 महीने थी: 1/12 वर्ष। आपकी नमूना सीमा 835 सप्ताह है। यदि आपका लक्ष्य दैनिक डेटा के आधार पर ~ 16 साल के डेटा के साथ एक वर्ष के लिए औसत का अनुमान लगाना है, तो आपको 1/365 वर्षों की नमूना दर की आवश्यकता होगी। तो 12 के लिए 52 को प्रतिस्थापित करें, लेकिन पहले इकाइयों को मानकीकृत करें और अपने 835 सप्ताह का विस्तार करके 835 * 7 = 5845 दिन करें। हालांकि, यदि आपके पास केवल साप्ताहिक डेटा बिंदु हैं, तो मैं चोटी के विश्लेषण के लिए 16 या 17 की थोड़ी गहराई के साथ 52 की एक नमूना दर का सुझाव देता हूं, वैकल्पिक रूप से 32 या 33 के लिए भी / विषम तुलना। तो डिफ़ॉल्ट इनपुट विकल्पों में शामिल हैं: 1) साप्ताहिक साधनों (या औसत निरपेक्ष विचलन, एमएडी, या उस सीमा तक कुछ) या 2) का उपयोग करने के लिए दैनिक मूल्यों का उपयोग करें, जो एक उच्च रिज़ॉल्यूशन प्रदान करते हैं।

लिबमैन एट अल। कट-ऑफ पॉइंट jmax = 2 को चुना। इसलिए, अंजीर 3. में कुछ भाग शामिल हैं और यह अंजीर की तुलना में साइन के शीर्ष पर अधिक सममित है। 2. बेस फ़्रीक्वेंसी में एक एकल भाग में शुद्ध साइन तरंग होती है। ) यदि एपस्टीन ने एक उच्च रिज़ॉल्यूशन (उदाहरण के लिए jmax = 12) का चयन किया होता, तो परिवर्तन संभवतः केवल अतिरिक्त घटकों के साथ मामूली उतार-चढ़ाव पैदा करता है, या शायद उसके पास कम्प्यूटेशनल शक्ति का अभाव है।

आपके डेटा के दृश्य निरीक्षण के माध्यम से आपको 16-17 चोटियां दिखाई देती हैं। मेरा सुझाव है कि आप 6, 11, 16 या 17 (या चित्र देखें) में jmax या "बिट डेप्थ" सेट करें और आउटपुट की तुलना करें। चोटियाँ जितनी ऊँची होती हैं, उतना ही वे मूल जटिल तरंग में योगदान करती हैं। तो 17-बैंड रिज़ॉल्यूशन या बिट डेप्थ मानने से 17 वां आंशिक 6 वें शिखर की तुलना में मूल तरंग पैटर्न में न्यूनतम योगदान देता है। हालाँकि, एक 34 बैंड-रिज़ॉल्यूशन के साथ आप लगातार विषम घाटियों द्वारा सुझाए गए समान और विषम चोटियों के बीच अंतर का पता लगा सकते हैं। थोड़ी गहराई आपके शोध प्रश्न पर निर्भर करती है, चाहे आप चोटियों में या दोनों चोटियों और घाटियों में रुचि रखते हैं, लेकिन यह भी कि वास्तव में आप मूल श्रृंखला को अनुमानित कैसे करना चाहते हैं।

फूरियर विश्लेषण आपके डेटा बिंदुओं को कम करता है। यदि आप फूरियर ट्रांसफॉर्म का उपयोग करके फ़ंक्शन को एक निश्चित बिट गहराई पर उलटा कर रहे थे, तो आप संभवतः क्रॉस-चेक कर सकते हैं यदि नया मतलब अनुमान आपके मूल साधनों के अनुरूप है। इसलिए, अपने चौथे प्रश्न का उत्तर देने के लिए: आपके द्वारा उल्लिखित प्रतिगमन पैरामीटर उस संवेदनशीलता और संकल्प पर निर्भर करते हैं जिसकी आपको आवश्यकता है। यदि आप एक सटीक फिट की इच्छा नहीं रखते हैं, तो हर तरह से बस ट्रांसफॉर्म में साप्ताहिक साधन इनपुट करें। हालांकि, सावधान रहें कि कम बिट गहराई भी डेटा को कम करती है। उदाहरण के लिए, ध्यान दें कि लिबरमैन और सहकर्मियों के विश्लेषण पर एपस्टीन के हार्मोनिक ओवरले कैसे कदम फ़ंक्शन के मध्य-बिंदु को याद करते हैं, तिरछा वक्र थोड़ा दाईं ओर (यानी अस्थायी। बहुत अधिक), चित्र 3 में दिसंबर में।


लाइबमैन और सहकर्मियों के पैरामीटर:

  • बिट गहराई: 2

एपस्टीन के पैरामीटर:

  • नमूना दर: 12 [हर महीने]
  • नमूना रेंज: 24 महीने
  • बिट गहराई: 6

आपके पैरामीटर:

  • नमूना दर: 365 [हर दिन]

  • नमूना रेंज: 5845 दिन

सटीक बिट गहराई दृष्टिकोण

दृश्य निरीक्षण के आधार पर सटीक फिट। (यदि आपके पास शक्ति है, तो बस यह देखें कि कम बिट-डेप्थ की तुलना में क्या होता है।)

  • पूर्ण स्पेक्ट्रम (चोटियों): 17
  • पूर्ण स्पेक्ट्रम (सम / विषम): 34

चर बिट गहराई दृष्टिकोण

शायद यही आप करना चाहते हैं:

  • चोटियों की तुलना केवल: 6, 11, 16, 17 से करें
  • सम / विषम की तुलना करें: 12, 22, 32, 34
  • Resynthesize और तुलना का मतलब है

यह दृष्टिकोण एपस्टीन में फिगर्स की तुलना के समान होगा, यदि आप फिर से परिवर्तन को उलट देते हैं, अर्थात मूल समय श्रृंखला के सन्निकटन में भाग का संश्लेषण करते हैं। आप resynthesized घटता के असतत बिंदुओं की औसत मानों से तुलना कर सकते हैं, शायद अपनी बिट गहराई पसंद की संवेदनशीलता को इंगित करने के लिए महत्वपूर्ण अंतरों के लिए भी परीक्षण करें।


अद्यतन 1:

थोड़ी गहराई

बाइनरी अंक के लिए थोड़ा - या तो 0 या 1. बिट्स 010101 एक वर्ग तरंग का वर्णन करेगा। बिट गहराई 1 बिट है। एक आरा लहर का वर्णन करने के लिए आपको अधिक बिट्स की आवश्यकता होगी: 0123210. एक तरंग जितनी अधिक जटिल होती है उतनी अधिक बिट्स की आवश्यकता होती है:

यह कुछ हद तक सरलीकृत स्पष्टीकरण है, लेकिन जितनी अधिक जटिल समय श्रृंखला है, उतने अधिक बिट्स इसे मॉडल करने के लिए आवश्यक हैं। दरअसल, "1" एक साइन वेव कंपोनेंट है न कि एक स्क्वायर वेव (एक स्क्वायर वेव 3 2 1 0 जैसा होता है - अटैच्ड फिगर देखें)। 0 बिट्स एक सपाट रेखा होगी। बिट की गहराई में कमी के साथ सूचना खो जाती है। उदाहरण के लिए, सीडी-गुणवत्ता ऑडियो आमतौर पर 16 बिट है, लेकिन लैंड-लाइन फोन गुणवत्ता ऑडियो अक्सर 8 बिट्स के आसपास होता है।

ग्राफ़ पर ध्यान केंद्रित करते हुए कृपया इस चित्र को बाएँ से दाएँ पढ़ें:

FFT

आपने वास्तव में पावर स्पेक्ट्रम विश्लेषण पूरा किया है (हालांकि आपके आंकड़े में उच्च रिज़ॉल्यूशन पर)। आपका अगला लक्ष्य यह पता लगाना होगा: समय श्रृंखला के साधनों को सही ढंग से पकड़ने के लिए मुझे पावर स्पेक्ट्रम में कितने घटकों की आवश्यकता है?

अद्यतन २


फ़िल्टर करने या न करने के लिए

मुझे पूरी तरह से यकीन नहीं है कि आप प्रतिगमन में बाधा का परिचय कैसे देंगे क्योंकि मैं केवल अंतराल बाधाओं से परिचित हूं, लेकिन शायद डीएसपी आपके समाधान है। यह वही है जो मैंने अब तक सोचा है:

  • चरण 1. पूर्ण डेटा सेट पर फूरियर फ़ंक्शन के माध्यम से साइनस घटकों में श्रृंखला को तोड़ें (दिनों में)

  • चरण 2. एक उल्टे फूरियर रूपांतरण के माध्यम से समय श्रृंखला को फिर से बनाएँ, मूल डेटा के लिए युग्मित अतिरिक्त मतलब-बाधा के साथ: मूल साधनों से प्रक्षेपों के विचलन को एक दूसरे को रद्द करना चाहिए (हरजल्ला, 1995)।

मेरा सबसे अच्छा अनुमान है कि अगर मैं हरज़ल्लाह (1995, छवि 2) को सही ढंग से समझूं तो आपको आत्मकथा का परिचय देना होगा। तो यह शायद एक अनंत प्रतिक्रिया फ़िल्टर (IIR) के अनुरूप होगा?

IIR http://paulbourke.net/misc विविध / ar /

संक्षेप में:

  1. Derive का मतलब होता है Raw data
  2. फूरियर ट्रांसफॉर्म रॉ डेटा
  3. फूरियर उलटा रूपांतरण रूपांतरित डेटा।
  4. IIR का उपयोग करके परिणाम को फ़िल्टर करें

शायद आप फूरियर विश्लेषण के माध्यम से जाने के बिना एक IIR फ़िल्टर का उपयोग कर सकते हैं? फूरियर विश्लेषण का एकमात्र लाभ जैसा कि मैं देखता हूं कि यह अलग करना और निर्धारित करना है कि कौन से पैटर्न प्रभावशाली हैं और वे कितनी बार reoccur करते हैं (यानी दोलन)। फिर आप कम योगदान देने वाले लोगों को फ़िल्टर करने का निर्णय ले सकते हैं, उदाहरण के लिए कम से कम योगदान वाली चोटी (या अपने मानदंडों के आधार पर फ़िल्टर) पर एक संकीर्ण पायदान फ़िल्टर का उपयोग करना। शुरुआत के लिए, आप कम योगदान देने वाली विषम घाटियों को फ़िल्टर कर सकते हैं जो "सिग्नल" में शोर की तरह दिखाई देती हैं। शोर बहुत कम मामलों और कोई पैटर्न की विशेषता है। विषम आवृत्ति घटकों पर एक कंघी फ़िल्टर शोर को कम कर सकता है - जब तक कि आपको वहां एक पैटर्न न मिले।

केवल व्याख्यात्मक उद्देश्यों के लिए कुछ मनमाने ढंग से बनिए- क्या आप घाटियों में शोर देख सकते हैं?

ओह - उस के लिए एक आर समारोह है !?

IIR- फिल्टर की खोज करते समय मुझे पता चलता है कि R पैकेज सिग्नल पैकेज में प्रक्षेपित है। इस बिंदु तक मैंने जो कुछ कहा, उसे भूल जाओ। प्रक्षेप हरज़ल्लाह की तरह काम करना चाहिए: http://cran.r-project.org/web/packages/signal/signal.pdf

कार्यों के साथ चारों ओर खेलते हैं। चाल चलनी चाहिए।


अद्यतन 3

interp1 interp1 नहीं

case.interp1 <- interp1(x=(ts.frame$no.influ.cases[!is.na(ts.frame$no.influ.case)]),y=ts.frame$yearday[!is.na(ts.frame$no.influ.case)],xi=mean(WEEKLYMEANSTABLE),method = c("cubic"))

Xi को मूल साप्ताहिक साधनों पर सेट करें।


इस उत्तर के लिए बहुत बहुत धन्यवाद! मेरा शोध लक्ष्य सरल है: मेरे पास साप्ताहिक साधन हैं और मैं दैनिक अनुमान प्राप्त करना चाहता हूं और एक सप्ताह में दैनिक अनुमानों का मतलब साप्ताहिक अनुमान (मूल डेटा बिंदु) के बराबर होना चाहिए। क्या आपको लगता है कि यह संभव है? इसके अलावा, मुझे समझ नहीं आ रहा है कि "बिट डेप्थ" और "पीक एनालिसिस" का क्या मतलब है (मुझे फूरियर ट्रांसफॉर्मेशन का कोई अनुभव नहीं है)।
COOLSerdash

1
@COOLSerdash मेरा अपडेट देखें। हाँ यह संभव है! लेकिन आपको मूल माध्यम श्रृंखला से मूल साधनों के साथ resynthesized समय श्रृंखला से अनुमानित साधनों की तुलना करने का सबसे अच्छा तरीका जानने की आवश्यकता होगी।
noumenal

(Btw: +1 कल, मैं आज और वोट नहीं दे सकता)। अपडेट के लिए बहुत बहुत धन्यवाद, यह अभी स्पष्ट है। मैंने निम्नलिखित प्रक्रिया के बारे में सोचा: 1) प्रतिगमन के साप्ताहिक साधनों के लिए एक फूरियर फ़ंक्शन को फिट करता है, 2) प्रतिगमन की भविष्यवाणियों का उपयोग साप्ताहिक मूल्यों के बीच अंतराल ("दैनिक मूल्यों को प्राप्त करने के लिए" 3) के लिए "भरने" के लिए करें। प्रत्येक सप्ताह, सभी दैनिक मूल्यों के माध्य की गणना करें और इसका अर्थ मूल मूल्य के बराबर होना चाहिए। कागज में, एपस्टीन ने फ़ंक्शन को वांछित गुणों के लिए बाध्य करने के लिए कुछ प्रकार के "सुधार" कारक का उपयोग किया, लेकिन मुझे अभी भी यकीन नहीं है कि प्रतिगमन के साथ कैसे करना है।
COOLSerdash

@COOLSerdash अपडेट 2 देखें! अंतिम पैराग्राफ पर जाएं।
नौमेनल

बिलकुल शानदार! शोध के लिए आपका बहुत-बहुत धन्यवाद। ध्यान दें कि मैं स्प्लिन (रैखिक और घन) का उपयोग करके हरज़ल्लाह के दृष्टिकोण को लागू करने में कामयाब रहा हूं । इसलिए मुझे लगता है कि मुझे इसकी आवश्यकता होगी interp। मैंने अपना प्रश्न संपादित किया है। फिर से बहुत बहुत धन्यवाद।
COOLSerdash
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.