मैं एयरलाइनों के मूल्य-निर्धारण व्यवहार की जांच करना चाहता हूं - विशेष रूप से एयरलाइंस प्रतियोगियों के मूल्य निर्धारण पर कैसे प्रतिक्रिया देता है।
जैसा कि मैं कहूंगा कि अधिक जटिल विश्लेषण के बारे में मेरा ज्ञान काफी सीमित है, मैंने डेटा के समग्र दृष्टिकोण को इकट्ठा करने के लिए ज्यादातर सभी बुनियादी तरीकों को किया है। इसमें सरल रेखांकन शामिल हैं जो पहले से ही समान पैटर्न की पहचान करने में मदद करते हैं। मैं एसएएस एंटरप्राइज 9.4 का भी उपयोग कर रहा हूं।
हालाँकि मैं अधिक संख्या आधारित दृष्टिकोण की तलाश में हूँ।
डेटा सेट
(सेल्फ) एकत्र किए गए डेटा सेट का उपयोग मैं ~ 54.000 किराए के आसपास कर रहा हूं। सभी किरायों को एक 60 दिन की समय खिड़की पर, दैनिक आधार पर (प्रत्येक रात 00:00 बजे) एकत्र किया गया था।
इसलिए, उस समय खिड़की के भीतर हर किराया होता है , किराया की उपलब्धता के साथ-साथ उड़ान के प्रस्थान की तारीख करने के लिए कई बार विषय है जब यह किराये का संग्रह दिनांक के आधार पर दिया जाता है। (आप उड़ान के लिए किराया जमा नहीं कर सकते हैं जब उड़ान की प्रस्थान तिथि अतीत में हो)
इस तरह मूल रूप से दिखाई देने वाला विकृत: (फर्जी डेटा)
+--------------------+-----------+--------------------+--------------------------+---------------+
| requestDate | price| tripStartDeparture | tripDestinationDeparture | flightCarrier |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 725.32 | 16APR2015:10:50:02 | 23APR2015:21:55:04 | XA |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 966.32 | 16APR2015:13:20:02 | 23APR2015:19:00:04 | XY |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 915.32 | 16APR2015:13:20:02 | 23APR2015:21:55:04 | XH |
+--------------------+-----------+--------------------+--------------------------+---------------+
"DaysBforeforeDeparture" की गणना जहाँ के माध्यम से की जाती है
- मैं और अंतराल (प्रस्थान से पहले दिन)
- किराया और उड़ान की तारीख
- c & तारीख जिसमें किराया एकत्र किया गया था
यहाँ I (DaysBeforeDep।) (नकली डेटा!) द्वारा सेट किए गए समूहीकृत डेटा का एक उदाहरण है।
+-----------------+------------------+------------------+------------------+------------------+
| DaysBefDeparture | AVG_of_sale | MIN_of_sale | MAX_of_sale | operatingCarrier |
+-----------------+------------------+------------------+------------------+------------------+
| 0 | 880.68 | 477.99 | 2,245.23 | DL |
+-----------------+------------------+------------------+------------------+------------------+
| 0 | 904.89 | 477.99 | 2,534.55 | DL |
+-----------------+------------------+------------------+------------------+------------------+
| 0 | 1,044.39 | 920.99 | 2,119.09 | LH |
+-----------------+------------------+------------------+------------------+------------------+
मैं अब तक क्या लेकर आया था
रेखा रेखांकन को देखते हुए मैं पहले ही अनुमान लगा सकता हूं कि कई रेखाओं में एक उच्च सहसंबंध कारक होगा। इसलिए, मैंने समूहीकृत डेटा पर पहले सहसंबंध विश्लेषण का उपयोग करने की कोशिश की। लेकिन क्या यह सही तरीका है? मूल रूप से मैं अब व्यक्तिगत मूल्यों पर बल्कि औसत से सहसंबंध बनाने की कोशिश करता हूं? क्या कोई और तरीका है?
मैं अनिश्चित हूं कि प्रतिगमन मॉडल यहां फिट बैठता है, क्योंकि कीमतें किसी भी रैखिक रूप में नहीं चलती हैं और गैर-रैखिक दिखाई देती हैं। क्या मुझे किसी एयरलाइन के मूल्य विकास के लिए एक मॉडल फिट करना होगा
पुनश्च: यह एक लंबी पाठ-दीवार है। अगर मुझे कुछ भी स्पष्ट करने की आवश्यकता है तो मुझे बताएं। मैं इस उप के लिए नया हूँ।
किसी का कोई सुराग? :-)