शेयर बाजार की भविष्यवाणी करने के लिए किस मशीन लर्निंग एल्गोरिदम का उपयोग किया जा सकता है?


15

वैकल्पिक रूप से, विदेशी मुद्रा बाजारों की भविष्यवाणी करने के लिए। मुझे पता है कि यह बहुत जटिल हो सकता है, इसलिए एक परिचय के रूप में, मैं एक सरल भविष्यवाणी एल्गोरिथ्म की तलाश कर रहा हूं जिसमें कुछ सटीकता है।

(यह एक M.Sc. विश्वविद्यालय परियोजना के लिए है जो चार महीने तक रहता है)

मैंने पढ़ा है कि बहु-परत तंत्रिका नेटवर्क उपयोगी हो सकता है। उस पर कोई विचार? इसके अलावा, सोशल मीडिया के शब्दार्थ विश्लेषण बाजार व्यवहार में अंतर्दृष्टि प्रदान कर सकते हैं जो शेयर बाजार को प्रभावित करता है। हालांकि, इस समय परियोजना के दायरे के बाहर शब्दार्थ विश्लेषण थोड़ा सा है।


15
मेरा, लेकिन स्पष्ट कारणों के लिए मैं यह सब अपने आप को रख रहा हूँ!
बेबलप्रूफरीडर

7
यदि कोई कुशल बाजार की परिकल्पना को मानता है, तो औसत बाजार रिटर्न (बिना अंदरूनी जानकारी) के मुकाबले लगातार उच्चतर हासिल करना असंभव है, जिसे वर्तमान दरों / मूल्यों में बनाया गया है। बहुत सारे लोग इससे सहमत नहीं हैं, लेकिन लगभग सभी इस बात से सहमत हैं कि यह आकस्मिक निवेशक के लिए सही है। दूसरे शब्दों में, एक 3 लाइन मॉडल ऑफ रैंड () संभवतः लगभग विशिष्ट निवेशक के रूप में अच्छा है: P
rm999

5
ऐसा लगता नहीं है कि कोई भी ऐसा एल्गोरिथ्म साझा करने को तैयार होगा जिसमें कोई भी नमूना सटीकता हो। सिवाय, शायद, कुछ प्रकाशित शैक्षणिक कार्य जहां विसंगति छोटी है और लेनदेन लागत को कवर नहीं करती है।
एनपीई

2
अकादमिक कार्य के लिए, कीमतों का अनुमान लगाने के बजाय इसे भविष्यवाणी करने की कोशिश करना अधिक सार्थक हो सकता है। भविष्यवाणी शायद असफल साबित होगी, लेकिन मॉडलिंग कम से कम कुछ अंतर्दृष्टि प्रदान कर सकती है कि चीजें वास्तव में कैसे काम करती हैं, और सैद्धांतिक रूप से भविष्यवाणी को बढ़ाया जा सकता है।
HighBandWidth

2
@ मुझे नहीं लगता कि यह ओवरफिटिंग के बारे में है, यह भविष्यवाणियों के लिए उपयोग किए जाने वाले भविष्यवाणियों की अनुमति देने के बारे में है, उदाहरण के लिए जो स्टॉक आंदोलनों के दौरान / बाद में होने वाले चर हैं - यदि आप पाते हैं कि ऐप्पल और माइक्रोसॉफ्ट स्टॉक का संबंध है, तो इस तथ्य का उपयोग नहीं किया जा सकता है msft स्टॉक की भविष्यवाणी करने के लिए लेकिन बहुत जानकारीपूर्ण हो सकता है।
rm999

जवाबों:


17

जैसा कि बबलप्रूफरीडर ने उल्लेख किया है , जिनके पास एक सफल एल्गोरिदम है वे इसके बारे में बहुत गुप्त हैं। इस प्रकार यह संभावना नहीं है कि किसी भी व्यापक रूप से उपलब्ध एल्गोरिदम बॉक्स से बहुत उपयोगी होने जा रहा है जब तक कि आप इसके साथ कुछ चालाक नहीं कर रहे हैं (जिस बिंदु पर यह व्यापक रूप से उपलब्ध होने वाले स्टॉप के प्रकार है क्योंकि आप इसे जोड़ रहे हैं)।

उस ने कहा, ऑटोरेग्रेसिव पूर्णांकित मूविंग एवरेज (एआरआईएमए) मॉडल के बारे में सीखना समय-श्रृंखला डेटा के पूर्वानुमान के लिए एक उपयोगी शुरुआत हो सकती है। हालांकि यादृच्छिक परिणामों से बेहतर की उम्मीद न करें।


5
+1: मैं कितनी बार पढ़ रहा हूं या एक कक्षा में हूं और लोगों को सुना है जो मानते हैं कि यदि उनके पास एक जटिल-पर्याप्त एल्गोरिथ्म है, तो वे स्टॉक / बिजली / वस्तुओं के बाजारों में समृद्ध हो सकते हैं। आप ओवरफिटिंग आदि के बारे में समझाने की कोशिश करते हैं, लेकिन कोई फायदा नहीं हुआ। हेक, जहां तक ​​मुझे पता है, एक अंदरूनी सूत्र नहीं होने के कारण, सफल स्टॉक-ट्रेडिंग सॉफ्टवेयर बिना किसी लेनदेन शुल्क, मध्यस्थता और उच्च गति पर निर्भर करता है। अत्याधुनिक अब स्वचालित व्यापार नियमों में खामियों का उपयोग करना है और चूसने वाले-पंच अन्य स्वचालित व्यापारियों को उच्च गति प्रस्ताव / बोलियों को वापस लेना है।
वेन

1
दूसरा मुद्दा यह है कि कई लोग एक ही एल्गोरिथ्म के साथ समाप्त होते हैं क्योंकि उन्होंने अपना प्रशिक्षण बिल्कुल उसी डेटा पर किया था, फिर वॉल्यूम बिक्री / खरीद के माध्यम से। क्या किसी भी एल्गोरिथ्म में लंबे समय तक सटीकता की उम्मीद की जाएगी?
मिशेल

@ ओवर-फिटिंग को कम करने के लिए रणनीति हैं, हालांकि समय श्रृंखला डेटा पर लागू करना मुश्किल है।
Zach

1
@Zach: हां, ओवरफिटिंग को दंडित करने के तरीके हैं, लेकिन यह वह रवैया है जो मैं परिलक्षित कर रहा हूं: जो लोग एक्सेल में कुछ बुनियादी (शायद गलत) वक्र फिटिंग करते हैं और महसूस करते हैं कि वे अपने गुप्त सॉस के साथ पैसे कमा सकते हैं , लेकिन क्या वे वास्तव में जरूरत है उन अत्याधुनिक, परिष्कृत एल्गोरिदम में से एक है कि प्रोफेसर सिर्फ कक्षा के साथ साझा नहीं करेंगे। वह एल्गोरिथ्म एक दस्ताने की तरह डेटा को फिट करेगा, और फिर एक्सेल स्प्रेडशीट का उपयोग करने वाले उन सभी अन्य सट्टेबाजों की तुलना में बहुत बेहतर भविष्यवाणी करता है ... लेकिन प्रोफेसर ओवरफिटिंग और डेटा की सीमाओं के बारे में बताते हैं। आह।
वेन

12

मुझे लगता है कि आपके उद्देश्यों के लिए, आपको एक मशीन लर्निंग एल्गोरिदम चुनना चाहिए जो आपको दिलचस्प लगता है और इसे आज़माएं।

कुशल बाजार सिद्धांत के बारे में, बाजार किसी भी समय पैमाने पर कुशल नहीं होते हैं। इसके अलावा, कुछ लोग (अकादमिक और वास्तविक जीवन दोनों में) बौद्धिक चुनौती से प्रेरित होते हैं, न कि केवल अमीर-जल्दी-जल्दी पाने के लिए, और वे दिलचस्प परिणाम प्रकाशित करते हैं (और मैं एक दिलचस्प के रूप में एक असफल परिणाम गिनता हूं)। लेकिन एक चुटकी नमक के साथ आप जो कुछ भी पढ़ते हैं उसका इलाज करें; यदि परिणाम वास्तव में अच्छे हैं, तो शायद उनकी वैज्ञानिक विधि नहीं है।

डेटा खनन आर के साथ आपके लिए एक उपयोगी पुस्तक हो सकती है; यह मूल्यपूर्ण है, इसलिए इसे अपने विश्वविद्यालय के पुस्तकालय में आज़माएं और खोजें। अध्याय 2 में वही शामिल है जो आप करना चाहते हैं, और वह एक तंत्रिका जाल के साथ सर्वोत्तम परिणाम प्राप्त करता है। लेकिन चेतावनी दी जाती है कि वह खराब परिणाम प्राप्त करता है, और उन्हें प्राप्त करने के लिए बहुत अधिक सीपीयू समय खर्च करता है। अमेज़ॅन समीक्षाएं इंगित करती हैं कि पुस्तक की लागत $ 20 अधिक है क्योंकि उस अध्याय में वित्त शब्द का उल्लेख है ; इसे पढ़ते समय मुझे आभास हुआ कि प्रकाशक ने इसे लिखने के लिए उसे धक्का दिया था। उन्होंने अपना होमवर्क किया, डॉक्स पढ़ा, सही मेलिंग सूचियों का उपयोग किया, लेकिन उनका दिल इसमें नहीं था। मैं इसे से कुछ उपयोगी आर ज्ञान मिला, लेकिन इसके साथ बाजार की धड़कन नहीं होगी :-)


@ डारेन - मुझे आपकी शैली पसंद है।
rolando2

1
R के साथ डेटा माइनिंग का ड्राफ्ट संस्करण (मई 2003) यहां पाया जा सकता है । (मेरे पास पुस्तक नहीं है, इसलिए मैं यह नहीं कह सकता कि दो संस्करणों के बीच की खाई क्या है।)
chl

@chi धन्यवाद! मैंने त्वरित रूप से देखा, और केवल दो चार अध्याय हैं। लेकिन इससे भी बड़ा अंतर यह है कि प्रिडिक्टिंग स्टॉक मार्केट रिटर्न्स चैप्टर बहुत अलग है। एक्सटी या क्वांटम का कोई उल्लेख नहीं है और इसके बजाय टीएस पैकेज का उपयोग कर रहे हैं, और भविष्यवाणियों के लिए एसीएफ और मार्स पैकेज का उपयोग कर रहे हैं। यह लगभग एक बोनस अध्याय की तरह है, और मैं इसे ठीक से पढ़ने के लिए समय बनाने जा रहा हूं। वह अभी भी तंत्रिका जाल का उपयोग कर रहा है, लेकिन उनकी तुलना एसवीएम से नहीं कर रहा है जैसा कि प्रकाशित पुस्तक में है।
डैरेन कुक

10

मेरे दिमाग में, कोई भी रन-ऑफ-द-मिल मजबूत AI जो निम्नलिखित में से सभी को आसानी से कर सकता है, एक सांख्यिकीय रूप से महत्वपूर्ण भविष्यवाणी का उत्पादन कर सकता है:

  • अफवाहों को इकट्ठा करें और समझें

  • सभी सरकारी ज्ञान तक पहुंच और व्याख्या

  • हर प्रासंगिक देश में ऐसा करें

  • प्रासंगिक भविष्यवाणियां करें:

    • मौसम की स्थिति

    • आतंकवादी गतिविधि

    • विचार और व्यक्तियों की भावनाएँ

    • बाकी सब कुछ जो व्यापार को प्रभावित करता है

सांख्यिकीय विश्लेषण वास्तव में आपकी चिंताओं का कम से कम है।


4

आप R में auto.arima और ets फ़ंक्शंस आज़मा सकते हैं। आपको रगार्च पैकेज के साथ कुछ सफलता भी मिल सकती है , लेकिन स्वचालित मापदंडों के चयन के लिए कोई मौजूदा कार्य नहीं है। हो सकता है कि आप माध्य मॉडल के लिए पैरामीटर प्राप्त कर सकें auto.arima, फिर उन्हें पास करें rugarchऔर जोड़ें garch(1,1)?

वहाँ सभी तरह के ब्लॉग हैं जो ऐसा करने का दावा करते हैं। यहां एक अरिमा मॉडल (और बाद में एक गार्च मॉडल) और सिस्टम का उपयोग करके एक SVM मॉडल का उपयोग किया जाता है । आपको बहुत सारी अच्छी जानकारी मिलेगी FOSS ट्रेडिंग के बारे में मिलेगी, खासकर यदि आप उसके ब्लॉगरोल पर ब्लॉग पढ़ना शुरू करते हैं।

जो भी मॉडल आप उपयोग करते हैं, वह क्रॉस-मान्य और बेंचमार्क सुनिश्चित करें! मुझे बहुत आश्चर्य होगा अगर आपको एक अरिमा, ईटीएस, या यहां तक ​​कि गार्च मॉडल मिला जो एक भोले मॉडल को लगातार नमूने से हरा सकता है । समय श्रृंखला क्रॉस-सत्यापन के उदाहरण यहां और यहां देखे जा सकते हैं । ध्यान रखें कि आप वास्तव में जो पूर्वानुमान लगाना चाहते हैं वह रिटर्न है, कीमतें नहीं।


2

मुझे एक मशीन लर्निंग अप्रोच का पता है जो वर्तमान में कम से कम एक हेज फंड के उपयोग में है। numer.ai फंड के कार्यों को निर्देशित करने के लिए उपयोगकर्ता द्वारा प्रदान की गई मशीन लर्निंग एल्गोरिदम का एक पहनावा उपयोग कर रहा है।

दूसरे शब्दों में: एक हेज फंड कुछ सौ निवेश वाहनों, अधिकांश संभावित शेयरों पर डेटा के एक एन्क्रिप्टेड संस्करण के लिए खुली पहुंच प्रदान करता है। हजारों डेटा वैज्ञानिक और उस तरह के सभी मशीन लर्निंग एल्गोरिदम को उस डेटा के विरुद्ध प्रशिक्षित करते हैं और परिणामों को स्कोरबोर्ड पर अपलोड करते हैं। उच्चतम स्कोरर को उनके परिणामों की सटीकता के आधार पर बहुत कम धनराशि मिलती है और उनका परिणाम ऑनलाइन कब तक उपलब्ध होता है।

सबसे अच्छी भविष्यवाणियों को निश्चित रूप से एल्गोरिदम के टुकड़ो द्वारा किया जाता है।

इसलिए आपके पास प्रशिक्षित अनुमान प्रदान करने वाले बहुत सारे वैज्ञानिक हैं, जिनमें से कुछ स्वयं अनुमानों के अनुरुप हैं और हेज फंड अपने निवेश को निर्देशित करने के लिए सभी प्रदान किए गए अनुमानों के पहनावे का उपयोग करता है।

इसके बजाय दिलचस्प हेज फंड के परिणामों ने मुझे दो चीजें सिखाईं:

  1. शेयर बाजार पर भविष्यवाणियों को अक्सर भविष्यवाणियों के रूप में देखा जाता है।
  2. अच्छी भविष्यवाणियों के लिए खुद को बांधने की इच्छा से अधिक टुकड़ियों की आवश्यकता होती है ...

यदि आप जाना चाहते हैं, तो जाएँ: https://numer.ai/ नहीं, मैं उनके साथ संबद्ध नहीं हूँ, मैं संभवतः अपने दिन ऑनलाइन नहीं बिताऊंगा। , लेकिन केवल उन लोगों को भुगतान करना जो औसत दर्जे का परिणाम प्रदान करते हैं :)

Numer.ai समुदाय का एक मंच है जहां वे अपने दृष्टिकोण पर चर्चा करते हैं ताकि आप दूसरों से सीख सकें जो ऐसा करने की कोशिश कर रहे हैं।

व्यक्तिगत रूप से मुझे लगता है कि एक अच्छा एल्गोरिथ्म वाला कोई भी व्यक्ति इसे बहुत गुप्त रखने वाला है।


1

आपको जीएमडीएच-प्रकार तंत्रिका नेटवर्क का प्रयास करना चाहिए। मुझे पता है कि शेयर बाजार की भविष्यवाणी के लिए कुछ सफल वाणिज्यिक पैकेज इसका उपयोग कर रहे हैं, लेकिन इसका उल्लेख केवल दस्तावेज की गहराई में है। संक्षेप में, यह एक बहुपरत पुनरावृत्त तंत्रिका नेटवर्क है, इसलिए आप सही रास्ते पर हैं।


0

मुझे लगता है कि शेयर बाजार में छिपे हुए मार्कोव मॉडल लोकप्रिय हैं। ध्यान रखने वाली सबसे महत्वपूर्ण बात यह है कि आप एक ऐसा एल्गोरिथ्म चाहते हैं जो आपके डेटा के लौकिक पहलू को संरक्षित करे।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.