ऐतिहासिक स्टॉक डेटा का स्रोत [बंद]


239

मैं एक शेयर बाजार सिम्युलेटर बनाने की कोशिश कर रहा हूं (शायद अंततः एक भविष्यवाणी एआई में बढ़ रहा है), लेकिन मुझे उपयोग करने के लिए डेटा खोजने में परेशानी हो रही है। मैं ऐतिहासिक स्टॉक मार्केट डेटा के स्रोत (उम्मीद से मुक्त) की तलाश कर रहा हूं।

आदर्श रूप से, यह NASDAQ और NYSE पर हर प्रतीक की कीमत और मात्रा (और शायद दूसरों को अगर मुझे रोमांच मिलता है) के साथ एक बहुत ही बढ़िया (दूसरा या मिनट अंतराल) डेटा सेट होगा। किसी को भी इस तरह की जानकारी के लिए एक स्रोत का पता है?

मुझे यह सवाल मिला जो इंगित करता है कि याहू सीएसवी प्रारूप में ऐतिहासिक डेटा प्रदान करता है, लेकिन मैं यह पता लगाने में असमर्थ हूं कि इसे साइट की सरसरी परीक्षा में कैसे प्राप्त किया जाए।

मुझे CSV फ़ाइलों में डेटा टुकड़ा डाउनलोड करने का विचार भी पसंद नहीं है ... मुझे लगता है कि याहू पहले कुछ हज़ार अनुरोधों के बाद परेशान हो जाएगा और मुझे बंद कर देगा।

मैंने एक और सवाल भी खोजा , जिससे मुझे लगा कि मैं जैकपॉट मारूंगा, लेकिन दुर्भाग्य से ओपनटिक साइट ने अपने दरवाजे बंद कर लिए हैं ... बहुत बुरा, क्योंकि मुझे लगता है कि वे वही थे जो मैं चाहता था।

मैं हर दिन हर प्रतीक के खुले / बंद मूल्य और मात्रा के डेटा का उपयोग करने में सक्षम हो जाऊंगा, लेकिन अगर मैं इसे प्राप्त कर सकता हूं तो मैं सभी डेटा को पसंद करूंगा। कोई अन्य सुझाव?


4
@rmeador, Yahoo आपको कितने भी अनुरोध करने पर बंद नहीं करेगा, लेकिन Google आपको बंद कर देगा। मैं याहू से 4GB ईओडी की ऐतिहासिक कीमतों को लगभग 5-6 घंटे में बिना बंद किए डाउनलोड कर सकता हूं। बाजार में शामिल होने के बाद से उनके ईओडी ऐतिहासिक कीमतों के साथ लगभग 7,000 स्टॉक हैं। अधिक जानकारी और नमूना स्रोत कोड के लिए मेरा उत्तर देखें।
किरिल

मुझे लगता है कि ईओडी डेटा पर्याप्त जानकारीपूर्ण नहीं है। यदि आप टिक-बाय-टिक कोट और ट्रेड्स चाहते हैं, तो मेरा मानना ​​है कि बहुभुज सबसे सस्ता है।
क्विंटन पाइक

जवाबों:


226

मुझे अपना 2 Let जोड़ने दें, हेज-फंड के लिए अच्छा और स्वच्छ डेटा प्राप्त करना मेरा काम है, मैंने काफी डेटा फीड और ऐतिहासिक डेटा प्रदाता देखे हैं। यह मुख्य रूप से यूएस स्टॉक डेटा के बारे में है।

शुरू करने के लिए, यदि आपके पास याहू से डेटा डाउनलोड करने के लिए कुछ पैसे नहीं हैं, तो सीएसआई डेटा से सीधे दिन का डेटा प्राप्त करें , यही वह जगह है जहां याहू को अपने ईओडी डेटा के साथ-साथ AFAIK भी मिलता है। उनके पास एक एपीआई है जहां आप डेटा को जो भी स्वरूप चाहते हैं, निकाल सकते हैं। मुझे लगता है कि डेटा के लिए वार्षिक सदस्यता कुछ $ 100 रुपये है।

एक मुफ्त सेवा से डेटा डाउनलोड करने में मुख्य समस्या यह है कि आपको केवल ऐसे स्टॉक मिलते हैं जो अभी भी मौजूद हैं, इसे सर्वाइवरशिप बायस कहा जाता है और यदि आप कई शेयरों को देखते हैं तो आप गलत परिणाम दे सकते हैं, क्योंकि आप केवल उन लोगों को शामिल करेंगे जिन्होंने इसे बनाया है दूर और नहीं है कि डी सूचीबद्ध थे।

कुछ इंट्रा डे डेटा के साथ खेलने के लिए मैं IQFeed में देखूंगा , वे ऐतिहासिक डेटा निकालने के लिए कई एपीआई प्रदान करते हैं, हालांकि वे मुख्य रूप से वास्तविक समय के फीड के लिए एक संगठन हैं। लेकिन यहाँ काफी विकल्प हैं, कुछ ब्रोकर अपने एपीआई के माध्यम से ऐतिहासिक डेटा डाउनलोड भी प्रदान करते हैं, इसलिए अपना जहर चुनें।

लेकिन आमतौर पर इस डेटा के सभी बहुत साफ नहीं होते हैं, एक बार जब आप वास्तव में परीक्षण करना शुरू करते हैं तो आप देखेंगे कि कुछ शेयर गायब हैं या दो अलग-अलग प्रतीकों के रूप में दिखाई देते हैं, या स्टॉक विभाजन का ठीक से हिसाब नहीं दिया जाता है, आदि और फिर आपको यह पता चलता है कि ऐतिहासिक लाभांश डेटा की आवश्यकता है और इसलिए आप हलकों में दौड़ना शुरू करते हैं, डेटा को 100 अलग-अलग डेटा स्रोतों से एक साथ पैच करते हैं और इसी तरह। तो एक "छूट" डेटा फीड के साथ शुरू करने के लिए, लेकिन जैसे ही आप अधिक व्यापक बैकैस्ट चलाते हैं, आप जो करते हैं उसके आधार पर आप समस्याओं में भाग सकते हैं। यदि आप अभी देखते हैं, तो हम कहते हैं, S & P 500 स्टॉक यह एक समस्या नहीं है, हालांकि और एक "सस्ते" इंट्राडे फ़ीड करेंगे।

जो आपको नहीं मिलेगा वो है फ्री इंट्राडे डेटा। मेरा मतलब है कि आपको कुछ उदाहरण मिल सकते हैं, मुझे यकीन है कि MSFT टिक डेटा के 5 साल के आसपास कहीं और तैर रहा है, लेकिन यह आपको बहुत दूर नहीं मिलेगा।

फिर, यदि आपको वास्तविक सामान (स्तर II ऑर्डर बुक, सभी टिक की आवश्यकता होती है, जैसा कि सभी एक्सचेंजों में हुआ है) एक "सस्ती", फिर भी उत्कृष्ट विकल्प नेनेक्स है । वे वास्तव में आपको डेटा के टेराबाइट्स के साथ एक ड्राइव भेज देंगे। अगर मुझे सही प्रति वर्ष $ 3k-4K डेटा याद है। लेकिन मेरा विश्वास करो, एक बार जब आप समझ जाते हैं कि अच्छा इंट्राडे डेटा प्राप्त करना कितना कठिन है, तो आप यह नहीं सोचेंगे कि यह बहुत पैसा है।

आपको हतोत्साहित करने के लिए नहीं बल्कि अच्छा डेटा प्राप्त करने के लिए कठिन है, वास्तव में इतना कठिन है कि कई हेज-फंड और बैंक डेटा प्राप्त करने के लिए एक महीने में सैकड़ों हजारों डॉलर खर्च करते हैं जिस पर वे भरोसा कर सकते हैं। फिर से, आप कहीं से शुरू कर सकते हैं और फिर वहां से जा सकते हैं लेकिन इसे संदर्भ में थोड़ा देखना अच्छा है।


संपादित करें: ऊपर दिया गया उत्तर मेरे अपने अनुभव से है। उपलब्ध डेटा फीड के बारे में कैलटेक का यह राइट-अप अधिक अंतर्दृष्टि देगा, और विशेष रूप से क्वांटक्वाइट की सिफारिश करता है


18
+1 डेटा (हिस्ट, इंट्रा, लेवल II) के 3 स्तरों को इंगित करने के लिए और दूसरों के उत्तरों (डेटा की पूर्णता, स्वच्छता, भंडारण आकार, ...) पर सुखद टिप्पणियों के लिए ...
पीटर होस्ट

2
CSI बहुत अच्छा है, लेकिन सिर्फ FYI, डीलिस्ट किया गया स्टॉक अब एक प्रीमियम सेवा है, जो अब मूल पैकेज में शामिल नहीं है। सिर्फ आपकी जानकारी के लिए।
ओली

1
सीएसआई बढ़िया है लेकिन कीमत महंगी है। यदि आप अनुचित लाभ का उपयोग करते हैं, तो आप उनके आवेदन के लिए बाध्य हैं। यह आपको इतिहास को अपडेट करने के लिए हर रोज उपयोग करना उबाऊ है। यदि आप सीएसआई के साथ http या ftp से डाउनलोड करना चाहते हैं, तो आपको महीने में लगभग 200 € का भुगतान करना होगा। क्षमा करें, लेकिन यह बहुत महंगा है।
davidxxx

@davidh, CSI अनफेयर एडवांटेज में एक ActiveX API है जहां आप अपनी सदस्यता के सभी डेटा को स्वचालित रूप से निर्यात कर सकते हैं। एक मजबूत निर्यातक टूल को लिखने में लगभग एक दिन लगता है ... यदि आप सीएसआई के समान गुणवत्ता वाले एक सस्ता विकल्प के बारे में जानते हैं, तो एक विकल्प पोस्ट करने के लिए स्वतंत्र महसूस करें!
lukebuehler

QuantQuote के बारे में ध्यान दें: वे खरीदने के 48 घंटों के भीतर आपके आदेश की समीक्षा / प्रक्रिया करते हैं। यदि आपको लगा कि आपके पास तत्काल पहुँच होगी।
फिओनबियो

94

इस व्याख्या के अनुसार, कोई भी लम्हा ऐसा नहीं है, जो योजू द्वारा निर्मित किया गया हो

ऊपर Yahoo के CSV दृष्टिकोण का उपयोग करके आप ऐतिहासिक डेटा भी प्राप्त कर सकते हैं! आप निम्न उदाहरण से इंजीनियर को उलट सकते हैं:

http://ichart.finance.yahoo.com/table.csv?s=YHOO&d=0&e=28&f=2010&g=d&a=3&b=12&c=1996&ignore=.csv

अनिवार्य रूप से:

sn = TICKER
a = fromMonth-1
b = fromDay (two digits)
c = fromYear
d = toMonth-1
e = toDay (two digits)
f = toYear
g = d for day, m for month, y for yearly

मापदंडों की पूरी सूची:

a   Ask
a2  Average Daily Volume
a5  Ask Size
b   Bid
b2  Ask (Real-time)
b3  Bid (Real-time)
b4  Book Value
b6  Bid Size
c   Change & Percent Change
c1  Change
c3  Commission
c6  Change (Real-time)
c8  After Hours Change (Real-time)
d   Dividend/Share
d1  Last Trade Date
d2  Trade Date
e   Earnings/Share
e1  Error Indication (returned for symbol changed / invalid)
e7  EPS Estimate Current Year
e8  EPS Estimate Next Year
e9  EPS Estimate Next Quarter
f6  Float Shares
g   Day's Low
h   Day's High
j   52-week Low
k   52-week High
g1  Holdings Gain Percent
g3  Annualized Gain
g4  Holdings Gain
g5  Holdings Gain Percent (Real-time)
g6  Holdings Gain (Real-time)
i   More Info
i5  Order Book (Real-time)
j1  Market Capitalization
j3  Market Cap (Real-time)
j4  EBITDA
j5  Change From 52-week Low
j6  Percent Change From 52-week Low
k1  Last Trade (Real-time) With Time
k2  Change Percent (Real-time)
k3  Last Trade Size
k4  Change From 52-week High
k5  Percent Change From 52-week High
l   Last Trade (With Time)
l1  Last Trade (Price Only)
l2  High Limit
l3  Low Limit
m   Day's Range
m2  Day's Range (Real-time)
m3  50-day Moving Average
m4  200-day Moving Average
m5  Change From 200-day Moving Average
m6  Percent Change From 200-day Moving Average
m7  Change From 50-day Moving Average
m8  Percent Change From 50-day Moving Average
n   Name
n4  Notes
o   Open
p   Previous Close
p1  Price Paid
p2  Change in Percent
p5  Price/Sales
p6  Price/Book
q   Ex-Dividend Date
r   P/E Ratio
r1  Dividend Pay Date
r2  P/E Ratio (Real-time)
r5  PEG Ratio
r6  Price/EPS Estimate Current Year
r7  Price/EPS Estimate Next Year
s   Symbol
s1  Shares Owned
s7  Short Ratio
t1  Last Trade Time
t6  Trade Links
t7  Ticker Trend
t8  1 yr Target Price
v   Volume
v1  Holdings Value
v7  Holdings Value (Real-time)
w   52-week Range
w1  Day's Value Change
w4  Day's Value Change (Real-time)
x   Stock Exchange
y   Dividend Yield

इस पृष्ठ में एक तालिका विशेष टैग है जो URL में उपयोग किया जा सकता है।
user443854

9
याहू, या जो भी ऑनलाइन सेवा से डेटा प्राप्त करने में एक बड़ी समस्या है, वह यह है कि आपको स्टॉक डिलीवर नहीं किया जाता है, इसलिए आप जल्दी से बचे हुए पूर्वाग्रह में भाग लेंगे। एरिक एच। या मेरी सलाह को बेहतर तरीके से गिना जाता है और सीधे सीएसआई में जाता है।
लुकेबुहलर

इस पृष्ठ में एक तालिका विशेष टैग का उपयोग किया गया था जो URL में उपयोग किया जा सकता है ... "याहू का तर्क है कि आपका उपयोग और उपकरण और सामग्री का वितरण ... पर स्थित अनुभाग 6, 12 और 18 का उल्लंघन होता है सेवा की शर्तें (अन्य प्रावधानों के बीच), अनुचित प्रतिस्पर्धा को जन्म देती हैं, और दूसरों को सेवा की शर्तों को भंग करने के लिए प्रेरित करती हैं ... इन संविदात्मक और व्यावसायिक रिश्तों के साथ हस्तक्षेप करके, आप संभावित रूप से अन्य उपयोगकर्ताओं की क्षमता को नुकसान पहुंचा रहे हैं। याहू फाइनेंस साइट पर उपलब्ध कराई गई सेवाओं का लाभ "। याहू पर अंगूठे
मुस्तफा जॉर्ज

मैंने अपने नोट्स से शेष स्विच जोड़े, जो उस वेब पेज पर मिलते थे। इन यहां पेश के साथ सेवा की शर्तों यहां पाया उल्लंघन प्रतीत नहीं होता है: policies.yahoo.com/us/en/yahoo/terms/product-atos/apiforydn/... याहू एक्सेल डेटा उपकरण है जो भी था के बारे में किया गया परेशान होना आवश्यक है उस साइट पर उपलब्ध है।
फ्रेड्रिक ई।

2
यह डेटा फ़ीड कोई और नहीं है।
माइकलऑस

47

मुझे पता है कि आप "मुक्त" चाहते थे, लेकिन मैं गंभीरता से $ 300 / वर्ष के लिए csidata.com से डेटा प्राप्त करने पर विचार करूंगा , अगर मैं आप थे।

यह वही है जो याहू अपने डेटा की आपूर्ति करने के लिए उपयोग करता है।

यह एक सभ्य एपीआई के साथ आता है, और डेटा (जहां तक ​​मैं बता सकता हूं) बहुत साफ है।

जब आप सदस्यता लेते हैं, तो आप 10 साल का इतिहास प्राप्त करते हैं, और उसके बाद रात को अपडेट करते हैं।

वे आपके लिए विभाजन और लाभांश जैसी सभी प्रकार की खराब चीजों का भी ध्यान रखते हैं। यदि आपने अभी तक डेटा-सफाई करने वाले आनंद की खोज नहीं की है, तो आपको एहसास नहीं होगा कि आपको इसकी कितनी आवश्यकता है, जब तक कि पहली बार आपका एटीएस (ऑटोमेटेड ट्रेडिंग सिस्टम) को लगता है कि कुछ स्टॉक वास्तव में सस्ता है, केवल इसलिए कि यह 2 विभाजित हो गया है : 1 और आपने ध्यान नहीं दिया।


1
कौन सी भाषाएँ उनके एपीआई द्वारा समर्थित हैं?
user443854

1
उनके पास एक ActiveX API है जिसे आप अपने डेटा को प्राप्त करने के लिए c ++ कोड या C # या जो भी विंडोज़ में कॉल कर सकते हैं।
लुकेबुहलर

1
दिलचस्प। स्प्लिट्स और डिविडेंड हैंडलिंग याहू से कैसे भिन्न है?
मैथ्यू लॉक

1
@MatthewLock मैं इस बारे में 100% नहीं हूं, लेकिन मुझे लगता है कि याहू एक अलग "कॉर्पोरेट इवेंट्स" डेटा प्रदाता का उपयोग करता है और फिर कॉरपोरेट इवेंट्स द्वारा समायोजित कच्चे सीएसआई डेटा का उपयोग करता है। यह कुछ पुराना लेख कुछ अंतर्दृष्टि देता है: amibroker.org/userkb/2007/09/23/yahoos-data-providers
lukebuehler

2
CSI बहुत अच्छा है, लेकिन सिर्फ FYI, डीलिस्ट किया गया स्टॉक अब एक प्रीमियम सेवा है, जो अब मूल पैकेज में शामिल नहीं है। सिर्फ आपकी जानकारी के लिए।
ओली

16

NASDAQ और NYSE के दूसरे या मिनट के अंतराल पर हर प्रतीक का एक डेटा सेट बड़े पैमाने पर होने वाला है

मान लीजिए कि दोनों एक्सचेंजों पर कुल 4000 कंपनियां सूचीबद्ध हैं (यह शायद बहुत कम पक्ष में है क्योंकि NASDAQ पर सूचीबद्ध 3200 से अधिक कंपनियां हैं )। दूसरे अंतराल पर डेटा के लिए, यह मानते हुए कि एक दिन में 6.5 ट्रेडिंग घंटे हैं, जो आपको प्रति दिन 23400 डेटा पॉइंट प्रति कंपनी या एक दिन में कुल मिलाकर लगभग 93,600,000 डेटा पॉइंट प्रदान करेगा। एक वर्ष में 200 कार्यदिवस मानते हुए, सिर्फ एक वर्ष के लिए लगभग 18,720,000,000 डेटा पॉइंट्स।

हो सकता है कि आप पहले छोटे सेट से शुरुआत करना चाहते हैं?


2
मैं इस धारणा के तहत काम कर रहा था कि ज्यादातर कंपनियों में हर सेकंड कारोबार नहीं किया जाएगा, इसलिए डेटा बिंदुओं की संख्या काफी कम होगी। शायद यह एक बुरी धारणा है। फिर भी, मैं प्रति वर्ष 10 जीबी के आदेश पर भविष्यवाणी कर रहा था ...
rmeador

10 प्रतीकों के लिए स्टॉक डेटा के एक दो महीने 3 डीवीडी पर आए। डेटा संपीड़ित पाठ भी था।
एलन

1
@rmeador सही है, लेकिन कुछ शेयरों में भी दैनिक मात्रा की तुलना में एक दिन में सेकंड की तुलना में अधिक है, जिसका अर्थ है कि वे एक से अधिक बार व्यापार करते हैं - और सभी ट्रेडों को एक ही कीमत पर होने की गारंटी नहीं है। तो आपको यह तय करना होगा कि क्या आप एक अंतराल पर कीमत में रुचि रखते हैं, या व्यापार पर
मैट बी

2
यदि आप पूरी चीज चाहते हैं, उदाहरण के लिए, सभी एक्सचेंजों के स्तर II के उद्धरण इत्यादि एक suuuuper संपीड़ित प्रारूप में एक वर्ष के लिए कुछ टीबी (लगभग 5GB प्रति दिन ट्रेडिंग)। यदि आप केवल मिनट के डेटा को वास्तव में बहुत कम स्टोर करते हैं, तो सभी शेयरों के 10 वर्षों के लिए लगभग 10GB ...
lukebuehler

16

परिचय:
याहू से आप ईओडी (दिन का अंत) ऐतिहासिक मूल्य, या वास्तविक समय मूल्य प्राप्त कर सकते हैं। ईओडी की कीमतें डाउनलोड करने के लिए आश्चर्यजनक सरल हैं। डेटा पाने के लिए और C # कोड उदाहरणों के बारे में स्पष्टीकरण के लिए मेरा ब्लॉग देखें ।

मैं एक वास्तविक समय डेटा फ़ीड "इंजन" लिखने की प्रक्रिया में हूं जो एक डेटाबेस में वास्तविक समय की कीमतों को डाउनलोड और संग्रहीत करता है। इंजन शुरू में याहू और इंटरएक्टिव ब्रोकर्स से ऐतिहासिक कीमतें डाउनलोड करने में सक्षम होगा और यह आपकी पसंद के डेटाबेस में डेटा को स्टोर करने में सक्षम होगा: एमएस SQL, MySQL, SQLite, आदि। यह खुला स्रोत है, लेकिन मैं और पोस्ट करूँगा अपने ब्लॉग पर जानकारी जब मैं इसे जारी करने के करीब पहुँच (एक दो दिनों के भीतर)।

एक अन्य विकल्प व्यापारी को ग्रहण करना है ... यह आपको ऐतिहासिक डेटा को ग्रैन्युलैरिटी के साथ 1 मिनट तक कम करने की अनुमति देता है और कीमतों को एक पाठ फ़ाइल में स्थानीय रूप से संग्रहीत करता है। यह मूल रूप से याहू से वास्तविक समय के डेटा को 15 मिनट देरी से डाउनलोड करता है। चूंकि मुझे अधिक मजबूत समाधान चाहिए था और मैं एक बड़े स्कूल प्रोजेक्ट पर काम कर रहा हूं, जिसके लिए हमें डेटा की आवश्यकता है, मैंने अपना डेटा फीड इंजन (जो मैंने ऊपर उल्लेख किया है) लिखने का फैसला किया।

नमूना कोड:
यहाँ नमूना C # कोड है जो प्रदर्शित करता है कि वास्तविक समय डेटा को कैसे डाउनलोड किया जाए:

public void Start()
{
    string url = "http://finance.yahoo.com/d/quotes.csv?s=MSFT+GOOG&f=snl1d1t1ohgdr";
    //Get page showing the table with the chosen indices
    HttpWebRequest request = null;
    IDatabase database =
        DatabaseFactory.CreateDatabase(
        DatabaseFactory.DatabaseType.SQLite);

    //csv content
    try
    {
        while (true)
        {
            using (Stream file = File.Create("quotes.csv"))
            {
                request = (HttpWebRequest)WebRequest.CreateDefault(new Uri(url));
                request.Timeout = 30000;
                using (var response = (HttpWebResponse)request.GetResponse())
                using (Stream input = response.GetResponseStream())
                {
                    CopyStream(input, file);
                }
            }
            Console.WriteLine("------------------------------------------------");
            database.InsertData(Directory.GetCurrentDirectory() + "/quotes.csv");

            File.Delete("quotes.csv");
            Thread.Sleep(10000); // 10 seconds
        }
    }
    catch (Exception exc)
    {
        Console.WriteLine(exc.ToString());
        Console.ReadKey();
    }
}

डेटाबेस:
डेटाबेस की ओर से मैं एक OleDbपॉप्युलेट करने के लिए CSV फ़ाइल के कनेक्शन का उपयोग करता हूं DataSetऔर फिर मैं अपने वास्तविक डेटाबेस को इसके माध्यम से अपडेट करता हूं DataSet, यह मूल रूप से आपके डेटाबेस से सीधे याहू से लौटी सीएसवी फाइल से सभी कॉलमों का मिलान करना संभव बनाता है ( यदि आपका डेटाबेस SQLV की तरह CSV डेटा के बैच आवेषण का समर्थन नहीं करता है)। अन्यथा, डेटा सम्मिलित करना एक-लाइनर है ... बस बैच CSV को आपके डेटाबेस में सम्मिलित करता है।

आप यहाँ url के प्रारूपण के बारे में अधिक पढ़ सकते हैं: http://www.gummy-stuff.org/Yahoo-data.htm


महाकाव्य मेरी इच्छा है कि मुझे यह पहले मिले।
ओब्ब्लास

क्या यह वास्तव में आपके द्वारा सुझाए गए वास्तविक समय डेटा प्रदान करता है? पृष्ठ से, इसका पैरामीटर "k1" है, लेकिन पिछली बार जब मैंने जाँच की थी, तब भी इसमें कुछ देरी है।
एंटनी

@ ज्यादातर समय किसी न किसी प्रकार की देरी होती है, इसलिए यह सिर्फ इस बात पर निर्भर करता है कि आप देरी के प्रति कितने सहनशील हैं। याहू का कहना है कि वे वास्तविक समय डेटा प्रदान करते हैं, लेकिन यह निश्चित रूप से सभी टिकरों के लिए नहीं है। टिकर जो वास्तविक समय नहीं हैं, उन्हें 15 मिनट तक देरी हो रही है। यहां तक ​​कि अगर आपको एक्सचेंज में एक सह-स्थित सर्वर मिलता है, तो भी "कुछ देरी" होगी । तो आप किस तरह की देरी बर्दाश्त करने को तैयार हैं?
किरिल

यह विश्वसनीय नहीं है। मुझे बताइए, उदाहरण के लिए यह काम अभी क्यों नहीं किया गया : real-chart.finance.yahoo.com/ ... जिसका उपयोग वित्त
mmm

9

NASDAQ प्रत्येक प्रतीक के लिए 10 वर्ष का ऐतिहासिक ईओडी डेटा प्रदान करता है

http://www.nasdaq.com/aspx/historical_quotes.aspx?symbol=AAPL&selected=AAPL

आप इस डेटा को डाउनलोड करने की प्रक्रिया को स्वचालित कर सकते हैं।


अच्छा स्रोत है। उन्होंने अनुरोध प्रणाली को बदल दिया, इसलिए अब सभी अनुरोधों को जेएस (जैसे nasdaq.com/symbol/aapl/histor ) के साथ संसाधित किया जाता है । क्या इसे स्वचालित करने का कोई तरीका है?
एंटोन तारासेंको

हां, इसे स्वचालित करना संभव है। आपको टेलिफ़िक जैसे एक स्निफ़र का उपयोग करने की आवश्यकता है और देखें कि डेटा कैसे प्राप्त किया जाता है (एक पोस्ट के माध्यम से)। जब तक आप पोस्ट चर को सही भेजते हैं, तब तक आपको डेटा प्राप्त करना चाहिए।
Nick_F

1
क्या यह अभी भी उपलब्ध है? क्या इसमें कोई इंट्राडे डेटा है?
ली

8

उत्तरजीविता पूर्वाग्रह मुक्त डेटा के लिए, एकमात्र विश्वसनीय स्रोत जो मैंने पाया है वह है क्वांटक्वाटे ( http://quantquote.com )

डेटा मिनट, सेकंड या टिक रिज़ॉल्यूशन में आता है, उनके ऐतिहासिक स्टॉक डेटा से लिंक होता है ।

ऊपर किबोट के लिए एक सुझाव था। मैं उनसे खरीदने से पहले एक त्वरित Google खोज करूँगा, आपको kibot डेटा गुणवत्ता समस्याओं के बारे में चेतावनियों के साथ इस तरह की बहुत सी पोस्टें मिलेंगी। यह भी बता रहा है कि उनके कथित जीवित जीव पूर्वाग्रह मुक्त Sp500 में केवल 14 वर्षों के लिए 570 प्रतीक हैं। यह बहुत असंभव है, प्रति माह 1-2 प्रतीकों द्वारा sp500 परिवर्तन ....


3
किबोट में केवल 3 मुफ्त प्रतीक हैं। बाकी का भुगतान करना होगा! वह सिर्फ विज्ञापन कर रहा है
उछल रहा है

क्वांटक्वेओट का मुफ्त दैनिक डेटा अनिर्धारित है: सीएसवी फाइलों में कोई कॉलम हेडर नहीं हैं, और न ही कोई डॉक।
user443854 22

प्रलेखन है, प्रारूप मूल रूप से उनके मिनट रिज़ॉल्यूशन डेटासेट के समान है।
user788171

quantquote.com के डेटा में बहुत सारी त्रुटियां हैं
Ivelin

वे 1998 के बाद से आईबीएम के लिए मुफ्त डेटा देते हैं। यह मेरे लिए काफी अच्छा था। मुझे संपीड़न का परीक्षण करने के लिए केवल एक प्रतीक की आवश्यकता थी: kibot.com/buy.aspx
सर्गेई रोडियोनोव

7

दुर्भाग्य से ऐतिहासिक टिकर डेटा जो मुफ़्त है, द्वारा आना मुश्किल है। अब जब कि ओपेंटिक मर चुका है, तो मुझे किसी अन्य प्रदाता के बारे में पता नहीं है।

पिछले जीवनकाल में मैंने एक हेजफंड के लिए काम किया था जिसमें एक स्वचालित ट्रेडिंग सिस्टम था, और हमने ऐतिहासिक डेटा का गहरा उपयोग किया था।

हमने अपने स्रोत के लिए टिकडाटा का उपयोग किया। उनकी कीमतें वाजिब थीं, और डेटा का दूसरा रिज़ॉल्यूशन था।


6

हमने Kibot.com से 12 साल का इंट्राडे डेटा खरीदा है और गुणवत्ता से काफी संतुष्ट हैं।

भंडारण आवश्यकताओं के लिए: संयुक्त राज्य अमेरिका के सभी इक्विटीज (8000 से अधिक प्रतीकों) के लिए 1-मिनट का 12 साल का डेटा लगभग 100GB है।

टिक-दर-टिक डेटा के साथ स्थिति थोड़ी अलग है। यदि आप केवल समय और बिक्री रिकॉर्ड करते हैं, तो यह सभी यूएसए इक्विटी के लिए प्रति माह लगभग 30GB डेटा होगा। यदि आप लेन-देन के साथ बोली में परिवर्तन / संग्रह करना चाहते हैं, तो आप प्रति माह लगभग 150GB की उम्मीद कर सकते हैं।

आशा है कि ये आपकी मदद करेगा। कृपया मुझे बताएं कि क्या कुछ और है जो मैं आपकी सहायता कर सकता हूं।


1
अभी भी KiBot @ boe100 से संतुष्ट हैं?
जारेडब्रोड

@ boe100 क्या उनके पास समायोजित और अनुचित दोनों कीमतें हैं? क्या उनके पास बेट्स और डेल्टास हैं?
user443854

दोनों समायोजित और अनुचित डेटा उपलब्ध है। HTTP एपीआई का उपयोग करके अपने डेटा को अपडेट करना या एफ़टीपी सर्वर से रोज़ाना नए अभिलेखागार डाउनलोड करना संभव है। कोई भी दांव या देरी की गणना नहीं की जाती है।
बोए 100

@ boe100 क्या आप अपना डेटा साझा कर सकते हैं?
टॉमाज़ वास्ज़ेस्क

2
डी: @Tomasz haha, अपनी टिप्पणी मेरा दिन बना दिया
Corneliu Maftuleac

6

मुझे एक स्रोत मैं बस की खोज की जोड़ते हैं, पाया यहाँ

यह सीएसवी प्रारूप में बहुत सारे ऐतिहासिक स्टॉक डेटा है और एंडी पावलो द्वारा इकट्ठा किया गया था, जो अपने मुखपृष्ठ के अनुसार "कार्नेगी मेलन विश्वविद्यालय में कंप्यूटर विज्ञान विभाग में सहायक प्रोफेसर" है।


यह ऐतिहासिक स्टॉक मार्केट डेटा के एक बड़े पर्याप्त सेट के साथ गड़बड़ करने के लिए देख रहे किसी के लिए भी बहुत अच्छा है।
सियारन गलाघेर

1
वेबपेज डाउन ...
ब्रेथोसॉज़


5

गणितज्ञ आजकल भी वर्तमान और ऐतिहासिक दोनों स्टॉक की कीमतों तक पहुँच प्रदान करता है, http://reference.wolfram.com/mathematica/ref/Fin FinancialData.html देखें , यदि आप इसकी एक प्रति लेते हैं।


5
सबसे छोटा समय कदम हैday
kirill_igum

हा मुझे यह बताने के लिए धन्यवाद - यह वास्तव में इतना महान नहीं है ...
टॉम वेन्सलेर्स 16

4

आप दैनिक डेटा (बहुत अधिक प्रबंधनीय डेटासेट) प्राप्त करने के लिए याहू का उपयोग कर सकते हैं, लेकिन आपको यूआरएल की संरचना करनी होगी। इस लिंक को देखें । आप बहुत कम अनुरोध नहीं कर रहे हैं आप कम बड़े अनुरोध कर रहे हैं। बहुत सारे मुफ्त सॉफ्टवेयर इसका उपयोग करते हैं इसलिए उन्हें आपको बंद नहीं करना चाहिए।

संपादित करें: यह आदमी ऐसा करता है, हो सकता है कि आप उसके द्वारा किए गए कॉल पर एक नज़र डाल सकें।


पहले तो मैंने सोचा कि लिंक आशाजनक लग रहा था, लेकिन मैं यह नहीं जान सकता कि ऐतिहासिक डेटा को कैसे निर्दिष्ट किया जाए ... ऐसा लगता है कि यह सब वास्तविक समय है। क्या मैं कुछ भूल रहा हूँ?
rmeador

तुम सही हो। मैंने सॉफ्टवेयर के साथ किसी और का लिंक जोड़ा है जो ऐतिहासिक सामान करता है इसलिए मुझे पता है कि यह संभव है। हो सकता है कि उनके सॉफ्टवेयर द्वारा की जाने वाली कॉल पर एक नज़र हो।
jimconstable

4

प्रारंभिक मुफ्त डेटा प्राप्त करने के लिए याहू सबसे सरल विकल्प है। एकेक के उत्तर में वर्णित लिंक को आसानी से एक अजगर कोड में इस्तेमाल किया जा सकता है, लेकिन आपको पहले सभी टिकरों की आवश्यकता है। मैं इस उदाहरण के लिए NYSE का उपयोग करूँगा, लेकिन इसका उपयोग विभिन्न एक्सचेंजों के लिए भी किया जा सकता है।

मैंने निम्नलिखित स्क्रिप्ट के साथ सभी कंपनी टिकर को डाउनलोड करने के लिए इस विकी पृष्ठ का उपयोग किया (मैं बहुत प्रतिभाशाली पायथनवादी नहीं हूँ, क्षमा करें यदि यह कोड बहुत कुशल नहीं है):

import string
import urllib2
from bs4 import BeautifulSoup

global f

def download_page(url):
    aurl = urllib2.urlopen(url)
    soup = BeautifulSoup(aurl.read())

    print url

    for row in soup('table')[1]('tr'):
        tds = row('td')
        if (len(tds) > 0):
            f.write(tds[1].string + '\n')


f = open('stock_names.txt', 'w')

url_part1 = 'http://en.wikipedia.org/wiki/Companies_listed_on_the_New_York_Stock_Exchange_'
url = url_part1 + '(0-9)'
download_page(url)

for letter in string.uppercase[:26]:
    url_part2 = letter
    url = url_part1 + '(' + letter + ')'

    download_page(url)

f.close()

प्रत्येक टिकर को डाउनलोड करने के लिए मैंने एक और समान स्क्रिप्ट का उपयोग किया:

import string
import urllib2
from bs4 import BeautifulSoup


global f

url_part1 = 'http://ichart.finance.yahoo.com/table.csv?s='
url_part2 = '&d=0&e=28&f=2010&g=d&a=3&b=12&c=1996&ignore=.csv'

print "Starting"

f = open('stock_names.txt', 'r')
file_content = f.readlines()
count = 1;
print "About %d tickers will be downloaded" % len(file_content)

for ticker in file_content:
    ticker = ticker.strip()
    url = url_part1 + ticker + url_part2
    
    try:
        # This will cause exception on a 404
        response = urllib2.urlopen(url)

        print "Downloading ticker %s (%d out of %d)" % (ticker, count, len(file_content))

        count = count + 1
        history_file = open('C:\\Users\\Nitay\\Desktop\\Historical Data\\' + ticker + '.csv', 'w')
        history_file.write(response.read())
        history_file.close()

    except Exception, e:
        pass

f.close()

ध्यान दें कि इस पद्धति का प्रमुख पहलू यह है कि विभिन्न कंपनियों के लिए अलग-अलग डेटा उपलब्ध है - जिन कंपनियों के पास अनुरोधित तिथियों (मौजूदा सूचीबद्ध) में मौजूद डेटा नहीं है, आपको एक 404 पृष्ठ मिलेगा।

यह भी ध्यान रखें कि यह तरीका केवल प्रारंभिक डेटा के लिए अच्छा है - यदि आप वास्तव में अपने एल्गोरिथ्म का परीक्षण करना चाहते हैं तो आपको थोड़ा भुगतान करना चाहिए और CSIData या अन्य जैसे विश्वसनीय डेटा आपूर्तिकर्ता का उपयोग करना चाहिए


वैश्विक नाम स्थान के अंदर एक वैश्विक घोषणा रखना अनावश्यक है, हालांकि अच्छी प्रतिक्रिया है।
ल्यूक टेलर

1
नीचे सेवा ...
ब्रेथोसॉज़

3

ब्राउनियन मोशन के साथ नकली स्टॉक मार्केट का मॉडल क्यों नहीं?

इसे करने के लिए बहुत सारे संसाधन। लागू करने में आसान।

http://introcs.cs.princeton.edu/java/98simulation/


1
:-) इसे और अधिक वास्तविक बनाने के लिए आपको भिन्नात्मक ब्राउनियन गति बनाने की आवश्यकता होगी और यहां तक ​​कि काफी वास्तविक नहीं है, सबसे यथार्थवादी नकली बाजार डेटा के लिए आपको एक फ्रैक्टल समय आयाम की भी आवश्यकता होगी ... इसे कहने के लिए सुई काफी जटिल हो जाता है। बेहतर है कि सिर्फ वास्तविक बाजार डेटा खरीदें ...
lukebuehler

यह भी मदद नहीं करता है कि स्टॉक आंदोलन lognormal नहीं है :)
पॉल Milovanov

3

मैं eodData.com का उपयोग करता हूं। इसकी सुंदर शालीनता की कीमत है। 30 डॉलर प्रति माह के लिए आपको सभी यूएस एक्सचेंजों के लिए 1,5 और 60 मिनट की सलाखों के 30 दिन मिलते हैं और अधिकांश अन्य के लिए 1 साल का ईओडी डेटा।


2

मैं crawl Finance.google.com (उद्धरण चिह्नों के लिए) - या Finance.yahoo.com पर करूँगा।

ये दोनों ऐतिहासिक सहित, दुनिया भर के अधिकांश एक्सचेंजों के लिए html पेज लौटाएंगे। फिर, यह HTML की पार्सिंग की बात है कि आपको क्या चाहिए।

मैंने अतीत में यह किया है, बड़ी सफलता के साथ। वैकल्पिक रूप से, अगर आपको पर्ल का उपयोग करने में कोई आपत्ति नहीं है - CPAN के कई मॉड्यूल हैं, जिन्होंने आपके लिए यह काम किया है - यानी Google / Yahoo से उद्धरण निकालना।

अधिक के लिए, उद्धरण इतिहास देखें


पेरो मॉड्यूल को +1 करने पर, वे डेटा को आसान बनाते हैं
मैथ्यू लॉक

1

मेरा एक पूर्व प्रोजेक्ट EODData से स्वतंत्र रूप से डाउनलोड करने योग्य डेटा का उपयोग करने जा रहा था ।


हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.