क्या कागज के रेंगने के लिए कोई एपीआई है?


13

अगर मेरे पास कागज के नामों की एक बहुत लंबी सूची है, तो मैं इन पत्रों को इंटरनेट या किसी डेटाबेस से कैसे प्राप्त कर सकता हूं?

पेपर के नाम "सार्वजनिक स्वास्थ्य के डोमेन के लिए वेब खनन में उपयोगिता का आकलन" जैसे हैं।

क्या कोई भी कोई एपीआई जानता है जो मुझे समाधान दे सकता है? मैंने Google विद्वान को क्रॉल करने का प्रयास किया, हालांकि, Google ने मेरे क्रॉलर को अवरुद्ध कर दिया।


2
मुझे संदेह है कि इसके लिए कोई सामान्य एपीआई है। आप Academia.edu, प्रकाशकों की साइट आदि जैसी विभिन्न सेवाओं को क्रॉल करने का प्रयास कर सकते हैं। फिर भी, पहले दस्तावेजों के स्थानीय डेटाबेस का निर्माण करना आसान होगा, और फिर अमूर्त निकालने के साथ प्रयोग करना होगा।
वोज्शिएक वाल्कैक

आपके उत्तर के लिए धन्यवाद! मैंने इसके लिए पहले ही एक स्थानीय डेटाबेस बनाया है। विभिन्न सेवाओं से क्रॉल करने की समस्या यह है कि मुझे प्रत्येक वेबसाइट के लिए पार्स नियम बनाने होंगे।
एलेक्स गाओ

तो, PDFs को TXT में कैसे परिवर्तित किया जाए और फिर रेगुलर एक्सप्रेशन के साथ एब्सट्रैक्ट निकाला जाए?
वोज्शिएक वाल्कैक

धन्यवाद! हालांकि, अनुबंध में कहा गया है कि बड़े पैमाने पर डाउनलोड करने की अनुमति नहीं है। यह कुछ सिरदर्द पैदा करता है।
एलेक्स गाओ

2
मुझे लगता है कि यह स्टैक-ओवरफ्लो उत्तर लिंक सबसे अच्छा जवाब देता है जो मुझे मिल सकता है। हो सकता है कि इस समस्या का सामना करने वाले लोग भी इस पृष्ठ पर नज़र डाल सकें।
एलेक्स गाओ

जवाबों:


8

इसे देखो:

यदि आपको एक भी सटीक शीर्षक मैच मिलता है, तो आपको शायद सही लेख मिल गया है, और बाकी जानकारी वहां से भर सकते हैं। दोनों आपको डाउनलोड लिंक और बिंबटेक्स-स्टाइल आउटपुट देते हैं। क्या आप संभवतः सही मेटाडाटा प्राप्त करने के लिए करना चाहते हैं डाउनलोड और पीडीएफ पार्स (यदि कोई हो) और DOI- शैली पहचानकर्ता के लिए देखना होगा।

कृपया अच्छा हो और यदि आप ऐसा करते हैं तो अपने अनुरोधों को सीमित करें।


5

arXiv में एक एपीआई और बल्क डाउनलोड है, लेकिन यदि आप पेड जर्नल्स के लिए कुछ चाहते हैं, तो बिना अनुक्रमित किए जैसे कि pubmed या somevier या like को भुगतान करना मुश्किल होगा।


1
बहुत बहुत धन्यवाद। हालाँकि arXiv मुझे आवश्यक कागजात प्रदान करता है।
एलेक्स गाओ
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.