क्या कोई ऐसी परियोजनाएं हैं जो मशीन लर्निंग के लिए स्टैक एक्सचेंज का उपयोग करती हैं?

23

क्या कोई चल रही एआई परियोजनाएं हैं जो मशीन लर्निंग के लिए स्टैक एक्सचेंज का उपयोग करती हैं?

machine-learning ai-design

— Techidiot
स्रोत

7

पाठ खनन / सूचना पुनर्प्राप्ति / आदि के कुछ फार्म को शामिल करते हुए निश्चित रूप से अनुसंधान परियोजनाएं दिखाई देती हैं। और StackExchange साइटें।

कुछ उदाहरण जो मैं गूगल / गूगल स्कॉलर के माध्यम से खोजने में सक्षम था (एक विस्तृत सूची के पास कहीं भी होने की संभावना नहीं):

TACIT: एक ओपन-सोर्स टेक्स्ट विश्लेषण, क्रॉलिंग और इंटरप्रिटेशन टूल विभिन्न प्रकार की साइटों (स्टैक एक्सचेंज साइट्स, लेकिन ट्विटर, रेडिट, आदि सहित) के लिए कई टेक्स्ट-क्रॉलर का वर्णन करता है। पहली नज़र में, यह मुख्य रूप से रेंगने के बारे में प्रतीत होता है, न कि बाद में डेटा के साथ कुछ और करने के बारे में। Google विद्वान पर इसे उद्धृत करने वाले अन्य कागजात की खोज करने पर दिलचस्प परिणाम मिल सकते हैं, हालांकि इससे ऐसे कागज हो सकते हैं जिन्होंने क्रॉलिंग के लिए इसका उपयोग किया और बाद में डेटा के साथ अधिक किया।
गेहूं से चैफ: स्टैक ओवरफ्लो पर हटाए गए प्रश्नों की विशेषता और मॉडलिंग, कुछ अर्थों में स्टैक ओवरफ्लो प्रश्नों की गुणवत्ता में अनुसंधान का वर्णन करता है (विशेष रूप से, यह भविष्यवाणी करते हुए कि क्या प्रश्न उदाहरण के लिए हटा दिए जाएंगे)। मैं 100% निश्चित नहीं हूँ कि यह उस तरह का सामान है जिसमें आप रुचि रखते हैं; यह स्टैक एक्सचेंज + मशीन लर्निंग है जैसा कि आपके प्रश्न के शीर्षक से निहित है, लेकिन जरूरी नहीं कि आपके प्रश्न में पाठ द्वारा निहित उत्तरों से जानकारी को बनाए रखने के बारे में हो।
टेक्स्ट माइनिंग स्टैकओवरफ़्लो: कंप्यूटर विज्ञान सीखने वालों के सामने आने वाली चुनौतियों और विषय-संबंधी कठिनाइयों के बारे में एक अंतर्दृष्टि भी स्टैकऑवरफ़्लो प्रश्नों और उत्तरों में टेक्स्ट माइनिंग का वर्णन करती है, हालांकि बहुत ही त्वरित नज़र में यह मुख्य रूप से विषय का पता लगाने आदि के बारे में प्रतीत होता है, जरूरी नहीं कि स्वचालित प्रश्न के बारे में। उदाहरण के लिए जवाब दे रहा है।
ऑटोमेटेड क्वेश्चन आंसरिंग रिसर्च के विषय पर टेक्स्ट बेस्ड ऑटोमेटेड क्वेश्चन आंसरिंग सिस्टम के विभिन्न पहलू अपेक्षाकृत हालिया सर्वेक्षण प्रतीत होते हैं। इस तरह के सिस्टम के डेटा के स्रोत के उदाहरण के रूप में स्टैक एक्सचेंज का उल्लेख कुछ समय के लिए किया जाता है, लेकिन इसका अन्यथा उपयोग नहीं किया जाता है।
StackOverflow से ज्ञान के साथ PythonQA का विस्तार करना , विशेष रूप से Python प्रोग्रामिंग भाषा के बारे में प्रश्नों के लिए स्वचालित प्रश्न में StackOverflow से प्रश्न और उत्तर को शामिल करने के बारे में है । कागज अधिक विवरण ( http://pythonqas2.epl.di.uminho.pt ) के लिए एक लिंक प्रदान करता है , लेकिन वह लिंक नीचे दिखाई देता है। मुझे लगता है कि आप हमेशा लेखकों से सीधे संपर्क करने की कोशिश कर सकते हैं यदि आप इस पर अधिक जानकारी में रुचि रखते हैं।

अधिक सामान्य रूप से, स्वचालित प्रश्न उत्तर प्रणाली अभी भी अनुसंधान के बजाय एक सक्रिय क्षेत्र प्रतीत होती है, न कि एक तुच्छ / "हल" समस्या। StackExchange ऐसी प्रणालियों के लिए डेटा का एक स्रोत हो सकता है, लेकिन डेटा के अन्य स्रोत भी बहुत हैं (विकिपीडिया, Quora, आदि)।

— डेनिस सोमरस
स्रोत

3

DuckDuckGo StackExchange से तकनीकी प्रश्नों के उत्तर सीखता है। डकडकगो में "चल रही परियोजनाओं का उपयोग स्टेक्सएक्सचेंज" जैसे एक तकनीकी प्रश्न टाइप करें और यह दाईं ओर उत्तर का एक हाइलाइट किया गया सारांश प्रदान करेगा। और बतख के पास डेटा स्रोतों का जवाब देने वाले कई (100) अधिक सवाल के लिए एक खुला एपीआई है। या आप सीधे स्टैकटेक्चेंज एपी में जा सकते हैं ।

जब तक वे अपने TOU का अनुपालन करते हैं, प्रोजेक्ट SE खुले API से डेटा का उपयोग कर सकते हैं । मूल रूप से सिर्फ यह सुनिश्चित करें कि आपके उपयोगकर्ता बता सकते हैं कि डेटा स्टैक एक्सचेंज से आया था। कॉपीराइट लाइसेंस पाठ की सामग्री को बदलने के लिए आपकी क्षमता को सीमित कर सकता है, एक सीखा सार संक्षेप के साथ। शायद यही कारण है कि डक डॉट कॉम केवल कीवर्ड पर प्रकाश डालता है।

डेटा अधिकार कानून प्रवाह में है, खासकर जब यह आपके द्वारा किसी साइट पर सबमिट किए गए डेटा और उस डेटा से प्राप्त मशीन लर्निंग मॉडल की बात आती है। नए यूरोपीय डेटा और गोपनीयता नियम आपको स्टैक एक्सचेंज जैसी साइट पर सबमिट किए गए सभी डेटा को डाउनलोड करने या हटाने के लिए सशक्त बनाते हैं।

— हॉब्स
स्रोत