क्या कोई ऐसी परियोजनाएं हैं जो मशीन लर्निंग के लिए स्टैक एक्सचेंज का उपयोग करती हैं?


23

क्या कोई चल रही एआई परियोजनाएं हैं जो मशीन लर्निंग के लिए स्टैक एक्सचेंज का उपयोग करती हैं?

जवाबों:


7

पाठ खनन / सूचना पुनर्प्राप्ति / आदि के कुछ फार्म को शामिल करते हुए निश्चित रूप से अनुसंधान परियोजनाएं दिखाई देती हैं। और StackExchange साइटें।

कुछ उदाहरण जो मैं गूगल / गूगल स्कॉलर के माध्यम से खोजने में सक्षम था (एक विस्तृत सूची के पास कहीं भी होने की संभावना नहीं):

  • TACIT: एक ओपन-सोर्स टेक्स्ट विश्लेषण, क्रॉलिंग और इंटरप्रिटेशन टूल विभिन्न प्रकार की साइटों (स्टैक एक्सचेंज साइट्स, लेकिन ट्विटर, रेडिट, आदि सहित) के लिए कई टेक्स्ट-क्रॉलर का वर्णन करता है। पहली नज़र में, यह मुख्य रूप से रेंगने के बारे में प्रतीत होता है, न कि बाद में डेटा के साथ कुछ और करने के बारे में। Google विद्वान पर इसे उद्धृत करने वाले अन्य कागजात की खोज करने पर दिलचस्प परिणाम मिल सकते हैं, हालांकि इससे ऐसे कागज हो सकते हैं जिन्होंने क्रॉलिंग के लिए इसका उपयोग किया और बाद में डेटा के साथ अधिक किया।
  • गेहूं से चैफ: स्टैक ओवरफ्लो पर हटाए गए प्रश्नों की विशेषता और मॉडलिंग, कुछ अर्थों में स्टैक ओवरफ्लो प्रश्नों की गुणवत्ता में अनुसंधान का वर्णन करता है (विशेष रूप से, यह भविष्यवाणी करते हुए कि क्या प्रश्न उदाहरण के लिए हटा दिए जाएंगे)। मैं 100% निश्चित नहीं हूँ कि यह उस तरह का सामान है जिसमें आप रुचि रखते हैं; यह स्टैक एक्सचेंज + मशीन लर्निंग है जैसा कि आपके प्रश्न के शीर्षक से निहित है, लेकिन जरूरी नहीं कि आपके प्रश्न में पाठ द्वारा निहित उत्तरों से जानकारी को बनाए रखने के बारे में हो।
  • टेक्स्ट माइनिंग स्टैकओवरफ़्लो: कंप्यूटर विज्ञान सीखने वालों के सामने आने वाली चुनौतियों और विषय-संबंधी कठिनाइयों के बारे में एक अंतर्दृष्टि भी स्टैकऑवरफ़्लो प्रश्नों और उत्तरों में टेक्स्ट माइनिंग का वर्णन करती है, हालांकि बहुत ही त्वरित नज़र में यह मुख्य रूप से विषय का पता लगाने आदि के बारे में प्रतीत होता है, जरूरी नहीं कि स्वचालित प्रश्न के बारे में। उदाहरण के लिए जवाब दे रहा है।
  • ऑटोमेटेड क्वेश्चन आंसरिंग रिसर्च के विषय पर टेक्स्ट बेस्ड ऑटोमेटेड क्वेश्चन आंसरिंग सिस्टम के विभिन्न पहलू अपेक्षाकृत हालिया सर्वेक्षण प्रतीत होते हैं। इस तरह के सिस्टम के डेटा के स्रोत के उदाहरण के रूप में स्टैक एक्सचेंज का उल्लेख कुछ समय के लिए किया जाता है, लेकिन इसका अन्यथा उपयोग नहीं किया जाता है।
  • StackOverflow से ज्ञान के साथ PythonQA का विस्तार करना , विशेष रूप से Python प्रोग्रामिंग भाषा के बारे में प्रश्नों के लिए स्वचालित प्रश्न में StackOverflow से प्रश्न और उत्तर को शामिल करने के बारे में है । कागज अधिक विवरण ( http://pythonqas2.epl.di.uminho.pt ) के लिए एक लिंक प्रदान करता है , लेकिन वह लिंक नीचे दिखाई देता है। मुझे लगता है कि आप हमेशा लेखकों से सीधे संपर्क करने की कोशिश कर सकते हैं यदि आप इस पर अधिक जानकारी में रुचि रखते हैं।

अधिक सामान्य रूप से, स्वचालित प्रश्न उत्तर प्रणाली अभी भी अनुसंधान के बजाय एक सक्रिय क्षेत्र प्रतीत होती है, न कि एक तुच्छ / "हल" समस्या। StackExchange ऐसी प्रणालियों के लिए डेटा का एक स्रोत हो सकता है, लेकिन डेटा के अन्य स्रोत भी बहुत हैं (विकिपीडिया, Quora, आदि)।


3

DuckDuckGo StackExchange से तकनीकी प्रश्नों के उत्तर सीखता है। डकडकगो में "चल रही परियोजनाओं का उपयोग स्टेक्सएक्सचेंज" जैसे एक तकनीकी प्रश्न टाइप करें और यह दाईं ओर उत्तर का एक हाइलाइट किया गया सारांश प्रदान करेगा। और बतख के पास डेटा स्रोतों का जवाब देने वाले कई (100) अधिक सवाल के लिए एक खुला एपीआई है। या आप सीधे स्टैकटेक्चेंज एपी में जा सकते हैं ।

जब तक वे अपने TOU का अनुपालन करते हैं, प्रोजेक्ट SE खुले API से डेटा का उपयोग कर सकते हैं । मूल रूप से सिर्फ यह सुनिश्चित करें कि आपके उपयोगकर्ता बता सकते हैं कि डेटा स्टैक एक्सचेंज से आया था। कॉपीराइट लाइसेंस पाठ की सामग्री को बदलने के लिए आपकी क्षमता को सीमित कर सकता है, एक सीखा सार संक्षेप के साथ। शायद यही कारण है कि डक डॉट कॉम केवल कीवर्ड पर प्रकाश डालता है।

डेटा अधिकार कानून प्रवाह में है, खासकर जब यह आपके द्वारा किसी साइट पर सबमिट किए गए डेटा और उस डेटा से प्राप्त मशीन लर्निंग मॉडल की बात आती है। नए यूरोपीय डेटा और गोपनीयता नियम आपको स्टैक एक्सचेंज जैसी साइट पर सबमिट किए गए सभी डेटा को डाउनलोड करने या हटाने के लिए सशक्त बनाते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.