मैं एक दूसरी भाषा के रूप में लोगों को अंग्रेजी सीखने में मदद करने के लिए एक ऐप पर काम कर रहा हूं। मैंने पुष्टि की है कि वाक्य अतिरिक्त संदर्भ प्रदान करके भाषा सीखने में मदद करते हैं। मैंने 60 छात्रों की कक्षा में एक छोटा शोध किया।
मैंने विभिन्न अंग्रेजी शब्दों के लिए विकिपीडिया से सौ हज़ार से अधिक वाक्यों का खनन किया है (बैरोन के 800 शब्दों और 1000 सबसे सामान्य अंग्रेजी शब्दों सहित)
संपूर्ण डेटा https://buildmyvocab.in पर उपलब्ध है
सामग्री की गुणवत्ता बनाए रखने के लिए, मैंने ऐसे वाक्यों को फ़िल्टर किया जो 160 वर्णों से अधिक लंबे थे क्योंकि उन्हें समझना मुश्किल हो सकता है।
अगले कदम के रूप में, मैं आसानी से समझने के क्रम में इस सामग्री को छांटने की प्रक्रिया को स्वचालित करने में सक्षम होना चाहता हूं। मैं स्वयं एक गैर-देशी अंग्रेजी वक्ता हूं। मैं यह जानना चाहता हूं कि मुश्किल से आसान वाक्यों को अलग करने के लिए मैं किन विशेषताओं का उपयोग कर सकता हूं।
इसके अलावा, क्या आपको लगता है कि यह संभव है?