खोजपूर्ण डेटा विश्लेषण पर काम करने और एल्गोरिदम विकसित करने में, मुझे लगता है कि मेरा अधिकांश समय कल्पना के चक्र में व्यतीत होता है, कुछ कोड लिखते हैं, छोटे डेटासेट पर चलते हैं, दोहराते हैं। मेरे पास जो डेटा है वह कंप्यूटर विज़न / सेंसर फ्यूजन टाइप का सामान है, और एल्गोरिदम विज़न-हैवी हैं (उदाहरण के लिए ऑब्जेक्ट डिटेक्शन और ट्रैकिंग, आदि), और इस संदर्भ में शेल्फ एल्गोरिदम काम नहीं करते हैं। मुझे लगता है कि यह बहुत सारे पुनरावृत्तियों लेता है (उदाहरण के लिए, एल्गोरिथ्म के प्रकार को डायल करने के लिए या एल्गोरिथ्म में मापदंडों को ट्यून करने के लिए, या एक विज़ुअलाइज़ेशन अधिकार प्राप्त करने के लिए) और साथ ही एक छोटे से डेटासेट पर भी चलने का समय काफी लंबा है, इसलिए सब एक साथ एक समय लगता है।
एल्गोरिथ्म के विकास को स्वयं कैसे विकसित किया जा सकता है और अधिक स्केलेबल बनाया जा सकता है?
कुछ विशिष्ट चुनौतियां:
पुनरावृत्तियों की संख्या को कैसे कम किया जा सकता है? (Esp। जब किस प्रकार का एल्गोरिथ्म है, तो इसकी बारीकियों को अकेले जाने दें, विभिन्न संस्करणों की कोशिश किए बिना और उनके व्यवहार की जांच किए बिना आसानी से समझ में नहीं आता है)
विकास के दौरान बड़े डेटासेट पर कैसे चला जाए? (अक्सर छोटे से बड़े डेटासेट में जाने पर नए व्यवहार और नए मुद्दों का एक गुच्छा दिखाई देता है)
एल्गोरिथ्म मापदंडों को तेजी से कैसे ट्यून किया जा सकता है?
एल्गोरिथ्म डेवलपमेंट के लिए मशीन लर्निंग टाइप टूल कैसे लागू करें? (उदाहरण के लिए, हाथ से एल्गोरिथ्म लिखने के बजाय, कुछ सरल बिल्डिंग ब्लॉक्स लिखें और उन्हें समस्या से सीखे तरीके से जोड़ दें, आदि।)