डोमेन नाम ट्रेडिंग बड़ा व्यवसाय है। डोमेन नाम ट्रेडिंग के लिए सबसे उपयोगी उपकरणों में से एक एक स्वचालित मूल्यांकन उपकरण है, जिससे आप आसानी से अनुमान लगा सकते हैं कि किसी दिए गए डोमेन का मूल्य कितना है। दुर्भाग्य से, कई स्वचालित मूल्यांकन सेवाओं का उपयोग करने के लिए सदस्यता / सदस्यता की आवश्यकता होती है। इस चुनौती में, आप एक साधारण मूल्यांकन उपकरण लिखेंगे जो मोटे तौर पर .com डोमेन के मूल्यों का अनुमान लगा सकता है।
इनपुट आउटपुट
इनपुट के रूप में, आपके प्रोग्राम को डोमेन नाम की सूची लेनी चाहिए, प्रति पंक्ति एक। प्रत्येक डोमेन नाम रेगेक्स से मेल खाएगा ^[a-z0-9][a-z0-9-]*[a-z0-9]$
, जिसका अर्थ है कि यह लोअरकेस अक्षरों, अंकों और हाइफ़न से बना है। प्रत्येक डोमेन कम से कम दो वर्ण लंबा है और न तो शुरू होता है और न ही एक हाइफ़न के साथ समाप्त होता है। .com
प्रत्येक डोमेन में शामिल करना ज़रूरी है, क्योंकि यह निहित है है।
इनपुट के वैकल्पिक रूप के रूप में, आप वर्णों की एक स्ट्रिंग के बजाय पूर्णांक की एक सरणी के रूप में एक डोमेन नाम को स्वीकार करने का विकल्प चुन सकते हैं, जब तक कि आप अपने वांछित चरित्र-से-पूर्णांक रूपांतरण को निर्दिष्ट करते हैं।
आपके प्रोग्राम को पूर्णांक, एक प्रति पंक्ति, जो संबंधित डोमेन के अनुमानित मूल्य देता है, की एक सूची का उत्पादन करना चाहिए।
इंटरनेट और अतिरिक्त फाइलें
आपके प्रोग्राम में अतिरिक्त फ़ाइलों तक पहुंच हो सकती है, जब तक आप इन फ़ाइलों को अपने उत्तर के हिस्से के रूप में प्रदान करते हैं। आपके प्रोग्राम को एक डिक्शनरी फ़ाइल (मान्य शब्दों की एक सूची, जो आपको प्रदान नहीं करनी है) तक पहुँचने की अनुमति है।
(संपादित करें) मैंने इस चुनौती का विस्तार करने का फैसला किया है ताकि आपके कार्यक्रम को इंटरनेट तक पहुँचाया जा सके। कुछ प्रतिबंध हैं, क्योंकि आपका प्रोग्राम किसी भी डोमेन की कीमतों (या मूल्य इतिहास) को नहीं देख सकता है, और यह केवल पूर्व-मौजूदा सेवाओं (कुछ खामियों को कवर करने के लिए उत्तरार्द्ध) का उपयोग करता है।
कुल आकार की एकमात्र सीमा एसई द्वारा लगाई गई उत्तर आकार सीमा है।
उदाहरण इनपुट
ये कुछ हाल ही में बेचे गए डोमेन हैं। अस्वीकरण: हालांकि इनमें से कोई भी साइट दुर्भावनापूर्ण नहीं है, मुझे नहीं पता कि कौन उन्हें नियंत्रित करता है और इस तरह उन्हें जाने के खिलाफ सलाह देता है।
6d3
buyspydrones
arcader
counselar
ubme
7483688
buy-bikes
learningmusicproduction
उदाहरण आउटपुट
ये नंबर असली हैं।
635
31
2000
1
2001
5
160
1
स्कोरिंग
स्कोरिंग "लॉगरिथम के अंतर पर आधारित होगा।" उदाहरण के लिए, यदि कोई डोमेन $ 300 में बेचा जाता है और आपके कार्यक्रम ने इसे $ 500 पर मूल्यांकित किया है, तो उस डोमेन के लिए आपका स्कोर अनुपस्थित है (ln (500) -ln (300)) = 0.5108। किसी भी डोमेन की कीमत $ 1 से कम नहीं होगी। आपका कुल स्कोर कम से कम बेहतर स्कोर के साथ, डोमेन के सेट के लिए आपका औसत स्कोर है।
एक अनुमान प्राप्त करने के लिए कि आपको किस स्कोर की उम्मीद करनी चाहिए, बस 36
के बारे में एक अंक में परिणाम के नीचे प्रशिक्षण डेटा के लिए एक निरंतर अनुमान लगा रहा है 1.6883
। एक सफल एल्गोरिथ्म का स्कोर इससे कम है।
मैंने लॉगरिदम का उपयोग करना चुना क्योंकि मान परिमाण के कई आदेशों को फैलाते हैं, और डेटा आउटलेर से भरा जाएगा। अंतर वर्ग के बजाय पूर्ण अंतर का उपयोग स्कोरिंग में आउटलेर के प्रभाव को कम करने में मदद करेगा। (यह भी ध्यान दें कि मैं प्राकृतिक लघुगणक का उपयोग कर रहा हूं, आधार 2 या आधार 10 नहीं।)
डेटा स्रोत
मैंने हाल ही में बेची गई 1,400 से अधिक की सूची की सूची तैयार की है। एक डोमेन नीलामी वेबसाइट Flippa से .com डोमेन । यह डेटा प्रशिक्षण डेटा सेट बना देगा। सबमिशन की अवधि समाप्त होने के बाद, मैं एक अतिरिक्त महीने की प्रतीक्षा करूँगा ताकि एक परीक्षण डेटा सेट बनाया जा सके, जिसके साथ सबमिशन स्कोर किया जाएगा। मैं प्रशिक्षण / परीक्षण सेट के आकार को बढ़ाने के लिए अन्य स्रोतों से डेटा एकत्र करना भी चुन सकता हूं।
प्रशिक्षण डेटा निम्नलिखित gist में उपलब्ध है। (अस्वीकरण: हालाँकि मैंने कुछ सरल रूप से NSFW डोमेन को हटाने के लिए कुछ सरल फ़िल्टरिंग का उपयोग किया है, फिर भी कई इस सूची में शामिल हो सकते हैं। इसके अलावा, मैं आपको पहचानने वाले किसी भी डोमेन पर जाने के खिलाफ सलाह देता हूं ।) दाईं ओर की संख्याएँ हैं। असली कीमतें। https://gist.github.com/PhiNotPi/46ca47247fe85f82767c82c820d730b5
यहां प्रशिक्षण डेटा सेट के मूल्य वितरण का एक ग्राफ दिया गया है। मूल्य का प्राकृतिक लॉग x- अक्ष, y- अक्ष की गणना के साथ। प्रत्येक बार की चौड़ाई 0.5 है। स्रोत वेबसाइट के बाद से बाईं ओर के स्पाइक्स $ 1 और $ 6 के अनुरूप हैं क्योंकि कम से कम $ 5 की वृद्धि के लिए बोलियों की आवश्यकता होती है। परीक्षण डेटा में थोड़ा अलग वितरण हो सकता है।
यहाँ 0.2 की बार चौड़ाई के साथ एक ही ग्राफ का लिंक दिया गया है। उस ग्राफ़ में आप $ 11 और $ 16 पर स्पाइक्स देख सकते हैं।