सबसे पहले, यह जान लें कि आप अपनी भाषा में फ़ाइलों का पता लगाने के लिए भाषा-भाषी ओवरराइड्स का उपयोग करके ओवरराइड कर सकते हैं ।
अब, संक्षेप में,
- प्रत्येक रिपॉजिटरी को भाषा के आंकड़ों से पहली भाषा के साथ टैग किया गया है ।
- भाषा आँकड़े प्रत्येक ज्ञात प्रोग्रामिंग या मार्कअप भाषा के लिए फ़ाइलों के कुल आकार की गणना करते हैं। वेंडर्ड, डॉक्यूमेंटेशन और जेनरेट की गई फाइल्स को काउंट नहीं किया जाता है।
- प्रत्येक फ़ाइल की भाषा का पता ओपन सोर्स प्रोजेक्ट लिंग्विस्ट द्वारा लगाया जाता है ।
भाषाविद् भाषाओं का पता कैसे लगाता है?
भाषाविद् क्रम में निम्नलिखित रणनीतियों पर निर्भर करता है , और जैसे ही यह एक परिपूर्ण मैच मिला (एक एकल लौटे हुए रणनीति के साथ) भाषा को वापस कर देता है।
- Emacs और विम मॉडल के लिए देखो ।
- ज्ञात नाम। कुछ फ़ाइलनाम विशिष्ट भाषाओं (विचार
Makefile) से जुड़े हैं ।
- एक चरवाहे के लिए देखो।
#!/bin/bashशेलबैंग वाली फाइल को शेल के रूप में वर्गीकृत किया जाएगा।
- ज्ञात फ़ाइल एक्सटेंशन। भाषाओं में उनसे जुड़े एक्सटेंशन का एक समूह होता है। हालांकि, इस रणनीति के साथ बहुत सारे संघर्ष हैं। परस्पर विरोधी परिणाम (सोचते हैं कि सी ++, सी और ऑब्जेक्टिव-सी के लिए
.h) बाद की रणनीतियों द्वारा परिष्कृत किए जाते हैं।
- हेयूरिस्टिक नियमों का एक सेट । वे आमतौर पर भाषा की कोशिश करने और पहचानने के लिए फाइलों की सामग्री पर नियमित अभिव्यक्तियों पर निर्भर होते हैं (उदाहरण के लिए,
^[^#]+:-प्रोलॉग के लिए )।
- एक भोले बेसेसियन क्लासिफायर नमूना फ़ाइलों पर प्रशिक्षित । अंतिम रणनीति, न्यूनतम सटीकता। बायेसियन क्लासिफायरियर हमेशा इनपुट के रूप में भाषाओं का सबसेट लेता है; यह सभी भाषाओं के बीच वर्गीकृत करने के लिए नहीं है। क्लासिफायर द्वारा पाया गया सबसे अच्छा मैच वापस आ गया है।
अनवेंडेड और डॉक्यूमेंटेशन फाइल क्या हैं?
भाषाविद् कुछ फाइलों को वंचित मानते हैं , जिसका अर्थ है कि वे भाषा के आँकड़ों में शामिल नहीं हैं। इनमें jQuery जैसे तृतीय-पक्ष लाइब्रेरी शामिल हैं और vendor.ymlकॉन्फ़िगरेशन फ़ाइल में परिभाषित हैं । आप भाषाई ओवरराइड्स का उपयोग करके अपनी रिपॉजिटरी में वेंडर या अनवेंडर फाइल भी कर सकते हैं ।
इसी तरह, प्रलेखन फ़ाइलों को परिभाषित किया जाता है documentation.ymlऔर लिंग्विस्ट ओवरराइड्स का उपयोग करके बदला जा सकता है ।
उत्पन्न फ़ाइलों का पता कैसे लगाया जाता है?
भाषाविद् उत्पन्न फ़ाइलों का पता लगाने के लिए सरल नियमों पर निर्भर करते हैं , दोनों पथ और फ़ाइलों की सामग्री का उपयोग करते हुए। जनरेट की गई फ़ाइलों को भाषा के आँकड़ों में नहीं गिना जाता है और github.com पर अलग-अलग प्रदर्शित नहीं किया जाता है।
प्रोग्रामिंग और मार्कअप भाषाओं के बारे में क्या?
भाषाविज्ञान में, प्रत्येक भाषा को एक प्रकार दिया जाता है। इन प्रकार, मुख्य विन्यास फाइल में पाया जा सकता languages.yml। केवल प्रोग्रामिंग और मार्कअप भाषा आँकड़ों में गिनी जाती है।