सबसे पहले, यह जान लें कि आप अपनी भाषा में फ़ाइलों का पता लगाने के लिए भाषा-भाषी ओवरराइड्स का उपयोग करके ओवरराइड कर सकते हैं ।
अब, संक्षेप में,
- प्रत्येक रिपॉजिटरी को भाषा के आंकड़ों से पहली भाषा के साथ टैग किया गया है ।
- भाषा आँकड़े प्रत्येक ज्ञात प्रोग्रामिंग या मार्कअप भाषा के लिए फ़ाइलों के कुल आकार की गणना करते हैं। वेंडर्ड, डॉक्यूमेंटेशन और जेनरेट की गई फाइल्स को काउंट नहीं किया जाता है।
- प्रत्येक फ़ाइल की भाषा का पता ओपन सोर्स प्रोजेक्ट लिंग्विस्ट द्वारा लगाया जाता है ।
भाषाविद् भाषाओं का पता कैसे लगाता है?
भाषाविद् क्रम में निम्नलिखित रणनीतियों पर निर्भर करता है , और जैसे ही यह एक परिपूर्ण मैच मिला (एक एकल लौटे हुए रणनीति के साथ) भाषा को वापस कर देता है।
- Emacs और विम मॉडल के लिए देखो ।
- ज्ञात नाम। कुछ फ़ाइलनाम विशिष्ट भाषाओं (विचार
Makefile
) से जुड़े हैं ।
- एक चरवाहे के लिए देखो।
#!/bin/bash
शेलबैंग वाली फाइल को शेल के रूप में वर्गीकृत किया जाएगा।
- ज्ञात फ़ाइल एक्सटेंशन। भाषाओं में उनसे जुड़े एक्सटेंशन का एक समूह होता है। हालांकि, इस रणनीति के साथ बहुत सारे संघर्ष हैं। परस्पर विरोधी परिणाम (सोचते हैं कि सी ++, सी और ऑब्जेक्टिव-सी के लिए
.h
) बाद की रणनीतियों द्वारा परिष्कृत किए जाते हैं।
- हेयूरिस्टिक नियमों का एक सेट । वे आमतौर पर भाषा की कोशिश करने और पहचानने के लिए फाइलों की सामग्री पर नियमित अभिव्यक्तियों पर निर्भर होते हैं (उदाहरण के लिए,
^[^#]+:-
प्रोलॉग के लिए )।
- एक भोले बेसेसियन क्लासिफायर नमूना फ़ाइलों पर प्रशिक्षित । अंतिम रणनीति, न्यूनतम सटीकता। बायेसियन क्लासिफायरियर हमेशा इनपुट के रूप में भाषाओं का सबसेट लेता है; यह सभी भाषाओं के बीच वर्गीकृत करने के लिए नहीं है। क्लासिफायर द्वारा पाया गया सबसे अच्छा मैच वापस आ गया है।
अनवेंडेड और डॉक्यूमेंटेशन फाइल क्या हैं?
भाषाविद् कुछ फाइलों को वंचित मानते हैं , जिसका अर्थ है कि वे भाषा के आँकड़ों में शामिल नहीं हैं। इनमें jQuery जैसे तृतीय-पक्ष लाइब्रेरी शामिल हैं और vendor.yml
कॉन्फ़िगरेशन फ़ाइल में परिभाषित हैं । आप भाषाई ओवरराइड्स का उपयोग करके अपनी रिपॉजिटरी में वेंडर या अनवेंडर फाइल भी कर सकते हैं ।
इसी तरह, प्रलेखन फ़ाइलों को परिभाषित किया जाता है documentation.yml
और लिंग्विस्ट ओवरराइड्स का उपयोग करके बदला जा सकता है ।
उत्पन्न फ़ाइलों का पता कैसे लगाया जाता है?
भाषाविद् उत्पन्न फ़ाइलों का पता लगाने के लिए सरल नियमों पर निर्भर करते हैं , दोनों पथ और फ़ाइलों की सामग्री का उपयोग करते हुए। जनरेट की गई फ़ाइलों को भाषा के आँकड़ों में नहीं गिना जाता है और github.com पर अलग-अलग प्रदर्शित नहीं किया जाता है।
प्रोग्रामिंग और मार्कअप भाषाओं के बारे में क्या?
भाषाविज्ञान में, प्रत्येक भाषा को एक प्रकार दिया जाता है। इन प्रकार, मुख्य विन्यास फाइल में पाया जा सकता languages.yml
। केवल प्रोग्रामिंग और मार्कअप भाषा आँकड़ों में गिनी जाती है।