अंग्रेजी पाठ की पठनीयता मापने के लिए उपकरण


13

क्या कोई कमांड लाइन प्रोग्राम है जो अंग्रेजी पाठ वाली फ़ाइल लेता है, पाठ का विश्लेषण करता है, और इसकी पठनीयता स्कोर को आउटपुट करता है?

उदाहरण के लिए, यदि कोई प्रोग्राम को टेक्स्ट फीड करता है, तो प्रोग्राम को फ्लेश-किन्कैड ग्रेड स्तर, मैकलॉघ्लिन की एसएमओजी ग्रेडिंग आदि का उत्पादन करना चाहिए।

मेरा मानना ​​है कि इस तरह का कार्यक्रम आधिकारिक रिपॉजिटरी में मौजूद है, लेकिन मुझे इसका नाम याद नहीं है। इस बात की भी संभावना है कि मैं भ्रामक हूं।

जवाबों:


11

diction डिक्शन स्थापित करेंपैकेज के लिए एक उपकरण कहा जाता है style:

Style किसी दस्तावेज़ की लेखन शैली की सतह विशेषताओं का विश्लेषण करता है। यह विभिन्न पठनीयता ग्रेड, शब्दों की लंबाई, वाक्य और पैराग्राफ प्रिंट करता है। यह आगे कुछ विशेषताओं के साथ वाक्यों का पता लगा सकता है।

उदाहरण के लिए, यदि मैं flux_question10 से अधिक पठनीयता सूचकांक (ARI) के साथ वाक्यों को मुद्रित करने के लिए आपके प्रश्न निकाय (फ़ाइल में सहेजा गया ) का मूल्यांकन करता हूं :

$ style -r 10 flux_question
flux_question:1: Is there a command line program that takes a file containing English text, analyzes the text, and outputs its readability scores?
flux_question:2: For example, if one feeds the program a text, the program should output the Flesch-Kincaid grade level, McLaughlin's SMOG grading, etc.
readability grades:
        Kincaid: 10.2
        ARI: 10.8
        Coleman-Liau: 12.5
        Flesch Index: 51.1/100
        Fog Index: 12.0
        Lix: 48.6 = school year 9
        SMOG-Grading: 11.2
sentence info:
        333 characters
        65 words, average length 5.12 characters = 1.65 syllables
        4 sentences, average length 16.2 words
        25% (1) short sentences (at most 11 words)
        0% (0) long sentences (at least 26 words)
        1 paragraphs, average length 4.0 sentences
        25% (1) questions
        25% (1) passive sentences
        longest sent 21 wds at sent 2; shortest sent 8 wds at sent 4
word usage:
        verb types:
        to be (1) auxiliary (2) 
        types as % of total:
        conjunctions 5% (3) pronouns 9% (6) prepositions 2% (1)
        nominalizations 0% (0)
sentence beginnings:
        pronoun (1) interrogative pronoun (0) article (0)
        subordinating conjunction (0) conjunction (0) preposition (0)

आउटपुट को फ़िल्टर करने के लिए आप उदाहरण tail -n8के लिए केवल ग्रेड प्राप्त करने के लिए या grep 'Flesch\|SMOG'केवल Flesch Index और SMOG- ग्रेडिंग प्रिंट करने के लिए उपयोग कर सकते हैं :

$ style style_test | grep 'Flesch\|SMOG'
        Flesch Index: 51.7/100
        SMOG-Grading: 11.2

आगे की पढाई

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.