टीईएक्स स्टैकएक्सचेंज पर, हम इस प्रश्न में पैराग्राफ में "नदियों" का पता लगाने के बारे में चर्चा कर रहे हैं ।
इस संदर्भ में, नदियाँ श्वेत स्थान की पट्टी होती हैं, जो पाठ में अंतरजाल के आकस्मिक संरेखण से उत्पन्न होती हैं। चूंकि यह एक पाठक को काफी विचलित कर सकता है खराब नदियों को खराब टाइपोग्राफी का एक लक्षण माना जाता है। नदियों के साथ पाठ का एक उदाहरण यह है, जहां दो नदियाँ तिरछे रूप से बहती हैं।
इन नदियों का स्वचालित रूप से पता लगाने में रुचि है, ताकि उन्हें टाला जा सके (संभवतः पाठ के मैनुअल संपादन द्वारा)। रैफिंक टीएक्स स्तर पर कुछ प्रगति कर रहा है (जो केवल ग्लिफ़ पदों और बाउंडिंग बॉक्स के बारे में जानता है), लेकिन मुझे विश्वास है कि नदियों का पता लगाने का सबसे अच्छा तरीका कुछ छवि प्रसंस्करण के साथ है (चूंकि ग्लिफ़ आकार बहुत महत्वपूर्ण हैं और टीएक्स के लिए उपलब्ध नहीं हैं) । मैंने उपरोक्त छवि से नदियों को निकालने के विभिन्न तरीकों की कोशिश की है, लेकिन एलीपिपोलाइडल धुंधलापन की एक छोटी मात्रा को लागू करने का मेरा सरल विचार अच्छा नहीं लगता है। मैंने कुछ राडोण भी आजमाएपर्याप्त रूप से फ़िल्टरिंग आधारित रूपांतरण, लेकिन मैं कहीं भी उन लोगों के साथ नहीं मिला। मानव आंख / रेटिना / मस्तिष्क के फीचर-डिटेक्शन सर्किट में नदियां बहुत दिखाई देती हैं और किसी तरह मुझे लगता है कि इसका अनुवाद किसी प्रकार के फ़िल्टरिंग ऑपरेशन में किया जा सकता है, लेकिन मैं इसे काम करने में सक्षम नहीं हूं। कोई विचार?
विशिष्ट होने के लिए, मैं कुछ ऑपरेशन की तलाश कर रहा हूं जो उपरोक्त छवि में 2 नदियों का पता लगाएगा, लेकिन बहुत अधिक झूठे सकारात्मक सकारात्मक नहीं हैं।
EDIT: एंडोलिथ ने पूछा कि मैं एक छवि-प्रसंस्करण-आधारित दृष्टिकोण का अनुसरण क्यों कर रहा हूं, यह देखते हुए कि TeX में हमारे पास ग्लिफ़ पोज़िशन, स्पेसिंग आदि हैं, और वास्तविक टेक्स्ट की जांच करने वाले एल्गोरिथ्म का उपयोग करने के लिए यह बहुत तेज़ और अधिक विश्वसनीय हो सकता है। चीजों को दूसरे तरीके से करने का मेरा कारण यह है कि आकारग्लिफ़ प्रभावित कर सकते हैं कि एक नदी कितनी ध्यान देने योग्य है, और पाठ स्तर पर इस आकृति पर विचार करना बहुत मुश्किल है (जो फ़ॉन्ट पर निर्भर करता है, लिगेटिंग पर, आदि)। एक उदाहरण के लिए कि ग्लिफ़ का आकार कैसे महत्वपूर्ण हो सकता है, निम्नलिखित दो उदाहरणों पर विचार करें, जहाँ उनके बीच का अंतर यह है कि मैंने कुछ समान चौड़ाई वाले अन्य लोगों के साथ कुछ ग्लिफ़ों को प्रतिस्थापित किया है, ताकि एक पाठ-आधारित विश्लेषण पर विचार किया जा सके। उन्हें समान रूप से अच्छा / बुरा। हालाँकि, ध्यान दें कि पहले उदाहरण में नदियाँ दूसरे की तुलना में बहुत खराब हैं।
ImageLines[]
मैथेमेटिका से, कुछ प्रीप्रोसेसिंग के साथ और बिना उपयोग किया । मुझे लगता है कि यह तकनीकी रूप से रैडॉन ट्रांसफ़ॉर्म के बजाय हॉफ का उपयोग कर रहा है। मुझे आश्चर्य नहीं होगा यदि उचित प्रीप्रोसेसिंग (मैंने डाटेजिस्ट के सुझाए गए फैलाव फिल्टर की कोशिश नहीं की) और / या पैरामीटर सेटिंग्स यह काम कर सकती हैं।