एकल उद्धरण वर्ण (एपोस्ट्रोफिस) के प्रमुख और अनुगामी को अनदेखा करें


2

हंसेल हमेशा शब्द के हिस्से के रूप में एकल उद्धरण वर्ण (एपोस्ट्रोफिस) मानते हैं। इसका मतलब है कि जब पाठ उद्धृत करने के लिए एकल उद्धरण का उपयोग करता है, तो हंसेल उन त्रुटियों के रूप में चिह्नित करते हैं। यहां तक ​​कि अपने आप में एक भी उद्धरण एक (गलत वर्तनी) शब्द माना जाता है।

% echo "He asked, 'Why can't I quote?'" | hunspell
Hunspell 1.3.2
*
*
& 'Why 3 10: why, whey, whiny
*
*
*
& ' 15 29: 's, e, s, i, a, n, r, t, o, l, c, d, u, g, m

एस्पेल को यह अधिकार मिलता है:

% echo "He asked, 'Why can't I quote?'" | aspell -a
@(#) International Ispell Version 3.1.20 (but really Aspell 0.60.7-20110707)
*
*
*
*
*
*

मैं hunspell का उपयोग करना पसंद करूंगा, लेकिन इसे प्रमुख उद्धरण वर्णों को अनदेखा करते हुए प्रमुख और अनुगामी एकल पात्रों को अनदेखा करने के लिए निर्देशित करना, जैसे कि "नहीं" में एम्बेडेड उद्धरण वर्णों को बनाए रखना।

मैं यह कैसे कर सकता हूँ?


लगभग 2018, यह बग (या कमी) तय हो गया है; जब मैं आपका परीक्षण चलाता हूं, तो इसमें कोई त्रुटि नहीं होती है। मेरा hunspellसंस्करण 1.6.2 पर है MacOS
C पर स्कॉट सी विल्सन

जवाबों:


1

'एक गैर-अल्फ़ान्यूमेरिक, या एक गैर-अल्फ़ान्यूमेरिक से पहले, या शुरुआत में या एक पंक्ति के अंत में निम्नलिखित को हटाएं :

echo "He asked, 'Why can't I quote?'" | perl -pe 's/'"'"'(\W)/$1/g;s/(\W)'"'"'/$1/g;s/^'"'"'//;s/'"'"'$//;' | hunspell

सुझाव के लिए धन्यवाद, लेकिन यह मेरी मदद नहीं करता है। मैं hunspell को बदलने का एक तरीका ढूंढ रहा हूं, hunspell के इनपुट को बदलने के लिए नहीं। स्ट्रिंग को बदलकर hunspell आउटपुट में कॉलम संख्याओं को बंद कर देता है। इसका मतलब है कि hunspell आउटपुट अब मूल स्ट्रिंग पर मैप नहीं करता है, इसलिए इसे बहुत अधिक अतिरिक्त बुकिंग के बिना प्रोग्रामेटिक रूप से उपयोग नहीं किया जा सकता है।
मर्स्टन

ठीक है, मैं समस्या देखता हूं। मुझे लगता है कि आप hunspell dictionaty फ़ाइलों को पैचिंग को प्राप्त कर सकते हैं। Hunspell4.pdf में प्रलेखित एक "IGNORE वर्ण" विकल्प है, लेकिन मैंने कभी कोशिश नहीं की है। वैकल्पिक रूप से, आप एक इनपुट रूपांतरण का उपयोग कर सकते हैं, जो रिक्त स्थान के उद्धरणों को प्रतिस्थापित करता है, उन्हें हटाने के बजाय, ताकि कॉलम नंबर अपरिवर्तित रहें:perl -pe 's/'"'"'(\W)/ $1/g;s/(\W)'"'"'/$1 /g;s/^'"'"'/ /;s/'"'"'$/ /;'
Uwe

1

आपको अपनी डिक्शनरी एफिक्स फाइल (यानी /usr/share/hunspell/en_US.aff) के लिए निम्नलिखित पंक्ति को जोड़ना होगा

IGNORE '

दुर्भाग्य से मैंने एक व्यक्तिगत एफिक्स फाइल को निर्दिष्ट करने के तरीके का पता नहीं लगाया, जैसे आप एक व्यक्तिगत शब्दकोश फ़ाइल के साथ कर सकते हैं।


मैंने यह कोशिश की, और इसने व्यवहार को नहीं बदला।
मर्स्टस्ट सिप 29'14
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.