पुनः मॉड्यूल समर्थन शब्द सीमा (\ b) से नियमित अभिव्यक्ति करते हैं?

Question 1

नियमित अभिव्यक्तियों के बारे में थोड़ा और जानने की कोशिश करते हुए, एक ट्यूटोरियल ने सुझाव दिया कि आप \bशब्द सीमा का मिलान करने के लिए शब्द का उपयोग कर सकते हैं । हालाँकि, पायथन इंटरप्रिटर में निम्नलिखित स्निपेट अपेक्षा के अनुरूप काम नहीं करता है:

>>> x = 'one two three'
>>> y = re.search("\btwo\b", x)

यदि कुछ भी मिलान किया गया था तो यह एक मैच ऑब्जेक्ट होना चाहिए था, लेकिन यह है None।

क्या \bपायथन में अभिव्यक्ति का समर्थन नहीं किया गया है या क्या मैं इसका गलत उपयोग कर रहा हूं?

Question 2

आप कोशिश क्यों नहीं करते

word = 'two'
re.compile(r'\b%s\b' % word, re.I)

आउटपुट:

>>> word = 'two'
>>> k = re.compile(r'\b%s\b' % word, re.I)
>>> x = 'one two three'
>>> y = k.search( x)
>>> y
<_sre.SRE_Match object at 0x100418850>

उल्लेख करना भी भूल गए, आपको अपने कोड में कच्चे तार का उपयोग करना चाहिए

>>> x = 'one two three'
>>> y = re.search(r"\btwo\b", x)
>>> y
<_sre.SRE_Match object at 0x100418a58>
>>>

Question 3

यह काम करेगा: re.search(r"\btwo\b", x)

जब आप "\b"पायथन में लिखते हैं , यह एक एकल चरित्र है "\x08":। या तो इस तरह बैकस्लैश से बच जाएं:

"\\b"

या इस तरह एक कच्ची स्ट्रिंग लिखें:

r"\b"

Question 4

बस स्पष्ट रूप से समझाने के लिए कि क्यों re.search("\btwo\b", x) काम नहीं करता है, यह इसलिए \bहै क्योंकि पायथन स्ट्रिंग एक बैकस्पेस चरित्र के लिए शॉर्टहैंड है।

print("foo\bbar")
fobar

इसलिए पैटर्न "\btwo\b"एक बैकस्पेस की तलाश में है two, उसके बाद एक और बैकस्पेस, जिसके बाद आप जिस स्ट्रिंग में खोज कर रहे हैं, x = 'one two three'वह नहीं है।

अनुमति देने के लिए re.search(या compile) अनुक्रम व्याख्या करने के लिए \bएक शब्द सीमा के रूप में, या तो बैकस्लैश (भागने "\\btwo\\b") या एक कच्चे स्ट्रिंग का उपयोग अपने पैटर्न बनाने के लिए ( r"\btwo\b")।

Question 5

अजगर का प्रलेखन

https://docs.python.org/2/library/re.html#regular-expression-syntax

\ b

खाली स्ट्रिंग से मेल खाता है, लेकिन केवल एक शब्द की शुरुआत या अंत में। किसी शब्द को अल्फ़ान्यूमेरिक या अंडरस्कोर वर्णों के अनुक्रम के रूप में परिभाषित किया जाता है, इसलिए किसी शब्द के अंत को व्हॉट्सएप या एक गैर-अल्फ़ान्यूमेरिक, गैर-अंडरस्कोर वर्ण द्वारा इंगित किया जाता है। ध्यान दें कि औपचारिक रूप से, \ b को \ w और a \ W वर्ण (या इसके विपरीत), या \ w और स्ट्रिंग के आरंभ / अंत के बीच की सीमा के रूप में परिभाषित किया जाता है, इसलिए अल्फ़ान्यूमेरिक समझे जाने वाले वर्णों का सटीक सेट निर्भर करता है UNICODE और LOCALE झंडे के मूल्यों पर। उदाहरण के लिए, r '\ bfoo \ b' 'फू', 'फू', '(फू)', 'बार फू बाज' लेकिन 'फोबार' या 'फू 3' से मेल नहीं खाता। एक वर्ण सीमा के अंदर, पायथन के स्ट्रिंग शाब्दिकों के साथ संगतता के लिए \ b बैकस्पेस वर्ण का प्रतिनिधित्व करता है।