मेरे पास स्ट्रिंग्स की हजारों सूची हैं, और प्रत्येक सूची में लगभग 10 तार हैं। किसी दिए गए सूची में अधिकांश तार बहुत समान हैं, हालांकि कुछ तार दूसरों के लिए पूरी तरह से असंबंधित हैं (और शायद ही कभी अप्रासंगिक शब्द हैं। उन्हें विहित स्ट्रिंग के शोर रूपांतर माना जा सकता है। मैं एक एल्गोरिथ्म या एक पुस्तकालय की तलाश कर रहा हूं जो प्रत्येक सूची को इस कैनोनिकल स्ट्रिंग में बदल देगा।
ऐसी ही एक सूची है।
- स्टार वार्स: एपिसोड IV एक नई आशा | StarWars.com
- स्टार वार्स एपिसोड IV - ए न्यू होप (1977)
- स्टार वार्स: एपिसोड IV - एक नई आशा - सड़े हुए टमाटर
- देखो स्टार वार्स: प्रकरण IV - एक नई आशा ऑनलाइन नि: शुल्क
- स्टार वार्स (1977) - ग्रेटेस्ट फिल्म्स
- [REC] 4 पोस्टर आउटबोर्ड मोटर द्वारा मौत का वादा करता है - SciFiNow
इस सूची के लिए, नियमित अभिव्यक्ति से मेल खाने वाला कोई भी स्ट्रिंग ^Star Wars:? Episode IV (- )?A New Hope$
स्वीकार्य होगा।
मैंने कोर्टेर पर मशीन लर्निंग पर एंड्रयू एनजी के पाठ्यक्रम को देखा है, लेकिन मैं एक समान समस्या नहीं पा रहा था।