हम में से कई को उपयोगकर्ता इनपुट, खोज क्वेरी और उन स्थितियों से निपटने की आवश्यकता है जहां इनपुट पाठ में संभवतः अपवित्रता या अवांछनीय भाषा हो सकती है। अक्सर इसे छानने की जरूरत होती है।
विभिन्न भाषाओं और बोलियों में शपथ शब्दों की एक अच्छी सूची कहां मिल सकती है?
क्या एपीआई ऐसे स्रोतों के लिए उपलब्ध हैं जिनमें अच्छी सूचियाँ हैं? या हो सकता है कि एक एपीआई जो केवल "हाँ यह साफ है" या "नहीं यह गंदा है" कुछ मापदंडों के साथ?
$ $, Azz, या a55 जैसे सिस्टम को चकमा देने की कोशिश कर रहे लोगों को पकड़ने के लिए कुछ अच्छे तरीके क्या हैं?
यदि आप PHP के लिए समाधान प्रदान करते हैं तो बोनस अंक। :)
संपादित करें: जवाब देने के लिए जो कहते हैं कि बस प्रोग्रामेटिक मुद्दे से बचें:
मुझे लगता है कि इस तरह के फिल्टर के लिए एक जगह है जब, उदाहरण के लिए, उपयोगकर्ता उन चित्रों को खोजने के लिए सार्वजनिक छवि खोज का उपयोग कर सकता है जो एक संवेदनशील सामुदायिक पूल में जुड़ जाते हैं। यदि वे "लिंग" की खोज कर सकते हैं, तो उन्हें संभवतः, हां की कई तस्वीरें मिलेंगी। यदि हम उस की तस्वीरें नहीं चाहते हैं, तो शब्द को खोज शब्द के रूप में रोकना एक अच्छा द्वारपाल है, हालांकि वास्तव में एक मूर्खतापूर्ण विधि नहीं है। पहले शब्दों की सूची प्राप्त करना ही वास्तविक प्रश्न है।
इसलिए मैं वास्तव में एक एकल टोकन से पता लगाने के तरीके का उल्लेख कर रहा हूं कि वह गंदा है या नहीं और फिर इसे हटा दें। मैं पूरी तरह से प्रफुल्लित करने वाला "लंबे गर्दन वाले जिराफ़" संदर्भ जैसी भावना को रोकने की जहमत नहीं उठाता। वहां आप कुछ नहीं कर सकते। :)