प्रोग्राम को अश्लील चित्रों का पता लगाने का सबसे अच्छा तरीका क्या है? [बन्द है]


120

Akismet स्पैम टिप्पणियों का पता लगाने में एक अद्भुत काम करता है। लेकिन टिप्पणियां इन दिनों स्पैम का एकमात्र रूप नहीं हैं। क्या होगा अगर मैं एक सोशल नेटवर्किंग साइट पर स्वचालित रूप से पोर्न छवियों का पता लगाने के लिए एक्ज़िमसेट जैसा कुछ चाहता था जो उपयोगकर्ताओं को अपने पिक्स, अवतार, आदि को अपलोड करने की अनुमति देता है?

वहाँ पहले से ही कुछ छवि आधारित खोज इंजन और साथ ही चेहरा पहचान सामान उपलब्ध हैं इसलिए मुझे लगता है कि यह रॉकेट विज्ञान नहीं होगा और यह किया जा सकता है। हालाँकि, मुझे इस बारे में कोई सुराग नहीं है कि यह कैसे काम करता है और अगर मुझे इसे खरोंच से विकसित करना है तो मुझे इसके बारे में कैसे जाना चाहिए।

मुझे कैसे शुरू करना चाहिए?

क्या इसके लिए कोई ओपन सोर्स प्रोजेक्ट चल रहा है?


82
वास्तव में मैं कहूंगा कि रॉकेट विज्ञान की तुलना में बहुत कठिन लगता है! हमें पहले से ही बहुत सारे रॉकेट मिले हैं, लेकिन AFAIK नहीं "पोर्न डिटेक्टर" :)
GaZ

4
जबरदस्त हंसी। चेहरा पहचान है, लेकिन जननांग और स्तन की पहचान के लिए अभी तक कोई तकनीक नहीं है। कठिन भाग्य।
जॉन लिमजाप

11
पोर्नोग्राफी भूगोल का विषय है - इसके अलावा, मुझे यकीन है कि बहुत सारे चित्र हैं जो जननांगों या नग्नता को बिल्कुल भी नहीं दिखाते हैं, जिसे काफी कट्टर (फिर से - कुछ स्थानों पर) माना जाएगा। एक उन्नत ऐ के लिए एक नौकरी की तरह लगता है, न कि एक साधारण एल्गोरिथ्म।
नोम गल

2
मैं बस इस उपयोगिता को ठोकर मारता हूं जिसने मुझे इस धागे को याद किया। आश्चर्य है कि अगर यह काम करता है? proofpronto.com/porn-detection-stick-by-paraben.html
मार्टिन स्मिथ

1
@ jm666, यदि समस्या आपके लिए गंभीर है, और आपको लगता है कि इस क्षेत्र में कला की स्थिति पिछले दो वर्षों में बेहतर हुई है, तो संदर्भित डुप पर एक इनाम कैसे रखा जाए? आपको कुछ ध्यान आकर्षित करना चाहिए, और शायद कुछ जवाब, इस तरह से।
माइकल पेट्रोत्ता

जवाबों:


69

यह 2000 में लिखा गया था, यह निश्चित नहीं है कि अगर पोर्न का पता लगाने में कला की स्थिति बिल्कुल उन्नत है, लेकिन मुझे संदेह है।

http://www.dansdata.com/pornsweeper.htm

PORNsweeper को लगता है कि जब तक लोग रंग में नहीं होते, तब तक लोगों की तस्वीरों को अलग करने की कुछ क्षमता होती है। यह स्वच्छ लोगों से गंदी तस्वीरों को अलग करने में कम सफल है।

डिफ़ॉल्ट, मध्यम संवेदनशीलता के साथ, यदि मानव संसाधन खातों में नए अध्याय की एक तस्वीर भेजता है, तो आपको इसे प्राप्त करने का लगभग 50% मौका मिलता है। यदि आपकी बहन आपको उसकी छह महीने पुरानी तस्वीर भेजती है, तो उसे हिरासत में लिए जाने की संभावना है।

यदि वे सॉफ़्टवेयर के व्यवहार के प्रतिनिधि हैं, तो मोना लिसा पोर्न को कॉल करने जैसी त्रुटियों को इंगित करना उचित है। यदि निर्माताओं ने स्वीकार किया कि उनकी एल्गोरिदमिक छवि पहचानकर्ता 15% समय के लिए गेंद को गिरा देगा, तो यह मजाक कर रहा है जब यह ठीक है कि यह मूर्खतापूर्ण है।

लेकिन PORNsweeper को केवल एक विभाग में इसके निर्दिष्ट विनिर्देशों पर खरा उतरना प्रतीत होता है - वास्तविक पोर्न का पता लगाना। पोर्न का पता लगाने में यह आधा अच्छा है, लेकिन साफ ​​तस्वीरों का पता लगाना बुरा है। और मुझे आश्चर्य नहीं होगा यदि निकट भविष्य में इस क्षेत्र में कोई बड़ी छलांग नहीं लगाई गई।


तब से पोर्न का पता चला है। ऑब्जेक्ट रिकॉग्निशन / इमेज क्लासिफिकेशन / कंप्यूटर विज़न में बहुत सारे ब्रेक-विचार हुए हैं। 2000 मुझे पत्थर की उम्र का लगता है।
मार्टन

89

यह वास्तव में काफी आसान है। आप प्रोग्राम को स्किन टोन का पता लगा सकते हैं - और पोर्न इमेज में बहुत सारी स्किन होती है। यह झूठी सकारात्मकता पैदा करेगा, लेकिन अगर यह एक समस्या है तो आप वास्तविक मॉडरेशन के माध्यम से ज्ञात छवियों को पारित कर सकते हैं। यह न केवल मध्यस्थों के लिए काम को बहुत कम करता है, बल्कि आपको बहुत सारे मुफ्त पोर्न भी देता है। यह जीत है।

#!python    
import os, glob
from PIL import Image

def get_skin_ratio(im):
    im = im.crop((int(im.size[0]*0.2), int(im.size[1]*0.2), im.size[0]-int(im.size[0]*0.2), im.size[1]-int(im.size[1]*0.2)))
    skin = sum([count for count, rgb in im.getcolors(im.size[0]*im.size[1]) if rgb[0]>60 and rgb[1]<(rgb[0]*0.85) and rgb[2]<(rgb[0]*0.7) and rgb[1]>(rgb[0]*0.4) and rgb[2]>(rgb[0]*0.2)])
    return float(skin)/float(im.size[0]*im.size[1])

for image_dir in ('porn','clean'):
    for image_file in glob.glob(os.path.join(image_dir,"*.jpg")):
        skin_percent = get_skin_ratio(Image.open(image_file)) * 100
        if skin_percent>30:
            print "PORN {0} has {1:.0f}% skin".format(image_file, skin_percent)
        else:
            print "CLEAN {0} has {1:.0f}% skin".format(image_file, skin_percent)

यह कोड छवि के केंद्र में त्वचा के टोन को मापता है। मैंने 20 अपेक्षाकृत टैम "पोर्न" छवियों और 20 पूरी तरह से निर्दोष छवियों पर परीक्षण किया है। यह "पोर्न" के 100% और स्वच्छ छवियों के 20 में से 4 को झंडे देता है। यह एक बहुत ही उच्च झूठी सकारात्मक दर है, लेकिन स्क्रिप्ट का उद्देश्य काफी सतर्क रहना है और इसे आगे बढ़ाया जा सकता है। यह हल्के, काले और एशियाई त्वचा टोन पर काम करता है।

यह झूठी सकारात्मकता के साथ मुख्य कमजोरियां हैं, रेत और लकड़ी जैसी भूरे रंग की वस्तुएं हैं और निश्चित रूप से यह "शरारती" और "अच्छा" मांस (चेहरे के शॉट्स की तरह) के बीच अंतर नहीं जानता है।

झूठी नकारात्मक के साथ कमजोरी बहुत उजागर मांस (जैसे चमड़े का बंधन) के बिना चित्र होगी, चित्रित या टैटू वाली त्वचा, B & चित्र, आदि।

स्रोत कोड और नमूना छवियों


अवधारणा के अपने 20 लाइन पायथन सबूत पोस्ट करने के लिए देखभाल? (-1)
बोबोबो

बुरा नहीं, १। नियमित रूप से सतहों (जैसे कालीन या फ्रिज की सतह) की दिलचस्प छवियां त्वचा की उच्च मात्रा के रूप में दिखाई देती हैं।
बोबोबो

6
Spoiler: छवि के नमूनों में कोई वास्तविक नग्नता नहीं।
ल्यूक

यह भी लकड़ी को त्वचा के रूप में माना जाएगा। क्योंकि इसमें बिल्कुल एक जैसा रंग है, लेकिन अलग बनावट है। पोर्टेट का उल्लेख नहीं है।
मार्टन

45

मैं बल्कि उपयोगकर्ताओं को खराब छवियों पर रिपोर्ट करने की अनुमति दूंगा। छवि पहचान विकास में बहुत अधिक प्रयास और समय लग सकता है और यह मानव आंखों के समान सटीक नहीं होगा। उस मॉडरेशन जॉब को आउटसोर्स करना बहुत सस्ता है।

ज़रा गौर कीजिए : अमेज़न मैकेनिकल तुर्क

" अमेज़ॅन मैकेनिकल तुर्क (एमटूरक) अमेज़ॅन वेब सर्विसेज के सूट में से एक है, एक क्राउडसोर्सिंग मार्केटप्लेस जो कंप्यूटर प्रोग्राम को उन कार्यों को करने के लिए मानव बुद्धि के उपयोग को समन्वयित करने में सक्षम बनाता है जो कंप्यूटर करने में असमर्थ हैं।"


4
अमेज़ॅन मैकेनिकल तुर्क-शैली की वेबसाइट के लिए शायद एक बाजार है, लेकिन एक है जो इस तरह के विषय में माहिर है .... :)
रिच

6
अमेज़ॅन मैकेनिकल तुर्क को शायद पैसा खर्च करना पड़ता है। विषय वस्तु को देखते हुए आपको लगता है कि एक चतुर व्यवसाय मॉडल है जहां आप इसे मुफ्त में प्राप्त कर सकते हैं।
अंकुर

1
मुझे लगता है कि यह एक बहुत ही अनैतिक दृष्टिकोण है।
दोपहर रेशम

2
@ ठाकुर! महान विचार। यह देखने के लिए कि क्या अभी भी PornOrNot.com उपलब्ध है, nic.com पर जा रहा है।
पेका

9
@ नून सिल्क आपको ऐसा क्यों लगता है कि यह एक अनैतिक दृष्टिकोण है?
मजेटेक

22

15

बूम! यहाँ एल्गोरिदम युक्त व्हाइटपेपर है।

क्या किसी को पता है कि एक जावा (या किसी भी भाषा) कार्यान्वयन के लिए स्रोत कोड कहां से मिलेगा?

वह रॉक होगा।

WISE नामक एक एल्गोरिथ्म में 98% सटीकता दर है लेकिन एक 14% झूठी सकारात्मक दर है। तो आप क्या करते हैं आप उपयोगकर्ताओं को 2% झूठी नकारात्मक ध्वज लगाने देते हैं, आदर्श रूप से स्वचालित हटाने के साथ यदि उपयोगकर्ता की एक निश्चित संख्या इसे ध्वजांकित करती है, और मध्यस्थों को 14% झूठी सकारात्मकता दिखाई देती है।


आपको अल्गोरिद्म मिला। यह बहुत अच्छा झकना है। स्रोत कोड को अक्सर अभ्यास के रूप में छोड़ दिया जाता है। आखिरकार, हम किसी विशेष प्रोग्रामिंग भाषा को निर्दिष्ट नहीं कर रहे हैं, क्या हम हैं?
इयान


8

सॉफ्टवेयर है जो पोर्न के लिए संभावना का पता लगाता है, लेकिन यह एक सटीक विज्ञान नहीं है, क्योंकि कंप्यूटर यह नहीं पहचान सकते कि वास्तव में चित्रों पर क्या है (चित्र केवल ग्रिड पर मानों का एक बड़ा सेट है जिसका कोई अर्थ नहीं है)। आप कंप्यूटर को बस सिखा सकते हैं कि पोर्न क्या है और उदाहरण देकर नहीं। इसका नुकसान यह है कि यह केवल इन या समान छवियों को पहचानेगा।

यदि आप कुछ झूठे सकारात्मक के साथ प्रणाली को प्रशिक्षित करते हैं, तो पोर्न की पुनरावृत्ति प्रकृति को देखते हुए आपके पास एक अच्छा मौका है। उदाहरण के लिए यदि आप सिस्टम को नग्न लोगों के साथ प्रशिक्षित करते हैं तो यह एक समुद्र तट की तस्वीरों को "लगभग" नग्न लोगों को भी पोर्न के रूप में चिह्नित कर सकता है।

इसी तरह का एक सॉफ्टवेयर facebook सॉफ्टवेयर है जो हाल ही में सामने आया है। यह सिर्फ चेहरों पर विशेष है। मुख्य सिद्धांत समान है।

तकनीकी रूप से आप किसी प्रकार के फ़ीचर डिटेक्टर को लागू करेंगे जो कि बैज़ फ़िल्टरिंग का उपयोग करता है। फ़ीचर डिटेक्टर फीमेल कलर्ड पिक्सल्स के प्रतिशत जैसे फीचर्स की तलाश कर सकता है यदि यह एक साधारण डिटेक्टर है या केवल सहेजे गए पोर्न चित्रों के सेट के साथ वर्तमान छवि की समानता की गणना करता है।

यह बेशक पोर्न तक सीमित नहीं है, यह वास्तव में एक कोने का मामला है। मुझे लगता है कि अधिक सामान्य सिस्टम हैं जो छवियों में अन्य चीजों को खोजने की कोशिश करते हैं ;-)


1
लोग इस जवाब को क्यों नहीं मानते हैं?
पैट्रिक कॉर्नेलिसन

क्योंकि इसमें एल्गोरिथ्म, रेसिपी, या संदर्भ जैसी कोई चीज़ नहीं है।
इयान

7
तो यह सवाल पूछने वाले उपयोगकर्ता को समझाने के लिए एक वैध जवाब नहीं है कि यह वास्तव में संभव नहीं है कि वह क्या हासिल करने की कोशिश करता है? यार, तुम थोड़े ज्यादा रिलेक्स हो सकते हो ...
पैट्रिक कॉर्नेलिसन

यह एक गलत बयान भी दे रहा है "क्योंकि कंप्यूटर पहचान नहीं सकता कि वास्तव में तस्वीरों पर क्या है"
डेवथ 3

क्योंकि वे नहीं कर सकते। आप केवल कुछ छवियों का पता लगाना सीख सकते हैं और सकारात्मक और नकारात्मक मामलों की आपकी डीबी जितनी बड़ी होगी, बेहतर है, लेकिन सामान्य तौर पर आपको कभी भी ऐसा समाधान नहीं मिलेगा जो मानव के रूप में सटीक हो, इसलिए आप बड़ी संख्या में आगे बढ़ेंगे झूठी सकारात्मक और नकारात्मक।
पैट्रिक कॉर्नेलिसन

5

उत्तर वास्तव में आसान है: यह कहना बहुत सुरक्षित है कि यह अगले दो दशकों में संभव नहीं होगा। इससे पहले हम शायद अच्छे अनुवाद उपकरण प्राप्त करेंगे। पिछली बार जब मैंने जाँच की थी, एआई लोग थोड़ी बदली हुई कोण से शूट की गई दो तस्वीरों पर एक ही कार को पहचानने में संघर्ष कर रहे थे। इस पर एक नज़र डालें कि OCR या भाषण पहचान को एक साथ अच्छी तरह से प्राप्त करने में उन्हें कितना समय लगा। वे मान्यता समस्याएं हैं जो शब्दकोशों से बहुत लाभ उठा सकती हैं और अभी भी उन पर फेंके गए बहु मिलियन मैन महीनों के बावजूद पूरी तरह से विश्वसनीय समाधान होने से दूर हैं।

कहा जा रहा है कि आप बस एक "आक्रामक" जोड़ सकते हैं? उपयोगकर्ता द्वारा बनाई गई प्रतियोगिता के बगल में लिंक और एक मॉड क्रॉस है जो आने वाली शिकायतों की जांच करता है।

संपादित करें:

मैं कुछ भूल गया: यदि आप किसी प्रकार के फ़िल्टर को लागू करने जा रहे हैं, तो आपको एक विश्वसनीय की आवश्यकता होगी। यदि आपका समाधान 50% सही होगा, तो सभ्य चित्रों वाले 4000 उपयोगकर्ताओं में से 2000 अवरुद्ध हो जाएंगे। नाराजगी की अपेक्षा करें।


5

ताइवान में राष्ट्रीय चेंग कुंग विश्वविद्यालय के एक स्नातक छात्र ने 2004 में इस विषय पर एक शोध किया था। वह इंटरनेट से डाउनलोड की गई नग्न तस्वीरों का पता लगाने में 89.79% की सफलता दर हासिल करने में सक्षम था। यहाँ उनकी थीसिस का लिंक दिया गया है: त्वचा पर रंग के आधार पर नग्न लोगों की छवि का पता लगाने पर अध्ययन
यह चीनी में है, इसलिए यदि आप इसे नहीं पढ़ सकते हैं तो आपको एक अनुवादक की आवश्यकता हो सकती है।


4

संक्षिप्त उत्तर: एक मॉडरेटर का उपयोग करें;)

लंबे उत्तर: मुझे नहीं लगता कि इस कारण के लिए एक परियोजना है क्या अश्लील है? केवल पैर, पूर्ण नग्नता, बौने आदि इसके व्यक्तिपरक।


3
सवाल यह है कि "अश्लील चित्रों का पता लगाने का सबसे अच्छा तरीका क्या है?", प्रोग्रामिक रूप से ...
अगस्ता-एन

5
मुझे सवाल पता है, लेकिन जैसा कि मैंने कहा कि कोई 100% सटीक पोर्न ब्लॉकर नहीं है क्योंकि पोर्न व्यक्तिपरक है। विषय कोड से संबंधित नहीं हो सकता। 1 सोचता है कि सिर्फ नग्नता है, अन्य सोचता है कि इसका पोर्न। बेहतर समाधान के लिए एक 'रिपोर्ट छवि' बटन है। Koistya Navin .NET के रूप में एक ही विचार
RvdK

1
"बजट आदि"? पवित्र गैर-सीक्वेटुर, बैटमैन।
डग मैकक्लीन

मिडगेट पोर्न जैसी कोई चीज होती है।
क्रिस शर्लक

4

एक आक्रामक लिंक जोड़ें और आपत्तिजनक छवि के md5 (या अन्य हैश) को स्टोर करें ताकि भविष्य में यह स्वचालित रूप से टैग किया जा सके।

यह कितना अच्छा होगा यदि किसी के पास छवि md5 का एक बड़ा सार्वजनिक डेटाबेस था जिसमें वर्णनात्मक टैग एक webservice के रूप में चल रहे थे? पोर्न का एक बहुत मूल काम नहीं है (इसमें वह व्यक्ति जिसके पास अभी है, वह शायद नहीं बना है) और लोकप्रिय चित्र अलग-अलग स्थानों पर घूमते हैं, इसलिए यह वास्तव में एक अंतर बना सकता है।


8
मुझे शक है। वहाँ बहुत अश्लील बाहर है (और दिन से अधिक टन) कि एक ही तस्वीर को दो बार देखने की संभावनाएं (IMHO) बल्कि शून्य के करीब हैं।
विल्क- 12

इस बात पर विचार करें कि थोड़ी देर के लिए कितनी बार टब गर्ल ने सब दिखाया। इसने एक बार झंडारोहण किया होगा और फिर बाकी सभी लोग इससे बच सकते थे।
rfusca

3
जब तक इसे क्रॉप नहीं किया गया, आकार दिया गया, या बस खोला गया और अपलोड होने से पहले फिर से सहेज लिया गया ..
Blorgbeard

हां, मैंने इसके बारे में सोचा :( एह, यह एक विचार था।
rfusca

1
Md5 से बेहतर है, लाइसेंस आईडी का टिनई।
तोबू

2

यदि आपके पास वास्तव में समय और पैसा है:

यह करने का एक तरीका 1 है) एक छवि का पता लगाने एल्गोरिथ्म लिखना यह पता लगाना है कि कोई वस्तु मानव है या नहीं। यह एक छवि को बिटमास्किंग करके किया जा सकता है ताकि यह "आकृति" को पुनः प्राप्त कर सके और देखें कि क्या आकृति एक मानव समोच्च फिट बैठता है।

2) डेटा मेरा बहुत सारी पोर्न इमेजेज है और पोर्न इमेजेस से मेल खाने वाले पैटर्न का पता लगाने के लिए C4 एल्गोरिदम या पार्टिकल स्वॉर्म ऑप्टिमाइजेशन जैसी डेटा माइनिंग तकनीक का इस्तेमाल करते हैं।

इसके लिए आवश्यक होगा कि आप यह पहचानें कि मानव शरीर के नग्न पुरुष / महिला आकृति को डिजीटल रूप में कैसे दिखना चाहिए (यह उसी तरह से प्राप्त किया जा सकता है जैसे ओसीआर छवि मान्यता एल्गोरिदम काम करता है)।

आशा है कि तुमको मज़ा आया! :-)


2

मुझे लगता है कि मुख्य बाधा एक "अश्लील छवि" को परिभाषित कर रही है। यदि आप इसे आसानी से परिभाषित कर सकते हैं, तो आप शायद कुछ ऐसा लिख ​​सकते हैं जो काम करेगा। लेकिन यहां तक ​​कि मनुष्य अश्लील क्या है पर सहमत नहीं हो सकते। आवेदन कैसे पता चलेगा? उपयोगकर्ता मॉडरेशन शायद आपकी सबसे अच्छी शर्त है।


1

मैंने एक वेब फ़िल्टरिंग एप्लिकेशन देखा है जो पोर्न इमेज फ़िल्टरिंग करता है, क्षमा करें मुझे नाम याद नहीं है। हालांकि यह काम कर रहा था ज्यादातर समय झूठी सकारात्मकता से ग्रस्त था।

मुझे लगता है कि मुख्य चाल "तस्वीर पर बहुत अधिक त्वचा का पता लगा रही है :)


1
मुझे या तो अध्ययन याद नहीं है - लेकिन इसने एक बढ़त का पता लगाया और मिलान किया जो वल्वा घुमाया या अस्पष्ट के पैटर्न के रूप में दिखाई दिया। एक छवि प्रसंस्करण पहलू से काफी दिलचस्प है।
jim

-1, यह कमेंट्री प्रदान करता है लेकिन पर्याप्त समाधान नहीं देता है।
ब्रैड कोच

1

अश्लील चित्रों का पता लगाना अभी भी एक निश्चित AI कार्य है जो अभी तक बहुत अधिक सैद्धांतिक है।

एक बटन / लिंक "स्पैम / दुरुपयोग की रिपोर्ट करें" जोड़कर सामूहिक शक्ति और मानव बुद्धि का विकास करें। या इस काम को करने के लिए कई मॉडरेटर्स को नियुक्त करें।

PS वास्तव में आश्चर्यचकित है कि कितने लोग सॉफ्टवेयर और एल्गोरिदम को मानने वाले प्रश्न पूछते हैं, वे भी बिना सोचे-समझे कि क्या किया जा सकता है। क्या वे प्रोग्रामर की उस नई नस्ल के प्रतिनिधि हैं जिन्हें हार्डवेयर, निम्न-स्तरीय प्रोग्रामिंग और "जादू के पीछे" की कोई समझ नहीं है?

पीएस # 2। मुझे यह भी याद है कि समय-समय पर ऐसा होता है कि कुछ स्थिति जब लोग खुद तय नहीं कर पाते कि कोई तस्वीर अश्लील है या कला को अदालत में ले जाया जाता है। अदालत के नियमों के बाद भी, संभावनाएं आधी हैं लोग निर्णय को गलत मानेंगे। इस तरह की अंतिम बेवकूफ स्थिति काफी हाल ही में थी जब एक सीडी कवर छवि के कारण यूके में एक विकिपीडिया पृष्ठ पर प्रतिबंध लगा दिया गया था जिसमें कुछ नग्नता थी।


1

दो विकल्प जिनके बारे में मैं सोच सकता हूँ (हालाँकि उनमें से कोई भी प्रोग्राम को अश्लील नहीं है):

  1. सभी अपलोड की गई छवियों को तब तक ब्लॉक करें जब तक कि आपके किसी प्रशासक ने उन्हें नहीं देखा हो। ऐसा कोई कारण नहीं है कि इसमें लंबा समय लगना चाहिए: आप कुछ सॉफ्टवेयर लिख सकते हैं जो 10 छवियों को एक दूसरे, लगभग एक फिल्म के रूप में दिखाता है - यहां तक ​​कि इस गति पर भी, एक मानव के लिए एक संभावित अश्लील छवि को स्पॉट करना आसान है। फिर आप इस सॉफ्टवेयर में वापस आते हैं और एक करीब से देखते हैं।
  2. सामान्य "इस छवि को अनुपयुक्त के रूप में फ़्लैग करें" विकल्प जोड़ें।

1

BrightCloud वेब सेवा एपीआई इस के लिए एकदम सही है। यह इस तरह से वेबसाइट लुक्स करने के लिए एक REST API है। इसमें एक बहुत बड़ा और बहुत सटीक वेब फ़िल्टरिंग DB है और श्रेणियों में से एक, वयस्क, की पहचान 10M से अधिक पोर्न साइट्स है!


1

मैंने उन उपकरणों के बारे में सुना है जो बहुत ही सरल, लेकिन काफी प्रभावी एल्गोरिदम का उपयोग कर रहे थे। एल्गोरिथ्म ने कुछ पूर्वनिर्धारित "त्वचा" रंगों के पास रंग के मूल्य के साथ पिक्सेल की सापेक्ष मात्रा की गणना की। यदि वह राशि कुछ पूर्वनिर्धारित मूल्य से अधिक है तो छवि को कामुक / अश्लील सामग्री माना जाता है। बेशक, एल्गोरिथ्म क्लोज-अप फेस फोटो और कई अन्य चीजों के लिए गलत सकारात्मक परिणाम देगा।
चूंकि आप सोशल नेटवर्किंग के बारे में लिख रहे हैं, इसलिए उस पर त्वचा के रंग की उच्च मात्रा के साथ बहुत सारी "सामान्य" तस्वीरें होंगी, इसलिए आपको सकारात्मक परिणाम के साथ सभी चित्रों को अस्वीकार करने के लिए इस एल्गोरिदम का उपयोग नहीं करना चाहिए। लेकिन आप इसे मध्यस्थों के लिए कुछ मदद प्रदान कर सकते हैं, उदाहरण के लिए इन चित्रों को उच्च प्राथमिकता के साथ ध्वजांकित करें,


मैंने वास्तव में उपयोग के समान एक प्रणाली देखी है। यह विश्वसनीय नहीं है कि इसे स्वयं छोड़ा जाए, लेकिन यह उचित होने पर एक मध्यस्थ को सचेत करने का बहुत अच्छा काम करता है। इसका पूर्ण प्रमाण नहीं है, खासकर यदि व्यक्ति केवल एक छोटे से उजागर क्षेत्र से आच्छादित है। अनुपात रिवर्स में मज़बूती से काम नहीं करता है।
टिम पोस्ट

1

यह एक आशाजनक लग रहा है। मूल रूप से वे त्वचा का पता लगाते हैं (चेहरे को पहचानकर अंशांकन के साथ) और "त्वचा पथ" (यानी त्वचा के पिक्सल बनाम चेहरे की त्वचा के पिक्सल / त्वचा के पिक्सल के अनुपात को मापने) का निर्धारण करते हैं। यह सभ्य प्रदर्शन है। http://www.prip.tuwien.ac.at/people/julian/skin-detection


0

फ़ाइल नाम और किसी भी विशेषता को देखें। लगभग 20% शरारती छवियों का पता लगाने के लिए लगभग पर्याप्त जानकारी नहीं है, लेकिन एक सरल कीवर्ड ब्लैकलिस्ट कम से कम वर्णनात्मक लेबल या मेटाडेटा के साथ छवियों का पता लगाएगा। 20% सफलता दर के लिए कोडिंग के 20 मिनट एक बुरा सौदा नहीं है, विशेष रूप से एक प्रिस्क्रिप्शन के रूप में, जो कम से कम कुछ साधारण लोगों को पकड़ने से पहले आप एक जज के लिए आराम करने वाले को पास कर सकते हैं।

अन्य उपयोगी चाल पाठ्यक्रम के विपरीत है, बिना मॉडरेशन या जाँच के अनुमति देने के लिए छवि स्रोतों का एक श्वेतसूची बनाए रखें। यदि आपकी अधिकांश छवियां ज्ञात सुरक्षित अपलोडर या स्रोतों से आती हैं, तो आप उन्हें केवल बाइंडली स्वीकार कर सकते हैं।


0

मैं आज उस शॉर्टहैंड विवरण [[हार्ड-कोर पोर्नोग्राफ़ी]] के भीतर जिस तरह की सामग्री को समझता हूं, उसे परिभाषित करने के लिए आगे प्रयास नहीं करूंगा; और शायद मैं बुद्धिमानी से ऐसा करने में कभी सफल नहीं हो सका। लेकिन मुझे पता है कि जब मैं इसे देखता हूं, और इस मामले में शामिल गति चित्र वह नहीं है।

- यूनाइटेड स्टेट्स सुप्रीम कोर्ट के जस्टिस पॉटर स्टीवर्ट, 1964



0

यह रॉकेट विज्ञान नहीं है। अब और नहीं। यह पहचान का सामना करने के समान है। मुझे लगता है कि इससे निपटने का सबसे आसान तरीका मशीन लर्निंग का उपयोग करना है। और जब से हम छवियों के साथ काम कर रहे हैं, मैं न्यूरोनल नेटवर्क की ओर इशारा कर सकता हूं, क्योंकि ये छवियों के लिए पसंद किए जाते हैं। आपको प्रशिक्षण डेटा की आवश्यकता होगी। और आप इंटरनेट पर कई टन प्रशिक्षण डेटा पा सकते हैं लेकिन आपको छवियों को उस विशिष्ट भाग में क्रॉप करना होगा जिसे आप एल्गोरिदम का पता लगाना चाहते हैं। निश्चित रूप से आपको समस्या को अलग-अलग शारीरिक भागों में तोड़ना होगा जिन्हें आप प्रत्येक के लिए प्रशिक्षण डेटा का पता लगाना और बनाना चाहते हैं, और यह वह जगह है जहां चीजें मनोरंजक बनती हैं।

जैसा कि ऊपर किसी ने कहा, यह 100% प्रतिशत नहीं किया जा सकता है। ऐसे मामले होंगे जहां ऐसे एल्गोरिदम विफल होते हैं। वास्तविक सटीकता आपके प्रशिक्षण डेटा, आपके न्यूरोनल नेटवर्क की संरचना और आप प्रशिक्षण डेटा (लिंग, योनि, स्तन, आदि) और इस तरह के संयोजन के क्लस्टर का चयन कैसे करेंगे, द्वारा निर्धारित किया जाएगा। किसी भी मामले में मुझे पूरा विश्वास है कि यह स्पष्ट पोर्न इमेजरी के लिए उच्च सटीकता के साथ प्राप्त किया जा सकता है।


0

यह एक न्यूडिटी डिटेक्टर है। मैंने कोशिश नहीं की है। यह एकमात्र ओएसएस है जिसे मैं पा सकता हूं।

https://code.google.com/p/nudetech


-1

ऐसा कोई तरीका नहीं है जिससे आप 100% कर सकते हैं (मैं कहूंगा कि शायद 1-5% प्रशंसनीय होगा) आजकल के ज्ञान के साथ। आपको बहुत अच्छा परिणाम मिलेगा (1-5% की तुलना में) बस लिंग-संबंधी-शब्दों के लिए छवि-नामों की जाँच करें :)।

@SO ट्रोल: तो सच है।


-1, यह कमेंट्री प्रदान करता है लेकिन पर्याप्त समाधान नहीं देता है।
ब्रैड कोच
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.