क्या किसी को किसी व्यक्ति के नाम को उसके लिंग के लिए मैप करने के लिए एक अच्छी लाइब्रेरी के बारे में पता है? [बन्द है]


90

मैं एक पुस्तकालय या डेटाबेस की तलाश कर रहा हूं जो इस बारे में अनुमान लगा सके कि कोई व्यक्ति अपने नाम या उपनाम के आधार पर पुरुष है या महिला। कुछ इस तरह

john => "M",
mary => "F",
alex => "A", #ambiguous

मैं कुछ ऐसी चीज़ों की तलाश में हूं जो अंग्रेजी नामों (जैसे जापानी, भारतीय, आदि) के अलावा अन्य नामों का समर्थन करती हैं।

इससे पहले कि मैं "आप अपने लिंग / लिंग को मानकर लोगों को नाराज करने जा रहे हैं" की तर्ज पर एक और जवाब पाने से पहले मुझे स्पष्ट कर दूं, मेरा आवेदन किसी के साथ बातचीत नहीं करता है। यह वैसे भी ईमेल नहीं भेजता है और न ही किसी से संपर्क करता है। पूछने के लिए कोई उपयोगकर्ता नहीं हैं। कई मामलों में, विचाराधीन व्यक्ति मर चुका है, और मेरे पास एकमात्र जानकारी नाम, जन्म तिथि और मृत्यु की तारीख है। जिस कारण से मैं व्यक्ति के लिंग को जानना चाहता हूं, वह है आउटपुट निकर का व्याकरण बनाना और बाद में आने वाली संभावित खोजों में सहायता करना।


33
वाह ... हर कोई इस सवाल का जवाब देने लगता है "क्या मुझे यह करना चाहिए," पूछे गए सवाल के बजाय "मैं यह कैसे करूँ?" आश्चर्य नहीं, सिर्फ दिलचस्प।
bsneeze

9
मुझे वास्तव में लगता है कि यह एक महान प्रश्न है। यदि आप किसी वेबसाइट पर जाते हैं और 90% समय यह आपके लिंग को आंकता है, तो मैं इसका लाभ देख सकता हूं। काश मेरा टीवी भी ऐसा कर पाता। मैं हाल ही में एक फ्लाइट में किंग ऑफ द हिल का पुनर्मिलन देख रहा था और हर 3 मिनट में "व्यक्तिगत मालिश करने वालों" के लिए एक विज्ञापन आता था।
उड़ी

6
@ एमओपी वाह, व्याकरण के अच्छे विचार को नस्लीय प्रोफाइलिंग बनाने के लिए सेक्स का अनुमान लगाने से जाने का रास्ता।
चास। 4:52

2
चास, यह बात नहीं है कि लोग आपको एक नैतिक चीज़ के कारण यह नहीं देना चाहते हैं, यह ऐसा है जैसे शुरुआत में इसका कोई अर्थ नहीं है, इसलिए आप एक असफल समाधान के लिए पूछ रहे हैं। इसके अलावा, आप अंग्रेजी नामों के अलावा अन्य का उल्लेख करते हैं, और क्रॉस-सांस्कृतिक संदर्भ में, यह और भी जटिल हो जाता है। मेरे लिए, यह एक नहीं है।
शाम

2
अगर कोई नाम पुरुष या महिला है तो आप कैसे बता सकते हैं? अलेक्जेंडर (एक पुरुष) या एलेक्जेंड्रा (एक महिला) के लिए एलेक्स छोटा हो सकता है। मैं एक मीका को जानता हूं जो नर है और जो मादा है। और विदेशी नामों के बारे में क्या?
गाबे

जवाबों:


66

एक नाम का लिंग कुछ ऐसा है जिसे सामान्य मामले में प्रोग्रामेटिक रूप से अनुमान नहीं लगाया जा सकता है। आपको एक नाम डेटाबेस की आवश्यकता है। यहाँ अमेरिकी जनगणना ब्यूरो का एक मुफ्त नाम डेटाबेस है

EDIT : 2010 नाम के लिए लिंक मृत है, लेकिन टिप्पणियों में काम करने वाले लिंक और एक पुस्तकालय हैं।


2
यह भी खूब रही। लगता है बस पूछने वाले को क्या चाहिए। अस्पष्ट नामों में पुरुष की आवृत्ति बनाम महिला की आवृत्ति के आधार पर लिंग का अनुमान लगाया जा सकता है।
स्टेपलप्रेटेज़ेल

1
मैंने जनगणना के आंकड़ों का उपयोग करते हुए इसके लिए एक पुस्तकालय बनाया और यह बहुत अच्छा काम करता है! संभावित अनुप्रयोग: विश्लेषिकी, आईवीआर आवाज लिंग चयन।
क्रिस मैक्कल

9
यहाँ नाम है -> जनगणना के आंकड़ों से अजगर के रूप में तानाशाही
Bemmu

3
मूल लिंक मृत है, लेकिन जनगणना अभी भी सूची को बनाए रखती है। 1990 के दशक के लिए विशिष्ट संस्करण (मुझे पता नहीं क्यों) यहाँ है: census.gov/genealogy/www/data/1990surnames/names_files.html
Chipmonkey

2
जन्म के वर्ष तक लिंग के साथ 22 एमबी अमेरिकी बच्चे के नाम: ssa.gov/oact/babynames/limits.html (जुलाई 2015 में मान्य लिंक)
डायलन होग

70

लिंग। सी एक ओपन सोर्स सी प्रोग्राम है जो एक अच्छा काम करता है। यह दुनिया भर के 44568 पहले नामों के डेटा के साथ आता है। अच्छा प्रलेखन और फ़ाइल प्रारूप (मूल रूप से सादे पाठ) का वर्णन है, इसलिए इसे अपने स्वयं के आवेदन से पढ़ना मुश्किल नहीं होना चाहिए।

यहाँ लेखक क्या कहता है:

डेटा की गुणवत्ता पर कुछ शब्द

पहले नामों का शब्दकोश अत्यंत सावधानी से तैयार किया गया है। उदाहरण के लिए, इस शब्दकोश में तुर्की, भारतीय और कोरियाई नाम सभी स्वतंत्र रूप से कई देशी वक्ताओं द्वारा वर्गीकृत किए गए हैं। मैंने केवल उन नामों को सूचीबद्ध करने के लिए विशेष ध्यान रखा जो वर्तमान में पाए जा सकते हैं।

इससे सबक?

किसी भी संशोधन को बहुत सावधानी से किया जाना चाहिए (और उन्हें खोज एल्गोरिथ्म द्वारा आवश्यक छंटाई का भी पालन करना होगा)। उदाहरण के लिए, यह जानते हुए कि "साशा" जर्मनी में एक लड़के का नाम है, लेखक ने कभी भी अंग्रेजी "साशा" को एक लड़की का नाम नहीं माना। यह जानते हुए कि "जन" जर्मनी में एक लड़के का नाम है, मैंने कभी भी इसे "जेनेट" का अंग्रेजी लघु रूप नहीं माना। बिंदु में एक और मामला "एसेरा" नाम है। यह जर्मनी में एक लड़के का नाम है, लेकिन तुर्की में एक लड़की का नाम है।

कार्यक्रम महिला के पुरुष होने के नाम के लिए एक संभावना की गणना करता है। यह केवल इनपुट के रूप में नाम के साथ या मूल नाम और देश के साथ कर सकता है, जो काफी बेहतर परिणाम देता है।

आप इसे जर्मन कंप्यूटर पत्रिका की वेबसाइट से नहीं डाउनलोड कर सकते हैं 40 000 नामेन । लेख जर्मन में है, लेकिन चिंता मत करो, सभी प्रलेखन अंग्रेजी है। यदि आप लेख में रुचि नहीं रखते हैं, तो यहां प्रत्यक्ष ftp लिंक 0717-182.zip है । ज़िप-फाइल में स्रोत कोड, एक विंडोज़ निष्पादन योग्य, डेटाबेस और प्रलेखन शामिल हैं।


यह अद्भुत है, धन्यवाद।
डेल अथानासीस

अजगर पोर्ट के लिए यहाँ देखें - pypi.python.org/pypi/SexMachine
philshem

33

"मैं बताता हूं, 'सू' नाम के एक लड़के के लिए जीवन आसान नहीं है।"

... तो, यह किसी भी कठिन क्यों बनाते हैं? यदि आपको सेक्स करने की आवश्यकता है, तो बस पूछें ... अन्यथा, इसके बारे में चिंता न करें।


15
@ चास: भले ही आप इसे 80% सही समय पर प्राप्त करने का प्रबंधन करते हैं, लेकिन फिर भी यह आपके सॉफ़्टवेयर का उपयोग करने वाले प्रत्येक दस लोगों में से दो को परेशान करने वाला है। इतना अच्छा नहीं है ... मैं प्रेरणा को समझता हूं, लेकिन आप अपने संदेशों को फिर से बेहतर बना रहे हैं जैसे कि वे लिंग-तटस्थ हैं।
शोग

2
मुझे आश्चर्य है कि अगर किसी और को एसएनएल से "पैट" याद है।
इरिकसन

8
इसे फिर से पढ़ना, मैं भयानक उपदेश से आ रहा हूं ... अपने विचार को रखने का मतलब नहीं है, मुझे लगता है कि यह एक दिलचस्प है ... लेकिन यह भी बहुत जोखिम भरा है। मैं एक टेलीमार्केटर के रूप में काम करता था, और चाहे आप कितने भी नाम जानते हों, चाहे आपको आवाजें पहचानने में कितना भी अच्छा क्यों न लगे, आप अभी भी कभी-कभी गलत अनुमान लगाते हैं ... और यह कभी मजेदार नहीं है। और इसलिए, यह ऐसा कुछ है जिससे मैं बचूंगा, जब तक कि यह सही अनुमान लगाने के लिए एक बड़ा, बड़ा भुगतान न हो
शोग

3
मैं शोग 9 की सलाह लूंगा। जब तक आपका आवेदन अंग्रेजी के अलावा अन्य भाषाओं में नहीं होगा, तब तक लिंग-तटस्थ सर्वनामों का उपयोग करना आसान हो सकता है - जैसे वे, एक, s / he, आदि
केल्विन

11
मेरी प्रेमिका का नाम केवन है। वह पर्याप्त लोगों को गलत तरीके से उसके नाम से उसके लिंग का अनुमान लगाती है, उसे कंप्यूटर की भी ज़रूरत नहीं है। से सावधान रहने वाली बात एक डेटाबेस प्रविष्टि बना रही है जो कंप्यूटर के अनुमान के आधार पर किसी के लिंग को बताती है; जो लोग इसे देखते हैं वे मान सकते हैं कि यह स्वयं उस व्यक्ति द्वारा प्रदान किया गया है, और वास्तव में भ्रमित हो जाते हैं जब उनकी धारणाएं गलत हो जाती हैं (जैसा कि केवल नाम के आधार पर कुछ हद तक भ्रमित है)।
ब्रायन कैंपबेल

29

मैंने एक मुफ्त एपीआई का निर्माण किया है जो पहले नाम के आधार पर लिंग पर एक संभाव्य अनुमान लगाता है। उपर्युक्त किसी भी दृष्टिकोण का उपयोग करने के बजाय, मैं एक निश्चित कारक के साथ एक संभाव्य अनुमान प्रदान करने के लिए सामाजिक नेटवर्क से प्रोफाइल के एक विशाल डेटासेट का उपयोग करता हूं। यह देश या भाषा आईडी के माध्यम से वैकल्पिक फ़िल्टरिंग का भी समर्थन करता है। यह दिन के हिसाब से बेहतर हो रहा है क्योंकि डेटासेट में अधिक प्रोफ़ाइल जोड़े गए हैं।

यह http://genderize.io पर उपयोग करने के लिए स्वतंत्र है

एक बात जिस पर आपको विचार करना चाहिए वह एक टूल का उपयोग कर रही है जो जनसांख्यिकी को ध्यान में रखता है, क्योंकि नामकरण परंपराएं इस पर बहुत अधिक भरोसा करेंगी।

उदाहरण

http://api.genderize.io?name=kim
{"name":"kim","gender":"female","probability":"0.89","count":1440}

http://api.genderize.io?name=kim&country_id=dk
{"name":"kim","gender":"male","probability":"0.95","count":44,"country_id":"dk"}

2
कोड एक्सटेंशन - लिंगाइज़.इओ
philshem

22

यहां दो ऑडबॉल दृष्टिकोण हैं जो काम भी नहीं कर सकते हैं, और संभवतः लाइसेंस की शर्तों का उल्लंघन किए बिना काम नहीं करेंगे:

  1. फेसबुक एपीआई का उपयोग करें (जो मुझे लगभग कुछ भी नहीं पता है, यह संभव भी नहीं है) दो खोजों को करने के लिए: एक एफबी पुरुष उपयोगकर्ताओं के लिए पहला नाम और एक महिला के लिए। लिंग की संभावना तय करने के लिए दो नंबरों का उपयोग करें।

  2. बहुत कम लेकिन अधिक स्केलेबल, Google API का उपयोग करें और नाम के साथ-साथ लिंग-विशिष्ट सर्वनामों की खोज करें और संख्याओं की तुलना करें। उदाहरण के लिए, "रिचर्ड द" "(वाक्यांश के रूप में नहीं) के लिए खोज करने के लिए 592,000,000 परिणाम हैं, लेकिन" रिचर्ड उसे "के लिए केवल 179,000,000 हैं।


पहले नाम से सेक्स जैसी चीजों का अनुमान लगाने की कोशिश करने वाले सॉफ्टवेयर पर आम सहमति के अलावा, यह वास्तव में मूल प्रश्न का कूल एल्गोरिथम उत्तर है। बहुत बढ़िया।
peSHIr

महान विचार। आप शायद किसी दिए गए देश की भाषा में कुछ शब्दों को फेंक सकते हैं और साथ ही उसे स्थानीय कर सकते हैं।
नोसरेडना

अच्छी बात है, Nosrenda ... बेशक, Google आपको पहले से ही भाषा कोड द्वारा खोज परिणामों को फ़िल्टर करने की अनुमति देता है। आप HTTP अनुरोध से उपयोगकर्ता की पसंदीदा भाषा भी चुरा सकते हैं। उनके ब्राउज़र की भाषा सेटिंग उनके नाम की जातीयता के साथ मेल नहीं खा सकती है या नहीं, लेकिन फिर भी यह एक फ़ज़ी तकनीक है।
रीचर्डलेंट

2
मैंने पाया कि Google चौकावादी है: महिलाओं की तुलना में पुरुषों के लिए अधिक परिणाम वापस आते हैं क्योंकि अधिक पुरुष Google में हैं। फेसबुक एपीआई शायद बहुत अधिक प्रतिनिधि है।
क्रिस मैकल

6

आपके द्वारा बताई गई बाधाओं को देखते हुए, आपका सबसे अच्छा विकल्प यह है कि आप जो भी लिख रहे हैं, उसे लिंग-तटस्थ होने के लिए फिर से वाक्यांश दें, जब तक कि आप नहीं जानते कि वे किस लिंग को प्रत्येक उदाहरण में बुलाया जाना चाहते हैं।

यदि अंग्रेजी में लिखते हैं , तो याद रखें कि एकवचन -तटस्थ तीसरे व्यक्ति एकवचन सर्वनाम के रूप में "वे" व्याकरणिक रूप से ठीक हैं।

एक अच्छा उदाहरण इस प्रश्न का शीर्षक है। जैसा कि वर्तमान में है:

    … किसी व्यक्ति का नाम उसके लिंग के लिए मैप करना?

अगर लिखा जाए तो यह बहुत कम अजीब होगा:

    … किसी व्यक्ति का नाम उनके सेक्स के लिए मैप करना?

यह बिल्कुल "पूरी तरह से" व्याकरणिक नहीं है। यहां तक ​​कि विकिपीडिया लेख स्वीकार करता है कि इसका उपयोग किया गया है, विशेष रूप से आधुनिक संदर्भ में, कुछ लेखकों की जेनेरिक "वह" के साथ असुविधा के परिणामस्वरूप। मुझे लेखकों के साथ एक बड़ी समस्या नहीं है जो ऐसा करते हैं (हालांकि अगर लिंग-तटस्थता वास्तव में महत्वपूर्ण है, तो मैं निर्माण को फिर से तैयार करना पसंद करता हूं इसलिए मैं "एक" जैसे सर्वनाम का उपयोग कर सकता हूं), लेकिन चलो इसे कहते हैं कि यह क्या है।
बेन कॉलिन्स

मेरा तर्क है कि हम दोनों सही हैं। सभी व्याकरण, विशेष रूप से अंग्रेजी व्याकरण, में महत्वपूर्ण समस्याएं हैं; लेकिन मैं "सही व्याकरण" की कोई भी परिभाषा कहूंगा जो वास्तव में अंग्रेजी में किसी भी चीज़ पर लागू होती है यहां भी लागू होती है। या तो एकवचन "वे" पूरी तरह से व्याकरणिक है, या अंग्रेजी में कुछ भी नहीं है :-)
bignose

ध्यान दें, व्याकरण लड़की (लेखक मिग्नन फोगार्टी) कुछ समय से एकवचन "वे" की स्वीकृति की ओर झुक रही है। grammar.quickanddirtytips.com/…
करेन लोपेज़

4

यह मानने के लिए भी खराब अभ्यास है कि उपयोगकर्ताओं को पुरुष या महिला होना चाहिए। "इंटरसेक्स" लोगों की एक छोटी लेकिन महत्वपूर्ण संख्या है, जिनमें से अधिकांश दिल से बीमार हैं टिक टिक करने के लिए एक बॉक्स नहीं होने के कारण ..
bignose: "विलक्षण वे" पर दिलचस्प। मुझे नहीं पता था कि यह इतना लंबा इतिहास था।


4

यह एक सेवा नहीं है, लेकिन एक डेटाबेस के साथ एक छोटा सा ऐप है:
http://www.codeproject.com/KB/cpp/genderizer.aspx

और यह उपकरण जर्मन में है:
http://www.faq-o-matic.net/2011/06/01/zu-einem-vornamen-das-geschlecht-finden/

और VB में एक और:
http://www.vbarchiv.net/tipps/tipp_1925-geschlecht-anhand-des-vornamens-ermitteln.html

मुझे लगता है कि कुछ "2011 में सबसे ज्यादा इस्तेमाल किया जाने वाला फर्स्टनाम" के साथ संयोजन में आप कुछ सभ्य बनाने में सक्षम होना चाहिए।


4

अजगर पैकेज SexMachine तुम्हारे लिए है कि कर देगा। किसी भी पहले नाम को देखते हुए अगर यह पुरुष, महिला या यूनिसेक्स है तो वापस आ जाता है। यह Jorg Michael के जेंडर.क्रिकेट प्रोग्राम के डेटा पर निर्भर करता है ।


3

केवल एक चीज जिसे आप स्वचालित करने की कोशिश कर रहे हैं, वह दुखी उपयोगकर्ताओं का एक समूह है। उस जनगणना के आंकड़ों से:

जेम्स, जॉन, रॉबर्ट, माइकल, डेविड, डेविड, रिचर्ड, चार्ल्स, जोसेफ, थॉमस, क्रिसलर, डेनियल, पॉल, मार्क, डोनाल्ड, जॉर्ज, केन्टीन, स्टीवन, एडवर्ड, ब्रायन, रॉलियन, रॉलिंस, रियान। गैरी, टिमोथी, जोस, लॉरी, जेफ्री, फ्रेंक, स्कॉट, एरा, स्टेफेन, एंड्रयू, रेमंड, ग्रेगरी, जोशुआ, जोरी, डेनिस, वाल्टर, पैट्रिक, पीटर, पीटर, हैरेन्डो, कार्नर, कार, कार, जैक, ALBERT, जस्टिन, टेरी, गेराल्ड, कीथ, समेल, विली, लॉरेन, रॉय, ब्रैंडन, एडम, फ्रेड, बिली, लूसी, जेरमी, आरोन, रेन, EUGENE, CARLOS, रसेल, बोसबेल, बोबेल शॉन, क्लैरेंस, सैनन, क्रिस, जॉनी, एनीमेयो, टोनी, लुइस, माइक, डेल, कर्टिस, नॉरमन, एलन, ग्लेन, ट्रेविस, ली, मेल्विन, केएलई, फ्राँसिस, जीसस, रेयस, जोय, जॉय अलेक्जेंडर, मारियो, फ्रांस्सिको, मिशैल, ओएसएआरए, जेईएल, एलेक्स, रॉननी, टॉमी, लियोन, लियो, वेस्ले, देव, दान, लेविस,कॉरी, मौरिस, वेरनॉन, रॉबर्टो, क्लीवे, शान, सैम, लेस्टर, चार्ली, टिलेर, जीन, ब्रेट, एंगेल, लेस्ली, सीईसीएल, एंड्रे, एल्मेर, गैब्रियल, मिचेल, एड्रियन, कार्ली, कॉरी, कॉली, कॉरी ईसाई, लोनी, कौडी, जूलियो, केली, जिमी, जोर्डन, जोई, केसी, जॉनी, सिदनी, जूलियन, डेरिल, विर्गिल, मार्शल, पेरी, मैरी, मेरी, ट्रेंकी, रेन्डी, फ्रेन्डे, फ्रैडसैडी, फ्रैडसैड। DONNIE, SHANNON, ANGELO, SHAUN, LYNN, CAMERON, BLAKE, KERRY, JEAN, IRA, RUDY, BENNIE, ROBIN, LOREN, NOEL, DEVIN, KIM, GUADALUPE, CARROLL, SAMMY, मार्टी, टाय, मार्टीनि DREW, JODY, FRANKIE, PAT, MERLE, TERRELL, DARNELL, TOMMIE, TOBY, VAN, COURTNEY, JAN, CARY, SANTOS, AUBREY, MORGAN, LOUIE, STACY, MICAH, BILLIE, LOGETAN, DEMAN, DEMW मिक्की, देवॉन, एशले, केरी, बेटा, मार्लिन, एएलआई, सामी, मिशैल, रोरी, KRIS, AVERY, ALEXIS, GERRY, STACEY,कारमेन, शेल्बी, रिक्की, बॉबी, ओलेनी, डेनियन, डायन, ओडेल, मैरी, कोलबी, हॉलीस, किर्बी, क्रुज, मर्ली, लेन, क्लियो, ब्लेयर, नेलर्स, क्लैयर, बर्न, जोहान, जोहान, डोमिनिकन, ट्रिनिटी। LAVERNE, ALVA, STEVIE, ERIN, AUGUSTINE, YOUNG, JOHNIE, ARIEL, DUSTY, LINDSEY, TRACEY, SCOTTIE, SANDY, SYDNEY, GAIL, DORIAN, LAVERN, REFUGIO, IVORY, ANDREA, SANG, DEANG, CARV, कार, TRINIDAD, SHIRLEY, MARIA, CHANG, ROSARIO, DANNIE, फ्रांसिस, THANH, CONNIE, TORY, LUPE, DEE, SUNG, CHI, QUINN, MINH, THEO, LOU, CHUNG, VALENTINE, JAMEY, WHITNEY, SOLIT, SOL, CHONG OTHA, LACY, DONG, ANTONIA, KELLEY, CARROL, SHAYNE, VAL, JUDE, BRITT, होंग, लेइट्स, GAYLE, JAE, NICKY, LESY, MAN, KASEY, JEWELL, PATRICIA, LAUREN, ELISHAHA, MALHAALक्लैर, बरनी, जोआन, डोमिनीक्वे, ट्रिस्टन, जेम्स, गेल, लावर्ने, एलावा, स्टेविई, एरिन, ऑगस्टाइन, योहंग, जॉनी, एरियल, डस्टी, लिंडसे, ट्राकी, स्कोट्टी, सिडेन, सिलेन्नी, गेलिन, गेल IVORY, SREA, SANG, DEON, CAROL, YONG, BERRY, TRINIDAD, SHIRLEY, MARIA, CHANG, ROSARIO, DANNIE, FRANCES, THANH, CONHIE, TORY, LUPE, DEE, SUNG, CHI, QUINN, MINH, OO चुंग, वैलेंटाइन, जैमी, व्हिटनी, एसओएल, चोंग, पैरिस, ओक्टा, लेक, डोंग, एंटोनिया, केली, कैरोल, शायनी, वैल, जुडे, ब्रेट, हेंग, लेयर्स, गेल, जेएई, नाइकी, लेस्ली, मानस, मानस ज्वेल, पटेरिया, लौरेन, एलिसा, मिशैल, लिंडसे और जुविलक्लैर, बरनी, जोआन, डोमिनीक्वे, ट्रिस्टन, जेम्स, गेल, लावर्ने, एलावा, स्टेविई, एरिन, ऑगस्टाइन, योहंग, जॉनी, एरियल, डस्टी, लिंडसे, ट्राकी, स्कोट्टी, सिडेन, सिलेन्नी, गेलिन, गेल IVORY, SREA, SANG, DEON, CAROL, YONG, BERRY, TRINIDAD, SHIRLEY, MARIA, CHANG, ROSARIO, DANNIE, FRANCES, THANH, CONHIE, TORY, LUPE, DEE, SUNG, CHI, QUINN, MINH, OO चुंग, वैलेंटाइन, जैमी, व्हिटनी, एसओएल, चोंग, पैरिस, ओक्टा, लेक, डोंग, एंटोनिया, केली, कैरोल, शायनी, वैल, जुडे, ब्रेट, हेंग, लेयर्स, गेल, जेएई, नाइकी, लेस्ली, मानस, मानस ज्वेल, पटेरिया, लौरेन, एलिसा, मिशैल, लिंडसे और जुविलमारिया, चंग, रोसरियो, डैनी, फ्रैंस, थान, कोनी, टॉपी, लुपे, डे, सुंग, सीएचआई, क्विन, मिन, थेओ, लू, चेंग, वैलेंटाइन, जैमी, WHITNEY, SOL, CHONG, PARIS, OTHA, LACY DONG, ANTONIA, KELLEY, CARROL, SHAYNE, VAL, JUDE, BRITT, HONG, LEIGH, GAYLE, JAE, NICKY, LESLEY, MAN, KASEY, JEWELL, PATRICIA, LAUREN, ELISHA, MICHAL, LINDSAY, andEWमारिया, चंग, रोसरियो, डैनी, फ्रैंस, थान, कोनी, टॉपी, लुपे, डे, सुंग, सीएचआई, क्विन, मिन, थेओ, लू, चेंग, वैलेंटाइन, जैमी, WHITNEY, SOL, CHONG, PARIS, OTHA, LACY DONG, ANTONIA, KELLEY, CARROL, SHAYNE, VAL, JUDE, BRITT, HONG, LEIGH, GAYLE, JAE, NICKY, LESLEY, MAN, KASEY, JEWELL, PATRICIA, LAUREN, ELISHA, MICHAL, LINDSAY, andEW

वे सभी नाम हैं जो पुरुषों और महिलाओं दोनों के लिए काम करते हैं। अगर किसी लड़की का नाम रॉबर्ट है और आपके सॉफ़्टवेयर सहित हर कोई उसे एक आदमी कहता रहता है, तो उसे बहुत ही अफ़सोस होगा।


25
चलो मान लेते हैं कि मार्क नाम की एक लड़की मौजूद है (एक बिंदु से बेझिझक)। अगर मैं उसकी थी तो मैं अपने माता-पिता से नाराज हो जाऊंगी और चास के सॉफ्टवेयर पर नहीं ...
Darko Z

6
क्या होगा अगर सॉफ्टवेयर उसे एक आदमी कभी नहीं कहता है, लेकिन यूआई के "मर्दाना" संस्करण को प्रस्तुत करता है? या वह विपणन संपार्श्विक को विकसित करने के लिए उपयोग किए जाने वाले डेटासेट पर कुल पुरुषों के साथ गांठदार है? वह शायद नोटिस भी न करे।
क्रिस मैकल

इन नामों में से कई के लिए मुझे दिए गए नाम के 500-1200 फेसबुक प्रोफाइल से डेटा के आधार पर 100% निश्चितता मिलती है। api.genderize.io/?name=robert api.genderize.io/?name=andrew api.genderize.io/?name=john
Stromgren

3

यद्यपि डेटाबेस संभवतः सबसे व्यावहारिक समाधान हैं, अगर आप कुछ मज़ा लेना चाहते हैं तो शायद आप एक तंत्रिका जाल (या एक तंत्रिका जाल पुस्तकालय का उपयोग करके) लिखने की कोशिश कर सकते हैं जो उन 3 विकल्पों में से एक का उत्पादन करता है (एफ, एम, ए) )।

आप इसे डेटासेट्स का उपयोग करके प्रशिक्षित कर सकते हैं जो अन्य उत्तरों द्वारा सुझाए गए डेटाबेस में मौजूद हैं, साथ ही आपके पास किसी भी अन्य डेटा के साथ।

यह समाधान आपको उन नामों को संभालने की अनुमति देगा जो विशेष रूप से पहले वर्गीकृत नहीं हैं, और विभिन्न भाषाओं को भी संभालते हैं। आप तंत्रिका जाल के लिए एक इनपुट के रूप में भाषा (यदि आप इसे जानते हैं) पास करना चाहते हो सकता है।

मुझे नहीं पता है कि मैं कह सकता हूं कि तंत्रिका जाल (या कोई अन्य मशीन सीखना) हालांकि वर्गीकृत करने का एक अच्छा काम करेगा।


3

यह संस्कृति / क्षेत्र पर निर्भर है: इटली के लिए एंड्रिया ले लो, केवल मर्दाना है, स्वीडन के लिए एक महिला का नाम है जबकि एंड्रियास पुरुषों के लिए है; शॉन अंग्रेजी में अस्पष्ट है। यदि किसी भाषा में घोषणा है, जैसे लैटिन या रूसी, अंतिम अक्षर व्याकरणिक नियमों के अनुसार बदल जाएंगे,

अस्पष्टता का एक अन्य स्रोत परिवार के नाम व्यक्तिगत नामों के समान है।

मेरी राय में यह सामान्य रूप से हल करना असंभव है।


अगर ओपी के पास उत्पत्ति, जन्मस्थान, राष्ट्रीयता की संस्कृति का संकेत करने वाला एक साथी चर है, जो भी उपयोगी होगा। लेकिन उन्होंने कहा कि वह ऐसा नहीं करते हैं, बस आपको समुच्चय के आधार पर सांख्यिकीय रूप से सूचित अनुमान लगाना होगा।
एसएमसीआई

3

विचार स्पष्ट रूप से अधिकांश भाषाओं में काम नहीं करेगा।

हालाँकि अगर आप पहले से ही राष्ट्रीयता बता सकते हैं तो आपको और अधिक सौभाग्य मिल सकता है। अधिकांश स्लाव भाषाओं (जैसे रूसी, पोलिश, अधिनियम) में आप सुरक्षित रूप से मान सकते हैं कि -वा -चा -स्का (सामान्य रूप से -a के साथ समाप्त होने वाले सभी उपनाम) हैं, जबकि -v -ch -shi मर्दाना हैं।

वास्तव में किसी भी उपनाम का स्त्रैण और मर्दाना रूप होता है जो अंत पर निर्भर करता है। अन्य देशों में उपयोग किए जाने वाले समान नाम (जैसे US) हालांकि केवल मर्दाना रूप का उपयोग कर सकते हैं।

पहले नामों के लिए भी यही कहा जा सकता है (-a -ya are feminine) लेकिन यह 100% सटीक नहीं है।

लेकिन सामान्य तौर पर आपको शायद ही कोई पुस्तकालय मिलेगा जो पर्याप्त रूप से सटीक हो।


एक उपनाम मर्दाना या स्त्री कैसे है?
साइमन_वेअर

2
@Simon_Weaver मेरे पिता का उपनाम स्लावचेव है, और मेरी माताओं का उपनाम स्लाचेवा है। यह वास्तव में एक ही उपनाम बिट है यह पुरुषों और wemen के लिए अलग-अलग वर्तनी है। यह स्लाव नामों के लिए आम है।
दिमित्र स्लावचेव


2

Z डायरेक्टरी (vettrasoft.com पर) सी-भाषा फ़ंक्शन है, कुछ इस तरह से काम करता है:

void func()
{
    char c = z_guess_sex_byfirstname ("Lon");
    switch(c)
    {
    case 'M': std::cout << "It's a boy!\n"; break;
    case 'F': std::cout << "It's a girl!\n"; break;
    case 'B': std::cout << "this name is for both sexes\n"; break;
    case '?': std::cout << "sex unknown sorry\n"; break;
    }
}

यह डेटाबेस से संचालित है, तालिका में मेरे विचार से 10,000+ नाम जैसे कुछ हैं, लेकिन आपको z निर्देशिका को डाउनलोड करने और स्थापित करने की आवश्यकता है (जिसमें कई अन्य टॉपो आइटम जैसे देश, भौगोलिक स्थल, हवाई अड्डे, राज्य, क्षेत्र कोड, डाक-ज़िप कोड आदि शामिल हैं) सी + + कार्यों और वस्तुओं के साथ डेटा का उपयोग करने के लिए)। हालांकि नाम बहुत अंग्रेजी-भाषा उन्मुख हैं। तालिका प्रगति पर काम करती है और धीरे-धीरे अपडेट की जाती है।


1

नाम-लिंग नक्शे काम कर सकते हैं लेकिन बहुसांस्कृतिक देशों में यह अनुमान लगाने की तरह अधिक है। मैं आपको एक उदाहरण दे सकता हूं: मैरियन इन पोलिश एक विशिष्ट मर्दाना नाम है, जबकि ग्रेट ब्रिटेन में एक ही नाम एक महिला नाम है। पूरी दुनिया में लोगों के आप्रवासन के दौर में, मुझे यकीन नहीं है कि ऐसा डेटाबेस बहुत सटीक होगा। सौभाग्य!


1
नहीं, लेकिन जब तक यह 50% से बेहतर है, यह हमेशा मर्दाना नाम का इलाज करता है।
चास। ओवन्स

@ क्या, तो उस झूठे द्वंद्ववाद के कारण क्यों? आपके पास लिंग-तटस्थता का विकल्प है।
०४:४२

हमारे पास 2 प्रसिद्ध राजनीति भी हैं जिनका दूसरा नाम 'मारिया' - 'मेरी' है जिसे आपके डेटाबेस में स्त्री के रूप में वर्गीकृत किया जाएगा। सिर्फ लोल के लिए।
शाम

@JZ मैं पहले नाम की बात कर रहा हूं न कि अंतिम नाम (या उल्टे करने वाली संस्कृतियों के लिए विपरीत)।
चास। ओवेन्स

@ लिगोस, लिंग-तटस्थ भाषा अजीब लगती है और जटिल होती है, मैं ऐसा कुछ पैदा करूंगा जो अच्छा लग सकता है जब मैं कर सकता हूं। यह व्यक्तियों (यदि वे भी मौजूद हैं) के लिए वापस संचारित नहीं किया जाता है, तो अपराध का कोई मौका नहीं है, मुझे नहीं पता कि लोग डेटाबेस के लिए लिंक प्रदान करने के बजाय केवल बहस करने में इतना समय क्यों खर्च कर रहे हैं यदि वे एक अच्छे के बारे में जानते हैं एक।
चास। ओवेन्स

1

कुछ संस्कृतियों के नाम यूनिसेक्स हैं - जैसे मेरा। तब आप क्या करते हो? मुझे लगता है कि उत्तर स्पष्ट और सरल है - यह मत मानो - आप अपराध का कारण बन सकते हैं। बस पूछें कि क्या इसकी आवश्यकता है, अन्यथा लिंग तटस्थता।


5
सवाल पहले से ही आपके जवाब का जवाब दिया: एलेक्स => "ए", # स्पष्ट। प्रश्न का उत्तर है या नहीं, आपका उत्तर यह नहीं है।
विंडोज प्रोग्रामर

मैं असहमत हूं - मेरा कहना है कि सभी नाम संभावित अस्पष्ट हैं।
प्रीत संघ

यदि नाम यूनिसेक्स हैं, तो वे सभी को ए के रूप में वर्गीकृत किया जाएगा और मैं लिंग तटस्थता के लिए जाऊंगा, लेकिन अगर नाम मुख्य रूप से मर्दाना या स्त्री है तो मैं बहुत अधिक प्राकृतिक भाषा का उपयोग कर सकता हूं।
चास। ओवेन्स

मैं देखता हूं कि आपका तर्क क्या है लेकिन मैं आपको बाद की टिप्पणी के लिए संदर्भित करता हूं।
प्रीत संघ

3
लेकिन अगर आप StackOverflow पर एक "प्रीत" देखते हैं, तो यह शायद एक पुरुष है।
नोसरेडना

1

खैर, अब और नहीं। आईबीएम ने कुछ समय पहले उस विचार का पेटेंट कराया था।

इसलिए यदि आप लचीलेपन के किसी भी स्तर (नामों की सूची के अलावा कुछ और) की तलाश कर रहे हैं, तो आपको या तो (हांफना होगा) उपयोगकर्ता से पूछें, या केवल अधिकारों के लिए आईबीएम का भुगतान करें :)

किसी भी मामले में, ऐसे ऑटोडेटेक्शन कई लोगों के लिए कष्टप्रद है जिनके पास लिंग-अस्पष्ट नाम हैं, या यहां तक ​​कि सिर्फ माता-पिता भी हैं। चलो यह उनके लिए कोई मुश्किल नहीं बनाते हैं।


3
ऐसा लगता है कि आईबीएम ने नाम के आधार पर एक अवतार चुनने का पेटेंट कराया है। सौभाग्य से यह उन अनुप्रयोगों में से एक नहीं है जिन्हें मैं इसके लिए उपयोग करने का इरादा रखता हूं, इसलिए मैं उनके पेटेंट का उल्लंघन नहीं कर रहा हूं। उपयोगकर्ता से पूछने के लिए, यह मानता है कि मेरे पास उपयोगकर्ताओं को नामों की सूची के विपरीत पूछने के लिए है। मैंने बार-बार कहा है कि कोई उपयोगकर्ता नहीं हैं, कोई बातचीत नहीं है, और कोई संदेश नहीं है जो उन लोगों के लिए जा रहे हैं जिनके नाम हैं।
चास। ओवेन्स

1

यह मुफ़्त नहीं है, लेकिन यह एक अच्छी लाइब्रेरी है जिसे मैंने पहले इस्तेमाल किया है:

.NET के लिए NetGender आपको अपने कस्टम एप्लिकेशन में नाम सत्यापन, पार्सिंग और जेंडर निर्धारण का त्वरित और आसानी से निर्माण करने की अनुमति देता है। यह निश्चित रूप से सत्यापित करें कि क्या किसी विशेष क्षेत्र में एक वैध व्यक्ति या कंपनी है। नेटगेंडर सटीक लिंग निर्धारण सुनिश्चित करने के लिए 8,000+ कंपनी के नाम शब्दकोश के संयोजन में 100,000+, जातीय रूप से विविध, नाम शब्दकोश का उपयोग करता है।

http://www.softwarecompany.com/dotnet/netgender.htm


1

यह दिलचस्प है कि आप कहते हैं कि आपके पास जन्मतिथि है। जिससे मदद मिल सके। मैंने नाम लोकप्रियता के इतिहास के डेटाबेस देखे हैं।

फिल्म स्प्लैश (1984) में, यह मज़ेदार था कि डैरिल हन्नाह का चरित्र मैडिसन एवेन्यू स्ट्रीट साइन से "मैडिसन" नाम चुनता है, क्योंकि जाहिर है कि "मैडिसन" एक लड़की का नाम नहीं है।

24 साल बाद मैडिसन बालिकाओं के लिए 4 वां सबसे लोकप्रिय नाम है!


Gov't से नाम इतिहास। (पिछले 100 वर्षों के दौरान मैरी की उदास गिरावट की जाँच करें।)


जब मैंने एक बच्चे के रूप में व्हाइट हाउस को लिखा, रिचर्ड निक्सन (या, शायद एक सचिव) ने ऐतिहासिक जगह की कुछ तस्वीरों के साथ मुझे जवाब दिया, "मिस रेट एंडरसन" को संबोधित किया। "मिस रेट?" यह भी मतलब नहीं है! क्या हम वास्तव में क्लार्क गेबल के रैट (मूंछ के साथ, गॉन विद द विंड!) और विवियन ली के स्कारलेट के बीच अंतर नहीं बता सकते हैं? नील यंग के इस आश्वासन के बावजूद कि "रिचर्ड निक्सन को भी आत्मा मिल गई है, मैं उसे कभी माफ नहीं करूंगा।"


अच्छा बिंदु, तारीख निश्चित रूप से यहाँ खेलने में आती है।
चास। ओवंस

1

मुझे पूरा यकीन है कि सटीकता के स्वीकार्य स्तर के साथ ऐसी कोई सेवा मौजूद नहीं हो सकती है। यहाँ समस्याएं हैं जो मुझे लगता है कि अपमानजनक हैं:

  • बहुत सारे नाम हैं जो पुरुषों और महिलाओं दोनों के लिए हैं।
  • इस दुनिया में कई अलग-अलग नाम हैं, भले ही आप केवल एक देश पर विचार करें।
  • वहाँ "ए बॉय नेम सू" का मुद्दा है, जिसे जॉनी कैश ने स्पष्ट रूप से उठाया है :-)

2
एक अच्छे डेटाबेस में प्रतिशत पुरुष / महिला क्षेत्र के लिए androgynous नामों से होगा और जब नमूना लिया गया था, आदि

जापानी जैसी भाषाओं के बारे में क्या? मैं जापानी सीख रहा हूं इसलिए मैं यहां गलत हो सकता हूं, लेकिन नाम <-> कांजी एक सीधे आगे के रिश्ते नहीं हैं, कांजी एक व्यक्ति के नाम को "क्या" पर सजा और गलतफहमी है।
फराुन


1

आप मेरी अजगर लिंग पहचान परियोजना https://github.com/muatik/genderizer पर नज़र डाल सकते हैं

यह लेखकों के लिंगों का पता लगाने की कोशिश करता है जो उनके नाम और / या नमूना पाठ (उदाहरण के लिए ट्वीट) को देखते हैं।

और यह मैंगोडब का भी समर्थन करता है, प्रदर्शन के लिए मेमकेड।


अच्छा लगता है, लेकिन अगर आपको "मूल देश" होने की आवश्यकता है, तो कृपया देखिए। लिंग या लिंग देखें। नीचे दिया गया है
HaveAGuess

0

यह वास्तव में एक प्रोग्रामिंग समस्या नहीं है - यह एक संभावना तालिका प्राप्त करने के लिए नीचे आता है।

AFAIK आसुत रूपों में कोई सार्वजनिक डेटाबेस नहीं हैं। आप इसे या तो जनगणना के डेटा से बना सकते हैं, या किसी से डेटा खरीद सकते हैं।

उदाहरण के लिए, यह वह व्यक्ति है जो कनाडा के लिए संभाव्यता तालिका बेचता है


0

IMHO, यह एक व्यक्ति के नाम से सेक्स का निर्धारण करने के लिए आम तौर पर बुरा विचार है। बहुत सारे नाम अंतरजाल (अच्छे दुःख) हैं, क्या यह भी एक शब्द है ?? :-), और यह भी कि वे एक संस्कृति में एक और दूसरे में एक लिंग हो सकते हैं।

कुछ बेवकूफी भरे उदाहरण, बस कुछ जो दिमाग में आया (दुनिया के मेरे हिस्से से, CE)

वनजा - मादा, यहाँ से पूर्वी देशों में, ज्यादातर पुरुष
एलेक्स - चौराहे (सैंड्रा, महिला और सैंड्रो, पुरुष के लिए कम)
रॉबिन - पश्चिमी संस्कृतियों में, दोनों हो सकते हैं

दुनिया के कुछ हिस्सों में, एक व्यक्ति सेक्स का निर्धारण यह देखकर कर सकता है कि नाम कैसे समाप्त होता है। उदाहरण के लिए, मरिजा, सैंड्रा, इवाना, पेट्रा, सारा, लुसिजा, एना - आप देख सकते हैं कि इनमें से अधिकांश महिला नाम "जा" या "रा" में समाप्त होते हैं। अन्य उदाहरण भी हैं।

फिर भी, मुझे लगता है कि केवल उपयोगकर्ता से सेक्स के लिए पूछना बेहतर है।


9
"फिर भी, मुझे लगता है कि उपयोगकर्ता से सेक्स के लिए पूछना बेहतर है।" - मैं मानता हूं, कि स्टैक ओवरफ्लो पर टिप्पणी पोस्ट करने से बेहतर होगा।
विंडोज प्रोग्रामर

2
यूपीएस। Okeey, कि नहीं बाहर सही आया था :-)
रूक

संपादन से पहले यह बेहतर था :-)
विंडोज प्रोग्रामर


0

मुझे ऐसी कोई सेवा नहीं है। हालाँकि, आप वह डेटा पा सकते हैं, जिसकी आप तलाश कर रहे हैं। अमेरिकी सरकार नामों की व्यापकता और उनके द्वारा संलग्न व्यक्ति के लिंग के बारे में डेटा प्रकाशित करती है। सामाजिक सुरक्षा प्रशासन के पास एक ऐसा पृष्ठ है , और जनगणना भी हो सकती है, लेकिन मैंने देखने के लिए समय नहीं लिया है। शायद अन्य विश्व सरकारें भी ऐसी ही बातें करती हैं।


0

मुझे ऐसी कोई सेवा नहीं है, हालांकि ..

कुछ देशों में (उदाहरण के लिए) एक व्यक्ति को जो नाम दिया जा सकता है वह कानून द्वारा सीमित है - शायद उस मामले से संबंधित कुछ प्रकाशन हैं, जिन्हें काटा जा सकता है (लेकिन मुझे इस समय किसी के बारे में पता नहीं है)।


0

मैं क्या करूँगा जो एक हैक बनाता है जो नाम लेता है और इसे फेसबुक एपीआई के खिलाफ खोजता है। फिर परिणामी उपयोगकर्ताओं को देखता है और गिनता है कि उनमें से कितने महिला या पुरुष हैं। आप फिर एक प्रतिशत वापस कर सकते हैं। अब इतना दुर्गम नहीं है। :)


-2

बस लोगों से पूछें, और अगर वे अच्छे हैं तो वे आपको अपने 'एम' या 'एफ' देंगे, और यदि वे नहीं हैं तो 'ए' नहीं देंगे।


2
मैं उन लोगों के साथ संचार में नहीं हूं जिनके नाम मैं मैप करना चाहता हूं।
चास। ओवेन्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.