मेरे पास एक डेटा फ्रेम है जो 19717 लोगों की बहुविकल्पीय प्रश्नों के माध्यम से प्रोग्रामिंग भाषाओं की पसंद को रिकॉर्ड करता है। पहला कॉलम निश्चित रूप से प्रतिवादी के लिंग का है जबकि बाकी विकल्प वे चुने गए हैं। और इसलिए यदि मैं पायथन को चुनता हूं तो मेरी प्रतिक्रिया पायथन कॉलम में दर्ज की जाएगी और बैश और इसके विपरीत नहीं।
ID Gender Python Bash R JavaScript C++
0 Male Python nan nan JavaScript nan
1 Female nan nan R JavaScript C++
2 Prefer not to say Python Bash nan nan nan
3 Male nan nan nan nan nan
मैं जो चाहता हूं वह एक तालिका है जो Gender
रिकॉर्ड के तहत प्रत्येक श्रेणी के उदाहरणों की संख्या लौटाती है । इसलिए यदि 5000 पुरुषों को पायथन में और 3000 महिलाओं को जेएस में कोडित किया गया है, तो मुझे यह प्राप्त करना चाहिए:
Gender Python Bash R JavaScript C++
Male 5000 1000 800 1500 1000
Female 4000 500 1500 3000 800
Prefer Not To Say 2000 ... ... ... 860
मैंने कुछ विकल्पों की कोशिश की है:
df.iloc[:, [*range(0, 13)]].stack().value_counts()
Male 16138
Python 12841
SQL 6532
R 4588
Female 3212
Java 2267
C++ 2256
Javascript 2174
Bash 2037
C 1672
MATLAB 1516
Other 1148
TypeScript 389
Prefer not to say 318
None 83
Prefer to self-describe 49
dtype: int64
और जैसा ऊपर वर्णित है वैसा आवश्यक नहीं है। क्या यह पंडों में किया जा सकता है?
Gender
सूचकांक के लिए सभी 0s लौटा रहा है ।