पायथन पंडों में दो मानों के बीच डेटाफ्रैम में पंक्तियों का चयन कैसे करें?

Question 1

मैं एक DataFrame को संशोधित करने के dfलिए केवल उन पंक्तियों को शामिल करने की कोशिश कर रहा हूं जिनके लिए स्तंभ में मान closing_price99 और 101 के बीच हैं और नीचे दिए गए कोड के साथ ऐसा करने की कोशिश कर रहे हैं।

हालाँकि, मुझे त्रुटि मिलती है

ValueError: किसी श्रृंखला का सत्य मान अस्पष्ट है। A.empty, a.bool (), a.item (), a.any () या a.all () का उपयोग करें

और मैं सोच रहा हूं कि क्या लूप का उपयोग किए बिना ऐसा करने का कोई तरीका है।

df = df[(99 <= df['closing_price'] <= 101)]

Question 2

()अस्पष्टता को दूर करने के लिए आपको अपने बूलियन वेक्टर को समूहित करना चाहिए ।

df = df[(df['closing_price'] >= 99) & (df['closing_price'] <= 101)]

Question 3

इसके बीच की श्रृंखला पर भी विचार करें :

df = df[df['closing_price'].between(99, 101)]

Question 4

एक अच्छा विकल्प है - क्वेरी () विधि का उपयोग करें :

In [58]: df = pd.DataFrame({'closing_price': np.random.randint(95, 105, 10)})

In [59]: df
Out[59]:
   closing_price
0            104
1             99
2             98
3             95
4            103
5            101
6            101
7             99
8             95
9             96

In [60]: df.query('99 <= closing_price <= 101')
Out[60]:
   closing_price
1             99
5            101
6            101
7             99

अद्यतन: टिप्पणी का उत्तर दे रहा है:

मुझे यहाँ सिंटैक्स पसंद है लेकिन एक्सप्रेशन के साथ संयोजन करने की कोशिश करते समय गिर गया; df.query('(mean + 2 *sd) <= closing_price <=(mean + 2 *sd)')

In [161]: qry = "(closing_price.mean() - 2*closing_price.std())" +\
     ...:       " <= closing_price <= " + \
     ...:       "(closing_price.mean() + 2*closing_price.std())"
     ...:

In [162]: df.query(qry)
Out[162]:
   closing_price
0             97
1            101
2             97
3             95
4            100
5             99
6            100
7            101
8             99
9             95

Question 5

आप .between()विधि का उपयोग भी कर सकते हैं

emp = pd.read_csv("C:\\py\\programs\\pandas_2\\pandas\\employees.csv")

emp[emp["Salary"].between(60000, 61000)]

उत्पादन

Question 6

newdf = df.query('closing_price.mean() <= closing_price <= closing_price.std()')

या

mean = closing_price.mean()
std = closing_price.std()

newdf = df.query('@mean <= closing_price <= @std')

Question 7

यदि आप कई मानों और कई इनपुटों के साथ काम कर रहे हैं, तो आप इस तरह से एक एप्‍लिकेशन फ़ंक्शन भी सेट कर सकते हैं। इस मामले में कुछ स्थानों के साथ गिरने वाले जीपीएस स्थानों के लिए एक डेटाफ्रेम को छानना।

def filter_values(lat,lon):
    if abs(lat - 33.77) < .01 and abs(lon - -118.16) < .01:
        return True
    elif abs(lat - 37.79) < .01 and abs(lon - -122.39) < .01:
        return True
    else:
        return False


df = df[df.apply(lambda x: filter_values(x['lat'],x['lon']),axis=1)]

Question 8

इसके अलावा

df = df[(99 <= df['closing_price'] <= 101)]

आपको इसका उपयोग करना चाहिए

df = df[(df['closing_price']>=99 ) & (df['closing_price']<=101)]

हमें क्वेरी कंपाउंडिंग के लिए NumPy के बिटवाइज़ लॉजिक ऑपरेटर्स |, &, ~, ^ का उपयोग करना होगा। इसके अलावा, कोष्ठक संचालक पूर्ववर्ती के लिए महत्वपूर्ण हैं।

अधिक जानकारी के लिए, आप लिंक पर जा सकते हैं: तुलना, मास्क और बूलियन लॉजिक