मैं सुंदर का उपयोग कर रहा हूँ और कुछ HTML पार्स कर रहा हूँ ।
मुझे प्रत्येक HTML से एक निश्चित डेटा मिल रहा है (लूप के लिए) और उस डेटा को एक निश्चित सूची में जोड़ रहा है।
समस्या यह है कि, कुछ HTML के अलग-अलग प्रारूप हैं (और उनके पास वह डेटा नहीं है जो मुझे चाहिए) ।
इसलिए, मैं अपवाद हैंडलिंग का उपयोग null
करने और सूची में मूल्य जोड़ने की कोशिश कर रहा था (डेटा के अनुक्रम महत्वपूर्ण होने के बाद से मुझे ऐसा करना चाहिए।)
उदाहरण के लिए, मेरे पास एक कोड है:
soup = BeautifulSoup(links)
dlist = soup.findAll('dd', 'title')
# I'm trying to find content between <dd class='title'> and </dd>
gotdata = dlist[1]
# and what i want is the 2nd content of those
newlist.append(gotdata)
# and I add that to a newlist
और कुछ लिंक किसी के पास नहीं हैं <dd class='title'>
, इसलिए मैं जो करना चाहता हूं, उसके null
बजाय सूची में स्ट्रिंग जोड़ें ।
त्रुटि दिखाई देती है:
list index out of range.
मैंने जो कुछ करने की कोशिश की है, वह कुछ पंक्तियों को इस तरह से जोड़ना है:
if not dlist[1]:
newlist.append('null')
continue
लेकिन यह काम नहीं करता है। यह अभी भी त्रुटि दिखाता है:
list index out of range.
इसके बारे में मुझे क्या करना चाहिए? क्या मुझे अपवाद हैंडलिंग का उपयोग करना चाहिए? या कोई आसान तरीका है?
कोई सुझाव? कोई मदद वास्तव में बहुत अच्छा होगा!
None
स्पष्ट रूप से क्लीनर है, ओपी'null'
इस मामले में चाहता है।