मैं एक गतिशील वेबपेज के माध्यम से स्क्रॉल करने का एक तरीका तलाश रहा था, और पेज के अंत तक पहुंचने के बाद स्वचालित रूप से रोक रहा था, और इस धागे को पाया।
@Cuong ट्रान द्वारा पोस्ट , एक मुख्य संशोधन के साथ, वह उत्तर था जिसकी मुझे तलाश थी। मैंने सोचा था कि अन्य लोग संशोधन को उपयोगी पा सकते हैं (इसका एक स्पष्ट प्रभाव है कि कोड कैसे काम करता है), इसलिए यह पोस्ट।
संशोधन बयान को स्थानांतरित करने के लिए है जो लूप के अंदर अंतिम पृष्ठ की ऊंचाई को कैप्चर करता है (ताकि प्रत्येक चेक पिछले पृष्ठ की ऊंचाई की तुलना कर रहा है)।
तो, नीचे दिया गया कोड:
लगातार गतिशील वेबपेज को स्क्रॉल करता है ( .scrollTo()
), केवल जब एक पुनरावृत्ति के लिए रुकता है, तो पृष्ठ की ऊंचाई समान रहती है।
(एक और संशोधन है, जहां विराम कथन एक अन्य शर्त के अंदर है (पृष्ठ 'चिपक' के मामले में) जिसे हटाया जा सकता है)।
SCROLL_PAUSE_TIME = 0.5
while True:
# Get scroll height
### This is the difference. Moving this *inside* the loop
### means that it checks if scrollTo is still scrolling
last_height = driver.execute_script("return document.body.scrollHeight")
# Scroll down to bottom
driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
# Wait to load page
time.sleep(SCROLL_PAUSE_TIME)
# Calculate new scroll height and compare with last scroll height
new_height = driver.execute_script("return document.body.scrollHeight")
if new_height == last_height:
# try again (can be removed)
driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
# Wait to load page
time.sleep(SCROLL_PAUSE_TIME)
# Calculate new scroll height and compare with last scroll height
new_height = driver.execute_script("return document.body.scrollHeight")
# check if the page height has remained the same
if new_height == last_height:
# if so, you are done
break
# if not, move on to the next loop
else:
last_height = new_height
continue