Python|selenium实现自动点赞收藏(进阶版)

在上一篇文章《Python|PyAutoGUI实现自动点赞收藏》中写过利用 PyAutoGUI 实现网页自动化点赞+收藏的功能，实测发现依靠屏幕坐标系完成鼠标操作的弊端（因为布局原因导致图标位置变化时，不能很好的处理），IT人当然不能接受这种瑕疵😂😂😂
今天用另一个 python 库实现全天候、全地域的精准点击😁😁😁

思路

和上一篇文章一样，也是基于网页实现循环打开未读文章，之后进行点赞+收藏操作。不同的是今天使用的 selenium 库在元素定位时是基于网页html的格式，可以通过元素 id 、 name 、 class 、 css 甚至 xpath 实现精准定位。在网页的处理上比 PyAutoGUI 有更高的稳定性。

测试效果

源码如下

from selenium import webdriver
import time
from os import path
from selenium.webdriver.common.by import By

driver = webdriver.Edge('C:\Program Files (x86)\Microsoft\Edge\Application\msedgedriver.exe')

def login():
    #打开网页版APP，完成登录
    driver.get('https://XXXX/')
    driver.maximize_window() #窗口最大化
    time.sleep(25) #登录系统
    print('----------登录成功----------')
    if driver.find_element(By.XPATH,'//img[@alt="资讯"]'):
        print('----------打开资讯----------')
        driver.find_element(By.XPATH,'//img[@alt="资讯"]').click()
        time.sleep(1)
        print('----------打开推荐----------')
        driver.find_element(By.XPATH,'//div[text()="推荐"]').click()
        time.sleep(1)

def auto_click(num):
    i = 0
    while i<num:
        driver.find_element(By.XPATH,'//span[text()="热度优先"]').click()
        time.sleep(0.5)
        driver.find_element(By.XPATH,'//span[text()="时间优先"]').click()
        time.sleep(0.5)
        # 打开第一篇文章
        driver.find_element(By.XPATH,'//div [@class="home-main-partyNews" and  @style="margin-top: 0px;"]//div [@class="dynamic-left-title"]').click()
        time.sleep(1)
        # 切换标签
        window = driver.current_window_handle #获取当前句柄
        all_handles = driver.window_handles
        driver.switch_to.window(all_handles[-1])
        # 收藏
        try :
            driver.find_element(By.XPATH,'//div[@class="icon"]/span[@class="pointer"]/i[@class="iconfont icon-shoucanghuise"]').click()
            print('第{}篇文章收藏成功'.format(i+1))
        except :
            try:
                driver.find_element(By.XPATH,'//div[@style="display: block;"]/span[@class="header-icon"]/i[@class="iconfont icon-weishoucang"]').click()
                print('第{}篇文章收藏成功'.format(i+1))
            except :
                print(driver.current_url) # 输出不能执行的页面url
                # print(driver.page_source) # 输出不能执行的页面源码
                pass

        time.sleep(0.2)
        # 点赞
        try :
            driver.find_element(By.XPATH,'//div[@class="icon"]/span[@class="pointer"]/i[@class="iconfont icon-dianzanhuise"]').click()
            print('第{}篇文章点赞成功'.format(i+1))
        except :
            try:
                driver.find_element(By.XPATH,'//div[@style="display: block;"]/span[@class="header-icon"]/i[@class="iconfont icon-dianzanhuise"]').click()
                print('第{}篇文章点赞成功'.format(i+1))
            except :
                print(driver.current_url) # 输出不能执行的页面url
                # print(driver.page_source) # 输出不能执行的页面源码
                pass
        time.sleep(1)
        # 关闭当前标签
        driver.close()
        driver.switch_to.window(window)
        time.sleep(0.5)
        i +=1
    print('----------执行完毕----------')

if __name__ == "__main__":
    login()
    auto_click(10)

总结

selenium 同样是一款 Web 自动化测试工具，但基本都被用来爬虫了。果真 python 的一切自动化测试工具的归宿都是爬虫😂😂😂
selenium 还是很强大的，在 web 页面解析、浏览器控制、鼠键处理上都是很灵活的，可以处理一些相对复杂的场景。并且selenium 支持 IE 、 chrome 、 edge 等常用浏览器，使用时需要借助 webdriver 插件完成。（ webdriver 插件最好和本地计算机对应浏览器的版本保持一致）

需要提示的是，selenium的4.*版本语法做了更新，和3.*差异较大，使用时需留意官方文档。

pip show selenium

附：selenium库基本用法整理

模块导入

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
import time

调用webdriver

1	`driver = webdriver.Edge("C:\Program Files (x86)\Microsoft\Edge\Application\msedgedriver.exe")`

使用get方法加载url界面

1	`driver.get(r'https://www.baidu.com')`

断言是否存在

1	`assert '百度一下，你就知道' in driver.title`

通过 find _ element 方法查找元素

# <input type="text" name="passwd" id="passwd-id" class="text-a"/>
# 支持的By类属性有：
# ID = "id"
# NAME = "name"
# XPATH = "xpath"
# LINK_TEXT = "link text"
# PARTIAL_LINK_TEXT = "partial link text"
# TAG_NAME = "tag name"
# CLASS_NAME = "class name"
# CSS_SELECTOR = "css selector"
element = driver.find_element(By.ID, "passwd-id")
element = driver.find_element(By.NAME, "passwd")
element = driver.find_element(By.CLASS_NAME, "text-a")
element = driver.find_element(By.XPATH, "//input[@id='passwd-id']")
element = driver.find_element(By.CSS_SELECTOR, "input#passwd-id")

键盘输入

1
2
3

element.clear() # 清除预加载信息
element.send_keys("pycon") # 输入信息
element.send_keys(Keys.RETURN) # 执行查询

处理下拉选项

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
import time
# 调用webdriver
driver = webdriver.Edge("C:\Program Files (x86)\Microsoft\Edge\Application\msedgedriver.exe")
# 使用get方法加载url界面
driver.get(r'https://www.sojson.com/time/jsq.html')
element = driver.find_element(By.ID, "month3")
all_options = element.find_elements(By.TAG_NAME, "option")
for option in all_options:
    print("Value is: {}".format(option.get_attribute("value"))) # 获取下拉选项
    if option.get_attribute("value")==10 : # 获取选项：10
        option.click()
time.sleep(10)

处理选择

from selenium.webdriver.support.ui import Select
select = Select(driver.find_element(By.NAME, 'name'))
select.select_by_index(index)
select.select_by_visible_text("text")
select.select_by_value(value)
# 选择/取消选择所有
select = Select(driver.find_element(By.ID, 'id'))
select.deselect_all()

处理拖放

# 处理拖放，将一个元素拖拽到另一个元素上
element = driver.find_element(By.NAME, "source")
target = driver.find_element(By.NAME, "target")

from selenium.webdriver import ActionChains
action_chains = ActionChains(driver)
action_chains.drag_and_drop(element, target).perform()