selenium 動態爬蟲的技巧
一、環境安裝
1. 開設一個新的測試環境
Miniconda下載網址:
https://docs.conda.io/en/latest/miniconda.html
直接下載:
https://repo.anaconda.com/miniconda/Miniconda3-latest-Windows-x86_64.exe
conda create --name se2024 python=3.9
2. 進入測試環境
(1) conda activate se2024
(2) 開啟程式放置的資料夾
在桌面開設dw2024的資料夾
實體路徑為:
C:\Users\Administrator\Desktop\dw2024
(3) 再命令提示字元下進入 cd C:\Users\Administrator\Desktop\dw2024
3. 安裝 selenium 套件 (動態爬蟲的主要套件)
pip install selenium
4. 下載webdriver (模擬瀏覽器)
pip install webdriver-manager
可透過官網下載 https://www.selenium.dev/downloads/
亦可透過瀏覽器官網下載
Chrome web driver
https://developer.chrome.com/docs/chromedriver/downloads?hl=zh-tw
Chrome 115 以上版本請使用下方連結
https://googlechromelabs.github.io/chrome-for-testing/
5. 如何執行與操作
(1)執行程式與webdriver放在同一個路徑下
(2)執行程式 python test.py
(3)Notepad++
https://github.com/notepad-plus-plus/notepad-plus-plus/releases/download/v8.6/npp.8.6.Installer.x64.exe
test.py 範例程式
from selenium import webdriver
browser=webdriver.Chrome()
## chromedriver.exe 模擬器 與 code 同一個路徑
browser.get('https://tech.digitgeek.net/')
# browser.close()
##將瀏覽器關閉
from selenium import webdriver # 啟動 Chrome 瀏覽器 browser = webdriver.Chrome() # 打開目標網站 browser.get('https://tech.digitgeek.net/') # 等待用戶輸入,避免瀏覽器立即關閉 input("按下 Enter 鍵以結束程式並關閉瀏覽器...") # 程式結束時,關閉瀏覽器 browser.quit()
熱門評論
補充:
pip install bs4
pip install requests
Select 的抓取方式
選取選項值
點選按鈕
Facebook 登入
Copyright © 2019 Digitgeek.Net ☺