Sa mga may experience na sa webscraping, please help.
Nag-advance reading, YøùTùbé, udemy, and documentation napo ako. Pero palang kulang ako sa industrial level "framework". Pa simpleng-simpleng scripts lang.
Sinubukan ko rin selenium, parang mas madali ata Selenium-Python kesa Playwright-Python.
Ano po ba masa-suggest niyo? Nakakahilo na.
Kung static site lang kaya naman ng HTTPX-Selectolax, ang problema nga lang yung mga dynamic websites then yung mga sites na need pa ng interaction kasi nakatago sa ibang url at may captcha pa.
I'm lost.
Gusto ko talaga matuto nito, need compassionate mentor
Static Site : Requests + Bs4 package
Dynamic site : selenium
Gagamit ka ng 2captcha service para sa reCaptcha/hCaptcha, sa Cloudflare naman hindi ako sure if kaya ng selenium, Webview ang gamit ko pang bypass ng Cloudflare
Static Site : Requests + Bs4 package
Dynamic site : selenium
Gagamit ka ng 2captcha service para sa reCaptcha/hCaptcha, sa Cloudflare naman hindi ako sure if kaya ng selenium, Webview ang gamit ko pang bypass ng Cloudflare