Enviado em 06/01/2025 - 20:16h
Senhores, estou fazendo algumas raspagens na web com Python + Selenium. Em um dos sites acabei esbarrando em bloqueios de execução de scripts (Shadow DOM) me impedindo de usar seletores comuns de css ou qualquer outra alternativa para interagir com o HTML da página. Dessa forma, a solução que cheguei foi: Com o selenium renderizar a página na sua extensão completa e tirar uma screenshot, a partir dessa screenshot estou usando pytesseract (library python) para converter a imagem em string. Essa string é enviada a uma API do gpt para me retornar em json as informações da página.Kernel turbinado e GNOME 49 dominam o giro do dia no mundo Linux
Novidades Linux: Kernel 6.17, distros em ebulição e segurança em foco
Kernel ganha novos linters Rust e distros avançam com recursos de IA
Firewire resiste, Bcachefs sai: destaques Linux do dia
Kernel 6.18 em foco, betas fervilhando e avanços em IA no Linux
Adicionando o repositório backports no Debian 13 Trixie
Como definir um IP estático no Linux Debian
systemd-resol... precisa ser reiniciado periodicamente (5)
Alguém que utilize o Warsaw do BB no Ubuntu 24.04 [RESOLVIDO] (6)
Fedora não reconhece James Donkey 102 Wireless Gaming Mouse (2)