2025-03-14 21:59:59 -06:00
|
|
|
# htmlq
|
|
|
|
|
|
|
|
|
|
> Utiliza selectores CSS para extraer contenido de archivos HTML.
|
2026-02-18 06:55:01 -07:00
|
|
|
> Más información: <https://github.com/mgdm/htmlq#usage>.
|
2025-03-14 21:59:59 -06:00
|
|
|
|
|
|
|
|
- Devuelve todos los elementos de la clase `card`:
|
|
|
|
|
|
|
|
|
|
`cat {{ruta/al/archivo.html}} | htmlq '.card'`
|
|
|
|
|
|
|
|
|
|
- Obtiene el contenido del texto del primer párrafo:
|
|
|
|
|
|
|
|
|
|
`cat {{ruta/al/archivo.html}} | htmlq --text 'p:primer-del-tipo'`
|
|
|
|
|
|
|
|
|
|
- Encuentra todos los enlaces de una página:
|
|
|
|
|
|
|
|
|
|
`cat {{ruta/al/archivo.html}} | htmlq --attribute href 'a'`
|
|
|
|
|
|
|
|
|
|
- Elimina todas las imágenes y archivos SVG de una página:
|
|
|
|
|
|
|
|
|
|
`cat {{ruta/al/archivo.html}} | htmlq --remove-nodes 'img' --remove-nodes 'svg'`
|
|
|
|
|
|
|
|
|
|
- Impresión bonita y escritura de la salida en un archivo:
|
|
|
|
|
|
2026-02-18 06:55:01 -07:00
|
|
|
`htmlq --pretty --filename {{ruta/al/archivo.html}} --output {{ruta/a/salida.html}}`
|