Cómo capturar datos usados en visualizaciones en la red: una alternativa robusta al scraping
Se me pregunta cómo llegué a los datos con los que armé esta entrada. Recuérdese que gráficos como los que aparecen aquí los pinta tu propio navegador con javascript. De alguna manera, el servidor manda datos a tu navegador y, por lo tanto, de alguna manera, esos datos obran en tu poder. Sólo hay que saber capturarlos.
La manera (más bien, una de ellas):
- Abre la página con Chrome
- Abre Chrome DevTools (con control-mayúscula-c en algunas máquinas o a través de menús (Tools, etc.) siempre).
- Entra a la pestaña Network y selecciona XHR.
- Busca entre los distintos ficheros intercambiados: típicamente, los datos están en el fichero más voluminoso.
Hay variantes (p.e., el navegador puede estar haciendo una petición POST), pero como todos los lectores de este blog menos, que me conste, uno sois gente lista, seguro que dais con la manera.