Nuevo vídeo en YouTube: sobre el futuro a corto y medio plazos de la ciencia de datos como negocio en España

Un título tan largo amerita, como menos, un vídeo igualmente largo,

y un panel de lujo, que incluye a Luz Frías (Circiter), Pelayo Arbués (Idealista) y Alejandro Llorente (Piperlab).

El vídeo existe en lugar de no existir, aparte de por la amabilidad de los participantes en el debate, por la perplejidad que me causa el inesperado cambio de tendencia en el mercado (de la ciencia de datos en España), que ha pasado de un crudo invierno post-pandémico, en el que parecía que la inversión privada se retraía hasta el nihil, a una situación de desbordamiento.

Mi mapa provincial favorito

Mi mapa provincial de España favorito es este:

O, en una versión más cruda,

Cosas sobre él:

  • Forma parte de la colección de mapas que provee el INE para su uso con en infausto PCAxis y puede descargarse de aquí (junto con muchos otros, casi todos convencionales y aburridos, mapas de España, sus regiones, provincias y municipios).
  • Para facilitar su uso y, probablemente, infringiendo normas sobre la propiedad intelectual u otras, lo he colgado también aquí.
  • Como se puede apreciar, el mapa resuelve los problemas que plantean otros más fieles al territorio para la representación de información estadística. En particular, redimensiona algunas provincias para hacerlas visibles y, llegado el caso, clicables.
  • Tiene muchos, muchos detractores.

Lo de los detractores es una cosa extraña. Yo creo que son familia de alguien del rincón de Ademuz o del Condado de Treviño. Desde luego, gente que jamás ha cogido un metro. Los primeros planos del metro de Londres eran tal que

Nuevo vídeo en YouTube. Esta vez, sobre la falacia ecológica

Este vídeo está motivado por un comentario muy entrañable y fácil de pasar por alto que me llamó la atención en este artículo de ElDiario.es. En el fondo, los autores, se dan cuenta de que pueden estar incurriendo en la falacia ecológica, término que dudo que conozcan siquiera, y admirablemente, se percatan de que pisan terreno pantanoso y se curan en salud.

Eso me conduce a reflexionar sobre cómo y cuándo se conformó esa ideología (¿o liturgia?) de lo cuantitativo sobre la que no quiero decir nada más que lo que cuento en el vídeo:

Cournot sobre el "efecto Roseto", 120 años antes de tal

Esta entrada abunda sobre una de la semana pasada sobre el llamado efecto Roseto. El Cournot al que alude el titulo es el Cournot famoso (1801-1877) al que, a pesar de ser más conocido por sus aportaciones a la economía, debemos una Exposition de la théorie des chances et des probabilités de 1843.

En su párrafo 114 critica explícitamente el tipo de conclusiones a las que llegan los descuidados exégetas del asunto Roseto y que Stigler comenta así:

¿Viven más los ganadores de los Óscars (que otros actores no premiados)?

La respuesta es sí. Al menos, si haces caso a las principales cuñadofuentes que puedes encontrar buscando en Google sobre el asunto o el cuñadolibro que critiqué el otro día (y que, dicho sea de paso, ilustra el nivel de los sujetos a los que encomendamos la educación de las futuras generaciones patrias).

Pero la respuesta es no. Un estudio de esas características tiene un serio riesgo de selección efectivamente, para ganar un Óscar tienes que haber sobrevivido lo suficiente que el primer y descuidado estudio sobre el asunto no tuvo la precaución de corregir.

Sobre el llamado "efecto Roseto"

Escribí ya hace tiempo (aquí):

Relata lo ocurrido en un pueblo inglés en el que una noche, unos vecinos (presuntamente), descendientes sin duda de aquellos campesinos búlgaros que huían de la vacuna, echaron abajo una antena de telefonía móvil que tenía al pueblo en vilo (la historia, aquí). Porque, resulta, alrededor de ella se habían dado recientemente n casos de cáncer: aquello era un clúster de cáncer. Y puestos a buscar culpables, ¿por qué no el electromagnetismo?

PCA robusto

Esta semana he descubierto el PCA robusto. En la frase anterior he conjugado el verbo en cursiva porque lo he pretendido usar con un significado que matiza el habitual: no es que haya tropezado con él fortuitamente, sino que el PCA robusto forma parte de esa inmensa masa de conocimiento estadístico que ignoro pero que, llegado el caso, con un par de clicks, una lectura en diagonal y la descarga del software adecuado, puedo incorporarlo y usarlo a voluntad.

Todavía más sobre las proyecciones de población a largo plazo del INE

Ese es otro capítulo más de lo que se está convirtiendo en toda una saga en este blog: véase esto, esto, esto o los enlaces de todas esas entradas. El presente está motivado por parrafitos como

No obstante, en términos absolutos los aumentos se concentrarán, sobre todo, en la Comunidad de Madrid (donde residirán 614.049 personas más que ahora) […]

y otros del mismo cariz que pueden encontrarse en el documento España 2050 recientemente publicado.

Nuevo vídeo en YouTube: "¿Se pueden estimar probabilidades pequeñas con pocas observaciones?"

Acabo de subir un nuevo vídeo a Youtube,

en el que discuto dos problemas: uno, general, que es el que indica su título; y otro más concreto que es su motivación última: si es posible asegurar que la combinación de vacunas es segura a través de un estudio realizado con 600 sujetos, tal como el realizado por el ISCIII recientemente.

¿Por qué nos habremos acostumbrado a esto?

Recuerdo el escándalo que me produjo el siguiente modo de razonar estadístico en mi primerísima aproximación al asunto:

  • Hago un test de significancia (p.e., para ver si dos muestras tienen la misma varianza).
  • Si no es significativo, asumo que las varianzas son iguales.
  • Continúo con el test siguiente…

Salí de aquella clase pensando que los romanos estaban locos. Luego, por no ser el único que parecía circular en sentido contrario por la autopista, di por bueno pulpo como animal de compañía. Ahora observo el razonamiento con una mezcla de menosprecio y condescendencia. Pero aún siento, vívido como el primer día, el encontronazo con ese pseudoargumento lógico-matemático.