Evolución de la resistencia al calor

En 2003 hubo una ola de calor de tal magnitud que el ministerio de sanidad puso en marcha un plan especial de seguimiento, prevención, monitorización, etc. de ese tipo de fenómenos.

La hipótesis que me propongo explorar aquí es la siguiente: que gracias a la prevención, a la popularización del aire acondicionado, a la mejora del nivel de vida, etc. el impacto del calor (en forma de olas) sobre la mortalidad decrece en el tiempo. Casi ninguno de vosotros podéis estudiarla, pero yo sí. No os puedo contar los detalles pero sí las líneas generales del estudio.

Prioris informativas: un ejemplo

Imagina que tienes que generar (reitero: generar) datos compatibles con el siguiente modelo:

  • Tienes n sujetos a los que se proporciona un remedio para dormir en distintas dosis (conocidas) en distintos días.
  • El número adicional de horas que duerme cada sujeto es lineal con una pendiente que depende de la dosis (una serie de dosis fijas).
  • Esa recta tiene un término independiente (el número de horas que duerme el sujeto con una dosis igual a cero del remedio).

Argumento que para generar los términos independientes usarías algo así como una normal de media igual a 8 horas. Seguro que usarías alguna otra distribución razonable para las pendientes (p.e., que prohibiese que con dosis pequeñas se durmiese, p.e., 80 horas).

Un generador de datos sintéticos para proteger la privacidad de los microdatados

DataSynthesizer (véase también el correspondiente artículo) es un programa en Python que:

  1. Toma una tabla de datos (microdatos, de hecho) que contiene información confidencial.
  2. Genera otra aleatoria pero que conserva (¿los conservará?) la estructura básica de la información subyacente (conteos, correlaciones, etc.).

Está pensado para poder realizar el análisis estadístico de (determinados) datos sin verlos propiamente.

Particularmente interesante es el algoritmo para preservar la correlación entre columnas.

[Nota: he aprovechado la entrada para acuñar el neologismo microdatado para referirme a quien figura en un fichero de microdatos.]

¿Existirá algún caso de uso de la estadística que no sea materia prima para la toma de decisiones informadas?

Estoy escribiendo unas notas muy punk sobre estadística. Desde cero. Hasta la luna. Pero que no se parecen en absoluto a nada de lo que he visto habitualmente escrito sobre la materia. Uno de sus capítulos, el primero, habla en general de la estadística. Abre con

Statistics is a technology concerned with stochastic data generating systems (SDGS) for the purpose of making informed decisions.

y el resto del capítulo desarrolla cada elemento de la frase (sí, qué es una tecnología, etc.). Sin embargo, lo más punk de la frase es el asunto de las decisiones. Porque, en el fondo, ejerciendo de estadístico, apenas se me ha encargado tener que tomarlas. Eran cosa de otros, de los que manejaban el presupuesto.

El calendario chino como determinante en el sexo de los hijos

No a la hora en la que escribo esto pero, probablemente y por lo que me han dicho, sí a la hora en la que se publique esto, aparecerá en la revista Buena Vida de El País un artículo en el que se me menciona como experto y que se refiere a lo que encabeza esta entrada.

Por si las necesarias ediciones y por su valor intrínseco, reproduzco aquí (casi) íntegro el correo que he enviado a la autora:

Casos de uso de MicroDatosEs

R

MicroDatosEs ha sufrido algunas modificaciones recientes. En particular, un nuevo colaborador, Jorge López Pérez ha reescrito la documentación usando roxygen2`.

Pero falta una cosa importante (sobre todo, para el usuario esporádico): casos de uso.

En la página del paquete (el README.md de Github) he añadido una sección de ejemplos de uso de funciones del paquete, que actualmente solo tiene un enlace. Pero si alguien ha hecho o conoce algún otro ejemplo, y me lo puede comunicar, lo añadiré muy gustosamente (y quedaré muy agradecido). Eso sí, por concretar ideas:

gam vs rrff (y, en general, modelos generativos vs cajas negras)

Para modelizar una serie temporal, y simplificándolo mucho, ¿gam o rrff? Como todo, depende. El otro día oí de un caso en el que los segundos vencían a los primeros claramente. Natural.

Hay contextos con una estructura matemática clara y potente. En particular, muchos en los que trabajo actualmente. ¿Para qué usar una herramienta genérica cuando cuento con una específica? Esos datos, mis datos, exigen estructura matemática.

Luego hay otros casos en los que uno se lanza al río. Luego uno siempre quiere invertir el proceso y ver qué carajos está ocurriendo con los datos (véase esto).

"Democratic people's republic" de algo que empieza por ge

Hay gente que es del parecer de que existen contubernios sanitarios (constituidos por empresas farmacéuticas y profesionales de la salud conchabados con ellos) que proceden de la siguiente manera:

  • Tratan de convencernos de que determinados rasgos de la personalidad son patológicos.
  • Cuando lo consiguen, recetan sus remedios químicos para sanarlos.
  • Alguien gana mucha pasta.

Con esto de la GDPR pasa algo parecido:

  • Tratan de convencernos de que cuando subimos fotos de nuestro gato a internet, en realidad, alguien nos está robando las fotos de nuestro gato.
  • Se sacan de la manga la GDPR.
  • Alguien va a ganar mucha pasta.

Ni un solo bien, ni un solo servicio va a generar la GDPR. Al puro estilo lampedusiano, todo va a cambiar para que todo quede igual (ya lo veréis). Solo que engordará la superestructura, se engrosarán los rangos de los parásitos de corbata y todo será un poquito más lento, un poquito más difícil y un poquito más caro.

CIS, ideología, gráficos y, sí, este blog

Si no estáis suscritos a @politibot en Telegram, hacedlo (y si no usáis Telegram, hacedlo también).

Hoy hablanban del último barómetro del CIS y han tenido la gentileza de mencionarme:

La entrada a la que hacían referencia es esta (a la que tal vez alguien, a quien le corresponda y dada su importancia, debería sacar más punta).

No obstante, el mismo episodio de @politibot incluía

que es un gráfico que, cuanto más miro, menos entiendo: ¿qué barras son las que deben sumar 100%? Ni idea.

gam/bam admiten efectos aleatorios

R

gam/bam admiten efectos aleatorios

gam/bam admiten efectos aleatorios

gam/bam admiten efectos aleatorios

gam/bam admiten efectos aleatorios

gam/bam admiten efectos aleatorios

gam/bam admiten efectos aleatorios

gam/bam admiten efectos aleatorios

Y solo me enteré anoche (gracias a José Luis Cañadas).

(Para más detalles, esto o esto).

Curso (mío) de estadística bayesiana aplicada con Stan en BCN

A primeros de julio (de 2018) impartiré un curso de 15 horas de estadística bayesiana aplicada con Stan en la UPC (Barcelona). La información relevante está aquí y aquí.

El proyecto y su definición es un tanto contradictorio en sus propios términos, lo reconozco. Es muy difícil hacer algo aplicado y, a la vez, bayesiano. Y más, con Stan. Además, podrían acusarme de hipócrita: ¿cuándo fue la última vez que facturé (recuérdese: facturable es el grado máximo de aplicado) por algo hecho con Stan? Porque la idea, en el fondo, es otra: esencialmente, cómo replantear modelos y estrategias de modelización, aunque se implenten con herramientas métodos de índole frecuentista, para enriquecerlos con la visión bayesiana.

Colaboración con adversarios

¿Debe usarse casco para circular con bici por las ciudades? Pues la respuesta, incluso la data driven, depende a quién leas. Ídem con cualquier otro asunto.

Por eso es relevante la propuesta de colaboración con adversarios. Que se resume en:

  • Dos personas con visiones opuestas sobre un tema se proponen colaborar en la redacción de un estudio.
  • Cada una de ellas se responsabiliza, pues, de aportar todo tipo de estudios y evidencia al respecto, cuidando de no omitir, por la cuenta que tiene, la más relevante para hacer prevalecer punto de vista.
  • Finalmente, desarrollan una síntesis conjuntamente.

De alguna manera, este procedimiento subcontrataría en los autores del estudio el esfuerzo que hoy en día se delegan en el lector interesado: recopilar opiniones y estudios encontrados para poder llegar al momento de la síntesis. Con los problemas que plantea la asimetría de información (uno tal vez no sea experto en la materia y menos aún en la visión que del asunto tienen tirios y/o troyanos), el sesgo debido a la disponibilidad de datos, su desigual accesibilidad, etc.

Liberalismo: los axiomas y sus corolarios

Una malhadada fisura en la rótula me ha tenido boca arriba más horas de las habituales durante el último mes. Por evitar el aburrimiento, no me ha quedado otra que interponer una tableta entre cara y techo de la que leer más o menos desordenadamente. Uno de los volúmenes que ha devorado mi sobrevenida afición por la lectura ha sido Liberalismo, de von Mises.

[Llegado a este punto, me ha dado la sensación de tener que justificar por qué he leído ese y no otro libro. Pero también he sentido que debía hacerlo como si me hubiesen visto apropiándome de unas cremas en un supermercado o saliendo de un lupanar. Así que he optado por no hacerlo, decir que lo he leído porque me ha dado la gana y mandar a quien le parezca mal a freír churros.]