Prioris informativas: un ejemplo

Imagina que tienes que generar (reitero: generar) datos compatibles con el siguiente modelo: Tienes n sujetos a los que se proporciona un remedio para dormir en distintas dosis (conocidas) en distintos días. El número adicional de horas que duerme cada sujeto es lineal con una pendiente que depende de la dosis (una serie de dosis fijas). Esa recta tiene un término independiente (el número de horas que duerme el sujeto con una dosis igual a cero del remedio). Argumento que para generar los términos independientes usarías algo así como una normal de media igual a 8 horas. Seguro que usarías alguna otra distribución razonable para las pendientes (p.e., que prohibiese que con dosis pequeñas se durmiese, p.e., 80 horas). ...

24 de mayo de 2018 · Carlos J. Gil Bellosta

Un generador de datos sintéticos para proteger la privacidad de los microdatados

DataSynthesizer (véase también el correspondiente artículo) es un programa en Python que: Toma una tabla de datos (microdatos, de hecho) que contiene información confidencial. Genera otra aleatoria pero que conserva (¿los conservará?) la estructura básica de la información subyacente (conteos, correlaciones, etc.). Está pensado para poder realizar el análisis estadístico de (determinados) datos sin verlos propiamente. Particularmente interesante es el algoritmo para preservar la correlación entre columnas. [Nota: he aprovechado la entrada para acuñar el neologismo microdatado para referirme a quien figura en un fichero de microdatos.] ...

23 de mayo de 2018 · Carlos J. Gil Bellosta

¿Existirá algún caso de uso de la estadística que no sea materia prima para la toma de decisiones informadas?

Estoy escribiendo unas notas muy punk sobre estadística. Desde cero. Hasta la luna. Pero que no se parecen en absoluto a nada de lo que he visto habitualmente escrito sobre la materia. Uno de sus capítulos, el primero, habla en general de la estadística. Abre con Statistics is a technology concerned with stochastic data generating systems (SDGS) for the purpose of making informed decisions. y el resto del capítulo desarrolla cada elemento de la frase (sí, qué es una tecnología, etc.). Sin embargo, lo más punk de la frase es el asunto de las decisiones. Porque, en el fondo, ejerciendo de estadístico, apenas se me ha encargado tener que tomarlas. Eran cosa de otros, de los que manejaban el presupuesto. ...

22 de mayo de 2018 · Carlos J. Gil Bellosta

El calendario chino como determinante en el sexo de los hijos

No a la hora en la que escribo esto pero, probablemente y por lo que me han dicho, sí a la hora en la que se publique esto, aparecerá en la revista Buena Vida de El País un artículo en el que se me menciona como experto y que se refiere a lo que encabeza esta entrada. Por si las necesarias ediciones y por su valor intrínseco, reproduzco aquí (casi) íntegro el correo que he enviado a la autora: ...

17 de mayo de 2018 · Carlos J. Gil Bellosta

Casos de uso de MicroDatosEs

MicroDatosEs ha sufrido algunas modificaciones recientes. En particular, un nuevo colaborador, Jorge López Pérez ha reescrito la documentación usando roxygen2`. Pero falta una cosa importante (sobre todo, para el usuario esporádico): casos de uso. En la página del paquete (el README.md de Github) he añadido una sección de ejemplos de uso de funciones del paquete, que actualmente solo tiene un enlace. Pero si alguien ha hecho o conoce algún otro ejemplo, y me lo puede comunicar, lo añadiré muy gustosamente (y quedaré muy agradecido). Eso sí, por concretar ideas: ...

16 de mayo de 2018 · Carlos J. Gil Bellosta

gam vs rrff (y, en general, modelos generativos vs cajas negras)

Para modelizar una serie temporal, y simplificándolo mucho, ¿gam o rrff? Como todo, depende. El otro día oí de un caso en el que los segundos vencían a los primeros claramente. Natural. Hay contextos con una estructura matemática clara y potente. En particular, muchos en los que trabajo actualmente. ¿Para qué usar una herramienta genérica cuando cuento con una específica? Esos datos, mis datos, exigen estructura matemática. Luego hay otros casos en los que uno se lanza al río. Luego uno siempre quiere invertir el proceso y ver qué carajos está ocurriendo con los datos (véase esto). ...

15 de mayo de 2018 · Carlos J. Gil Bellosta

"Democratic people's republic" de algo que empieza por ge

Hay gente que es del parecer de que existen contubernios sanitarios (constituidos por empresas farmacéuticas y profesionales de la salud conchabados con ellos) que proceden de la siguiente manera: Tratan de convencernos de que determinados rasgos de la personalidad son patológicos. Cuando lo consiguen, recetan sus remedios químicos para sanarlos. Alguien gana mucha pasta. Con esto de la GDPR pasa algo parecido: Tratan de convencernos de que cuando subimos fotos de nuestro gato a internet, en realidad, alguien nos está robando las fotos de nuestro gato. Se sacan de la manga la GDPR. Alguien va a ganar mucha pasta. Ni un solo bien, ni un solo servicio va a generar la GDPR. Al puro estilo lampedusiano, todo va a cambiar para que todo quede igual (ya lo veréis). Solo que engordará la superestructura, se engrosarán los rangos de los parásitos de corbata y todo será un poquito más lento, un poquito más difícil y un poquito más caro.

14 de mayo de 2018 · Carlos J. Gil Bellosta

CIS, ideología, gráficos y, sí, este blog

Si no estáis suscritos a @politibot en Telegram, hacedlo (y si no usáis Telegram, hacedlo también). Hoy hablanban del último barómetro del CIS y han tenido la gentileza de mencionarme: La entrada a la que hacían referencia es esta (a la que tal vez alguien, a quien le corresponda y dada su importancia, debería sacar más punta). No obstante, el mismo episodio de @politibot incluía que es un gráfico que, cuanto más miro, menos entiendo: ¿qué barras son las que deben sumar 100%? Ni idea.

11 de mayo de 2018 · Carlos J. Gil Bellosta

gam/bam admiten efectos aleatorios

gam/bam admiten efectos aleatorios gam/bam admiten efectos aleatorios gam/bam admiten efectos aleatorios gam/bam admiten efectos aleatorios gam/bam admiten efectos aleatorios gam/bam admiten efectos aleatorios gam/bam admiten efectos aleatorios Y solo me enteré anoche (gracias a José Luis Cañadas). (Para más detalles, esto o esto).

10 de mayo de 2018 · Carlos J. Gil Bellosta

Curso (mío) de estadística bayesiana aplicada con Stan en BCN

A primeros de julio (de 2018) impartiré un curso de 15 horas de estadística bayesiana aplicada con Stan en la UPC (Barcelona). La información relevante está aquí y aquí. El proyecto y su definición es un tanto contradictorio en sus propios términos, lo reconozco. Es muy difícil hacer algo aplicado y, a la vez, bayesiano. Y más, con Stan. Además, podrían acusarme de hipócrita: ¿cuándo fue la última vez que facturé (recuérdese: facturable es el grado máximo de aplicado) por algo hecho con Stan? Porque la idea, en el fondo, es otra: esencialmente, cómo replantear modelos y estrategias de modelización, aunque se implenten con herramientas métodos de índole frecuentista, para enriquecerlos con la visión bayesiana. ...

9 de mayo de 2018 · Carlos J. Gil Bellosta