¿Cómo pensar en la probabilidad de un evento?

[Esta entrada lo es, además de por su propio mérito, en preparación de la que habrá de ocurrir mañana o pasado.]

Así:

My father, Leonard Jimmie Savage, was an early advocate of subjective probability. He encouraged me from a young age to think of the probability of an event as the amount I would pay for a gamble that would pay $100 if the event occurred.

Sam Savage, 2004 (fuente)

En defensa de Simón: variaciones diarias de la mortalidad

Qué cafres tenéis que ser para que tenga que salir yo —precisamente yo, que tantas cosas no buenas tengo para decir del buen hombre— en defensa de Simón. Tiene delito que de todo lo que se le pueda echar en cara os hayáis fijado en una intervención en la que os trataba de desasnar para que no le anduviéseis buscando tres pies a la varianza.

Es un tema que vengo tratando de antiguo en estas páginas y de ello dan fe:

Cuando sea mayor, quiero escribir informes como esos

Ayer buscaba información sobre la historia de la sanidad española y de la pública en particular. Quería averiguar por qué acabamos con un sistema britanoide en lugar del centroeuropeo:

Aún tengo pendiente averiguar el motivo. Pero por el camino di con esto y gracias a ello, con el Euro Health Consumer Index y sus correspondientes informes anuales, escritos con una fina ironía. No hay que ir más allá de la primera frase del de 2018 para encontrar el primer ejemplo (las cursivas son del original):

¿Agregar antes de modelar?

El otro día me pasaron unos datos artificiales para poder probar el ajuste de cierto tipo de modelos. El autor de la simulación construyó tres conjuntos de pares (x,y) y luego los agregó (media de los y agrupando por x) antes de proporcionármelos.

¿Tiene sentido agregar antes de modelar? Incluso sin entrar en el problema del potencial número desigual de observaciones por punto (datos desbalanceados) o las heterogeneidades entre las distintas iteraciones (que nos llevaría al mundo de los modelos mixtos).

Lo que queda cuando has eliminado tantas cosas que ya no se entiende nada se llama "paper"

Para un observador externo objetivo, eso que llaman ciencia es un conjunto de tinglados absolutamente intrascendente en para su día a día que opera de acuerdo con un sistema torcido de incentivos orquestados alrededor de una suerte de moneda ficticia que se llama paper que permite acumular avatares de todo tipo.

Esa economía ficticia mantiene nexos con la real. Por ejemplo, una acumulación suficiente de papers genera un avatar llamado sexenio que genera euros contantes y sonantes mes a mes en la cuenta corriente de quien lo ostenta. En ocasiones, también, los partícipes de ese enorme Monopoly pagan euros contantes y sonantes a terceros a condición de que estos elaboren papers (o partes significativas de ellos) para poder así firmarlos y canjearlos en el mercado de los avatares.

Coronavirus cualitativo

Una de las pocas cosas rescatables de la antigua dialéctica es aquella ley de la transformación de los cambios cuantitativos en cualitativos.

Lo cuantitativo en estos tiempos del coronatirus se ha convertido en una especie de caza de pokemones, con cifras que suben y bajan, concienzudas exégesis de la varianza y todo tipo de medias verdades.

Pero es inevitable que los números, sean cuales sean realmente, cuajen cambios cualitativos mucho más rotundos y cuestionables. De todos ellos, voy a rescatar unos cuantos a los que he estado dando vueltas estos días pasados.

Wikipedia y causas de muerte

Es entretenido echar un vistazo a las causas de muerte más comunes (y todavía más, a las más raras) de la gente que aparece en la Wikipedia (y que tiene una causa de muerte informada en la caja lateral). Son estas.

Se puede jugar más con el asunto corriendo

select ?cod (count(distinct ?who) as ?count)
where {?who <http://dbpedia.org/ontology/deathCause> ?cod.}
order by desc(?count)

y sus variantes aquí.

Movimientos brownianos y barreras

En Hypermind se está planteando esta cuestión:

A día de hoy, el S&P 500 está en 2830. La predicción está y viene estando aproximadamente alrededor de la regla de tres:

$$ \frac{s - 2000}{3000 - 2000} \times 100%$$

donde $latex s$ es la cotización del índice.

Y aquí vienen dos preguntas/ejercicios para mis lectores:

  • Suponiendo que el S&P 500 se comportase como un movimiento browniano (sin drift), ¿sería precisa la regla anterior?
  • ¿Y si los saltos no fuesen normales sino, p.e., de acuerdo con una t de Student?

¿42.000 muertes por coronavirus? Una corrección de la heterogeneidad

Publica hoy (cuando escribo) El Confidencial el artículo 42.000 muertes por covid: un estudio eleva la mortalidad un 76% sobre la cifra oficial citando el Estudio del exceso de mortalidad motivado por pandemia de Covid-19 de unos ingenieros de la UPM que corrige al alza los números de MoMo.

El resumen es simple: MoMo no recoge todas las defunciones, solo las de los registros civiles informatizados. Aunque la cobertura sea del ~95% de la población española, hay diferencias grandes por CCAA (y aún más, aunque no haya cifras públicas al respecto, por provincia). Además, sucede casualmente que la cobertura es menor precisamente en las CCAA más afectadas. Ergo una regla de tres aplicada comunidad a comunidad, arroja necesariamente una estimación sustancialmente más elevada que las publicadas hasta la fecha.

Sobre lo de "publicar cuando ya no hace falta"

El otro día escribí (véase también esto):

Y mirad:

La lista de la vergüenza: los municipios con registros civiles no informatizados

[Nota: la lista pudiera contener errores. Se ha extraído de un sistema de la informatización o no de los registros civiles está deducida indirectamente.]

Se ha hablado últimamente de las discrepancias entre los datos de mortalidad del INE y de MoMo y creo que a estas alturas del partido ya sabemos casi todos que se deben a que el segundo sistema solo se nutre de datos de los registros civiles informatizados.