Podría ser Simpson, pero a lo mejor es "otra cosita"

Observo en The deadly effects of losing health insurance cómo el efecto de interés, 15% sobre una población se convierte en efectos del 16%, 23% y 30% en sus tres subpoblaciones (útimas columnas de la tabla que ocupa la página 25). Es raro que el efecto combinado no esté cerca de la media ponderada (por población) de cada uno de sus subcomponentes. Podría ser Simpson, pero hay motivos para pensar que hayan cambiado las proporciones de las poblaciones subyacentes (demasiado). Habría un efecto Simpson, por ejemplo, si se hubiese incrementado sustancialmente la proporción del grupo con el efecto (no confundir con la variación del efecto) globalmente más pequeño antes y después del tratamiento. Pero dudo que sea el caso. ...

4 de septiembre de 2018 · Carlos J. Gil Bellosta

Lo buscaba y aquí está

Lo buscaba (véase el último párrafo) y aquí está: The results show that levels of education have hardly any impact on the mortality rate.

3 de septiembre de 2018 · Carlos J. Gil Bellosta

Feliz verano (y nos vemos en septiembre)

Suelo interrumpir la publicación de entradas en agosto y este año no será excepción. No porque me vaya de vacaciones sino porque, según Google Analytics, os vais vosotros. Así que, en septiembre, más. Y cuidado con la ola de calor que se nos viene: decidles a vuestros mayores que beban mucha agua, etc. porque no los quiero ver aparecer en mi base de datos (de seguimiento diario de la mortalidad).

1 de agosto de 2018 · Carlos J. Gil Bellosta

¿Qué son esas líneas descendentes?

Pues son los tipos del impuesto de sociedades de los países de la OECD. Más info sobre la pendiente aquí.

31 de julio de 2018 · Carlos J. Gil Bellosta

El problema de la bella durmiente

Lee esto y luego opina: ¿1/2 o 1/3?

30 de julio de 2018 · Carlos J. Gil Bellosta

Como no podemos medir X, usamos Y; pero luego, en las conclusiones, no criticamos Y sino X

Ayer estuve leyendo un artículo (arg, y perdí la referencia; pero da igual para la discusión, porque es genérica) en el que trataba de atribuir diferencias de mortalidad a diversas causas: diabetes, tabaco, alcohol,… y SES (estado socioeconómico). El gran resultado más reseñable (por los autores) era que un SES bajo implicaba nosecuántos años menos de vida, incluso descontando el efecto del resto de los factores (y no recuerdo si estudiaban las correlaciones entre ellos, etc., como se debe en un estudio con pretensiones causales). ...

26 de julio de 2018 · Carlos J. Gil Bellosta

¿Por que slt-ear si puedes stR-ear?

La función stl (véase [aquí]/2018/07/23/suicidios-crisis-y-cambios-de-regimen-en-series-temporales/) un ejemplo de su uso) es fundamental en el estudio de las series temporales con R. Pero tiene sus limitaciones. El paquete stR la extiende y permite, entre otras cosas, introducir distintos tipos de estacionalidades (p.e., anuales y semanales). ¡Sea bienvenido!

25 de julio de 2018 · Carlos J. Gil Bellosta

La reedición del sueño de Laplace

Dejó escrito Laplace: Podemos mirar el estado presente del universo como el efecto del pasado y la causa de su futuro. Se podría concebir un intelecto que en cualquier momento dado conociera todas las fuerzas que animan la naturaleza y las posiciones de los seres que la componen; si este intelecto fuera lo suficientemente vasto como para someter los datos a análisis, podría condensar en una simple fórmula el movimiento de los grandes cuerpos del universo y del átomo más ligero; para tal intelecto nada podría ser incierto y el futuro, así como el pasado, estarían frente a sus ojos. ...

24 de julio de 2018 · Carlos J. Gil Bellosta

Suicidios, crisis, y cambios de régimen en series temporales

El capo de los diletantes, en declaraciones a El País, dijo: “Ellos no se habían dado cuenta y nosotros tampoco”, asegura Antonio Cabrera de León, autor principal del artículo del medio millón de muertos, que defiende la tesis principal de su trabajo: “Yo no tengo duda de que ha habido un incremento importantísimo de la mortalidad”. Y añade: “No negamos que haya un problema con los datos, que a lo mejor no son 500.000, puede variar en decenas de miles arriba o abajo”. Para Cabrera, director del área de Medicina Preventiva y Salud Pública de la ULL, no se puede negar que “los suicidios por los desahucios y las penurias están ahí”. ...

23 de julio de 2018 · Carlos J. Gil Bellosta

kamila: Clústering con variables categóricas

La codificación de las variables categóricas en problemas de clústering es la fuente de la mayor parte de los problemas con que se encuentran los desdichados que se ven forzados a aplicar este tipo de técnicas. Existen algoritmos que tratan de resolver el problema sin necesidad de realizar codificaciones numéricas. kamila es un paquete de R que implementa uno de ellos. El artículo que lo acompaña, A semiparametric method for clustering mixed data aporta los detalles, que en resumen son: ...

20 de julio de 2018 · Carlos J. Gil Bellosta