Carlos J. Gil Bellosta

Voy a abundar sobre la entrada de hace unos días, ¿Informática o matemáticas?, una pregunta muy mal planteada, mostrando simplemente un ejemplo del tipo de cosas que se espera de los matemáticos y/o estadísticos cuando trabajan en ciencia de datos y para las cuales los informáticos no están particularmente mejor entrenados (de serie) que otras especies faunísticas.

Es este.

¿Cosas sobre las que podría hacer comentarios? Por ejemplo:

Tampoco sé si el matemático o estadístico promedio podría desenvolverse con mediana soltura con ese tipo de modelos. Y sí, cuando la sal se vuelve sosa, no es de extrañar que la tiren fuera y que la pise la gente.
Ese tipo de modelos no se usan y no porque no sean [más] adecuados [que otros]. No se usan, principalmente, por motivos que mi colega José Luis Cañadas expone en párrafos de su blog que suelen contener la palabra ingenazi.

He construido

que, obviamente no es la gran maravilla, basándome en Rectangular Statistical Cartograms in R: The recmap Package y usando

library(rgdal)
library(pxR)
library(recmap)

provs <- readOGR(dsn = "provincias/",
    layer = "Provincias")

pobl <- as.data.frame(read.px("2852.px",
    encoding = "latin1"), use.codes = T)
pobl2 <- as.data.frame(read.px("2852.px",
    encoding = "latin1"))

pobl$nombre <- pobl2$Provincias

pobl <- pobl[, c("Provincias", "nombre", "value")]
colnames(pobl) <- c("COD_PROV", "nombre", "poblacion")
pobl <- pobl[pobl$COD_PROV != "null",]

pobl <- pobl[!pobl$COD_PROV %in%
    c("51", "52", "38", "07", "35"),]


dat <- merge(provs, pobl,
    by = "COD_PROV", all.x = FALSE)
dat@data$NOM_PROV <- NULL
dat$z <- dat$poblacion

tmp <- as.recmap(dat)

tmp$name <- dat@data$nombre
tmp$ccaa <- dat@data$COD_CCAA

res <- recmapGA(tmp, popSize = 300,
    maxiter = 30, run = 10)

cartogram <- res$Cartogram

ccaa <- tmp[, c("name", "ccaa")]
ccaa$ccaa <- as.numeric(factor(ccaa$ccaa))
cartogram <- merge(cartogram, ccaa)

plot.recmap(cartogram, col.text = "black",
    main = "cartograma -- población\n  españa peninsular",
    col = cartogram$ccaa)

Como los datos los he bajado de por ahí y no recuerdo dónde, dejo como referencia el objeto arriba llamado tmp aquí.

Continúo con esto.

(El pico de primeros de agosto corresponde a la ola de calor).

Resumen:

Acusada variación intrasemanal (con un intevalo de variación del 5%, que es mucho).
Los intervalos de confianza de los nuevos modelos contienen mucho mejor las observaciones reales; muchos picos observados dejan de parecer anómalos para quedar dentro de las franjas de variación esperadas.

Dos noticias para la entrada de hoy:

En Economipedia han tenido a bien entrevistarme.
El jueves y viernes de la semana que viene impartiré sendas conferencias en Alicante dentro del ciclo Matemáticos en la Sociedad. Más información, aquí.

Es sabido que nacen menos niños en domingo, efecto, parece de la planificación de partos. Tengo cierto indicio, que voy a ver cuándo (y si) puedo corroborar, de que también hay menos fallecimientos. Mírese

que es una gráfica de mortalidad diaria en España y en la que, contumazmente, los días 2 de junio (domingo), 9 de junio (domingo) y 16 de junio (domingo), las observaciones quieren salirse de las bandas que para que no trotaran libérrimamente por el plano cartesiano construyó el bueno de Monsieur Poisson.

En vigilancia epidemiológica contamos eventos (p.e., muertes o casos de determinadas enfermedades). Lo que pasa es que el caso ocurrido en el día 0 puede notificarse con un retraso de 1, 2, 3… o incluso más días. En algunas aplicaciones, incluso semanas.

¿Cómo estimar el número de casos ocurridos el día 0 el día, p.e., 5?

Se puede aplicar el análisis de la supervivencia donde el evento muerte se reinterpreta como notificación. El el día 0 todos los sujetos están vivos y, poco a poco, van cayendo. Como en los consabidos modelos/gráficos de Kaplan-Meier,

Aviso: hoy incursiono en el minado campo de la sicología pop. Seguramente todo lo que escriba sea mentira, esté superadísimo o las dos cosas a la vez.

La entrada debe y bebe de un libro archiconocido. Si no lo has leído, no sé a qué esperas.

La entrada está motivada por otro libro que estoy leyendo, The Case Against Education, del que sospecho:

que dice la verdad en cada párrafo
para armar un argumento global falso.

Allá voy.

Dependiendo de con quién hables, la optimización (de funciones) es un problema fácil o difícil.

Si hablas con matemáticos y gente de la escuela de optim y derivados (BFGS y todas esas cosas), te contarán una historia de terror.

Si hablas con otro tipo de gente, la de los que opinan que el gradiente es un tobogán que te conduce amenamente al óptimo, el de la optimización no alcanza siquiera talla de problema.

De aquí a cuando lo tenga que usar realmente, seguro que me olvido. Así que retomo el uso original de este blog, que era el de dejarme notas a mí mismo y apunto: usa [flextable`](https://cran.r-project.org/package=flextable).

¿Y por qué?, me preguntaré a mí mismo dentro de unos días. Pues por cosas como esta:

(Claro está, salvo que alguien tenga a bien proponer una alternativa mejor).

, extraído de Verbal probabilities: Very likely to be somewhat more confusing than numbers, creo que es ya cultura general.

Pero me pregunto (y pregunto a mis lectores) si existirá algo parecido para el español. Que incluya, claro, expresiones del tipo “muy improbable”, etc. pero que se extienda también a otros métodos (que es la parte más interesante) de manifestar incertidumbre, como el uso del condicional (el PP recuperaría la alcaldía…) y otros que pueda haber.

Abundando en la discusión sobre matemáticas y/o informática

Cartogramas con recmap

Estacionalidad semanal de la mortalidad

Dos noticias: entrevista y cursos en Alicante

Mortalidad y domingos

Modelización de retrasos: una aplicación del análisis de supervivencia

Aprender deprisa, aprender despacio

Optimización: dos escuelas y una pregunta

Nota para mí: usar flextable, usar flextable

¿Existiría (la cosa de la que voy a hablar)? Lo veo muy poco probable