Varios

Hay bulos, sí, pero la pregunta es: ¿qué hacer?

Ayer asistí a una charla, Pseudociencia en la red: la pandemia de bulos y rumores que nos amenaza en la que se habló mucho del qué (qué bulos circulan, dónde se ubican, cómo se difunden, etc.) un poco del quiénes (separando un nosotros, los racionales/racionalistas, de una masa de tamaño indefinido de gentes susceptibles a un pensamiento mágico) y casi nada del qué hacer. Así que formulé una pregunta que reproduzco aquí por si a alguien le apetece darle vueltas.

Reflexiones bayesianas al hilo del manido: "Independientemente de su ideología, los economistas suelen estar de acuerdo en que..."

Podría hacerse un ránking de disciplinas académicas según el grado de acuerdo entre quienes las cultivan. Supongo que lo lideraríamos los matemáticos. Salvo los constructivistas y esos raritos que dan por malo el axioma de elección, no contamos con familias heterodoxas. En el otro extremo, aventuro, se ubicarían los que hacen crítica literaria y políticas. Pero, seguro, dentro de las ciencias humanas, los economistas quedarían en bastante buen lugar.

Así que si aceptáis mis premisas (postmisas: vienen después), tendréis que conceder también que este fenómeno es corolario del teorema de von Mises:

Políticas y tarifas; medias y deciles

Aviso: Esta entrada es altamente, puramente especulativa.

Tiempo atrás, se tendía a ponderar el efecto de una política (p.e., la alteración de la tarifa de un servicio público o semipúblico) en términos de su impacto en un usuario medio. A lo Quetelet (en el mejor de los casos).

Ahora está más de moda medirlo en términos de su impacto en el decil mas desgraciadico. A lo maxmin rawlsiano (en el mejor de los casos).

Dónde están las letras

Inspirado en esto construí

usando como texto el Quijote y como código una versión mucho más simple y limpia que (aunque inspirado en) la del enlace original:

library(stringr)
library(plyr)
library(ggplot2)

raw <- readLines("http://www.gutenberg.org/cache/epub/2000/pg2000.txt")

# limpieza de encabezamientos
textfile <- raw[-(1:36)]
textfile <- text[1:which(text == "Fin")]

# en una única cadena
textfile <- paste(textfile, collapse= " ")

# limpieza
textfile <- str_to_lower(textfile)
textfile <- str_replace_all(textfile, "[[:punct:]]|[[:digit:]]", " ")

# selección de palabras
words <- unique(unlist(str_split(textfile, " ")))
words <- words[words != ""]

# recolección de estadísticas
res <- ldply(words, function(word){
  tmp <- str_split(word, "")[[1]]
  data.frame(word = word,
              letra = tmp,
              posicion = 1:length(tmp) / length(tmp),
              stringsAsFactors = FALSE)
})

tmp <- table(res$letra)
tmp <- names(tmp[tmp > 10])
res <- res[res$letra %in% tmp,]

ggplot(res, aes(x = posicion)) +
  geom_density(fill = "red") +
  facet_wrap( ~ letra, scales = "free_y") +
  ggtitle("Dónde aparece cada letra dentro de un texto (El Quijote)") +
  ylab("proporción de aparicion") + xlab("% de la longitud de la palabra") +
  scale_fill_brewer(palette = "Set1") + theme_minimal() +
  theme(axis.ticks = element_blank(),
        axis.text.y = element_blank(),
        axis.text.x = element_blank(),
        legend.position = "none",
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())

¡Terror! ¡Las máquinas nos van a quitar los trabajos! ¡Oh, oh, oh! ¡Uh, uh, uh!

Habréis leído por ahí relatos apocalípticoides sobre un futuro gris en el que las máquinas nos dejarán sin trabajo. Clic. Otra gente memos agorera opina que, más que trabajos, la máquinas eliminarán tareas (i.e., partes aburridas de los trabajos).

No voy a hablar de unas señoras, muy funcionarias ellas, clic, que conforman el Registro (con mayúscula) de cierta institución pública en la que tuve que depositar una factura impresa, firmada a mano y por duplicado recientemente. Y cuyo trabajo consiste en sellar la factura, meterla factura en la carpeta correspondiente, clic, y esperar a que un bedel la lleve al despacho donde seguirá el trámite. Hoy no.

¿Lo racional? Que jueguen a la lotería los demás

Yo mismo, lo confieso, he sido uno de los cenizos participantes en esa habitual letanía prenavideña sobre lo conveniente o no de comprar lotería en las que tanto se apela a la racionalidad. En una u otra dirección. Véase, cosecha de la campaña del año pasado, esto, esto, o, más tangencialmente, esto (y sus enlaces).

Cuando lo verdaderamente racional es hacer por que compren lotería, precisamente, los demás.

El fraude de Lemús aún adorna las memorias del CSIC

Un tal Lemús, del CSIC, hizo avanzar su carrera científica inventando datos hasta que lo pillaron. Hasta 13 retracciones lleva el pillo. En particular esta.

Que es relevante porque aún adorna la memoria del CSIC de 2010 (pág. 256) y suma a la lista de méritos (sección de publicaciones de alto impacto) de la institución en tal año.

¿Nadie edita ese tipo de cosas? ¿Ni por principios básicos de higiene?

Redes sin neutralidad de red que funcionan tan ricamente

Existen muchas redes de distribución. La red vial es una de ellas. La de pan, leche y huevos, otra. La de electricidad. La telefónica. Y la de paquetes de datos internet.

Prácticamente ninguna se rige por principios de neutralidad de red. En la viaria, no es solo que los vehículos no puedan circular por donde y cuando quieran, sino que existen restricciones como el carril bus, el Bus Vao, lo que se perpetra diariamente en la Gran Vía de Madrid durante el periodo navideño, etc. y se aplican excepciones para los vehículos eléctricos y los conducidos por gentes con habilidades distintas de otros o como quiera que se los denomine el año en que leas esto. Y se hace para que el tráfico sea más fluido y en pretendido beneficio de todos, no para lo contrario.

Mezcolanza: de INLA a GAM pasando por la frenología

Combino en uno cuatro asuntos demasiado prolijos para Twitter pero sobre los que no sé lo suficiente como para desarrollarlos en una entrada entera.

El paquete stpp de R tiene muy buena pinta para el análisis de conteos espacio-temporales. Se recomienda leer el artículo que lo describe. Para el tipo de problemas que plantea, se me habría ocurrido tirar de INLA. Desafortunadamente, a los autores del artículo no se les ocurrió compararlos. Cosas de la academia.

Antropocentrismo cansino

Es muy cansino. No hay debate sobre big data, inteligencia artificial o similar en el que no pase: de repente lo captura alguien (con pinta de no haber tirado una maldita línea de código en la vida) llevándoselo al tema con el que asustan a las porteras: ¡oh, oh, oh, la protección de datos!, ¡la nueva normativa europea! Que si Facebook sabe lo que hiciste, que si Google conoce tus amigos, que si…