Aquellos que ignoran la estadística etcétera

Ayer asistí a una charla sobre errors. Brevemente (porque está estupendamente explicado, motivado y documentado por su autor, al que aprovecho la ocasión para saludar), hace esto: library(errors) valores <- unlist(list(a = 1, b = 2, c = 3)) vars <- c(1, 1, 1) # varianzas de esos datos/medidas sds <- sqrt(vars) # errores x <- valores errors(x) <- sds format(x[1] * sin(x[2])^3, notation = "plus-minus", digits = 3) #[1] "0.75 +/- 1.28" Y nuestro viejo, clásico, manido, infrautilizado, semidesconocido mas no por ello menos querido método delta, ¿para qué existe en lugar de (como elucubraba el filósofo), simplemente, no existir? ¿Para qué otra cosa sino para aprenderlo me levanté yo aquella fría mañana del 94 sino para contemplarlo proyectado de diapositivas manuscritas de acetato? ¿Fue en vano? ...

24 de mayo de 2017 · Carlos J. Gil Bellosta

¡Doble llave al sepulcro de Gauss!

¿Hasta dónde creéis que estoy de que cuando se hace divulgación matemática en la prensa diaria vuelvan a reciclarse las manidas historias del Gauss jovencito sumando 1:100, de por dónde sacaba Euler a pasear el perro o de si es posible calcular una raíz cúbica con regla y compás? Si ha pasado algo interesante y de impacto en las matemáticas en los últimos tiempos (dentro de la última década, porfa), hágase el esfuerzo en replantearlo en términos asequibles y tráigase a la atención del lector. En cualquier caso, déjense esas historietas para los libritos de divulgación para adolescentes con ínsulas.

23 de mayo de 2017 · Carlos J. Gil Bellosta

Sentir números, sentir probabilidades

En El hombre anúmerico, J.A. Paulos discute el problema de la visualización (e italizo para indicar que ver no es el fin sino el medio para interiorizar y sentir) números, particularmente, grandes números. Sobre los no excesivamente grandes escribe, p.e., To cite some happier illustrations for smaller numbers, the standard I use for the lowly thousand is a section of Veterans Stadium in Philadelphia which I know contains 1,008 seats and which is easy to picture. The north wall of a garage near my house contains almost exactly ten thousand narrow bricks. For one hundred thousand, I generally think of the number of words in a good-sized novel. ...

22 de mayo de 2017 · Carlos J. Gil Bellosta

Me siento mal porque han sido muy majos conmigo y ahora no sé qué hacer con lo que me han mandado

Recibo esto en mi correo electrónico: RESOLUCIÓN DE LA GERENTE DE LA EMPRESA MUNICIPAL DE LA VIVIENDA Y SUELO DE MADRID S.A. POR LA QUE SE ADMITE PARCIALMENTE LA SOLICITUD DE ACCESO A LA INFORMACIÓN PÚBLICA EN EL EXPEDIENTE NÚM. 213/2017/00294 ANTECEDENTES DE HECHO PRIMERO.- Con fecha de entrada en el registro del Ayuntamiento de Madrid 16 de abril de 2017 y núm. de anotación 2017/0367535, se ha recibido solicitud formulada al amparo de la Ley 19/2013, de 9 de diciembre, de transparencia, acceso a la información pública y buen gobierno (LTAIP en adelante) por D Carlos Javier Gil Bellosta en la que solicita: ...

18 de mayo de 2017 · Carlos J. Gil Bellosta

Una proyección no es un número sino una distribución de probabilidad

Nos lo recuerda NeG. Aunque es un tema manido en estas páginas. Pero, ea, ea, ea, el INE no se entera. (Y es a ese tipo de cosas a la que me refiero implícitamente cuando digo, cada vez más frecuentemente, que España es un país de pueblo).

17 de mayo de 2017 · Carlos J. Gil Bellosta

¿Soy un dinosauRio? Sobre las novedades de R

Trato de estar abierto a lo nuevo. Tantos años soportando dinosaurios me han vacunado contra el conservadurismo tecnológico. De hecho, me produce arcadas. La experiencia, no obstante, me ha hecho permeable al efecto Lindy, lo que me da ocasión de saludar a mis amigos emaqueros. Las cosas cambian y en R estamos viviendo una especie de revolución. Mi argumento, para impacientes, es que: Es más superficial que sustancial: es azúcar sintáctico. En ciertos aspectos, no es positiva y mina ciertos principios valiosos que hicieron de R un lenguaje popular. Cuento todo esto a raíz de una reseña a un novedoso curso de R. Lo es en tanto que, dicen: ...

16 de mayo de 2017 · Carlos J. Gil Bellosta

Diapositivas sobre mi charla acerca del "stack analítico"

Tuve ocasión el pasado jueves, en Barcelona y gracias a la invitación de KSchool, de lo que llamo el stack analítico. Es decir, de aquellas herramientas tecnológicas necesarias para poder hacer ciencia de datos hoy en día. Las diapositivas de la charla están aquí. El tema es viejo pero no por ello menos urgente: existen herramientas (y, desgraciadamente, me he visto a incluir el saber leer documentación técnica en inglés) cuyo conocimiento es imperativo para poder trabajar de manera efectiva en ciencia de datos. Incluidos están sistemas operativos (dencentes), editores de texto (decentes) e IDEs y, como poco, un lenguaje de programación.

15 de mayo de 2017 · Carlos J. Gil Bellosta

Me too, me too!

Las alturas corresponden a una cierta potencia de la población residente en la correspondiente rejilla. Los datos son del SEDAC (Socioeconomic Data and Applications Center, Universidad de Columbia) y se pueden bajar gratis si te registras y rellenas un cuestionario tontaina. El código, library(ggplot2) options(expressions = 10000) dat <- read.table("dat/espp00ag.asc", skip = 6) dat <- as.matrix(dat) dat <- data.frame(y = as.numeric(row(dat)), x = as.numeric(col(dat)), pop = as.numeric(dat)) peninsula <- dat[dat$x > 200,] peninsula <- peninsula[peninsula$y < 250,] res <- ggplot() for (i in 1:max(peninsula$y)){ tmp <- peninsula[peninsula$y == i,] tmp$pop <- tmp$pop^0.3 res <- res + geom_polygon(data = tmp, aes(x = x, y = pop - y), fill = "white", col = "black", size = 0.1) res <- res + geom_path(data = tmp, aes(x = x, y = pop - y), size = 0.2) res <- res + geom_hline(data = tmp, aes(yintercept = -y), col = "white") } res + theme(axis.line=element_blank(), axis.text.x=element_blank(), axis.text.y=element_blank(), axis.ticks=element_blank(), axis.title.x=element_blank(), axis.title.y=element_blank(), legend.position="none", panel.background=element_blank(), panel.border=element_blank(), panel.grid.major=element_blank(), panel.grid.minor=element_blank(), plot.background=element_blank()) Nota: se me olvidó escribir en el cuerpo lo que anunciaba el título, i.e., que esta entrada está inspirada (fusilada, de hecho) en lo esencial de otras previas.

12 de mayo de 2017 · Carlos J. Gil Bellosta

Cosas de Twitter (y encuestas)

Hoy (día en que escribo, no en que lees) se han publicado los resultados de intención electoral del CIS (los de los barómetros), de cuya cocina ha salido Esos números han producido una avalancha de comentarios en Twitter sobre la ecuanimidad del CIS. Sobre todo en el sentido de que hincha los resultados de los partidos de la derecha. Nada nuevo bajo el sol. Los datos son de la primera semana de abril, del 1 al 8. Lo sorprendente es que con datos de los cinco primeros días del mismo mes, Celeste-Tel, publicó para eldiario.es, un medio de izquierda, ...

11 de mayo de 2017 · Carlos J. Gil Bellosta

¿Es Vd. de izquierdas o de derechas?

En una escala (de enteros) del 1 al 10, ¿cuál es el punto medio? ¿Cuál indicaría indiferencia entre ambas opciones? No, no es 5; es 5.5. Cuando el CIS, en sus barómetros, como el de abril, pregunta obtiene las respuestas en las que se aprecian fenómenos sesgantes como, por ejemplo: Toda esa gente que se define ni fú ni fá (véase el pico en el 5), va a elegir 5 pero ¿por qué no 6? El 5 está tan alejado del valor medio, 5.5, como 6. Si damos por bueno que la gente que no sabe calcular medias va a cosiderar 5 el valor neutro, quedan 4 casillas de izquierdas (1:4) y 5 de derechas (6:10). Como consecuencia de lo anterior, solo te dejan ser muy, muy, muy, muy de izquierdas pero no muy, muy, muy, muy, muy de izquierdas; pero sí muy, muy, muy, muy, muy de derechas. Es folk knowledge que España es un país sociológicamente de izquierdas. Y ese conocimiento está fundamentado en esa pregunta (y, obviamente, sus respuestas). ...

10 de mayo de 2017 · Carlos J. Gil Bellosta