Vivimos en un mundo opaco e interconectado

Vivimos en un mundo opaco: como en los cuentecillos de Asimov, somos usuarios de tecnologías que ni conocemos ni controlamos. Parametrizamos nuestras máquinas y las echamos a correr. Poco más podemos hacer que fiarnos de quienes nos las proporcionan. Luego pasan cosas como que, de repente, resulta que Stan, en las últimas versiones, ha estado produciendo muestras sesgadas. ¿Qué resultados condicionará eso río abajo? Un caso mucho más famoso es el de la resonancia magnética (fMRI): un error en el software concomitante pone bajo sospecha hasta 40000 artículos sobre estudios del cerebro. Precisamente, por lo mismo. ...

17 de enero de 2017 · Carlos J. Gil Bellosta

Lo que pasa cuando omites la priori con variables categóricas

Stan. Modelo multinivel. Variable categórica. Codificación con ceros y unos. Matriz. Coeficiente vector[n_ccaa] Cccaa. Sin priori. Catástrofe: (Coeficientes hasta 15000. Sin tasa, con tiempo. Los valores desorbitados, en ceros de la dummy). Priori. for (i in 1:n_ccaa) Cccaa[i] ~ cauchy(0, 20); ¿Por qué no? Tachán: (¿Para qué verbos?)

12 de enero de 2017 · Carlos J. Gil Bellosta

Las conexiones telefónicas de Vodafone España, visualizadas con R

Me pasa un exalumno (no os perdáis su blog y su otro blog, especialmente si os interesa la versión friqui de la fotografía) de mi curso de R de KSchool, un gráfico que ha realizado con R para su empresa: Addenda: En los comentarios hay más enlaces relevantes (proporcionados por el autor de la imagen), que conducen al código, etc.

20 de diciembre de 2016 · Carlos J. Gil Bellosta

Problemas navideños de/con R

Acabo de sugerir a mis alumnos de KSchool una lista de problemas después de sus 10 primeras horas de contacto con R. Uno de ellos, advierto, y les he advertido (porque yo, no siendo rector de universidad pública alguna, no cuento el plagiar entre mis vicios) es una versión de otro publicado aquí. Ejercicio Construye una matriz que dada una entrada del tipo a <- c('NAME:Maria /COUNTRY:uruguay /EMAIL:mariaUY@gmail.com', 'NAME:Paul/COUNTRY:UK /EMAIL:PaulUK@gmail.com', 'NAME:Jhon /COUNTRY:USA /EMAIL:JhonUSA@gmail.com', 'NAME:Carlos /COUNTRY:Spain /EMAIL:CarlosSP@gmail.com') devuelva un tabla con columnas name, country y email (con los datos correspondientes). ...

19 de diciembre de 2016 · Carlos J. Gil Bellosta

Que la fuerza de R también te acompañe a ti (allá a donde haya datos)

La fuerza de R siepre me acompaña allá donde tengo datos. De ello da fe la siguiente captura de pantalla de mi móvil: Si quieres que también te acompañe a ti: Instálate telegram Conecta con teleR

13 de diciembre de 2016 · Carlos J. Gil Bellosta

Un muy cuestionable análisis de lo de PISA

Voy a realizar un más que cuestionable (debajo desgranaré los caveats) de los resultados de las pruebas PISA del 2015 en España. Primero, datos y métodos. Los primeros (y las descripciones de las variables) se pueden bajar de aquí. En cuanto a los segundos, he consultado esto (que me ha llevado a), esto y esto (donde está actualizado para los resultados de la última oleada). Hablaré más de métodos, y sus problemas, más abajo. ...

12 de diciembre de 2016 · Carlos J. Gil Bellosta

Análisis de la supervivencia cuando ningún sujeto ha muerto

Me ha sobrevenido un problema de análisis de supervivencia curioso: ningún sujeto ha muerto. Dicho de otra manera, todas mis observaciones están censuradas por la derecha. Los datos recogen la antigüedad de la cámara de fotos de los visitantes de cierto blog. Y debería uno poder estimar cada cuántos años renuevan la cámara, es decir, la vida promedio de esos aparatejos. Si embargo, no tenemos información de la edad de las cámaras en el momento de la renovación. Solo de su edad hoy. ¡Todas las observaciones están censuradas por la derecha! ...

28 de noviembre de 2016 · Carlos J. Gil Bellosta

Habiendo mónadas, ¿quién quiere callbacks?

Nunca me he visto en la tesitura de tener que usar callbacks porque no son mi guerra. Pero por lo que he oído de la gente que sabe mucho más que yo, son uno de esos infiernos de los que hay que huir con el mismo pavor que de los fors, los ifs, los elses (¡argggg! ¡he escrito else!) y los whiles. Una pequeña maravilla teórica que me ha hecho replantearme la absoluta inutilidad de aquello que estudié en Álgebra III (funtores y demás) son las mónadas. ...

24 de noviembre de 2016 · Carlos J. Gil Bellosta

Hoy no estaré donde debería: las VIII Jornadas de R

A la hora en que salga publicada esta entrada se estarán inaugurando las VIII Jornadas de Usuarios de R, las primeras a las que no asisto. Es por culpa de vaya uno a saber qué tipo de microorganismos, que han decidido medir sus fuerzas con la Seguridad Social en algún recoveco de mis vías urinarias, y que me han obligado a cancelar el viaje a última hora. Ha sido mi cita obligada del año durante los últimos ocho. Han sido ocasión de momentos memorables y han visto nacer grandes amistades. ...

17 de noviembre de 2016 · Carlos J. Gil Bellosta

Detrás de la detección de anomalías en series temporales

Por azares, me ha tocado lidiar con eso de la detección de anomalías. Que es un problema que tiene que ver con dónde colocar las marcas azules en El anterior es el gráfico construido con los datos de ejemplo del paquete AnomalyDetection. De hecho, así: library(AnomalyDetection) data(raw_data) res <- AnomalyDetectionTs(raw_data, max_anoms=0.02, direction='both', plot=TRUE) res$plot Aparentemente, AnomalyDetectionTs hace lo que cabría sospechar. Primero, una descomposición de la serie temporal, tal como myts <- raw_data$count myts <- ts(myts, start = c(1, 841), frequency = 24 * 60) plot(stl(myts, "per")) es decir, ...

16 de noviembre de 2016 · Carlos J. Gil Bellosta