El casco y las bicis: no porque no

Vaya por delante que: monto y me traslado en bici por Madrid siempre que razonablemente puedo (que son las menos de las veces) simpre uso casco (más que por la improbable protección que pueda darme, por poder reforzar el alegato, en caso de incidente, de que soy un ciudadano responsable) tengo en el cuerpo dos cicatrices de más y otros tantos dientes de menos a resultas de diversos accidentes no tengo tiempo de discurrir cuál sería mi postura sobre la prohibición de circular en bici sin casco: es asunto que no me afecta en absoluto por lo arriba indicado. Sentado lo cual, entro en materia. Y es la del aburridor y artificial debate que se crea siempre que ...

29 de abril de 2013 · Carlos J. Gil Bellosta

Todo lo que Vd. siempre quiso saber sobre la EPA (etc.)

¿A quién considera la EPA «con trabajo»? Esencialmente, a aquellas personas que durante la semana de referencia hayan trabajado, incluso de forma esporádica u ocasional, al menos una hora a cambio de un sueldo, salario u otra forma de retribución conexa, en metálico o en especie. También se suman a la lista aquellas personas que, aunque no hayan trabajado durante esa semana, mantengan un estrecho vínculo con su puesto de trabajo (por ejemplo, porque están de vacaciones o disfrutan de una baja médica). ...

26 de abril de 2013 · Carlos J. Gil Bellosta

¿Leemos "Analyzing Linguistic Data" juntos?

Victor Peinado y yo estamos organizando un grupo de lectura. Junto con quienes se nos sumen, vamos a ir leyendo el libro Analyzing Linguistic Data: A practical introduction to Statistics, que trata de: R (instalación, gráficos, etc.) Métodos estadísticos con R (modelos lineales, clústering, clasificación, modelos mixtos) Lingüística (que es el contexto en el que se aplica lo anterior). La participación en este grupo está indicada para quienes tengan interés en las aplicaciones lingüísticas de la estadística (y de R, por supuesto). Y muy particularmente para esos lingüistas que se han encontrado con que su disciplina (o grandes partes de ella), cada vez más, está dejando de ser de letras. ...

24 de abril de 2013 · Carlos J. Gil Bellosta

Pero mañana seguiremos usando Excel

Inmerso en asuntos que los más catalogarían de friquis, he permanecido ignorante de los más de los infelices sucesos que nos ha regalado el mundo durante los últimos días. Pero sí que he tenido ocasión de enterarme de algo de ese runrún, imagino que conocido de los más, sobre unos economistas encopetados que usanban Excel (y unos economistas muy encopetados). Noticia que se suma a otra que guardaba para comentarla un día: cómo JP Morgan estuvo calculando su VaR erróneamente durante años por los mismos motivos. ...

23 de abril de 2013 · Carlos J. Gil Bellosta

Demanda y uso de gobierno abierto en España

Traigo a la consideración de mis lectores el Estudio de demanda y uso de gobierno abierto en España que con fecha de primeros de este año ha realizado el Observatorio Nacional de las Telecomunicaciones y otros asuntos afines. Aborda, dice, las siguientes cuestiones que copio: La visión de la ciudadanía sobre la administración pública. La valoración que hace de los servicios públicos. El uso de la Administración Electrónica. La importancia que concede a las actuaciones en materia de transparencia, participación y colaboración. Las demandas más relevantes sobre transparencia y participación. Los principales resultados que dice encontrar son: ...

22 de abril de 2013 · Carlos J. Gil Bellosta

Más sobre la ley de Benford (I): una condición suficiente

Las circunstancias —frente a las que soy dócil como el que más— me conducen a escribir de nuevo sobre la Ley de Benford. En concreto, voy a traer a la atención de mis lectores una condición suficiente para que se cumpla. Y de ella extraeremos conclusiones tal vez sorprendentes en sucesivas entradas de la serie que con esta inicio. Dado un número (p.e., 1234), lo podemos descomponer en dos: una potencia de 10 y otro entre 0 y 10: ...

16 de abril de 2013 · Carlos J. Gil Bellosta

"Tu tasa de paro" en Medialab Prado

El martes (2013-04-15 en formato ISO 8601) participaré en el II Barcamp de Periodismo de Datos en Medialab Prado de 5:00 a 8:00 de la tarde. Hablaré de Tu Tasa de Paro, proyecto del que ya hablé en otra ocasión. Y aprovecharé, claro está, para promocionar R y, en particular, el paquete MicroDatosEs. ¡Estáis invitados!

15 de abril de 2013 · Carlos J. Gil Bellosta

Un plan de acción para extender el ámbito de la estadística

Ya es un poco viejo: tiene 12 años. Pero su contenido es de lo más actual. Se trata de un artículo de Cleveland titulado Data Science: An Action Plan for Expanding the Technical Areas of the Field of Statistics que se plantea extender el ámbito de acción de la estadística (tradicional) a nuevas áreas (emergentes entonces) y cuyo objetivo es definir un conjunto de contenidos que deberían conformar el bagaje del analista de datos (hoy lo llamaríamos científico de datos o data scientist). ...

9 de abril de 2013 · Carlos J. Gil Bellosta

Mapa de los terremotos en la península ibérica

Me sorprendió hace un tiempo averiguar que en la península ibérica hubiese tantos terremotos (aunque mis amigos chilenos los llamarían de otra manera). En esta entrada voy a mostrar el siguiente mapa de actividad sísmica durante los últimos años, que he construido con el siguiente código en R: library(ggmap) url <- "http://comcat.cr.usgs.gov/earthquakes/feed/search.php?maxEventLatitude=45&minEventLatitude=35&minEventLongitude=-10&maxEventLongitude=5&minEventTime=953683200000&maxEventTime=1364688000000&minEventMagnitude=-1.0&maxEventMagnitude=10&minEventDepth=0.0&maxEventDepth=800.0&format=csv" terremotos <- read.csv(url) # obtengo un mapa pen.iber <- get_map( location = c(-9.5, 36, 3.5, 44), color = "color", maptype = "roadmap") # le añado puntos ggmap(pen.iber) + geom_point(aes(x = Longitude, y = Latitude, size = Magnitude), data = terremotos, colour = 'red', alpha = 0.2)

8 de abril de 2013 · Carlos J. Gil Bellosta

textConnection y ficheros anónimos: cuestión de rendimiento

La función textConnection de R es útil para leer el contenido de una variable como si fuese un fichero de texto. Verbigracia, zz <- textConnection(LETTERS) readLines(zz, 2) Pero cuando uno hace ?textConnection y lee con detenimiento, encuentra la siguiente nota: As output text connections keep the character vector up to date line-by-line, they are relatively expensive to use, and it is often better to use an anonymous file() connection to collect output. Vamos, que desaconseja usar dicha función por motivos de rendimiento cuando no vayan a usarse todas las sus características de las que file carece. Pero, ¿será cierto que el rendimiento es tan malo? Y de serlo, ¿cómo usar file? ...

4 de abril de 2013 · Carlos J. Gil Bellosta