Los "mejores" paquetes de R (I): la red social de los participantes en r-help

Hace no mucho leí un articulillo de SAS sobre el impacto de ciertas marcas en determinadas redes sociales. Como este tema, así como sus posibles aplicaciones, siempre me ha intrigado, llevado de la curiosidad y del aburrimiento, decidí realizar un estudio análogo. El artículo de SAS utiliza como materia prima resúmenes de publicaciones científicas que tratan de determinados medicamentos. A los autores les interesa conocer de qué marca de medicamentos escribe cada autor ponderando a éstos últimos en función de su impacto. El impacto lo miden a través de su peso en la red de colaboraciones científicas: tiene alto impacto un autor que ha escrito muchos artículos en colaboración con otros autores que también han escrito muchos artículos. ...

18 de abril de 2010 · Carlos J. Gil Bellosta

Los mayas y la crisis

Tengo que pedir disculpas a mis lectores por el título de la entrada: reconozco que tiene un sí es no es de desesperado intento por captar tráfico a costa de los amigos de lo escatológico, tal vez interesados en averiguar qué nos sucederá a todos en el 2012. En realidad, el vínculo que establezco entre los mayas y la crisis actual tiene que ver con una relativamente reciente (re)visita mía a uno de esos museos en los que uno, a veces, ríe y, otras, llora como por dentro. En él me topé con una versión facsímil (¿por qué en los museos siempre debería haber originales?) de lo siguiente: ...

14 de abril de 2010 · Carlos J. Gil Bellosta

La opinión sobre R de una pobre señora

Me llegan noticias de una pobre señora que, se conoce, tiene un blog en el que habla de cosas que, da la impresión, le trascienden. Dice lo siguiente: Contrary to what some people seem to think, R is definitely not the next big thing, either. I am always surprised when people ask me why I think that, because to my mind it is obvious. Vamos, que no cree en R y que, además, esa idea suya le parece la más obvia del mundo. Para apoyar su argumento, muestra el siguiente ejemplo de código en R, supuestamente muy feo (más, de hecho, de lo que se imagina): ...

14 de abril de 2010 · Carlos J. Gil Bellosta

Google public data explorer

Participo últimamente en un proyecto dentro de un banco español bastante grande (sobre el que no abundaré ahora), que tiene como objetivo diseminar información financiera y comercial del mismo para los responsables de su dirección y gestión. La información de partida yace (nunca mejor dicho) en vetustos prodigios de la técnica de los años setenta y nuestro papel consiste en desenterrarla con herramientas y procedimientos más a la altura de los tiempos. ...

11 de abril de 2010 · Carlos J. Gil Bellosta

El censo del rey David y el castigo de Yahvé

A la vuelta de la Semana Santa, voy a escribir sobre una historia que leí en un librito muy recomendable de I.B. Cohen: El triunfo de los números. Imagino que mis lectores, más eruditos que yo, seguramente la conocerán de antiguo. La Biblia está plagada de números e incluso define en cierto punto el valor de pi como tres. También trae noticia de algunos censos realizados en el antiguo Israel/Judea. El más famoso de todos, supongo, es el que condujo a José y María a Belén. Pero el que comento en esta entrada no deja de tener su interés. ...

7 de abril de 2010 · Carlos J. Gil Bellosta

¿Puedo cambiar mi código retroactivamente?

La verdad, me gustaría, me gustaría volver atrás y modificar algunas docenas de líneas de código en R que malescribí como un diletante por no estar al tanto de una función de R cuya verdadera utilidad descubrí recientemente (gracias le sean dadas, de nuevo, a Jorge Iván Vélez). La verdad, no tengo excusa. Incluso se habló de ella en nuestro blog hermano. Y es que nunca me había percatado de la potencia de la función mapply. He aquí el problema: se tienen dos listas de la misma longitud y se quieren transformar los objetos de la primera en función de datos extraídos de los objetos correspondientes de la segunda. En los tiempos oscuros que duraron hasta anteayer, me veía abocado a utilizar un bucle que llevase la contabilidad del índice para poder recorrer ambas listas simultáneamente: ...

29 de marzo de 2010 · Carlos J. Gil Bellosta

Proyectos de R en el Google Summer of Code 2010

El Google Summer of Code es una iniciativa de Google por la cual la empresa otorga becas a estudiantes para que estos colaboren en determinados proyectos de código abierto. Y las becas no son moco de pavo: cada estudiante aceptado recibiría 5000 dólares de Google. En estas colaboraciones, los estudiantes participan bajo la tutela de un mentor. Se buscan, por tanto, mentores con proyectos y estudiantes que quieran participar en alguno de ellos. ...

28 de marzo de 2010 · Carlos J. Gil Bellosta

Una red social para usuarios y entusiastas de SAS

Es encomiable el esfuerzo realizado por SAS para crear una comunidad integrada de usuarios y entusiastas. Avanzando más allá de SAS-L, la lista de correo de los usuarios de SAS, se ha subido al carro de la Web 2.0 y ha creado un servicio abierto a la comunidad que tiene algo de red social: sasCommunity.org. Sus usuarios están invitados a subir sus propios documentos, crear páginas en la wiki y, por supuesto, contactar con otros usuarios. Además, SAS utiliza el portal para vehicular información acerca de congresos, eventos y publicaciones; divulgar información corporativa, etc. ...

27 de marzo de 2010 · Carlos J. Gil Bellosta

La varianza y cifras macroeconómicas

De la pobre varianza solo se acuerdan los vándalos: el historial de su página en la Wikipedia refleja la incesante actividad de unos cuantos desaprensivos empeñados en sustituir su definición o propiedades por declaraciones de amor perpetuo a sus novias circunstanciales u otras lindezas. De la varianza se acuerdan los vándalos, pero es ignorada por políticos, periodistas y quién sabe si también economistas. Ni aun estoy seguro de que de ella se acuerde el INE. El hecho es que las cifras macroeconómicas que se publican periódicamente (desempleo, crecimiento del PIB, etc.) nos son dadas como si de verdades reveladas se tratase y sin el muy conveniente aderezo de algún tipo de medida de su nivel de fiabilidad (varianza o similar). Luego, a toro pasado (en ocasiones, a toro lidiado, cocido en caldereta, comido, digerido con café, copa y puro y defecado), aparecen revisiones de las que ya nadie da cuenta. En fin. ...

21 de marzo de 2010 · Carlos J. Gil Bellosta

Leyendo tablas de SAS... sin SAS

No era atípico en aquella época en que SAS todavía se utilizaba como herramienta estadística que a uno le enviasen conjuntos de datos con la arcana extensión .sas7bdat, completamente imposibles de abrir con programa asequible alguno. Era una asombrosa manía dado que SAS (al igual que Excel) ni siquiera es compatible consigo mismo: los ficheros generados en SAS sobre Windows son incompatibles con los generados sobre UNIX, por ejemplo. Existe la posibilidad de exportar los datos desde SAS a un formato más abierto, interoperable y documentado que puede ser leído, por ejemplo, desde R. Pero para eso, de nuevo, hace falta tener acceso a SAS. ...

20 de marzo de 2010 · Carlos J. Gil Bellosta