Una red social para usuarios y entusiastas de SAS

Es encomiable el esfuerzo realizado por SAS para crear una comunidad integrada de usuarios y entusiastas. Avanzando más allá de SAS-L, la lista de correo de los usuarios de SAS, se ha subido al carro de la Web 2.0 y ha creado un servicio abierto a la comunidad que tiene algo de red social: sasCommunity.org. Sus usuarios están invitados a subir sus propios documentos, crear páginas en la wiki y, por supuesto, contactar con otros usuarios. Además, SAS utiliza el portal para vehicular información acerca de congresos, eventos y publicaciones; divulgar información corporativa, etc. ...

27 de marzo de 2010 · Carlos J. Gil Bellosta

La varianza y cifras macroeconómicas

De la pobre varianza solo se acuerdan los vándalos: el historial de su página en la Wikipedia refleja la incesante actividad de unos cuantos desaprensivos empeñados en sustituir su definición o propiedades por declaraciones de amor perpetuo a sus novias circunstanciales u otras lindezas. De la varianza se acuerdan los vándalos, pero es ignorada por políticos, periodistas y quién sabe si también economistas. Ni aun estoy seguro de que de ella se acuerde el INE. El hecho es que las cifras macroeconómicas que se publican periódicamente (desempleo, crecimiento del PIB, etc.) nos son dadas como si de verdades reveladas se tratase y sin el muy conveniente aderezo de algún tipo de medida de su nivel de fiabilidad (varianza o similar). Luego, a toro pasado (en ocasiones, a toro lidiado, cocido en caldereta, comido, digerido con café, copa y puro y defecado), aparecen revisiones de las que ya nadie da cuenta. En fin. ...

21 de marzo de 2010 · Carlos J. Gil Bellosta

Leyendo tablas de SAS... sin SAS

No era atípico en aquella época en que SAS todavía se utilizaba como herramienta estadística que a uno le enviasen conjuntos de datos con la arcana extensión .sas7bdat, completamente imposibles de abrir con programa asequible alguno. Era una asombrosa manía dado que SAS (al igual que Excel) ni siquiera es compatible consigo mismo: los ficheros generados en SAS sobre Windows son incompatibles con los generados sobre UNIX, por ejemplo. Existe la posibilidad de exportar los datos desde SAS a un formato más abierto, interoperable y documentado que puede ser leído, por ejemplo, desde R. Pero para eso, de nuevo, hace falta tener acceso a SAS. ...

20 de marzo de 2010 · Carlos J. Gil Bellosta

Los portátiles, ¿objetos fálicos?

Yo siempre he creído que eso de los portátiles tiene algo de fálico. Ya no gastamos puñal ni espada. Ni escribimos con tachuelas Biba mi dueño en el mango de navajas valleinclanianas. Pero salimos a la calle con portátiles y los celamos (yo, al menos) como antaño se guardaban de la sucia mano ajena los afilados depositarios de la virilidad carpetovetónica. He comprado un portátil nuevo y, llevado de fálico exhibicionismo, he decidido que amerita una entrada en la que proclamar que el mío es más pequeño que el de casi todos mis lectores. ...

15 de marzo de 2010 · Carlos J. Gil Bellosta

La fábula del tendero, la báscula y la caneca (y su desasosegadora moraleja)

Érase una vez un tendero tan con los sesos hechos agua de la desordenada lectura de divulgación científica soviética que, émulo de su autor favorito, decidió diseñar su propio experimento de física recreativa. Así, armado de su nueva y flamante báscula, decidió comprobar si un litro de agua pesaba más de medio kilo. Y, efectivamente, el resultado de su experimento fue el esperado. Animado por el éxito, se aventuró a realizar otro: comprobar si dos litros de agua pesaban, de nuevo, más de medio kilo. Habrá quien piense que se trata de un experimento ocioso (habida cuenta del resultado del primero). No obstante, el tendero realizó el experimento y, oh sorpresa, ¡resultó que dos litros de agua pesaban menos de medio kilo! ...

14 de marzo de 2010 · Carlos J. Gil Bellosta

Madre Teresa, patriotas, idiotas... y queries recursivas

No es este foro para opinar sobre si nos interesa la Madre Teresa o si los patriotas son idiotas, pero sí para mostrar nuestro desacuerdo con la canción (por abreviar, acá está su letra) y dejar claro que las jerarquías no son una porquería. Si no, que se lo digan a un indirecto cliente mío que consume lo que no nos devuelve a los accionistas como dividendo en pagar hordas de consultores poco avisados de lo que acá cuento. Y lo cuento y dejo públicamente escrito para que tengan todavía menos excusa. ...

11 de marzo de 2010 · Carlos J. Gil Bellosta

¿Sabes estadística? ¿Quieres ganar 100K dólares? Pues lee...

Después del éxito de crítica y público de la competición de Netflix, están apareciendo iniciativas similares. De hecho, acabo de recibir noticia de una más en la que se busca a una persona o equipo capaz de aportar ideas novedosas para el análisis de un conjunto de datos grande. Y se ofrece, además, una recompensa de 100k dólares para el ganador. ¿Interesante para algún proyecto de tesis/tesina? ¿O como proyecto colectivo en algún curso de minería de datos?

7 de marzo de 2010 · Carlos J. Gil Bellosta

Un vídeo algo viejo sobre estadísticas, expectativas y mentiras

Hace poco me hicieron llegar el vídeo de una conferencia pronunciada en el seno del TED. TED es una ONG dedicada a la difusión de ideas… que merecen difusión. Organiza conferencias anuales en California y Oxford y, según su página, reta a los pensadores más fascinantes a dar la charla de sus vidas en 18 minutos. No ha de sorprender, pues, que también haya acogido Hans Rosling para que vuelva a sorprendernos con la potencia de su afamado Gapminder. ...

6 de marzo de 2010 · Carlos J. Gil Bellosta

Ofertas de trabajo en estadística, para consultores SAS, etc.

Aunque ando desaparecido estos días, me dejo caer por estas páginas para dar a conocer que estoy al tanto de una serie de ofertas de trabajo para estadísticos en general y expertos en SAS en particular. Los interesados están siempre invitados a enviarme su currículo.

4 de marzo de 2010 · Carlos J. Gil Bellosta

R en "The Economist"

El semanario The Economist ha publicado un suplemento especial sobre nuevos retos y tendencias en el procesamiento de cantidades ingentes de información. Aparte de multiplicar por 10 los informes que aparecen publicados periódicamente, en este se menciona explícitamente que un free programming language called R lets companies examine and present big data sets. También habla de Hadoop y otras técnicas y herramientas novedosas de las que sin duda voy a ir hablando en estas páginas. Aunque solo sea que me embarco en un proyecto destinado a manipular grandes volúmenes de datos con tecnologías del siglo XX.

1 de marzo de 2010 · Carlos J. Gil Bellosta