Paella sin arroz con sabor a judías enlatadas

El otro día leí el artículo A Prototype Model of Stock Exchangede G. Caldarelli, M. Marsili y Y.C. Zhang. La promesa que me ofrecía era la de la creación de un sistema relativamente realista de los agentes que operan en los mercados financieros que diese lugar a una evolución de precios con propiedades similares a las observadas. Sin embargo, el planteamiento, interesante en un principio, se deshinchó enseguida: El modelo planteado por los autores ni siquiera aspira a representar los aspectos más distintivos del mercado: en lugar de agentes tremendamente desiguales en tamaño y entrelazados en una maraña de dependencias e influencias mutuas, los agentes son todos equivalentes en tamaño (si bien es cierto que en el estado estacionario de la simulación los ingresos adquieren una distribución dada por una ley de potencias) y que actúan de manera independiente entre sí una vez observados los precios en el mercado. Los resultados, una serie temporal de precios, es calificada por los autores como muy rica, aunque enseguida pasan, en un dechado de honradez, a apuntar diferencias más o menos manifiestas entre sus características estadísticas y las observadas en mercados reales. Entiendo y aplaudo el virtuosismo técnico empleado por los autores del artículo y la implementación de los algoritmos involucrados. No obstante, tras leerlo, me embriaga una extraña sensación que no debe de ser muy distinta de aquellos comensales a los que se les anunció paella, se les advirtió que no traía arroz ni gambas y comprobaron después que sabía a judías de lata.

21 de julio de 2011 · Carlos J. Gil Bellosta

Y Kenia qué, ¿eh?

—Sí, ya sabemos que en EE.UU. e Inglaterra las cosas son distintas, pero nosotros semos mediterráneos y tenemos sol y aceite de oliva. —Además, uno siempre puede comprar la publicación España en cifras en las librerías Índice a un precio popular establecido anualmente en el BOE (o, incluso, ¡descargarla en PDF gratis!). —Ejque… Etc. Pero, y Kenia qué, ¿eh? ¿Nos vamos a dejar ganar por Kenia?

20 de julio de 2011 · Carlos J. Gil Bellosta

Clústering (II): ¿es replicable?

Sólo conozco un estudio ?y lo digo bona fide; si alguno de mis lectores conoce otro, le ruego que me lo indique? en el que las técnicas de clústering hayan sido rectamente aplicadas. Se trata del artículo Molecular Classification of Cancer: Class Discovery and Class Prediction by Gene Expression Monitoring de cuyo resumen extraigo y traduzco lo siguiente: Un procedimiento de detección de clases automáticamente descubrió la distinción entre la leucemia mieloide aguda (AML) y la leucemia linfoblástica aguda (ALL) sin conocimiento previo de las clases. Después se construyó un predictor de clases… ...

19 de julio de 2011 · Carlos J. Gil Bellosta

Competición de estadística con R en las III Jornadas de Usuarios de R

Como actividad complementaria a las III Jornadas de Usuarios de R, por gentileza de uno de sus patrocinadores, Nestoria y gracias al trabajo de Emilio Torres Manzanera, se ha anunciado hoy el I Concurso de Análisis de Datos con R. Con 1.500€ en premios y la posibilidad de pasar a colaborar con la plantilla de Nestoria para los autores de las mejores soluciones, el concurso aspira a sondear la habilidad de la comunidad de usuarios de R para analizar datos reales y extraer valor de la base de datos de viviendas y precios de viviendas de Nestoria. ...

18 de julio de 2011 · Carlos J. Gil Bellosta

Nassim Taleb y el problema de la inferencia

Según el DRAE, inferir consiste en sacar una consecuencia o deducir algo de otra cosa. Estadísticos, economistas, económetras y muchos otros lidian siempre con el llamado problema de la inferencia: ¿es posible generalizar a sucesos aún no observados los resultados que parecen deducirse de los datos recogidos? Nassim Taleb, empiricista y escéptico, es un pensador y polemista que cuestiona la fe que muchos depositan en teorías y métodos. De lo mucho que podía hablarse de él, me limitaré a subrayar que gran parte de sus reflexiones están contenidas en el muy recomendable libro El cisne negro y que los faltos de tiempo podrán averiguar lo más de ellas en esta conferencia suya de apenas una hora. ...

15 de julio de 2011 · Carlos J. Gil Bellosta

La percepción del riesgo, en la BBC

La percepción del riesgo es el juicio subjetivo que hacen las personas sobre la relevancia o severidad de un riesgo. Esta percepción tiene una dimensión matemática por naturaleza y que tiene que ver con la habilidad del sujeto para manejarse con las cifras. Pero también tiene una dimensión no matemática: mucha gente, de hecho, reacciona de una manera que pudiera parecer incoherente con su visión racional de las probabilidades implicadas. ...

14 de julio de 2011 · Carlos J. Gil Bellosta

SAS 9.3, disponible

Acaba de llegarme la noticia de que la versión 9.3 de SAS (sí, el producto de esa empresa que no quiere saber nada de las III Jornadas de Usuarios de R a pesar de que las palabras de su director general en España nos hicieran creer a algunos lo contrario) que, como de costumbre, es lo mejor de lo mejor. Entre los cambios grandes y pequeños que aporta están: No es necesario pasar de SAS 9.1.3 a SAS 9.2 para instalar la versión 9.3 Para producir gráficos con ODS no es necesaria la licencia de SAS/GRAPH Los procedimientos gráficos SGPANEL, SGPLOT, SGRENDER y SGSCATTER han pasado de SAS/GRAPH a SAS Base. El nuevo procedimiento FMM de SAS/STAT permite ajustar modelos de mezclas finitas Se pueden leer tablas de JMP en SAS directamente. Y algunas más que podrán consultar los interesados en la página de SAS 9.3.

13 de julio de 2011 · Carlos J. Gil Bellosta

Desarrollo de paquetes con R (III): check, check, check

Uno de los pasos más importantes en el desarrollo de un paquete es verificar que funciona correctamente. Un check comprueba la estructura del paquete, la consistencia entre el código y la documentación, que no faltan secciones importantes en esta última, que los ejemplos pueden ejecutarse sin problemas, etc. De ahí que sirva para muchos propósitos. En particular, si uno elige los ejemplos que acompañan a la documentación de las funciones con buen criterio, éstos servirán no solo para ilustrar el comportamiento de las funciones sino, también, para verificar el funcionamiento del paquete. Además, de usar R-forge, como el sistema realiza checks en varias plataformas distintas, el elegir bien los ejemplos permite realizar comprobaciones multiplataforma del código. ...

12 de julio de 2011 · Carlos J. Gil Bellosta

Clustering (I): una pesadilla que fue real

Comienzo hoy una serie de entradas en seis entregas sobre una muy utilizada técnica de análisis de datos de la que soy un profundo detractor. Reconozco que uno de los motivos, aunque menores, de esta postura estriba en que carece de un nombre castizo y reconocido en español. Aunque por ahí gusta agrupación o agrupamiento, yo siempre he preferido arracimamiento: aparte de su valor visual, descarga el término grupo, manifiestamente sobreutilizado en muchos ámbitos. ...

11 de julio de 2011 · Carlos J. Gil Bellosta

useR!, en Warwick, dentro de un mes

Dentro de un mes tendrá lugar la conferencia internacional de usuarios de R, useR!, en Warwick, R.U. A partir del documento que resume las ponencias, usando el paquete tm de R y Wordle para la parte artística, he creado la siguiente nube de palabras: Y ya que toco estos temas, menciono dos: ¿Os habéis puntado a las III Jornadas de Usuarios de R? ¿Qué lematizador utilizáis en español? ¿Cuál os gusta más?

6 de julio de 2011 · Carlos J. Gil Bellosta