Competición de estadística con R en las III Jornadas de Usuarios de R

Como actividad complementaria a las III Jornadas de Usuarios de R, por gentileza de uno de sus patrocinadores, Nestoria y gracias al trabajo de Emilio Torres Manzanera, se ha anunciado hoy el I Concurso de Análisis de Datos con R. Con 1.500€ en premios y la posibilidad de pasar a colaborar con la plantilla de Nestoria para los autores de las mejores soluciones, el concurso aspira a sondear la habilidad de la comunidad de usuarios de R para analizar datos reales y extraer valor de la base de datos de viviendas y precios de viviendas de Nestoria. ...

18 de julio de 2011 · Carlos J. Gil Bellosta

Nassim Taleb y el problema de la inferencia

Según el DRAE, inferir consiste en sacar una consecuencia o deducir algo de otra cosa. Estadísticos, economistas, económetras y muchos otros lidian siempre con el llamado problema de la inferencia: ¿es posible generalizar a sucesos aún no observados los resultados que parecen deducirse de los datos recogidos? Nassim Taleb, empiricista y escéptico, es un pensador y polemista que cuestiona la fe que muchos depositan en teorías y métodos. De lo mucho que podía hablarse de él, me limitaré a subrayar que gran parte de sus reflexiones están contenidas en el muy recomendable libro El cisne negro y que los faltos de tiempo podrán averiguar lo más de ellas en esta conferencia suya de apenas una hora. ...

15 de julio de 2011 · Carlos J. Gil Bellosta

La percepción del riesgo, en la BBC

La percepción del riesgo es el juicio subjetivo que hacen las personas sobre la relevancia o severidad de un riesgo. Esta percepción tiene una dimensión matemática por naturaleza y que tiene que ver con la habilidad del sujeto para manejarse con las cifras. Pero también tiene una dimensión no matemática: mucha gente, de hecho, reacciona de una manera que pudiera parecer incoherente con su visión racional de las probabilidades implicadas. ...

14 de julio de 2011 · Carlos J. Gil Bellosta

SAS 9.3, disponible

Acaba de llegarme la noticia de que la versión 9.3 de SAS (sí, el producto de esa empresa que no quiere saber nada de las III Jornadas de Usuarios de R a pesar de que las palabras de su director general en España nos hicieran creer a algunos lo contrario) que, como de costumbre, es lo mejor de lo mejor. Entre los cambios grandes y pequeños que aporta están: No es necesario pasar de SAS 9.1.3 a SAS 9.2 para instalar la versión 9.3 Para producir gráficos con ODS no es necesaria la licencia de SAS/GRAPH Los procedimientos gráficos SGPANEL, SGPLOT, SGRENDER y SGSCATTER han pasado de SAS/GRAPH a SAS Base. El nuevo procedimiento FMM de SAS/STAT permite ajustar modelos de mezclas finitas Se pueden leer tablas de JMP en SAS directamente. Y algunas más que podrán consultar los interesados en la página de SAS 9.3.

13 de julio de 2011 · Carlos J. Gil Bellosta

Desarrollo de paquetes con R (III): check, check, check

Uno de los pasos más importantes en el desarrollo de un paquete es verificar que funciona correctamente. Un check comprueba la estructura del paquete, la consistencia entre el código y la documentación, que no faltan secciones importantes en esta última, que los ejemplos pueden ejecutarse sin problemas, etc. De ahí que sirva para muchos propósitos. En particular, si uno elige los ejemplos que acompañan a la documentación de las funciones con buen criterio, éstos servirán no solo para ilustrar el comportamiento de las funciones sino, también, para verificar el funcionamiento del paquete. Además, de usar R-forge, como el sistema realiza checks en varias plataformas distintas, el elegir bien los ejemplos permite realizar comprobaciones multiplataforma del código. ...

12 de julio de 2011 · Carlos J. Gil Bellosta

Clustering (I): una pesadilla que fue real

Comienzo hoy una serie de entradas en seis entregas sobre una muy utilizada técnica de análisis de datos de la que soy un profundo detractor. Reconozco que uno de los motivos, aunque menores, de esta postura estriba en que carece de un nombre castizo y reconocido en español. Aunque por ahí gusta agrupación o agrupamiento, yo siempre he preferido arracimamiento: aparte de su valor visual, descarga el término grupo, manifiestamente sobreutilizado en muchos ámbitos. ...

11 de julio de 2011 · Carlos J. Gil Bellosta

useR!, en Warwick, dentro de un mes

Dentro de un mes tendrá lugar la conferencia internacional de usuarios de R, useR!, en Warwick, R.U. A partir del documento que resume las ponencias, usando el paquete tm de R y Wordle para la parte artística, he creado la siguiente nube de palabras: Y ya que toco estos temas, menciono dos: ¿Os habéis puntado a las III Jornadas de Usuarios de R? ¿Qué lematizador utilizáis en español? ¿Cuál os gusta más?

6 de julio de 2011 · Carlos J. Gil Bellosta

Disponible el borrador de la ley de acceso a la información

Ha sido publicado recientemente un borrador de lo que pudiera convertirse en la futura Ley de Transparencia española. Quiere esta ley regular las obligaciones de las administraciones públicas en lo concerniente a la difusión de los datos que obran en su poder y no tiene desperdicio su exposición de motivos, que comienza así: El reconocimiento y garantía del derecho de los ciudadanos a acceder a la información pública es una práctica de buen gobierno. La transparencia constituye una eficaz salvaguarda frente a la mala administración, posibilita a los ciudadanos conocer mejor y vigilar el ejercicio de las potestades, la prestación de los servicios y el empleo de los recursos públicos y estimula a los poderes públicos a funcionar de modo eficiente. Un gobierno transparente es, por ello, un gobierno que genera confianza y que rinde un mejor servicio a la sociedad. ...

5 de julio de 2011 · Carlos J. Gil Bellosta

Miscelánea de citas

Creo que tengo que pedirle excusas a Sam Savage por utilizar citas recopiladas por él para esta entrada mía de hoy. Me atrevo solo porque espero que contribuya a difundir el conocimiento de su libro. Son: Todos los modelos son erróneos, pero algunos son útiles. —George Box, estadístico Mentir un poco está permitido, pero jamás engañar. —Paul Halmos, matemático Un modelo exitoso te cuenta cosas que no le habías pedido que te contase. ...

4 de julio de 2011 · Carlos J. Gil Bellosta

Paquetes huérfanos de R

Ayer hablaba con Juan José Gibaja (al que finalmente conocí en persona) y me contaba cómo había usado un paquete de R —no recuerdo cuál— que misteriosamente había desaparecido de CRAN. —¡Imposible! Los paquetes no desaparecen: quedan huérfanos. Efectivamente, en la lista de paquetes de CRAN, abajo, se mencionan los llamados paquetes húerfanos. Según el README, se trata de paquetes cuyos autores o mantenedores han decidido desentenderse del paquete o los mensajes que les envían desde CRAN rebotan o no son contestados. Tales paquetes pasan al estado ORPHANED y se mantienen en CRAN mientras pasen los checks. Pero, conforme avanzan las versiones de R, puede que algunos de esos paquetes dejen de compilar y entonces son archivados. Existe una lista de paquetes huérfanos archivados cuya última versión puede encontrarse aquí. ...

1 de julio de 2011 · Carlos J. Gil Bellosta