Navegando por ahí: un (otro) curso de estadística con R

Navegando por ahí he dado con otro curso de R y otro blog muy interesante. Para facilitar la búsqueda a mis lectores, les dejo acá los enlaces directos a los distintos capítulos: Introduccion a R Modelos lineales Modelos lineales generalizados Diseño de experimentos Modelos lineales mixtos Análisis multivariante ¡Buena lectura!

18 de enero de 2011 · Carlos J. Gil Bellosta

Una frase afortunada que merece ser enmarcada

Si bien en mi entrada de hace un par de días critiqué aspectos manifiestamente perfectibles de un articulillo que he leído estos días, hay en él una frase estupenda. Una frase que merece ser enmarcada. Una frase de la que, por evitar que se me traspapele y para solaz de mis lectores, voy a dejar aquí constancia. Es: Knusel (2005) investigated tail probabilities of distributions using Excel 2003 and found that previously inaccurate algorithms in Excel have been replaced by new inaccurate algorithms. ...

6 de enero de 2011 · Carlos J. Gil Bellosta

Graficaca a tutiplén

Al autor le preocupa de viejo el problema de la representación gráfica de datos. Piensa que tiene más de arte que de ciencia. Tal vez lo dice porque no se le da bien: confunde tonos y colores y desgarbado es el adjetivo que mejor describe sus trazos. Y como casi todo diletante maltratado de las musas, ejerce de crítico. Y voto a Dios que su crítica es acerba. Le irritan todos los gráficos de tarta (menos este), desea toda clase de malaventura al cretino que lleva lo de Excel en Expansión y vive prisionero de otras manías semejantes. ...

5 de enero de 2011 · Carlos J. Gil Bellosta

De la matriz a de covarianzas a la de correlaciones con Excel

Me preguntan cómo construir la matriz de correlaciones a partir de la de covarianzas con Excel. Mis lectores más versados en R conocerán la existencia de la función cov2cor (cuyo código fuente merece ser examinado). Sin embargo, ¿cómo hacerlo con Excel? No es tan complicado, aunque infinitamente más prolijo: en la posición (i,j) de la matriz de correlaciones hay que asignar: el valor (i,j) de la correspondiente matriz de covarianzas dividido por la raíz cuadrada del producto de los valores (i,i) y (j,j) de la matriz de covarianzas. Tan fácil como parece, implementarlo en Excel es poco menos que una tortura. Partiendo de una matriz de covarianzas A1:C3, ...

27 de noviembre de 2010 · Carlos J. Gil Bellosta

Nuestro mandato: ordenar y simplificar

Todo el mundo entiende que los médicos,solo por serlo, están sujetos a un mandato específico: luchar contra la enfermedad. Puede que otros gremios (como los maestros o los jueces) tengan otros tan escuetos como significativos. Yo, durante un tiempo, me pregunté cuál sería el de los matemáticos, los estadísticos, los que nos dedicamos al análisis de datos. Y creí dar con una fórmula que hice mía: ordenar y simplificar la información. ...

23 de noviembre de 2010 · Carlos J. Gil Bellosta

Siete consejos para expertos en análisis de datos

En mis deambulaciones por internet topé con una página interesante que bien merece ser comentada en este blog. Enumera siete técnicas (o secretos en su formulación primigenia) que habrían de hacer suyas los expertos en análisis de datos. Son: Usa una herramienta del tamaño adecuado SAS u Oracle no deberían considerarse las herramientas por defecto. Para procesar y depurar ficheros de texto de menos de mil líneas bastan herramientas como R, Google Refine, vi, Excel/OpenCalc,… ...

17 de noviembre de 2010 · Carlos J. Gil Bellosta

La Wikipedia te necesita

Hoy, procrastinando, me he dado un paseo por la Wikipedia en español. Y me he deprimido viendo el lamentable estado en que se encuentran la mayor parte de las páginas de las categorías a las que concierne esta bitácora como, por ejemplo, las de probabilidad, estadística y minería de datos. Quiero invitar a los lectores de este blog (a los que, por serlo, se les presupone un mínimo de interés y formación) a que participen en ese proyecto común que es la Wikipedia (y, en particular, la Wikipedia en español) para no tener que volver a sonrojarnos al comparar nuestras páginas con las correspondientes de otros idiomas. ...

15 de noviembre de 2010 · Carlos J. Gil Bellosta

Google Refine 2.0, una herramienta con muy buen aspecto

Le debo a Guillermo, un excompañero de SAS, la noticia que aquí publico: Google Refine. Acabo de ver y no he podido resistir la tentación de escribir algo al respecto. Tiene una pinta increíble y creo que el lunes a más no tardar podré contar mis impresiones personales sobre la herramienta. ¿Será que se me adelanta alguno de mis lectores?

12 de noviembre de 2010 · Carlos J. Gil Bellosta

La estadística en los sellos del siglo XX por cortesía del INE

Con motivo del Día Mundial de la Estadística, el INE publicó en su página de internet una muestra de sellos relacionados con la estadística catalogados por país, década y tema.

6 de noviembre de 2010 · Carlos J. Gil Bellosta

Una solución al problema de la separación perfecta con regresiones logísticas

Cuando el otro día planteé al mis lectores el problema de cómo representar de manera efectiva un conjunto de datos pequeños, no lo hice de manera enteramente ociosa. Eran datos reales de un cliente que tropezó con el llamado problema de la separación perfecta al intentar aplicar una regresión logística. Veamos de nuevo los datos: En la gráfica cada punto representa un individuo (posiblemente una persona). Los grupos los distinguen en dos clases (posiblemente, enfermos y sanos). La variable en el eje de la x mide el nivel de cierta proteína (supongo que en las células de algún tipo de tejido). Si se intenta realizar una regresión logística sobre este conjunto de datos sucede una catástrofe: el algoritmo diverge, aparecen mensajes de error en la pantalla, etc. ¡Es el problema de la separación perfecta! ...

25 de octubre de 2010 · Carlos J. Gil Bellosta