Códigos de caracteres, unicode y UTF-8

Unos quebraderos de cabeza en el desarrollo del paquete pxR concernientes a los distintos códigos de caracteres en que hay que transfomar los datos me han obligado a profundizar en este enojoso asunto. En el principio, todo era felicidad. Existía el código ASCII que establecía una correspondencia entre caracteres, números y su representación binaria. Así, a la letra b le correspondía el número 98 cuya codificación binaria es el byte 01100010. ...

6 de septiembre de 2011 · Carlos J. Gil Bellosta

Un paseo por cloudnumbers

Cloudnumbers es una empresa que ofrece servicios de computación de alto rendimiento en la nube con especial énfasis en aplicaciones que corren sobre R. Me ofrecieron una cuenta temporal y gratuita el otro día y en la entrada de hoy voy a describir mis primeros pasos en su plataforma. Hace dos años hice, y dejé descrita, mi primera incursión en la computación con R en la nube. En dicha ocasión utilicé la plataforma EC2 de Amazon: en resumidas cuentas, Amazon alquila servidores con diversas configuraciones de software por horas a un precio muy competitivo y uno puede acceder a ellos vía ssh, instalar R, los paquetes necesarios, correr el código y descargar los resultados. ...

5 de septiembre de 2011 · Carlos J. Gil Bellosta

Un paseo por Google Fusion Tables

El siguiente vídeo contiene una entrevista con Alon Halevy, que dirige el Data Group en Google Research. Aunque confunda Suecia y Finlandia, merece la pena la presentación que hace de Google Fusion Tables, una plataforma para compartir, combinar, distribuir y representar gráficamente conjuntos de datos.

2 de septiembre de 2011 · Carlos J. Gil Bellosta

Diez pasos para construir indicadores compuestos

“[…] es difícil imaginar que el debate sobre el uso de indicadores agregados llegue algún día zanjarse […] los estadísticos desconfían de ellos puesto que gran parte del trabajo de recolección y análisis de datos se “desvirtúa” o “esconde” detrás de un único número de dudoso valor. Otros, por su parte, encuentran irresistiblemente tentadora la posibilidad de resumir procesos complejos y lábiles (por ejemplo, sostenibilidad, etc.) en una cifra con la que comparar el desempeño de los distintos países.” ...

31 de agosto de 2011 · Carlos J. Gil Bellosta

Dinero y motivación

¿Nos motiva el dinero? ¿Hasta qué punto? ¿En todo tipo de tareas? El siguiente vídeo de Dan Pink, basado en su libro Drive: The Surprising Truth About What Motivates Us, subraya la importancia de otros factores —autonomía, maestría, propósito— como directores de nuestra actividad. Aunque extraído de una discusión acerca de la conveniencia de pagar a los desarrolladores de R, los más agudos de mis lectores sabrán extrapolar sus enseñanzas a otras circunstancias cotidianas.

30 de agosto de 2011 · Carlos J. Gil Bellosta

"Arte gráfico" con R

El otro día di con un blog dedicado al arte matemático y en particular con esta entrada sobre cómo crear figuras mediante rotación de segmentos: El código (en matlab) estaba disponible y lo traduje a R: graphic.art <- function( foo, n = 200, init = -1, end = 1, breaks = 20 ){ x <- seq( init, end, by = 1 / breaks ) base <- matrix( c( x, foo( x ) ), ncol = 2 ) rotate <- function(a,m) m %*% matrix(c(cos(a), -sin(a), sin(a), cos(a)), 2) my.lines <- sapply( 2 * pi * ( 1:n ) / n, rotate, base, simplify = F ) limits <- data.frame(do.call(rbind, my.lines)) limits <- data.frame(lapply(limits, range)) plot(limits, type = "n") lapply(my.lines, function(x) lines(x, col = sample(colours(), 1))) } Unos querrán probar diversas opciones: graphic.art(sin) graphic.art(exp) graphic.art(tan) A otros tal vez les interese comparar el código en R con el original en matlab para evaluar pros y contras.

29 de agosto de 2011 · Carlos J. Gil Bellosta

Clústering (IV): una digresión real como la vida misma

Entré a trabajar en una consultora hace un tiempo ?no diré si mucho o poco? y uno de mis primeros encargos fue el de supervisar el desarrollo e implementación de unos modelos que habían creado unos compañeros. Les eché un vistazo y me sorprendió que sin mayor miramiento habían eliminado aquellas observaciones cuya variable objetivo tomaba el 4% de los valores más altos y el 4% de los más pequeños. ...

26 de agosto de 2011 · Carlos J. Gil Bellosta

Ubi ratio, ibi paradoxa (Simpsorum)

Efectivamente, ahí donde hay ratios, aparece con frecuencia la llamada paradoja de Simpson (a propósito, en enlace anterior a la Wikipedia es un despropósito: a ver si alguno de mis lectores con tiempo deja la página a la altura de lo que merece una lengua de cultura). Una ratio muy traída y llevada últimamente y con la que nos gusta autoflagelarnos a los españoles es el de la productividad, que es el cociente entre la producción nacional y el número de trabajadores. Los economistas lo usan para, entre otras cosas, autojustificar su existencia. ...

25 de agosto de 2011 · Carlos J. Gil Bellosta

Tasa Tobin: una discusión casi empírica

—¿Me prestas 10.000 euros al 2%? —Vale, pero me los devuelves mañana. ¿Para qué quiero yo 10.000 euros por un día? Para nada, realmente: al día siguiente perdería los 54 céntimos de interés sin haber podido encontrar provecho alguno a ese capital. Igual ocurre, a otra escala, con los países y los llamados capitales golondrina. Es positiva, cuentan, la inversión externa. Pero no toda es igualmente beneficiosa: ¿qué inversión productiva puede financiarse con capitales de quita y pon? Muchos países han luchado contra este tipo de inversión difícilmente ­­_productivizable_ mediante diversos mecanismos. Por ejemplo, en Chile y Colombia, durante los años 90, se utilizó el encaje: ...

24 de agosto de 2011 · Carlos J. Gil Bellosta

Piensa en términos de inferencia

Recomiendo a mis lectores este estupendo vídeo. Es una conferencia de casi una hora que nos invita a pensar en los datos en términos de inferencia. Aunque en un contexto un tanto exótico (la remodelación del currículo estadístico en los niveles educativos intermedios de Nueva Zelanda), plantea de una manera muy accesible el principal problema de la inferencia: dados unos datos que son una muestra de una población entera, ¿qué es legítimo afirmar acerca de la segunda a partir de los primeros? ...

23 de agosto de 2011 · Carlos J. Gil Bellosta