Unix para poetas

Existe una breve obrita, Unix for Poets, que utiliza el análisis cuantitativo de texto como excusa para aprender a manejar una serie de comandos inexcusables de Unix y sus derivados: wc, grep, etc.

Se la recomiendo particularmente a aquellos que se compraron una Mac y no saben que cuentan con una terminal decente oculta en alguna parte de su sistema (en serio, los hay: el otro día se la descubrí a una maquera).

Spam 2.0 (increíblemente bien hecho)

Recibí recientemente este correo (con los enlaces que aparecen en él; solo he eliminado el apellido de la remitente):

Subject: Carlos - Scala resource

Hi Carlos,

I was doing some research for our students here at Udemy on people using Scala resources and when I came across your site, saw you were using the tutorial from Wikipedia.

We really like that resource, and actually created our own that we think is a perfect supplement! This Scala tutorial is text-and image based, easy to search for quick answers, and super helpful for anyone: as a base for learning or as a reference guide.

Programa Profesional de Iniciación a R II

Del 10 de noviembre al 17 de diciembre impartiré la segunda edición de mi Programa Profesional de Iniciación a R. Los detalles pueden consultarse en el enlace anterior.

Es la segunda edición. De la primera hablé aquí.

El programa es esencialmente el mismo: presentar y trabajar con aquellas herramientas que hacen de R una herramienta útil dentro de BBVA, Santander, Mapfre, etc. Para trascender Excel y, entre otros,

  • manipular datos como un pro,
  • crear gráficos estadísticos complejos de calidad,
  • crear informes automáticos que combinan análisis de datos, gráficos, texto, etc.,
  • desarrollar plataformas interactivas de visualización y análisis de datos.

En el curso se tocarán (aunque sin profundizar) las herramientas para el análisis estadístico de datos con R (p.e., regresiones) y algunas técnicas de machine learning (p.e., árboles de decisión y random forests), pero no se trata de un curso de estadística.

purrr: otro dialecto para la programación funcional en R

R

Acaba de publicarse purrr. Es un paquete del universo Wickham que ofrece funciones para desarrollar otro dialecto funcional sobre R.

R es un lenguaje oportunista: ni del todo funcional, ni del todo orientado a objetos, ni del todo procedural. Es como es porque nació con un objetivo muy concreto y fue adoptando cosas de aquí y de allá como cuando uno recorre el supermercado. Merece la pena traer a colación cómo el primerísimo R (cuando era S), durante los ochenta, antes de adoptar la forma actual a través de los diversos libros de colores de Chambers y compañía, estaba fuertemente inspirado por Lisp.

#INKS2015

Ha salido publicada la guía INKS2015. Está dirigida a profesionales digitales y trata temas como el márketing digital, el SEO, las redes sociales o la usabilidad. Temas todos ellos que, aunque interesantes, no suelo tratar aquí.

Solo que la guía incluye esta vez una sección dedicada al big data y recoge un par de páginas mías (así como de un par de colegas: Ismael Herráiz y Rubén Casado) a las que igual queréis echar un vistazo.

El curioso caso de los suicidios en Madrid

Uno de esos descubrimientos del XIX fue que, mientras que los seres humanos tenemos (cierta) libertad de acción, en agrupaciones humanas amplias de distintos lugares y fechas existían ciertas regularidades en números tales como la tasa de suicidio.

Hoy he tenido acceso a datos que el INE no publica: número de suicidios por municipio (mayor de 10000 habitantes) y los que corresponden a la ciudad de Madrid son increíbles. No los tengo, pero sí los de la provincia (que sí que publica el INE):

La funesta manía de querer acertar

Vayan dos cosas por delante:

  • Que la de pretender acertar es una perniciosa manía. Más loable es la de tratar de evitar un fallo catastrófico.
  • Que recomiendo muy mucho seguir las cosas que hace Kiko Llaneras.

Dicho lo cual…

Kiko Llaneras ha estado elaborando predicciones del resultado de las elecciones en Cataluña durante la precampaña. Pueden verse aquí. El documento enlazado incluye una discusión de la metodología.

A diferencia de los más de los comentaristas, Kiko ofrece, más que pretendidas certezas, distribuciones. Tal y como hacen los que más saben. Es algo aplaudible.

Anunciado el programa de las VII Jornadas de Usuarios de R

Se acercan las VII Jornadas de Usuarios de R. Y se acaba de actualizar la página con la siguiente información:

  • El programa, en el que, además de charlas, hay varios talleres muy atractivos.
  • La cena social (para la que es bueno que reserves: ¡necesitamos una buena estimación de cuántos acabaremos siendo!)
  • El anuncio de una visita guiada gratuita a la ciudad de Salamanca.
  • Como novedad con respecto a otras jornadas, el anuncio de una excursión durante el sábado a la sierra de Francia y alrededores.

La asistencia a las jornadas es gratuita y, de momento, estamos inscritos unos 150. ¿Te sumas tú también?

La huelga del metro de Londres y sus efectos beneficiosos

En Londres hubo huelgas de metro en febrero de 2014. Eso obligó a muchos viajeros a experimentar con rutas alternativas. Usando datos de la tarjeta Oyster, que permite trazar los viajes, S. Larcom y sus coautores encontraron un hecho sorprendente: un número significativo de viajeros que probaron (por necesidad) rutas alternativas siguió usándolas después de la crisis. Especulan con que la información que los usuarios extrajeron (o se vieron obligados a extraer) durante la huelga contribuyó a mejorar el funcionamiento global de la red.

Curso de ASPgems: Descubre Spark en 8 semanas

En el Meetup de hoy me he enterado de que mis colegas de ASPgems están organizando un curso de Spark. Y no por colegas sino por competentes, lo divulgo por aquí.

La información al respecto, aquí.

Advertencia: El curso no es gratuito y ASPgems me ha invitado a dos cervezas a la salida del Meetup de hoy. Pero, tranquilos, mi precio no es ese.