Recordatorio: las VIII Jornadas de Usuarios de R
Que tendrán lugar en Albacete los días 17 y 18 de noviembre de 2016. Más información (toda la información, de hecho), aquí.
Que hagan lo que quieran en Plaza de España; yo, la verdad, no tengo tiempo para leer 350 MB de documentación
Ha salido lo de la votación de plaza de España. Un festival para la democracia.
Yo, de hecho, ya voté en la primera ronda. Voté que la dejasen como está. Por un motivo muy simple: cada vez que camino por las calles próximas a mi casa, como haya llovido no hace tanto y tenga mala suerte, piso en una de esas baldosas mal fijadas que proyectan alevosos chorros de agua putrafacta por la pierna p’arriba. Porque en la intersección de dos calles por las que paso siempre, cuando llueve, se forma una balsa de agua a la que solo faltan ranas. Porque los contenedores en los que reciclo están cercados de montañas de residuos de todo tipo. Porque, creo, que antes de invertir más (y particularmente, antes de invertir a un kilómetro de mi casa) deberían devolverse a un estado digno las infraestructuras municipales por las que transito a diario. Por eso, insisto, me opuse.
Barómetros del CIS con R
El CIS realiza barómetros todos los meses menos uno. Pasado un tiempo (es octubre y el último publicado es de julio) coloca los microdatos en su banco de datos.
Aparte de ficheros .pdf que lo explican todo (pero que no dejan de ser .pdf), publica dos ficheros. Uno de datos en ancho fijo (prefijo DA) y otro con código SPSS (prefijo ES) con los consabidos (¿lo son? ¡felicidades si no!) encabezados DATA LIST, VARIABLE LABELS, VALUE LABELS, y MISSING VALUES.
Si se estudió que las autopistas eran viables, ¿por qué están ahora en quiebra?
Así titula El Mundo un artículo en el que el mismo periódico se responde:
Porque los estudios de viabilidad sirvieron más para justificar la construcción que para cubrir una necesidad real. La R-3 y la R-5 absorberían 70.000 vehículos diarios según las estimaciones y el tráfico real es al menos cuatro veces inferior. En sentido contrario Gobierno, concesionarias y bancos subestimaron el coste del suelo. Los expropiados llevaron su caso a los tribunales y llegaron a multiplicar hasta en 10 veces lo que recibieron años atrás.
Una jerarquía de analistas de datos en cuatro escalafones
Es:
- Nivel 1: Realizan la mayor parte de su trabajo con herramientas ofimáticas (fundamentalmente Excel), aunque pueden utilizar puntualmente Eviews, Stata, R o Matlab.
- Nivel 2: Los que realizan la mayor parte de su trabajo con R, Python, SAS o SQL pero cuyo sistema de control de versiones es el de ficheros con determinadas convenciones de nombres.
- Nivel 3: Como el anterior, pero usando control de versiones, estilos de código, y revisión por pares (peer review).
- Nivel 4: Como el anterior, pero incorporando métodos propios de la ingeniería de software como el unit testing, documentación integrada, release cycles, etc.
Lo anterior está traducido de Why you need version control, que habla de eso y más. Léelo.
Sobre ciencia de datos en UNIR: teoría y gente
Hoy (jueves) he participado en un desayuno de trabajo organizado en la UNIR como pistoletazo de salida a un curso de inteligencia artificial en el que tendré una pequeña participación.
Nos ha tocado presentarnos a todos (había gente de Telefónica, Santander, Mapfre, Siemens, etc.) y según avanzaba la ronda han ido superándose peligrosamente las dosis máximas diarias establecidas por la OMS para la el impacto auditivo de palabras tales como disruptivo, futuro, innovación, coche autónomo, fabuloso y nosotros.
Curso de modelos gráficos probabilísticos en Coursera
Acaba de arrancar un curso de modelos gráficos probabilísticos en Coursera.
No solo lo recomiendo sino que lo estoy siguiendo.
Además, he dejado en el foro del curso un mensaje por si los apuntados de la zona de Madrid quieren organizar un grupo de estudio.
¿Cómo se escribía "verosimilitud" en francés en 1774?
Lo cuento luego, después del (por mí traducido) contexto:
La incertidumbre del conocimiento humano puede serla sobre los sucesos o de las causas de los sucesos; si se nos asegura, por ejemplo, que una urna encierra bolas blancas y negras en una proporción dada y se pregunta por el color de una bola extraída al azar, el suceso es incierto, pero la causa de la que depende la probabilidad de su existencia, es decir, la proporción de bolas blancas y negras, es conocida.
Organicemos un referéndum para determinar qué causa las mareas
Hasta hace un par de días no me había tratado de formar una opinión adulta sobre las causas de las mareas. Supongo que durante la EGB leí en algún sitio que era cosa de la gravedad y la luna y ahí lo dejé estar.
Hasta que leí esto. Que da cuenta de la discusión de un político muy antipático (es del UKIP, ¡uh, uh, uh!) con un tal Paul Nightingale, de profesión científico, acerca de la materia. Según el primero, son producto (entiendo que fundamentalmente) del sol; según el segundo, de la luna.