Trucos cutrebayesianos

El contexto Cada día $i$ ocurren eventos de cierta naturaleza (transacciones, fallecimientos, infartos, etc.) que interesa contar. El problema El número de eventos $n_i$ que ocurren el día $i$ no se conoce el día $i$ sino que va siendo conocido progresivamente los días $i+1, \dots$. Pero hace falta una estimación de $n_i$ antes del fin del mundo. Los datos La distribución de los $n_i$ (basados en el histórico). La proporción (probabilidad) $p_\Delta$ de eventos del día $i$ que se conocen el día $i+\Delta$. La solución prebayesiana ...

13 de septiembre de 2017 · Carlos J. Gil Bellosta

Airbnb da en el clavo: ha desarrollado lo que hacía mucha falta

Y no me refiero a lo que quita el sueño a ciertos ayuntamientos retrógrados. Sino a esto. Que es una herramienta corporativa para diseminar internamente información cuantitativa (en forma de cuadernos (de Python), Rmarkdowns y similares). Más info, aquí. Los que me leéis y trabajáis en uno de esos lugares grandotes donde lo cuantitativo viaja por correo en PPTs, ya sabéis que tenéis que proponer ipso facto en esas reuniones que tanto os gustan.

2 de junio de 2017 · Carlos J. Gil Bellosta

Diapositivas sobre mi charla acerca del "stack analítico"

Tuve ocasión el pasado jueves, en Barcelona y gracias a la invitación de KSchool, de lo que llamo el stack analítico. Es decir, de aquellas herramientas tecnológicas necesarias para poder hacer ciencia de datos hoy en día. Las diapositivas de la charla están aquí. El tema es viejo pero no por ello menos urgente: existen herramientas (y, desgraciadamente, me he visto a incluir el saber leer documentación técnica en inglés) cuyo conocimiento es imperativo para poder trabajar de manera efectiva en ciencia de datos. Incluidos están sistemas operativos (dencentes), editores de texto (decentes) e IDEs y, como poco, un lenguaje de programación.

15 de mayo de 2017 · Carlos J. Gil Bellosta

Lo que pasa cuando interrumpes a alguien que desarrolla una actividad intelectual seria

¿Quién demonios inventó esos espacios de trabajo diáfanos?

17 de febrero de 2017 · Carlos J. Gil Bellosta

En defensa de lo simple

No es propiamente estadística. Tiene que ver también con la consultoría, pero no necesariamente con la relacionada con numerillos. Pero se traslada a ambas línea a línea. Es ¿Eres complicado o sencillo? y se lee en un momento.

15 de febrero de 2017 · Carlos J. Gil Bellosta

Podcast: "Vivir analizando datos"

Los amigos de Descifrando Emprendedores han tenido la gentileza de entrevistarme. Nuestra charla puede escucharse aquí.

14 de noviembre de 2016 · Carlos J. Gil Bellosta

Una jerarquía de analistas de datos en cuatro escalafones

Es: Nivel 1: Realizan la mayor parte de su trabajo con herramientas ofimáticas (fundamentalmente Excel), aunque pueden utilizar puntualmente Eviews, Stata, R o Matlab. Nivel 2: Los que realizan la mayor parte de su trabajo con R, Python, SAS o SQL pero cuyo sistema de control de versiones es el de ficheros con determinadas convenciones de nombres. Nivel 3: Como el anterior, pero usando control de versiones, estilos de código, y revisión por pares (peer review). Nivel 4: Como el anterior, pero incorporando métodos propios de la ingeniería de software como el unit testing, documentación integrada, release cycles, etc. Lo anterior está traducido de Why you need version control, que habla de eso y más. Léelo.

3 de octubre de 2016 · Carlos J. Gil Bellosta

Herramientas (y consejos) para avanzar en tu carrera

Escribo hoy para invitar a leer esto, una entrada en otra bitácora que recoge y resume ideas que ya han aparecido en la mía, como por ejemplo: Usa herramientas para las que no tengas que pedir permiso (típicamente, abiertas) Considera el tiempo que pases trabajando en una empresa grande aprendizaje subsidiado Especialízate un conjunto de cosas que sepas hacer mejor que la mayoría Aprende a plantear preguntas Aprende (cuando menos) un lenguaje de programación Y algunas otras.

5 de junio de 2015 · Carlos J. Gil Bellosta

Y todo ocurre en un abrir y cerrar de ojos

Abres una aplicación en tu móvil que diseñó un programador búlgaro. Ipso facto aparece un insidioso banner de, p.e., Jazztel. ¿Cuáles son los mecanismos que ponen en contacto al búlgaro con Jazztel? ¿De qué manera recibe aquel una compensación de esta? Tradicionalmente, el desarrollador habría hablado con, p.e., Google. Le habría dicho: yo voy a generar “espacios” donde tú vas a poder colgar propaganda a cambio de una cantidad (fija o variable). El intermediario, por otra parte, capta anunciantes (Jazztel en nuestro ejemplo), almacena un inventario de ellos y decide cuál de ellos mostrar. Hay teoría aplicable en estos contextos, como la que describe Real-Time Bidding Algorithms for Performance-Based Display Ad Allocation. ...

27 de marzo de 2015 · Carlos J. Gil Bellosta

bellostamisc y una moraleja

Antier recibí un correo inesperado. Me agradecía el paquete bellostamisc, sabía de mi salida de eBay y me ofrecía trabajo en su empresa. bellostamisc (miscelánea de funciones de Bellosta, i.e., yo) es un paquete para mi uso personal que recopilaba funciones auxiliares que usaba en eBay para distintos fines: conexiones a bases de datos, paralelización, etc. Nunca pensé que fuera a ser utilizado por nadie que no fuese yo. No obstante, lo documenté en condiciones, lo publiqué en nuestro GitHub corporativo y una vez vi que era estable, se lo sugerí a quien me vino con los problemas que con él había resuelto. ...

26 de febrero de 2015 · Carlos J. Gil Bellosta