Bayes no había previsto esto

Muestreo. Se trata de seleccionar unas unidades experimentales (proceso caro) y tratar de estimar una proporción (p.e.) en la población total. Existen técnicas para estimar el valor N mínimo para garantizar cierto margen de error. Pero dichas técnicas requieren conocer (algo d-) el resultado del experimento para estimar N (p.e. una estimación de la proporción que cabe esperar). Circulus in demonstrando. Bayes. Ve examinando unidades y actualiza tus intervalos de credibilidad hasta que tengan la anchura solicitada. ...

18 de junio de 2019 · Carlos J. Gil Bellosta

Rebelarse vende

Tales son las circunstancias de los tiempos que nos ha tocado vivir que muchos de quienes trabajamos en ciencia de datos, querámoslo o no, nos dedicamos a vender cachivaches. De ahí que recomiende la lectura de un librito con muchas posibles interpretaciones pero que da en el clavo en muchas. O tal opino yo. Nota: muchas cosas han cambiado desde que se publicó. No sé si es bueno leer esto antes o después que el libro.

17 de junio de 2019 · Carlos J. Gil Bellosta

Más sobre la paradoja de Berkson

a: eres listo b: has estudiao c: la nota del examen Se supone que a y b son independientes. Pero conocido c, dejan de serlo (saber que eres listo y que has suspendido nos dice que…). Esto no es exactamente pero se parece a (o, más bien, es un caso que generaliza) la llamada Paradoja de Bergson, de la que hablé hace unos años.

12 de junio de 2019 · Carlos J. Gil Bellosta

¿Informática o matemáticas? Una pregunta muy mal formulada

Si queréis trabajar de “data scientists” mejor estudiad informática que mates, si podéis haced el doble grado y ya hay grados de data science. En ningún trabajo os pedirán inventaros algoritmos revolucionario, os pedirán cosas de programador y mates que se enseñan en Informática https://t.co/ebfr05NqVP — Victoriano Izquierdo (@victorianoi) May 31, 2019 es el tuit que lo comenzó todo. Hay más sobre su impacto aquí. No voy a comentarlo. Sí que diré que la pregunta está mal formulada. Y muchas de las respuestas y comentarios que he visto, muchos de ellos de gente que conozco, han entrado al trapo sin percatarse de que, de algún modo, contiene una petición de principio. ...

11 de junio de 2019 · Carlos J. Gil Bellosta

Vigilancia de la mortalidad diaria asociada al exceso de temperatura

Aquí. Se agradecen comentarios.

7 de junio de 2019 · Carlos J. Gil Bellosta

Mi infraestructura para Python

Resumen: He decidido usar RStudio como IDE para Python. RStudio no es el mejor IDE para desarrollar, pero es incomparablemente mejor que cualquier otro IDE para explorar, etc. Funciona muy bien y solo puede mejorar. He decidido pasar de Jupyter. Los notebooks valen para lo que valen, pero no para lo que hago. En caso de necesidad, uso Rmarkdown con bloques de Python. De nuevo, funcionan muy bien y solo pueden mejorar. Finalmente, he decidido pasar de Anaconda. Tiene incompatibilidades con RStudio. Particularmente, cuando los módulos de Python tratan de cargar shared libraries. Los módulos de Anaconda tienen el vicio de buscarlos dentro del directorio de instalación, pero al lanzar el intérprete de Python a través de reticulate, en Linux parece que los busca en el sistema (por debajo de /usr/lib y similares). Y todo se rompe mucho. Mucho y muy, muy feo. Así que uso los Python (3.7 cuando puedo, otras versiones cuando me obligan) del sistema. Pero la instalación del sistema es mínima. He creado varios environments ad hoc (y dentro de un directorio ad hoc para ellos) y obigo a reticulate a usarlos (vía use_virtualenv()) según conveniencia. En ellos tengo todas las dependencias (de numpy para arriba). ...

6 de junio de 2019 · Carlos J. Gil Bellosta

Causalidad. Atribución. Madrid Central.

Si hay algo inaprensible, es la causalidad. No la que entiende Maripili, claro, sino esta. Pero vivimos en tiempos de tremendamente polémicas y presuntamente potentísimas y causas eficientes. Verbigracia, la desigualdad… y Madrid Central: Que dizque hace subir el precio de los pisos el 2.67% más que en su derredor. Que dizque incrementa / reduce el tráfico en su frontera. Que dizque… Argumentas en términos causales cuando esperas que te lea Maripili. Entre gente seria solemos hablar más bien de atribución. Lo de la atribución consiste en tratar de repartir un efecto entre posibles causas potenciales. Como típicamente no hay criterio definitivo, en la práctica funciona así: ...

5 de junio de 2019 · Carlos J. Gil Bellosta

Feria del libro, 2019

Fui a la Feria del Libro. El calor era el de L’Étranger. Comencé por la caseta uno. TOC. Riguroso orden hasta la cientiypico. Libros, libros por todas partes… Autoayuda. Autoayuda. Reverté (¿recopilatorio de artículos?). Libros rosas, libros con nombres y fotos de mujeres en la portada. Autoayuda. Infantil. Losantos y su Barcelona. Autoayuda. Dos pornógrafas. Los gatitos (y la filosofía) de Stoya. Autoayuda. DIY. Facsílmil de Voynich. Los mismos libros una y otra vez. Más autoayuda y libros facilongos. Marx y esas cosas. ...

4 de junio de 2019 · Carlos J. Gil Bellosta

Un esquema simpsoniano para repensar el presunto incremento de la desigualdad

Consta de tres simples pasos: Repasa mentalmente una serie de profesiones: taxista, profesor, agricultor, enfermera, músico, programador, prostituta, camarero,… Compara mentalmente los ingresos del 1% más rico con el del 10% más pobre. Compara mentalmente el peso relativo de las distintas profesiones en el tiempo.

3 de junio de 2019 · Carlos J. Gil Bellosta

Modelos GARCH (o: no me cuentes tu vida, dame el pxxx modelo generativo y ya)

Los modelos GARCH son otra de esas cosas de las que oyes hablar y como nunca se convierten en problemas de los de carne en el asador, preocupan poco y ocupan menos (más allá de que sabes que se trata de modelos similares a los de series temporales de toda la vida donde la varianza varía de cierta forma a lo largo del tiempo). Pero comienzas a leer cosas como esta y no te enteras de nada: solo hay letras y llamadas a funciones oscuras y oscurantistas. ...

31 de mayo de 2019 · Carlos J. Gil Bellosta