Las cosas son azules, las personas son rosas (dicen algunos sicólogos)

El otro día hablé con un amigo. Estaba un tanto preocupado por lo que cuento a continuación. Trabaja en un lugar que organiza conferencias, seminarios, etc., y frecuentemente suben los vídeos a Youtube. Al examinar el perfil demográfico de los _yutuvidentes _advertía con desazón que entre los de los vídeos de unas charlas de tecnología muy friquis apenas había un 10% de mujeres. El autor de un blog que sigo también está preocupado. El hombre lidera (no sé cómo de formalmente) una comunidad de _racionalistas _(aunque yo los catalogaría más bien como empiristas). Escribe sobre temas… imaginaos cuáles serán si me interesan a mí. Y el motivo de su preocupación no es tanto, sospecho, la escasa presencia de mujeres en la antedicha comunidad sino la posibilidad de que lo puedan acusar de lo habitual. Es decir, tener una actitud discriminadora, hostil o menospreciante. ...

5 de octubre de 2017 · Carlos J. Gil Bellosta

Circiter

Este es, finalmente, el anuncio de que Circiter existe. Circiter (una SL con todas las de la ley) es la empresa a través de la que voy (vamos: nótese que hablo en plural) a trabajar en el futuro. Qué hacemos (qué nos gusta) Esencialmente, cuatro cosas: Formación, si toca. No es lo más emocionante, pero mientras siga inflándose la burbuja, ahí estaremos. Tenemos varios cursos preparados (dos niveles de R, Spark, etc.) y bajo pedido, de lo que sabemos, lo que haga falta. Sistemas, programación, etc. Generalmente, relacionado con ciencia de datos. E incluyendo cosas como migraciones de sistemas viejunos a R o Python, aggiornamento de código, produccionalización, etc. Ingeniería estadística. Análisis de datos, cómo no. Aunque es la actividad que encuentro que peor se acomoda dentro de la consultoría, además de que comercialmente lo tenemos muy crudo de competir con los vendedores de humo que todos conocemos. En resumen, aquello de lo que hablo por aquí. ...

4 de octubre de 2017 · Carlos J. Gil Bellosta

Vivir del ruido

Tienes acceso a la serie histórica de hospitalizaciones (p.e. en Madrid) por diversas (muchas) causas. Tienes acceso a la serie histórica de mediciones de distintos factores ambientales (p.e., en Madrid): ruido, óxidos de nitrógeno, partículas en suspensión,… Buscas correlaciones (y, por supuesto, las encuentras). Les asocias p-valore espurios. Lo escribes en inglés (frecuentemente) y publicas: Effect of Environmental Factors on Low Weight in Non-Premature Births: A Time Series Analysis Effects of noise on telephone calls to the Madrid Regional Medical Emergency Service (SUMMA 112) Short-term association between environmental factors and hospital admissions due to Dementia in Madrid Impacto de la contaminación asociada al tráfico y la temperatura sobre variables adversas al nacimiento en Madrid. Un análisis de series temporales. Short-term association between road traffic noise and demand for health care generated by Parkinson’s disease in Madrid Traffic noise and adverse births outcomes in Madrid Evaluation of short-term mortality attributable to particulate matter pollution in Spain Impact of road traffic noise on cause-specific mortality in Madrid (Spain) Association between environmental factors and emergency hospital admissions due to Alzheimer’s disease in Madrid Saharan dust intrusions in Spain: Health impacts and associated synoptic conditions Emergency multiple sclerosis hospital admissions attributable to chemical and acoustic pollution: Madrid (Spain), 2001-2009 ¡Eso es a lo que Lakatos llama un señor programa de investigación científica!

3 de octubre de 2017 · Carlos J. Gil Bellosta

CatastRo, un paquete de R para consultar la API del Catastro

Informo de que está disponible en GitHub el paquete CatastRo para consultar la API pública del Catastro. No es una API particularmente extensa, pero es de esperar que se amplíe el catálogo de servicios disponible cuando comencemos a machacarla (o no: a saber qué hay en la mente de esa gente). El paquete es el trabajo de fin de máster de mi alumno Ángel Delgado Panadero en el máster de ciencia de datos de la UTAD.

2 de octubre de 2017 · Carlos J. Gil Bellosta

Bus al norte, bus al sur

El día 2017-09-20 hubo gente que tomó el autobús en Madrid. Se montó en una determinada parada y la siguiente estaba situada o bien al norte o bien al sur de la anterior. He contado, por horas, cuánta gente viajó en ese primer tramo, hacia el norte y quién lo hizo hacia el sur y he obtenido que es —al contrario de los resultados presuntamente basados en datos pero, en el fondo ideológicamente sesgados con los que nos quieren tan frecuentemente vender motos— totalmente compatible con lo que todos los que nos movemos por Madrid sabemos. ...

29 de septiembre de 2017 · Carlos J. Gil Bellosta

Geofacetas

Con geofacet se puede hacer

28 de septiembre de 2017 · Carlos J. Gil Bellosta

Estadística, ciencia de datos y la revalorización del no

Ya están disponibles las diapositivas de mi charla del lunes. En los próximos días iré desarrollando algunas de las ideas, prometo que para nada estándares, que recorre en estas páginas. Les pondré un par de rombos en la esquina para avisar de que pueden resultar (lo comprobé el lunes aunque no entiendo por qué) ofensivas para personas de cierto perfil.

27 de septiembre de 2017 · Carlos J. Gil Bellosta

Ajustad vuestras prioris: la mayoría de los "programas sociales" carecen de efectos positivos

Muy frecuentemente, economistas, sociólogos, etc. publican artículos en los que se recoge la evaluación de algún tipo de programa social: políticas activas de empleo, cheques de nosequé, etc. Para ser publicados, como siempre, estos estudios tienen que tener las tres propiedades habituales: No ser obvios. Ser interesantes. No ser manifiestamente falsos (es decir, que de serlo, no se note demasiado, posiblemente, haciendo uso de tahuromaquia estadística). Esos resultados son datos observacionales que tenemos que componer con una priori para corregir el entusiasmo de los investigadores y ese amor tan cegador que suelen acabar desarrollando por el objeto de sus pesquisas. Pero, ¿cuál usar? ...

26 de septiembre de 2017 · Carlos J. Gil Bellosta

Charla en Pamplona

A la hora en que se publiquen estas líneas estaré llegando a Pamplona para participar como ponente en la jornada ¿Es la estadística una parte significativa de la ciencia de datos? organizada por el InaMat en la Universidad Pública de Navarra. La invitación ha sido una oportunidad (que agradezco muchísimo) para reflexionar sobre la problemática relación entre estadística y ciencia de datos y tratando de ser, por una vez, constructivo. A pesar de ello, mi ponencia llevará por título Estadística y Ciencia de Datos: la revalorización del “no”, que sugiere lo contrario. ...

25 de septiembre de 2017 · Carlos J. Gil Bellosta

No, la trigonometría babilónica no era "novedosa"

Supongo que en agosto todo vale en prensa. Así Solucionado un enigma matemático de 3.700 años y otros del mismo tenor en medios españoles y extranjeros (de algunos de los cuales se espera más). En el que cito dan pábulo a citas como: Nuestro estudio desvela que Plimpton 322 describe las formas de triángulos rectángulos usando una novedosa forma de trigonometría que se basa en la razón entre los números [que expresan las longitudes de los lados], sin usar ángulos ni círculos. ...

22 de septiembre de 2017 · Carlos J. Gil Bellosta