La media y el riesgo (de nuevo)

Hoy me han preguntado una cosa algo rara. Era alguien del departamento de riesgos de una conocida entidad financiera que quería saber cómo calcular (con SAS) la media del LTV. El LTV, aunque tiene otras acepciones, significa en este contexto loan to value, el cociente entre el valor de un préstamo y valor del colateral que lo respalda. (Este LTV tiene que ver con el famoso le financiamos el 80% del valor de la inversión de otras épocas. Un préstamo con un LTV bajo es seguro: el banco puede con más o menos facilidad recuperar el 100% del capital prestado; un préstamo con un LTV alto es mucho más problemático.) ...

30 de julio de 2012 · Carlos J. Gil Bellosta

¡A los datos mismos!

Me llamaron (y aún no tengo claro qué hay de lo mío en el asunto) para un proyecto. Consistía en estimar el tiempo que lleva completar determinados procesos en una conocida empresa. Cada proceso $P_i$, se ve, consistía en una sucesión de subprocesos parametrizados, por lo que las duraciones podrían calcularse algo así como $$ P_i=p_{i1}+\dots+p_{ik}.$$ Además, cada $p_{ij}$ dependía de ciertos parámetros, aunque eso no es lo más relevante para el caso. ...

27 de julio de 2012 · Carlos J. Gil Bellosta

Hemos cerrado el curso básico de R

El curso básico de R ha concluido. Hemos tenido 904 inscritos (aunque de ellossolo un porcentaje pequeño ha tenido una participación activa) que a lo largo de 5 semanas han seguido el programa que planteamos Juanjo Gibaja y yo. Quiero dar las gracias a los participantes en el curso y muy particularmente a quienes han contribuido más activamente en nuestra plataforma de preguntas y aprendizaje. Al acabar hemos hecho una pequeña encuesta entre quienes lo han seguido con los resultados siguientes: ...

26 de julio de 2012 · Carlos J. Gil Bellosta

Graficaca 2.0

Hace casi veinte años, cuando tomaba mis lecciones de conducción, el profesor de la autoescuela —a la sazón, mi tío— pronunció una frase que aún me persigue. Todavía hoy, casi veinte años después, me ocurre que, inopinadamente, me abstraigo del mundo y la pondero. Y sigo sin saber por dónde agarrarla. Lo que aquel día dijo mi tío tras levantar la cabeza del Marca (y mientras yo me afanaba por aparcar en batería en un costado de la ciudad universitaria de Zaragoza) fue lo siguiente: “La quinta del Buitre le ha hecho tanto bien como mal al Real Madrid”. ...

25 de julio de 2012 · Carlos J. Gil Bellosta

Desahucios en España y su estructura geográfica

Participo (de manera muy pasiva) en un foro de periodismo de datos de Barcelona. En él se planteó la posibilidad de desarrollar un proyecto para recopilar información sobre desahucios y entender mejor este fenómeno. La iniciativa partió de Carlos Alonso, Concha Catalán y Karma Peiró y, recientemente, Alberto Gonzalez Paje ha cruzado varias bases de datos (como esta, la de la población por provincias del INE, etc.) para crear el material con el que he construido el siguiente gráfico: ...

20 de julio de 2012 · Carlos J. Gil Bellosta

Las IV Jornadas de Usuarios de R están aquí

Como imagino que ya sabréis, las IV Jornadas de Usuarios de R están aquí. El anuncio oficial, reproducido debajo, se hizo ayer: Escribo en nombre de los comités organizador y científico de las IV Jornadas de Usuarios de R para anunciarlas pública y oficialmente. Tendrán lugar los días 15 y 16 de noviembre en el CREAL, Barcelona y está coorganizadas por el CREAL, el Grupo de Usuarios de R de Barcelona y la Comunidad R Hispano. ...

19 de julio de 2012 · Carlos J. Gil Bellosta

Conferencia sobre Grandes Datos

Permítanme mis lectores matar dos pájaros con una misma entrada. La primera es anunciar que se está organizando una conferencia sobre Grandes Datos en Madrid este invierno. Tendrá lugar los días 14, 15 y 16 de noviembre. Los organizadores la anuncian así: Un grupo informal de universidades, grupos de desarrolladores y empresas tienen el honor de organizar un congreso sobre Grandes Datos en Madrid, España. El congreso introducirá formalmente la disciplina de los Grandes Datos en España a través de una completa revisión de todas las áreas que incluye, desde la minería de datos y su limpieza hasta el análisis, la modelación y la distribución. ...

18 de julio de 2012 · Carlos J. Gil Bellosta

Dos cursos de R en la U. de Murcia

La Universidad de Murcia ha organizado dos talleres sobre R: Iniciación a los gráficos estadísticos con R, el día 19 de julio de 2012, de 10:00 a 13:00h. Creación automática de informes con R: markdown + knitr, tendrá lugar el 24 julio a la misma hora. Ambos tienen un enfoque eminentemente práctico y podrán seguirse por videoconferencia (entrando como invitado).

17 de julio de 2012 · Carlos J. Gil Bellosta

El paro, ¿cosa de hombres?

Está de moda hablar de paro. Pero las discusiones al respecto adolecen de una serie de carencias: Son excesivamente retrospectivas: nos aburren con la serie temporal, lo que pasó en 2003, en 1995 y otras fechas ya amortizadas. Tienen un sesgo administrativo: honestamente, lo que pase en Andalucía importa (o debería importar) poco a un andaluz que acaba de graduarse y busca su primer empleo. Además de que existen opciones fuera de las distintas comunidades autónomas, no hay un mercado de trabajo sino cientos de mercados de trabajo estancos dentro de cada una de ellas. El tema de la desigualdad entre sexos se trata de manera totalmente pueril: apenas se hace un esfuerzo por controlar el resto de las variables de confusión que pueden afectar a las tasas de paro entre sexos (p.e., la edad, el nivel educativo, etc.). Interesa más pensar qué puede pasar en el futuro. Es complicado pero, aun así, hay fenómenos (como los demográficos) de una inercia ineluctable. Nuestros políticos, además, deberían estar pensando cuántos médicos, cuántos ingenieros, cuántos electricistas puede necesitar nuestra economía al cabo de los plazos multianuales que necesita la formación de nuevos profesionales. Para que no nos pase como en el pasado. ...

16 de julio de 2012 · Carlos J. Gil Bellosta

Edad, nivel de formación, sexo y paro

No sé si alguien podrá ayudarme con este gráfico que he hecho con Mondrian: Está construido a partir de los microdatos de la última EPA e indica el porcentaje de parados (resaltado en verde) dentro de las siguientes tres categorías: Tramos de edad (ordenados) Nivel de estudios (desde los que no han completado la primaria hasta los universitarios) Sexos Desafortunadamente, he perdido las etiquetas. ¿Podría alguno de mis lectores ayudarme a identificar a qué categoría pertenece cada barra?

12 de julio de 2012 · Carlos J. Gil Bellosta