Por fecha
- 2024
- Diciembre 2024
- Una justificación desapasionada del promedio como mecanismo para agregar predicciones
- Una serie de asuntos sobre encuestas, mercados de predicciones y su intersección
- Bajo hipótesis razonables, hacen falta 16 veces más observaciones para estimar una interacción que para estimar un efecto principal
- Unas cuantas notas sobre filosofía de la ciencia
- Sobre el modelo beta-binomial con “deriva”
- Seis asuntos sobre modelización estadística, incluyendo un problema que no parece del todo trivial
- Noviembre 2024
- Unas cuantas herramientas tecnológicas
- LLMs: ajedrez, poesía, “ciencia normal”, “prompts” y “RAG”
- Sobre la verosimilitud de distribuciones “compuestas”
- LLMs: algunas herramientas (potencialmente) útiles
- La paradoja (de Simpson) detrás de ciertos argumentos en pro de una subida generalizada de salarios
- k-means “2.0” y cuatro asuntos más
- ¿A quién crees que van a votar tus vecinos?
- Un argumento en contra del redondeo y cuatro breves asuntos más
- Octubre 2024
- Los estadísticos, hasta cierto momento, no hicieron más que interpretar de diversos modos el mundo; luego, cuando quisieron transformarlo, se encontraron con una serie de problemas que no anticiparon
- Más allá del “software” libre y algunos asuntos más
- El bee-bot vía “artefactos” de Claude
- Cinco asuntos breves sobre modelización estadística
- Interpretación de modelos: el elefante en el salón
- Cómo exprimir la prueba de Kolmogorov-Smirnov y unos cuantos asuntos más
- SVI, ELBO y todas esas cosas: un ejemplo básico
- Algunos apuntes sueltos sobre causalidad
- Ergodicidad, Birkoff, Pareto, Sidgwick, utilitarismo y todas esas cosas
- Cinco breves notas sobre LLMs
- Septiembre 2024
- Exigencias aisladas de rigor (estadístico)
- Los boxplots como “herramientas de entretiempo” y cuatro asuntos más
- Probabilidad y estadística en los Ig Nobel de 2024
- Una propuesta para cambiar la sintaxis de SQL y cuatro asuntos más
- Comparaciones vs efectos y cuatro asuntos más
- Causalidad
- (Estadística y fraude electoral) vs (fraude electoral y fraude estadístico)
- Unas cuantas aplicaciones de los LLMs
- Julio 2024
- Renta básica universal y revisión de la literatura
- Mamba vs “transformers” y cuatro asuntos más
- El Elo: prácticamente una regresión logística entrenada en línea
- Argumentos para discutir sobre la inteligencia de los LLMs y cuatro asuntos más
- Monosemanticidad: una introducción para despistados
- Algunos apuntes sobre tecnología moderna y no tan moderna
- Otro índice de sorpresa y algún que otro asunto más
- Positron
- Descuentos para RCTs algunos asuntos más
- ¿Por qué es “tan fácil” la optimización en altas dimensiones?
- “El problema de la academia” y cuatro asuntos más
- Una lectura muy esclarecedora sobre la prelación entre ciencia e ingeniería
- Junio 2024
- Estimaciones, intervalos de confianza y todas esas cosas… ¿qué significan realmente?
- Un par de novedades de R 4.4.0 y algunos otros asuntos más
- Pero, ¿cuánto consumen los LLMs?
- Más sobre las R² pequeñas
- Lista de los ETFs comercializados por ING
- Manipulación y discriminación
- Regresiones con discontinuidad y algunos otros asuntos
- ¿De qué “forma” es que A causa B?
- Embeddings, LLMs y algunas de sus aplicaciones a mediados de 2024
- Descuento hiperbólico: lo que es y lo que no es
- Mayo 2024
- La regla de Edlin
- ¿Cuántas copias vende un libro?
- Alberto Olmos sobre los microfundamentos y cuatro asuntos más
- ¿Redujo el covid la esperanza de vida en 2020? No y sí, según se mire.
- Más ideas alrededor de la sentencia de lo del bono social de la luz
- Ideas alrededor de la sentencia de lo del bono social de la luz
- Neutralidad en la red (en mayo de 2024)
- Algunas novedades tecnológicas que he recopilado en los últimos tiempos (no todas rompedoramente nuevas)
- Wolfram sobre los LLMs (y otras cuatro historias relacionadas con el asunto)
- Aún más sobre la falacia ecológica
- Cortos - LLMs
- Abril 2024
- Marzo 2024
- Hoy vuelve a ser el día internacional de la copia de seguridad
- ¿Cómo se interpretan los resultados de estas regresiones
- modelplotr
- Cortos
- Cortos (sobre LLMs)
- El “perspectivismo” en el debate sobre la naturaleza, objetiva o subjetiva, de la probabilidad
- El “precio medio de la electricidad” no es el precio medio de la electricidad
- Cartogramas “de Dorling”
- Cortos (casi todos sobre R)
- Errores en modelos. Zillow. Control de alquileres.
- Los modelos bayesianos, ¿condenados a sobreajustar?
- Cortos
- Febrero 2024
- Lo que se dice sobre los LETFs
- Un truco probabilístico para balanceadores de carga
- Probabilidad y banca
- Sobre el muy necesario “Rolling Journal of Sociology”
- Unos números sobre los márgenes de la distribución
- “Outliers”: las dos aproximaciones
- Sobre la elipse que “mejor” se ajusta a una “nube de puntos”
- Mi última aplicación de los LLMs en producción
- Ajuste de modelos: Optimización vs generalización
- Enero 2024
- Sobre la interpretación de los indicadores económicos
- Una aplicación inesperada de la detección de “outliers”
- El discreto encanto de los árboles olvidadizos
- Nueva (y espero que última) versión de MicrodatosEs
- Causalidad en el EuroMedioMillón
- Sobre lo de Ariely, Gino, etc.
- Inmigración y PISA: ¿en qué quedamos? (si es que merece la pena)
- Causalidad: un (otro) ejemplo de libro
- Sobre los retos asociados a la “stealthflation”
- Diciembre 2024
- 2023
- Diciembre 2023
- Noviembre 2023
- Aprendizaje por refuerzo: ¿Q o no Q?
- ¿Se encoge el cerebro de los hombres cuando tienen un su primer crío?
- En defensa del futuro del subjuntivo
- El “teorema” sobre las sumas de lognormales no es solo falso sino que, además, es innecesario (en muchos casos)
- Hoy, y sin que sirva de precedente, voy a hablar de economía y política
- ¿Cuántas iteraciones necesita mi MCMC?
- Charla en la U. de Oviedo sobre sistemas de recomendación con el objetivo de ilustrar aspectos relevantes y frecuentemente olvidados de la estadística bayesiana
- La progresividad fiscal: una perspectiva temporal
- Dibujar y modelar: ¿en qué se parecen?
- ¿De dónde vienen las interacciones?
- Octubre 2023
- Más sobre paralelismos entre textos vía embeddings
- Más allá del BMI
- De qué va TimesNet
- Cuidado con ChatGPT (advertencia núm. 232923423)
- Villaverde, Carabanchel, Puente de Vallecas, Tetuán, Ciudad Lineal, Usera, Villa de Vallecas, Latina, San Blas-Canillejas, Hortaleza, Moratalaz, Vicálvaro, Retiro, Fuencarral-El Pardo, Arganzuela, Moncloa-Aravaca, Chamartín, Barajas, Centro, Chamberí, Salamanca
- LLMs: grados de libertad en la generación de texto
- ¿Y si calculamos la potencia de un test a posteriori?
- LLMs en perspectiva
- Si tus datos son minúsculos y están hipersesgados, no los tires a la basura: aquí te contamos cómo reciclarlos.
- Septiembre 2023
- ¿Qué catástrofes cabe esperar de las pruebas estadísticas con poca potencia?
- Sobre la etiqueta medioambiental de los monitores
- Cómo gestiono mis inversiones a largo plazo en renta variable
- Más sobre extensiones (bayesianas, pero no necesariamente) del t-test
- Gestión de la liquidez en tiempos de inflación
- Dos nuevos libros de estadística
- De cómo la estadística bayesiana ha descompuesto la solución a un problema que la estadística clásica tenía plusquamsolucionado
- [Super]forecasting
- Julio 2023
- Desigualdad de Schwarz y su aplicación al consumo eléctrico doméstico
- Tutorial de numpyro (I): modelos probabilísticos
- Coeficientes “no identificables”: un ejemplo y sus consecuencias
- La energía nuclear, ¿salvará el mundo?
- Subversión de convenciones gráficas: un ejemplo
- Números aleatorios, estado interno y su relación con el paralelismo
- Un gráfico con dos lecturas muy distintas
- El modelo 3PL, ajustado con numpyro
- Junio 2023
- Mnemo, la aplicación
- Acerca de “Ver como un mercado”
- La paradoja de Lord, de nuevo
- “Goals based investment” (y su relación con la modelización probabilística)
- Paralelismos entre textos vía embeddings: el caso, por poner uno, de los evangelios de Mateo y Marcos
- Si Pearson hubiese tenido un ordenador como el mío…
- Un duelo de aforismos sobre datos
- Vehículos particulares: estimación del número de kWh/día por conductor en España
- Cómo “vender” los “algoritmos”
- Mayo 2023
- La ley fuerte de los números pequeños
- ¿Estamos tratando justamente a los “algoritmos”?
- 48 horas de consumo doméstico real de electricidad
- Twitter API: cómo usar una única cuenta para tuitear en nombre de terceros
- Problemas de los promedios de encuestas electorales
- Nivel de estudios: padres vs hijos
- Encuestas vs predicciones electorales
- Buscándole las cosquillas al “Indicador Multidimensional de Calidad de Vida”
- Acciones “disparadas” por chatGPT (y sus verdaderos peligros)
- Abril 2023
- Siete problemas matemáticos que plantea el “deep learning”
- Estadísticas creativas: el “peso del paro”
- ¿Dejar morir pxR?
- Código para resolver “wordles” en español
- ¿Qué distribución usar? ¡Examina el proceso generativo!
- El impacto de la contaminación de los diésel: dos perspectivas sobre el “Volkswagen affaire”
- Extrapolar es difícil (¿imposible?); hoy, con “sigmoides”
- Kant: probabilidad y apuestas
- Marzo 2023
- Mañana vuelve a ser el día internacional de la copia de seguridad
- Todos los SE son iguales, pero algunos son más iguales que otros
- Mi “home server”
- Reducción del error en tests A/B (y similares)
- El negocio bancario como corolario del teorema central del límite (y sí, de paso, sobre SVB)
- De la paradoja de la patata a los neo-Protágoras de la estadística
- Memes, memes estadísticos y sofística
- Un estadístico le echa un vistazo a su consumo eléctrico en tiempo real
- Breve introducción crítica a la llamada “predicción conforme”
- Febrero 2023
- ¿Se puede levantar la mano y decir que la curva, esencialmente, crece y no decrece?
- Una “app” para la selección de parámetros de prioris informativas
- Todo sobre la wifi
- Descuento hiperbólico: una perspectiva bayesiana
- Programación: aspectos sicológicos
- Ajuste de modelos lineales y predicción de valores con numpyro
- Nueva “edición” de mi libro de R
- Enero 2023
- Llevando la contabilidad de los grados de libertad
- Esta entrada no tiene título porque no se me ocurre ninguno sin “spoilers”
- Funciones de enlace “por defecto” en (ciertos) GLMs
- Una regresión de Poisson casi trivial con numpyro
- Autoencoders: una serie de lecciones aprendidas
- Otra forma de llegar a la distribución normal
- “Denoising diffusion” en una dimensión (entre otras simplificaciones)
- Google vs Goodhart vs GPT-n vs el nuevo (y desconocido) equilibrio
- Variaciones de la opinión sobre fenómenos pretéritos
- 2022
- Diciembre 2022
- Aristóteles sobre lo probable y lo improbable (y, más concretamente, sobre la frecuencia de eventos muy improbables)
- Curso en línea: “R para visualización de datos”
- Curso en línea: “R para visualización de datos”
- Sobre la correlación entre Y y la predicción de Y
- Significativo vs significativo
- Raking, Introdución al
- Nuevo vídeo en YouTube: “Sobre chatGPT”
- Si no podemos dilucidar si algo crece lineal o exponencialmente, ¿qué podemos saber?
- Una entrada para desocupados que buscan causas que libren al mundo de todo neomal
- ¿Por qué son los eventos (en probabilidad) conjuntos y no otra cosa?
- Noviembre 2022
- El origen de uso moderno del término “variable aleatoria” podría estar en un artículo publicado en italiano en una revista oscura en 1913
- Sobre la llamada ley del estadístico inconsciente
- RSA para exmatemáticos
- Operacionalización de la “igualdad de opotunidades”
- Sobre la “African dummy”
- ¿Qué hora debería ser?
- UMAP, tSNE y todas esas cosas
- El equivalente cierto (y apuntes para su aplicación en el monotema ¡tan cansino! de este tiempo)
- Octubre 2022
- Los muchos nombres de la inflación
- 2.551879e+18 julios anuales
- ¡Cuidado con las discontinuidades (subrepticias o no) en las escalas de color!
- Nuevo vídeo en YouTube: “¿Por qué nos volvemos bayesianos con la edad?”
- Bayesianismo y frecuentismo bajo la óptica de la teoría de la decisión, y IV
- Bayesianismo y frecuentismo bajo la óptica de la teoría de la decisión, III
- Bayesianismo y frecuentismo bajo la óptica de la teoría de la decisión, II
- Bayesianismo y frecuentismo bajo la óptica de la teoría de la decisión, I
- Septiembre 2022
- “Ensembles” meteorológicos: ¿probabilísticos o no?
- Uso y abuso de los “embeddings”
- Nuevo vídeo en YouTube: “Una charla de 2013 sobre la EPA”
- Herramientas para ETLs en memoria
- Perder ganando (o a la inversa)
- Errores en cierto tipo de encuestas
- Un ejemplo de regresión con pérdidas asimétricas
- Un problema no tan simple de probabilidades resuelto usando frecuencias naturales
- TF-IDF
- Julio 2022
- npl(nadaesgratis.es): el subproducto
- El hueco térmico: una caracterización vía kmeans
- Una crítica a una crítica de MoMo
- “Scorings” para evaluar predicciones expresadas en términos de CIs
- Medidas de similitud entre distribuciones
- El estilo es la coocurrencia de patrones
- L-momentos: en busca de la intuición
- Sobre la hipótesis de la variedad
- Junio 2022
- Sumas de variables de Bernuilli heterogénas
- “Frente a la aspiración de una representación precisa, debemos considerar las limitaciones conceptuales, matemáticas y computacionales”
- Una aplicación/ilustración casi “full Bayesian” del filtro de Kalman
- Matrices de confusión, sensibilidad, especificidad, curva ROC, AUC y todas esas cosas
- Un matemático visita los modelos de difusión (generativos)
- Umbralistas vs antiumbralistas
- Vale, el modelo es y = f(x) + error y f es importante, pero lo que le da significado es y
- “Generalized random forests”: una introducción
- Cómo organizar un proyecto de análisis de datos: primeros pasos
- Mayo 2022
- NannyML: ¿estima realmente la bondad de un modelo sin grupo de control?
- CRPS
- Log scoring = máxima verosimilitud
- Algunos números sobre el cambio climático: servicios en la nube
- Cómo se calcula (vs cómo podría calcularse) la inflación
- El principio de mediocridad como instrumento para estimar duraciones
- Si yo fuera rey, ¿cómo serían las encuestas electorales?
- Causalidad e individualismo metodológico
- WGS84 vs ETRS89 vs ED50 vs Madrid 1870
- Abril 2022
- Principios de geodesia
- Probabilidades subjetivas: una redefinición “profesional”
- ¿Qué es “seguro”?
- El coste nivelado de la energía: la plantilla
- Causalidad: en defensa de Hume
- Gráficos mejorables en REE
- Doxa, episteme y gnosis: una reinterpretación bayesiana
- ¿Por qué no funcionan las intervenciones buenistas?
- Marzo 2022
- Un experimento físico (y su relación con la causalidad) (II)
- Nuevo vídeo en YouTube: “Causalidad: una charla con Carlos M. Madrid Casado”
- Un experimento físico (y su relación con la causalidad) (I)
- La infradispersión como indicio de fraude
- Diagramas causales hiperbásicos (III): mediadores
- Diagramas causales hiperbásicos (II): ¿qué significa “controlar por” una variable?
- Sobre la sistemática infraestimación del error en las encuestas
- Diagramas causales hiperbásicos (I): variables omitidas y sus consecuencias
- Estadística en las ciencias blandas
- “Proxys”: error y sesgo en modelos lineales
- Usos de la versión barata de la entropía
- Febrero 2022
- Nuevo vídeo en YouTube: “Modelos estadísticos vs comportamiento estratégico”
- ¿Converge Bayes demasiado rápido?
- Un gráfico para quitarse el sombrero
- Exámenes probabilísticos
- Otra correlación del siglo XXI
- El sesgo de supervivencia: más allá del manido avión de la IIGM
- El efecto “pierna rota”
- ¿Qué nos enseña la historia de los granos de trigo sobre el muestreo de las posterioris?
- Abundancia roja: una miniperspectiva matemática e informática
- Enero 2022
- Inflación… ¿media?
- Universo y muestra: un ejemplo muy didáctico en el que La Caixa lo hace todo mal
- La peor página de N. Taleb
- Las reglas generales son para lacayos; el contexto, para reyes
- Cambio climático e incertidumbre
- La (mejor) caracterización de la binomial negativa (en términos de la Poisson y la gamma)
- ¿Cómo ha evolucionado la altura media de los animales del zoo de Madrid en los últimos años?
- ¿Por qué vivimos tantos españoles a tanta altitud?
- Diciembre 2022
- 2021
- Diciembre 2021
- Una forma insidiosa de spam
- He migrado el blog a Hugo
- Más sobre el exceso de mortalidad en noviembre de 2021
- Sobre el exceso de mortalidad en noviembre de 2021
- Más sobre la estimación de probabilidades de eventos que no se repiten
- Estadística vs siquiatría: la aparente contradicción, la profunda síntesis
- ¿Por qué cabe argumentar que estos resultados infraestiman la efectividad de las vacunas contra el covid?
- Noviembre 2021
- Un episodio relevante para estas páginas extraído de “Un espía perfecto”
- Medias ponderadas a lo Uluru
- Sobre el almacenamiento “industrial” de la energía eléctrica
- Garantías de robustez en inferencia causal
- La miseria de la inferencia causal vivida
- Nuevo vídeo en YouTube: “Street Fighting Statistics (2/n)”
- ¿Es Bunge un fraude?
- Más sobre aquel concepto estadístico que aconsejé desaprender: la suficiencia
- Octubre 2021
- Dos cuestiones sobre la naturaleza de la probabilidad planteadas por Keynes en 1921 pero que siguen hoy igual de vigentes
- Monty Hall, reformulado
- Sobre las R² pequeñas y sus interpretaciones
- Evindencias sobre la vigencia del operacionalismo en estadística
- Causalidad inversa: más sobre los momentos “Le Verrier”
- ¿Una nueva afición para los próximos 10-15 años?
- ¿Cómo aleatorizan las columnas los RRFF?: un experimento mental y una coda histórica
- Cuantificación de la incertidumbre
- Esos felices “momentos Le Verrier”
- Septiembre 2021
- Un curso de estadística de Antonio José Pou y Ordinas muy recomendable
- En respuesta a los “dudacionistas” de la vacuna que me preguntaron, preguntan o preguntarán
- Aún más sobre propagación de errores (y rv)
- Sobre la economía conductual
- Nuevo vídeo en YouTube: un artículo y tres problemas metodológicos
- Agosto 2021
- Julio 2021
- Apuntes para el estudio del impacto del cierre de la central nuclear de Garoña en el precio de la electricidad en España
- ¿Quién inventó los “random forests”?
- Mi apuesta para el larguísimo plazo: Julia
- Nuevo vídeo en YouTube. Segunda entrega sobre causalidad (y, esta vez, datos observacionales)
- Hayek vs “Machín Lenin”
- La miseria de la sicología de la percepción
- Junio 2021
- Nuevo vídeo en YouTube: sobre el futuro a corto y medio plazos de la ciencia de datos como negocio en España
- Mi mapa provincial favorito
- Nuevo vídeo en YouTube. Esta vez, sobre la falacia ecológica
- Cournot sobre el “efecto Roseto”, 120 años antes de tal
- ¿Viven más los ganadores de los Óscars (que otros actores no premiados)?
- Sobre el llamado “efecto Roseto”
- PCA robusto
- Mayo 2021
- Todavía más sobre las proyecciones de población a largo plazo del INE
- Nuevo vídeo en YouTube: “¿Se pueden estimar probabilidades pequeñas con pocas observaciones?”
- ¿Por qué nos habremos acostumbrado a esto?
- Un viejo truco para que R vuele
- Causalidad y paraísos fiscales
- Nuevo vídeo en YouTube: una breve introducción a la causalidad “a la Pearl”
- Nuevo vídeo en YouTube: charla con J.L. Cañadas
- Más sobre si la estadística es una ciencia
- Abril 2021
- Una nota sobre el artículo “retractado” porque sus autores habían omitido vínculos con la industria del tabaco
- Un artículo muy poco BdE del BdE
- Nuevo vídeo en YouTube: analizo un proyecto de fugas de clientes en Paypal
- Más sobre ese corolario del teorema de Rolle que es la curva de Laffer
- Nuevo vídeo en YouTube: micromuertes
- El mejor negocio de la década
- Formalismos y modelos
- Sobre las probabilidades de eventos que ocurren una única vez
- Sobre Helium: ¿un esquema piramidal?
- Nuevo vídeo en YouTube. Esta vez, sobre encuestas.
- ¿Por qué es tan enrevesada la definición de intervalo de confianza?
- Marzo 2021
- Sobre rectángulos largos y estrechos
- Gigerenzer sobre riesgo e incertidumbre
- ¿La teoría de la probabilidad no extiende la lógica?
- Nutri-Score: el “algoritmo”
- La falacia de la conjunción desaforada
- Sobre la “inferencia basada en magnitudes”
- Nuevo vídeo en YouTube: ¿son las probabilidades “subjetivas”? ¿Existe el azar?
- Sobre el teorema de Aumann
- Un argumento para usar la normal: la maximización de la entropía
- Febrero 2021
- Nuevo vídeo en YouTube: sobre mi “filosofía” de modelización de datos
- Sobre sumas de cuadrados de normales con varianzas desiguales
- Tres “teoremas” que son casi ciertos
- Nuevo vídeo en mi canal de YouTube: conversación con Luz Frías
- ¿Dónde son más frecuentes las muestras de una distribución en dimensiones altas?
- Hay mil motivos para criticar una regresión “trucha”, pero una R² baja no es uno de ellos
- Solo el modelo vacío pasa todos los “checks”
- El teorema de Bayes como la versión modal del modus tollens
- Separación perfecta en el modelo de Poisson
- Allanando el camino a Andorra (aka he publicado mi primer vídeo en YouTube)
- Enero 2021
- Simpson sobre la desigualdad
- ¿Qué modelas cuando modelas?
- Más sobre el mito de la objetividad (especialmente, la “data-driven”)
- Estos keynesianos ven el mundo de una manera muy, muy loca
- Más capítulos del libro de estadística (y otras cosas y proyectos para 2021)
- Sobre la relación entre la teoría de la relatividad y la regresión logística
- Tres pirámides poblacionales con nombre
- Mis prioris sobre la vacuna: ¿por qué estarían tan desviadas?
- Diciembre 2021
- 2020
- Diciembre 2020
- Sobre el “programa fuerte” de la sociología de la ciencia: una visión desde la “ciencia de datos”
- La interpretación de “significativo” en un caso muy concreto
- Encuestas (electorales), medios y sesgos
- La lotería del hardware y la cámara de resonancia académica
- Máxima verosimilitud vs decisiones
- En respuesta a los que me preguntan si pondré “la vacuna”
- Sobre la “Carta de Derechos Digitales”
- Análisis de eventos recurrentes
- Noviembre 2020
- “Introducción a la probabilidad y la estadística para científicos de datos”: segunda entrega
- ¿A que les ha jugado una mala pasada el Excel?
- Sobre los orígenes de la falacia ecológica
- Distancias (V): el colofón irónico-especulativo
- Distancias (IV): la solución rápida y sucia
- La “cocina”, para anumeristas y conspiranoicos
- Inferencia causal: entrevista a Pearl (el 2020-11-17, es decir, mañana)
- ¿Qué números admiten la distribución de Benford?
- De A/B a DiD
- Codificación de categóricas: de (1 | A) a (B | A)
- No es tanto sobre la media como sobre la maldición de la multidimensionalidad
- Distancias (III): la gran pregunta
- Canales (o estéticas), de mejor a peor, según Healy
- PIB trimestral: una alternativa gráfica a la representación tradicional para los tiempos del coronavirus
- Distancias (II): las distancias no son distancias
- Distancias (I): el planteamiento del problema
- Octubre 2020
- ¿Mercados de apuestas como cobertura?
- Algoritmos y ética circa 1950
- Qué métodos estadísticos utilizar si el pan de tus hijos depende de que las p sean pequeñajas
- Anomalías, cantidad de información e “isolation forests”
- Intervalos de confianza y la velocidad de la luz
- Corrección en mi entrada “Comentarios varios sobre un artículo de El País sobre MOMO”
- Comentarios varios sobre un artículo de El País sobre MOMO
- ¿Modelos para ordenar datos?
- z-scores, p-scores y el problema de las áreas pequeñas
- ¿Cómo asignar probabilidades? Simetría y universalidad
- El “nowcast” de MOMO, por qué sobreestima en el año del coronavirus y qué pasará en los siguientes si no se remedia
- Con un poco de imaginación, la teoría lo aguanta todo
- “Introducción a la probabilidad y la estadística para científicos de datos”: primera entrega
- Explicación de los scorings de “ciertos” modelos
- IGN + R + leaflet
- Explicación de modelos como procedimiento para aportar valor a un “scoring”
- Usa uno u otro mapa, según tus intereses
- El modelo de Poisson es razonablemente robusto (pero atención a lo de “razonablemente”)
- Neyman y la definición original de los intervalos de confianza
- Una potencial consecuencia positiva de lo del coronavirus
- Socialismo y fascismo en Italia: una reflexión sobre la causalidad y las microcausas
- “Regression models that claim to reach causal conclusions, as favoured by economists”
- Septiembre 2020
- Una guía (breve, concisa) para crear código (y proyectos) reproducibles
- Un extracto del documento metodológico de las proyecciones de población del INE
- Las diapositivas de mi charla sobre sobredispersión en modelos de Poisson, disponibles
- Los orígenes de la sicología WEIRD
- Un decepcionante método de “inferencia robusta” para GLMs de Poisson
- Este es uno de los pecados estadísticos que menos indulgencia suscita
- Una diferencia teórica importante entre los lm y el resto de los glm
- En defensa de iris
- Esto no es práctico, pero sí bonito; bonito, además, de esa forma inasequible a la chusma
- Una herramienta para el análisis no paramétrico de series temporales
- Charla sobre cosas que no te han contado sobre le modelo de Poisson (y de paso, el logístico)
- Infradispersión en la logística
- Recordatorio: no olvidéis restar los fallecimientos atribuibles al calor en la estimación del efecto de la “segunda ola”
- De “la fiebre amarilla de Cádiz y pueblos comarcanos” de 1800
- Distribuciones (¿de renta? ¿solo de renta?) a partir de histogramas
- Este vídeo es un resumen en 15 minutos de años de entradas de este blog, solo que contado todo al revés
- Más sobre variables instrumentales con R
- Muchos cocineros con la misma receta…
- El pozo aristotélico
- Contrariamente a lo que creía recordar, “Hot deck” != LOCF
- Hoy sí, sobre tetas y culos (e Instagram, como excipiente)
- ¿CDO de, p.e., España? Nah…
- Agosto 2020
- Julio 2020
- Misma p, distinto n, luego…
- ¿Un “Instituto Nacional de Datos”?
- “Transformación digital”
- Modelos como “hechos estilizados”
- Un recordatorio: MOMOCalor está “up and running”
- Rarezas: ML algebraico
- Por supuesto que tengo más variables que observaciones… ¿y?
- Aún más sobre la presunta sobredispersión en modelos de Poisson
- Análisis de arquetipos
- Mi parrafito favorito de “Number Sense”
- Más sobre la presunta sobredispersión en el modelo de Poisson
- No, tus datos no “tienen sobredispersión”: es que el gato de Nelder se ha merendado la epsilon
- Más sobre el artículo raro, raro, raro
- Sobre el efecto medio
- El incentivo perverso
- La pregunta a la que el TCL es una muy particular (y mucho menos importante de lo que habitualmente se cree) respuesta
- Sobre la curva ROC como medida de bondad de clasificadores
- ¿Qué queda de la “estadística robusta” clásica?
- Regresión polinómica vs redes neuronales
- Un artículo muy raro, raro, raro
- Junio 2020
- AI (o ML, o DM, o…) y la “crítica de Lucas”
- Sobremuestreando x (y no y)
- ¿Criptobayesianismo?
- Sobre predicciones puntuales
- La regresión logística como el modelo más simple posible (que…)
- ¿Cuándo falla lasso?
- Escalabilidad (y estructuras cooperativas)
- RuleFit
- Bagging y boosting, hermanados
- Un mecanismo para fomentar la provisión privada de bienes púbicos
- Coronavirus: prevalencia, sensibilidad y especificidad
- Cuidado con la aleatoriedad “pochola”
- Explicación de modelos
- Un marco conceptual para repensar los presuntos sesgos del AI, ML, etc.
- Sobre “Predicción, estimación y atribución”
- 53 (o, ¿cuál es la prior?)
- Aleatoriedad hirsuta, aleatoriedad pochola
- De histogramas a distribuciones (usando la de Burr)
- Programación lineal, de nuevo
- La antifragilidad del kioskero de Watchmen
- No hagáis esto o se darán cuenta de que sois muy cutres
- La ley de la cerveza para pintar nubes (y su relación con el análisis de la supervivencia)
- Mayo 2020
- No leáis nada de lo que diga este inepto: no sabe por dónde le pega el aire
- Sobre la función de riesgo en el análisis de la supervivencia
- ¿Por qué el optimizador de una red neuronal no se va al carajo (como suelen L-BFGS-B y similares)?
- “Poor Economics”: el resumen
- “The great reset”
- Optimización estocástica
- Análisis (bayesiano) de pruebas con sensibilidad/especificidad desconocida
- ¿Estos son los argumentos para “un debate riguroso sobre las transferencias de renta”?
- Micromuertes y coronavirus
- ¿Cómo pensar en la probabilidad de un evento?
- Un marco sobre el que reflexionar sobre el estudio de seroprevalencia ENECovid19
- La gramática del análisis explicativo interactivo de modelos
- En defensa de Simón: variaciones diarias de la mortalidad
- Cuando sea mayor, quiero escribir informes como esos
- ¿Agregar antes de modelar?
- Lo que queda cuando has eliminado tantas cosas que ya no se entiende nada se llama “paper”
- Coronavirus cualitativo
- Wikipedia y causas de muerte
- Movimientos brownianos y barreras
- ¿42.000 muertes por coronavirus? Una corrección de la heterogeneidad
- Abril 2020
- Sobre lo de “publicar cuando ya no hace falta”
- La lista de la vergüenza: los municipios con registros civiles no informatizados
- Más sobre el consumo alimentario mensual en los hogares españoles en R
- Muestreo, sensibilidad y especificidad
- ¿Por qué fluye el tiempo de izquierda a derecha?
- Charla (mía) sobre impacto causal mañana viernes 24
- Reducción de la dimensionalidad
- Defunciones: INE vs MoMo
- Activa Madrid: el laboratorio de ideas
- Be-MOMO
- Cosas que ocurrirán sin lugar a dudas tras el coronavirus
- Consensus clustering
- Regresión tradicional vs multinivel
- Tengo cuenta en Hypermind
- ¿Deberían publicarse datos “en beta”?
- MoMo: una documentación oficiosa
- Spike and slab: otro método para seleccionar variables
- ¿En primavera? ¿En serio? Ni de coña
- 10k regresiones truchas para que cada cual elija la que más le cuadre
- Pokemoneando ruido
- Consumo alimentario mensual en los hogares españoles en R
- Marzo 2020
- Mirad lo bien que funciona la hidroxicloroquina
- El modelo SIR con inferencia
- CausalImpact me ha complacido mucho
- Densidades unidimensionales en R
- Cuantificación y riesgo
- ¿Se puede calcular la letalidad (del coronavirus, digamos) sin el análisis de la supervivencia?
- Hospitales y camas en la Comunidad de Madrid
- Casos de coronavirus en Madrid provincia: un modelo un poco menos crudo basado en la mortalidad (II)
- Casos de coronavirus en Madrid provincia: un modelo muy crudo basado en la mortalidad
- k-vecinos + lmer
- lme4 + simulate
- Dos escenarios mutuamente incompatibles: extinción o cronificación
- Interacciones y selección de modelos
- La causa de muerte no es la causa de muerte
- Piedrecitas y pepitas de oro
- ¿Qué significa para los políticos responder a desastres naturales usando la “evidencia científica”?
- Monitorización diaria de la mortalidad
- Análisis de la supervivencia cuando todas las observaciones están censuradas
- Más sobre el “método delta”: propagate
- Seguimiento de los nuevos casos diarios de coronavirus en «tiempo real» con R
- Una R-referencia con referencias para epidemiólogos circunstanciales
- Seguimiento del coronavirus en “tiempo real” con R
- Fases divergentes y convergentes del análisis de datos
- Clasificación vs predicción
- Intervalos de confianza, intervalos de predicción
- “Para razonar rigurosamente bajo incertidumbre hay que recurrir al lenguaje de la probabilidad”
- Sobre los peligros del “Tukey biweight”
- Febrero 2020
- satRday… ¡en Santiago de Compostela!
- Una versión aún más sencilla
- “Algoritmos” y acatarrantes definiciones de “justicia”
- To IRLS or not to IRLS
- Platón en el estercolero
- Curvas de equiprobabilidad de la t bivariada
- Análisis estadístico de mezclas
- La probabilidad de que el parámetro esté en el intervalo de confianza es .95
- ¿Lineal o logística?
- WoE,… pero ¿y las interacciones?
- No sé cómo traducir “Partially additive (generalized) linear model trees”
- Bibliografía científica y sesgos
- Sobre la normalización de las direcciones postales
- La densidad de una Cauchy bivariada es cuasiconvexa
- model4you
- Agoreros
- Comparación y selección de modelos bayesianos
- El “método delta”, ahora con NIMBLE
- Enero 2020
- ¿Pato o conejo? (Y su moraleja)
- “Deep learning”: una evaluación crítica
- x[] <- lapply(…)
- GoF para modelos bayesianos
- “Estadística Básica Edulcorada”
- ¿Están los hogares preparados para una nueva recesión?
- Turing y la telepatía
- Siete llaves al sepulcro del método delta
- De texto a función
- 0.7% NYC - MAD .3%
- Estadística “sin el dolor agónico”
- Curso de python básico orientado al análisis de datos
- ¡Son todos igualitos!
- Regresiones con discontinuidad y grados de libertad
- Rebaños de modelos: el resumen
- La probabilidad, ¿algo subjetivo?
- Diciembre 2020
- 2019
- Diciembre 2019
- Charla en el CodingClub de la UC3M este martes
- Electricidad, clima, incentivos y… ¿fetichismo de la ciencia de datos?
- Ser científico de datos, ¿puede ser menos sexi de lo que te han contado?
- P-valores y decisiones
- La población envejece pero, ¿envejecen también los grupos de edad?
- Sobre los coeficientes de los GLM en Scikit-learn
- Noviembre 2019
- ¿El Registro Mercantil debería ser abierto y gratuito? Yo creo que no.
- Por si alguien lo toma literalmente
- Sobre la burbuja del “online advertising”
- Ciencia de datos 1.0 vs ciencia de datos 2.0
- Los factores de Bayes son las hamburguesas veganas
- bamlss promete regresión bayesiana flexible
- Los ejemplos son las conclusiones
- A más gripe, ¿menos mortalidad? En determinados submundos frecuentistas, sí
- tfprobability debería llamarse tfeoprobability
- Política y varianza
- Análisis y predicción de series temporales intermitentes
- Octubre 2019
- DLMs
- r -> d -> p -> q
- Gente que toma la causalidad en vano
- ¿Tienes un sistema predictivo guay? Vale, pero dame los dos números
- Se non è vero, non è vero (¡qué se le va a hacer!)
- El modelo son las conclusiones
- Consumismo de fricadas: OpenZmeter
- Pyro
- Los fundamentos matemáticos de la estadística teórica
- Todo libro de estadística básica debería tener un enlace al este artículo
- Voy a demostrar (con la ayuda del INE) que Airbnb no existe
- ¿Una versión intuitiva del problema de Monty Hall?
- Varian sobre el muestreo
- flygskam punto ceeseuve
- BLAS, eficiencia y lme4
- Septiembre 2019
- Rootclaim
- ranger (o cómo el truco para hacerlo rápido es hacerlo, subrepticiamente, mal)
- Preprocesamiento de variables categóricas con muchos niveles
- ¿Qué variable distingue mejor dos subgrupos?
- Factorización matricial con nulos
- Mi consumo de electricidad, hora a hora
- Los modelos mixtos en Python son un bien público pero quienes debieran proveerlo están a otra cosa
- Un modelo que alimenta una simulación
- Del “Andalucía ‘first’” al “La Rioja por doquier”
- ¿Qué más puede colgar de un árbol?
- Sobre mi nueva infraestructura de backups
- Publicidad, #MeeToo y todo lo demás
- Ver la I+D+i como un estado
- Agosto 2019
- La multivarianza total de la distancia no implica causalidad
- Esto no trata sobre lo que la ciencia es
- Más sobre la anonimidad y reidentificación en ficheros de microdatos
- (g)lms con coeficientes > 0 (p.e.)
- Relevante para entender la “maldición de la dimensionalidad”
- Más sobre factores, strings y ordenación
- Hagan sus apuestas; luego, corran el siguiente código
- dplyr parece que prefiere los factores
- Julio 2019
- XI Jornadas de Usuarios de R
- Proporciones pequeñas y “teoremas” de “imposibilidad”
- Un truco para reducir la varianza de un estimador
- ¿Qué demonios le ha pasado a la página de la distribución beta en la Wikipedia?
- Sobre la peculiarísima implementación del modelo lineal en (pseudo-)scikit-learn
- Abundando en la discusión sobre matemáticas y/o informática
- Cartogramas con recmap
- Estacionalidad semanal de la mortalidad
- Dos noticias: entrevista y cursos en Alicante
- Mortalidad y domingos
- Modelización de retrasos: una aplicación del análisis de supervivencia
- Aprender deprisa, aprender despacio
- Optimización: dos escuelas y una pregunta
- Junio 2019
- Nota para mí: usar flextable, usar flextable
- ¿Existiría (la cosa de la que voy a hablar)? Lo veo muy poco probable
- Bayes no había previsto esto
- Rebelarse vende
- Más sobre la paradoja de Berkson
- ¿Informática o matemáticas? Una pregunta muy mal formulada
- Vigilancia de la mortalidad diaria asociada al exceso de temperatura
- Mi infraestructura para Python
- Causalidad. Atribución. Madrid Central.
- Feria del libro, 2019
- Un esquema simpsoniano para repensar el presunto incremento de la desigualdad
- Mayo 2019
- Modelos GARCH (o: no me cuentes tu vida, dame el pxxx modelo generativo y ya)
- ¿Escenarios jerárquicos? (para encuestas electorales en contextos multipartidistas)
- ¿Y si quitamos el puntico de arriba a la izquierda?
- Causalidad y desigualdad
- 1 3 6 19 30 34 2 7 18 31 33 16 9 27 22 14 11 25 24 12 13 23 26 10 15 21 28 8 17 32 4 5 20 29 35
- Cotas superiores para el AUC
- Matematización oscurantista
- ¿Qué puede colgar de un árbol?
- Charlas en Alicante, julio de 2019
- Análisis de la discontinuidad + polinomios de grado alto = …
- ¡Bien por AIReF!
- Un recíproco para el teorema de Bernstein–von Mises
- ¡Eh! ¡Atención a la media geométrica!
- A falta de escenarios, tenemos instituciones con atribuciones solapadas
- Elecciones e índice (supernaíf) de Shapley
- Elecciones, mapas… y mi favorito
- Abril 2019
- Yo no elaboro programas electorales pero sí propuestas de proyectos
- ML y estadística, ¿cosas distintas?
- Sobre el error de generalización (porque a veces se nos olvida)
- Las altas dimensiones son campo minado para la intuición
- Un resultado contraintuitivo
- Gestión del riesgo: una perífrasis con hitos aprovechables
- Demasiada gente conozco que todavía no sabe de GPT-2
- Simulación de procesos de Poisson no homogéneos y autoexcitados
- El día del oxímoron
- Incertidumbre en ránkings (o cómo la varianza es la mayor enemiga de la meritocracia)
- ¿Vale realmente el “bootstrap” para comparar modelos?
- ¿Irán por aquí los tiros en el futuro de la “ciencia de datos”?
- Marzo 2019
- Mi semilla
- Sobre la (necesaria) validación a posteriori de modelos de caja negra
- Hay algo podrido en la microeconomía normativa
- Ceteris paribus vs Heráclito
- Análisis (clasificación, etc.) de textos muy cortos
- Encuesta de Estructura Salarial y R: propedéutica
- Mariposa
- Si das la regla por buena, enhorabuena, estás usando el sistema d’Hondt
- Las decisiones son lo primario; la estadística es subsidiaria
- Si los prejuicios son prioris, entonces…
- Lo que las diferencias de medias evocan
- Mezclas y regularización
- La simplicísima mas no por ello menos útil distribución de Dirac
- Charla (mía) el día de pi (de 2019) en Elche
- Aviso para navegadores
- Pesos de los componentes del QualityScore en Google Ads
- Quienes ignoran la estadística están condenados a reinventarla
- El método de Laplace para aproximar ciertas funciones
- offset, porque el coeficiente es 1 necesariamente
- Febrero 2019
- Entre lo fofo y lo hierático,modelos loglineales
- Sobre el agregador de noticias sobre R en español
- Homo politicus < IQ < homo economicus
- Modelos log-lineales y GLMs con regularización
- Los resultados preliminares del experimento finlandés de la renta básica apestan a…
- Todo lo que deberías saber sobre encodings
- Charlatanes y regulación
- vecpart: modelización de moderadores con árboles
- Modas y fotogenia del código secuencial
- Una cosa buena, una cosa mala
- Sr. Python, muchas gracias por su candidatura; ya le llamaremos cuando… tenga modelos mixtos
- AUC = Wilcoxon
- Ya, pero ¿es viable un fact check descentralizado? Entonces, ¿qué hacer?
- “Cocinas electorales” con encuestas muy sesgadas
- Taxis (y su huelga) y tráfico (en Madrid)
- No lo léais, no lo sigáis; todo lo que cuenta es mentira y si acierta es de casualidad
- Demasiados colores (para el hijo de un daltónico)
- Enero 2019
- ¿Hay demasiados paquetes en R?
- Sobre la tesis de Sánchez (y no es lo que se espera de mí)
- Evaluación de trucos para multiplicaciones aproximadas
- El discreto encanto de las animaciones
- Cerebros “hackeados”
- NMDS y un poquito más allá
- Reglas de “scoring” impropias: un ejemplo
- ¿Es Madrid ciudad para startups (relacionadas con los datos)?
- Scorings: interpolando (y extrapolando) entre el de Brier y el lineal
- Cointegración: un modelo generativo
- Mejores predictores: un ejemplo (el de Brier)
- Una de las mil maneras malas de elegir al mejor predictor
- ¿Quién será el mejor predictor? ¿Cómo se podrá medir?
- Clasificación vs predicción
- Sic “scientia” facta est
- Cadenas de Markov para generar trayectorias posibles de huracanes
- Modelos de conteos con sobredispersión (con Stan)
- d’Hondt vs lm
- Sobre la brecha salarial… de belleza
- Diciembre 2019
- 2018
- Diciembre 2018
- Un acto fallido: la pregunta sigue, pues, abierta
- p-valores y el perro que no ladró
- Todos los seres vivos necesitan agua y las rosas necesitan agua, luego las rosas son seres vivos
- data.tree: porque no todos los datos son tabulares
- Fui a Costa Rica y volví convencido de que el Índice Goblal de Felicidad es una basura
- Siete años después, dejo la presidencia de la Comunidad R Hispano
- Libros y el índice de compresibilidad
- ¿Tiene sentido plantearse un objetivo que no se puede medir?
- Sobre Madrid Central
- Noviembre 2018
- ¿Inmigración cualificada en España? Pues va a ser que no
- Interpretación de modelos predictivos (en LUCA)
- Charla: predicciones y decisiones, más allá de los errores cuadráticos
- Colinealidad y posterioris
- Sentido de la proporción
- Modelos y sesgos (discriminatorios): unas preguntas
- Goodhart, Lucas y márketing
- Goodhart, Lucas y todas esas cosas
- Creación de “secuencias” con redes neuronales recurrentes
- ¿Siguen votando igual los diputados?
- Cuando oigáis que los algoritmos discriminan, acordaos de esto que cuento hoy
- ¿Qué hay de malo en gorronear investigación básica?
- Cuatro paquetes interesantes de R
- Las tres culturas (en LUCA)
- Octubre 2018
- Encuesta Social Europea: un cociente
- Datos anchos y largos (y otras cosas relacionadas con Stan)
- Enlaces parasociológicos
- ABC (II)
- ABC (I)
- Más sobre las proyecciones de población del INE
- Los tres retos de la inferencia estadística
- Sartenes e ideologías
- Dos ejercicios (propuestos) sobre “embeddings”
- Un resultado probabilístico contraintuitivo (y II)
- Un resultado probabilístico contraintuitivo (parte I)
- La ética, como un problema de aproximación funcional
- Extingámonos con dignidad: generaciones actuales y futuras, no incurramos en los errores de las anteriores
- Licitaciones por insaculación ponderada
- “Embeddings” y análisis del carrito de la compra
- ¿De qué matriz son los “embeddings” una factorización?
- Planes de búsqueda y rescate con R
- Acerca del CIS y la cocina
- Septiembre 2018
- Hoy he asistido a un “evento” sobre ciencia de datos en Cabify: dos partes y una reflexión
- Recordatorio: ideas para futuros TFMs de “ciencia de datos”
- Así de floja está la evidencia científica (sobre el impacto de Airbnb en el mercado inmobiliario)
- Disponible el fichero de datos abiertos más goloso de ambas castillas: las rutas de Bicimad
- Creo que necesitamos un neologismo para la versión pobre de solucionar
- Una anécdota sobre el mercado eléctrico y sus mermas
- X Jornadas de Usuarios de R: ¡abiertas las inscripciones!
- Ocurrencias: cuotas de gente de letras en la “ciencia de datos”
- Los datos están histogramizados… ¿quién los deshisotogramizará?
- El anómalo verano de 2018
- Contraargumentando (materialmente) sobre la falacia del fiscal
- ¿Funcionan los programas sociales?
- La falacia del fiscal: la/mi mejor explicación para profanos hasta la fecha
- Series temporales y “motifs”
- Tres titulares alternativos y un extracto de “Mala ciencia”
- ¿El pionero de la matematización de la sicología?
- Reciclar, ¿es siempre y en toda circunstancia lo correcto?
- Podría ser Simpson, pero a lo mejor es “otra cosita”
- Lo buscaba y aquí está
- Agosto 2018
- Julio 2018
- ¿Qué son esas líneas descendentes?
- El problema de la bella durmiente
- Como no podemos medir X, usamos Y; pero luego, en las conclusiones, no criticamos Y sino X
- ¿Por que slt-ear si puedes stR-ear?
- La reedición del sueño de Laplace
- Suicidios, crisis, y cambios de régimen en series temporales
- kamila: Clústering con variables categóricas
- Que no, que es imposible esconder medio millón de muertos (y que la cordialidad está de más)
- Sociología normativa: el estudio de cuáles deberían ser las causas de los problemas sociales
- Curso de estadística aplicada con Stan: ejercicio 1
- Consecuencias indeseadas de la falta de humildad
- Las tres culturas
- Junio 2018
- Replicabilidad (y su falta de ella, fuera de la academia)
- Hoy estoy participando en un evento sobre “big data”
- El motivo: retorno esperado negativo
- Inmigrantes y la historia del que se comió un pollo y el otro no
- ¿El mejor formato para diseminar microdatos?
- ¡Un aplauso para el INE!
- François Husson en las X Jornadas de Usuarios de R
- Posterioris informativas (o más bien, cuando te informan de cuál es la posteriori)
- Estadística descriptiva y teoría de la decisión
- Mayo 2018
- Guasa tiene que habiendo tanto economista por ahí tenga yo que escribir esta cosa hoy
- Los extraños números de los muertos en carretera por accidente
- Evolución de la resistencia al calor
- Prioris informativas: un ejemplo
- Un generador de datos sintéticos para proteger la privacidad de los microdatados
- ¿Existirá algún caso de uso de la estadística que no sea materia prima para la toma de decisiones informadas?
- El calendario chino como determinante en el sexo de los hijos
- Casos de uso de MicroDatosEs
- gam vs rrff (y, en general, modelos generativos vs cajas negras)
- “Democratic people’s republic” de algo que empieza por ge
- CIS, ideología, gráficos y, sí, este blog
- gam/bam admiten efectos aleatorios
- Curso (mío) de estadística bayesiana aplicada con Stan en BCN
- Colaboración con adversarios
- Liberalismo: los axiomas y sus corolarios
- Leaflet con capas WMS de Correos, Catastro, etc.
- t y as.raster no conmutan; ¿por qué no conmutarán?
- Abril 2018
- Redundancias (o por qué empeñarnos en tener tantos datos cuando con una fracción sobra)
- Diapositivas con reveal.js y yeoman
- El malabarista de Amiga, con R (y rgl)
- No son los picos, son los rangos
- ¿Es racional (aparte de aburrido) nadar contra el efecto Lindy?
- De España a Dinamarca en dos pasos
- Protección de los datos de los muertos
- Un problema: cómo muestrear histogramas con medias. La vía de los trapecios
- España, Platón, Madrid
- Modelos con inflación de ceros y separación perfecta
- Estimar la demanda es como ponerle el cascabel al gato
- La intrahistoria de mi libro de R
- Un libro de R: mi libro de R
- Causalidad: malo lo uno, pero tampoco bueno lo otro
- Sobre lo de Cambridge Analytica
- Marzo 2018
- ¿Qué más se supo de la correlación del s. XXI?
- ¿Un voluntario para aggiornar MicroDatosEs?
- ¿Admitirá finalmente el DLE la acepción “algoritmo” de “logaritmo”?
- Población: el padrón y la otra cosa
- A mayor efecto (sobre todo, si es novedoso), mayor escepticismo
- Lecciones estadísticas que pueden extraerse de los disturbios de Lavapiés
- Invertir relaciones causales plausibles exige mucha, mucha explicación
- Si te tienen que explicar por qué algo es bueno, es que igual no es tan bueno
- Windows Subsystem for Linux
- Modelos de factores ocultos y la caverna de Platón
- Hay bulos, sí, pero la pregunta es: ¿qué hacer?
- Brechas salariales: así las calcularía yo
- ¿Podría ser la solución que almas caritativas creasen viñetas espontáneamente?
- Recomendaciones… ¿personalizadas?
- ¿Soy parte del concilábulo heteropatriarcal?
- Las X Jornadas de Usuarios de R: noviembre de 2018, en Murcia
- Reflexiones bayesianas al hilo del manido: “Independientemente de su ideología, los economistas suelen estar de acuerdo en que…”
- Kriging con Stan
- Febrero 2018
- Documentar como el culo, no pensar en el usuario final, ser incapaz de ponerte en su situación, etc.
- Estructura poblacional de España: 2010-2050
- LDA para dummies (y con un ejemplo)
- Con tiempo: encuentro de usuarios de R de Latinoamérica en enero de 2019
- Más sobre sesgo, varianza y gripe: estimaciones a ojímetro
- ¿Que no suben los salarios?
- Los que creen haber encontrado la verdad y los que siguen buscándola
- ¿Podéis probarme/le CatastRo? Porfa…
- Diagramas de cajas: lo que hay que saber y muchas otras cosas que no hacen tanta falta pero que son entretenidas
- De sesgo, varianza y gilipollas (esta vez, con la gripe como excusa)
- ILOVEFS + rOpenSpain: 13 y 14 de febrero en Medialab Prado
- Secciones censales en la Wikipedia
- Inferencia fiduciaria: una ocurrencia, afortunadamente, muerta
- Políticas y tarifas; medias y deciles
- Interacciones “mecánicas” en regresiones logísticas
- Lanzamientos de moneda: no es azar sino física
- rOpenSpain está en marcha
- Enero 2018
- Mortalidad y tramos de edad gordotes
- Dónde están las letras
- Charla: las *-metrías en la práctica de la ciencia de datos: el papel de la teoría
- mgm (no la de las pelis sino la de los modelos gráficos)
- La dieta de hambre en días alternos en la alimentación de los viejos
- ¡Terror! ¡Las máquinas nos van a quitar los trabajos! ¡Oh, oh, oh! ¡Uh, uh, uh!
- No os creáis esta encuesta: ¡n = 10!
- “Poor economics”: una microcrítica
- Insospechadas aplicaciones de la estadística en arqueología
- ¿Quitar variables no significativas?
- Las correlaciones positivas, ¿son transitivas?
- Lecturas recomendadas: sobre la anonimización de currículos y su impacto en la “diversidad”
- ABC
- Un caso en el que falla la máxima verosimilitud
- ¿Lo publico y nos echamos unas risas todos?
- Mortalidad en carretera (contada de una manera distinta)
- Recodificación de variables categóricas de muchos niveles: ¡ayuda!
- Preludio (de más por venir)
- La ilusión de progreso (en problemas de clasificación)
- Diciembre 2018
- 2017
- Diciembre 2017
- ¿Lo racional? Que jueguen a la lotería los demás
- El fraude de Lemús aún adorna las memorias del CSIC
- Redes sin neutralidad de red que funcionan tan ricamente
- Mezcolanza: de INLA a GAM pasando por la frenología
- Sobre el problema de las martingalas: ¿cuántos sabíais la respuesta?
- El z-score es una medida inadecuada de la perplejidad
- La distribución de Poisson y la estabilización de la varianza
- Martingalas, tiempos de parada y tuits cuasivirales
- p-curvas
- Cuidado con los $
- Un artículo que está esperando a ser escrito
- ¿Cómo se mide el número medio de días para pagar una factura?
- La magnitud de la sequía
- Simpson, de nuevo: ahora con la mortalidad
- Noviembre 2017
- De nuevo, la falacia del fiscal (aplicada a fiscales que fenecen)
- Antropocentrismo cansino
- Neutralidad de la red: ¿importa?
- Más sobre correlaciones espurias y más sobre correlación y causalidad
- dbf · xlsx · pdf
- Arqueólogos bayesianos
- La viejunísima escuela
- ¿Primeros principios para la estadística descriptiva?
- La función de pérdida es una API entre los “stakeholders” de un análisis estadístico
- Advertencias sobre el uso de los n-gramas de Google
- ¿Cuántos culpables son declarados inocentes por un juez?
- Estadística(s) y el dedo de Dios
- Probabilismo, probabilorismo y todas esas cosas
- Todo sobre bitcoin (y por qué he decidido cogerle manía)
- “Intervalos” de confianza con forma de rosquilla
- La heterogénea distribución temporal de las 100 mejores novelas según Le Monde
- “Intervalos” de confianza creativos que excluyen el 0
- ¿Cómo está distribuida la renta? No, más bien, cómo son de grandes las provincias
- Octubre 2017
- Distribuciones hiperbólicas
- nls con odes
- ISO 3166-2:ES
- No, no soy hípster; tampoco soy más guay; solo es que tengo más RAM
- Mismo trabajo, nosequé cosa
- Tres de seis consejos para mejorar las regresiones
- Modelos directos, inversos y en los que tanto da
- He tratado de contrastar una hipótesis sin éxito, así que solo publico el subproducto
- #ardeAsturias, #ardeAvilés? Ah, ¡mierda!
- Para esto que me da de comer no vale XGBoost
- Modelos no lineales directos e inversos
- rOpenSpain: ahí tiro el guante
- Efectos secundarios (nota: que existan no significa que debas usarlos)
- La estadística (y la ingenería, y la medicina, y…) es una tecnología
- Una comparación de lenguajes de programación en una esquinita pequeña de la economía
- Las cosas son azules, las personas son rosas (dicen algunos sicólogos)
- Circiter
- Vivir del ruido
- CatastRo, un paquete de R para consultar la API del Catastro
- Septiembre 2017
- Bus al norte, bus al sur
- Geofacetas
- Estadística, ciencia de datos y la revalorización del no
- Ajustad vuestras prioris: la mayoría de los “programas sociales” carecen de efectos positivos
- Charla en Pamplona
- No, la trigonometría babilónica no era “novedosa”
- No lo busquéis porque no existe
- 17 no es estadística
- Fedatarios, blockchain y bitcoin
- Militancia y datos
- Dos argumentos racionales en pro de la homeopatía
- Triste vida
- Trucos cutrebayesianos
- Pues los SVMs, al final, no son tan exóticos
- A épsilon de todo
- Vampírico como antónimo de empírico
- Ey, ¡en esta serie hay más muertos que en Juego de Tronos!
- Python y R: una perspectiva markoviana
- Predecir a los predictores por incordiar
- IX Jornadas de Usuarios de R en Granada: ¡recordatorio!
- Julio 2017
- ¿Qué hemos hecho mal?
- ¿Nos sacudimos las servidumbres del papel?
- Gelmaneando
- ¿Alguien sabe por qué es tan pequeño este número?
- Estereotipos y estadística (II)
- Micromapas
- Creo que darán que hablar (los GRF)
- Syberia tiene muy buena pinta [pero…]
- Dudas ¿razonables? que me asaltan
- Me encanta la confianza torera en las encuestas
- Junio 2017
- ¿Una perspectiva económica del lenguaje?
- Hoy, como excepción, gritaré y justificaré: ¡Malditos logaritmos!
- ¿Les dará un patatús a mis excolegas?
- Cartuchos malbaratados
- ¿Cómo preambuláis vuestros .Rmd?
- Vaya, vaya, vaya… (Y, ¿hay motivo para retractar?)
- La AEMET ha muerto, ¡larga vida a la NOAA!
- La anticonferencia: una idea que me ronda la cabeza
- Funcionalidades infravaloradas de R: los corchetes
- Que Magritte me perdone
- Airbnb da en el clavo: ha desarrollado lo que hacía mucha falta
- Este también buscaba la precisión donde tal vez menos importaba
- Mayo 2017
- Dizque al sexto mes… pero ¿y los datos?
- El teorema de Rolle, ¿acientífico?
- Aquellos que ignoran la estadística etcétera
- ¡Doble llave al sepulcro de Gauss!
- Sentir números, sentir probabilidades
- Me siento mal porque han sido muy majos conmigo y ahora no sé qué hacer con lo que me han mandado
- Una proyección no es un número sino una distribución de probabilidad
- ¿Soy un dinosauRio? Sobre las novedades de R
- Diapositivas sobre mi charla acerca del “stack analítico”
- Me too, me too!
- Cosas de Twitter (y encuestas)
- ¿Es Vd. de izquierdas o de derechas?
- ¿Cómo fue R antes de R?
- Contratos por diffs
- Charla en Barcelona: Si yo fuera rey…
- Curso de introducción a R en Gijón
- Abril 2017
- ¿Dónde dejar de leer? Un caso práctico
- WolframAlfa al rescate de exmatemáticos
- Avisos recibidos, avisos resueltos y la creciente suma acumulada
- Así se inventó el nudo gordiano del “hombre medio”
- La tierra gira alrededor del sol, sí, pero… ¿cuánta gente lo sabe?
- Guadalajara joven, Guadalajara inconclusa
- Zu den Sachen selbst
- IX Jornadas de Usuarios de R: noviembre en Granada
- Oferta de empleo: científico de datos todero para “startup”
- Experimentos con “extremely small data”: la media muestral de pocas betas
- El extraño y extremoso caso de los empleados fantasma de Galapagar
- Pues sí, puede fabricarse uno para España
- ¿Podría fabricarse uno para España?
- Lo (mínimo) que hay que saber de series temporales: breve, conciso e indoloro
- Etsa es una edntara a pubrea de roreetcs cnctoaumes
- Llegó (¿llegó?) el tiempo de la ingeniería estadística
- Tres grandes problemas que ocupan pero, según el CIS, no preocupan
- Marzo 2017
- Hoy es el día internacional de la copia de seguridad
- Evolución de la edad media de la población por provincias
- Rejillas poblacionales con R (un borrador)
- Datos abiertos y farolas solares: más motivos para el escepticismo
- El señor de las ondículas
- Y mientras tanto… nos roban la cartera
- Así se calculan los logaritmos de Zaragoza, se ve (y una reflexión)
- EM (duro) a mano (y para humanos)
- Disponibles las diapositivas de mi charla en el EL BetaBeers Madrid (especial opendata)
- Todo lo que sucede en R es una llamada a una función
- qgraph para representar grafos que son correlaciones que son vinos
- He visto que eran de la Rey Juan Carlos y hasta ahí he podido leer
- Calibración de probabilidades vía apuestas
- Daré una charla en el Betabeers Madrid (especial OpenData)
- Un párrafo afortunadísimo sobre las “nuevas aptitudes”
- Reducción de la dimensionalidad con t-SNE
- En contra del estado “de derecho”
- Cuantiles, sí, pero ¿de qué tipo?
- Wikipedia + prophet
- “Todas” las terrazas de Madrid
- Sobre una poco conocida y para nada menguante “brecha de género”
- Febrero 2017
- Al cabo de más de 50 meses hemos observado un fenómeno que ocurriría en uno de cada cincuenta
- Consultando el número de visitas a páginas de la Wikipedia con R
- ¿Un detector de nepotismo?
- Otro ejemplo de infradispersión de conteos
- Las gráficas en la prensa (de allá)
- Vídeos sobre estadística (pero, que conste, esto no es una recomendación)
- Probando hunspell para el procesamiento de texto en español
- Lo que pasa cuando interrumpes a alguien que desarrolla una actividad intelectual seria
- Pasión y curiosidad
- En defensa de lo simple
- La tierra es redonda (p < 0.05)
- Diapositivas de “Antikaggle: contra la homeopatía de datos”
- ¿Hay terroristas islámicos en Poissonistán?
- La inesperada correlación de los ratios
- Ha muerto Hans Rosling
- Una mala manera de perder un par de horas
- 1/e por doquier
- Nueva charla: “Antikaggle: contra la homeopatía de datos”
- ¿Cuánto durará la sólo-nostalgia?
- Infradispersión de conteos: ¿buenos ejemplos?
- Enero 2017
- Proyecciones probabilísticas de población
- Sobre las miserias de la universidad
- ¿Cuántas veces habré metido la pata?
- El número efectivo de partidos
- Las tres (o cuatro) eras de la estadística
- Polinomios monótonos
- La h-filosofía de la estadística en once puntos
- Tlön, Uqbar, Orbis Tertius y el análisis novométrico
- Va de si hay una o dos lambdas
- Vivimos en un mundo opaco e interconectado
- Weapons of Math Destruction
- Es imposible enseñar nada a alguien cuyo sueldo depende de no aprender
- Lo que pasa cuando omites la priori con variables categóricas
- Escribid a ley de Stamp en un papelito y pegadla en el espejo
- Repensando la codificación por impacto
- En lugar de dar la lata hablando de ruido estadístico, doy dos puntos a aquellos de mis alumnos que solucionen en siguiente problema
- Que la imaginación te acompañe
- Claroscuros que, obviamente, pasan inadvertidos
- Diciembre 2017
- 2016
- Diciembre 2016
- Las conexiones telefónicas de Vodafone España, visualizadas con R
- Problemas navideños de/con R
- Que la fuerza de R también te acompañe a ti (allá a donde haya datos)
- Un muy cuestionable análisis de lo de PISA
- Una pregunta sobre pruebas de hipótesis
- Enhorabuena a eldiario.es porque el análisis de el diario.es de los resultados de PISA está perfectamente alineado con la linea editorial de eldiario.es
- Un tutorial interactivo sobre optimización numérica
- No soy yo, sos vos; repito, sos vos
- Hacía tanto que no publicaba sobre graficaca, tanto, que casi ni me acordaba
- Noviembre 2016
- La regla del tres (para estimar la probabilidad de un evento todavía no observado)
- Probabilidades de empates en elecciones
- Análisis de la supervivencia cuando ningún sujeto ha muerto
- Estereotipos y estadística
- Habiendo mónadas, ¿quién quiere callbacks?
- El IPT y la paradoja de Simpson
- El guión de mi charla sobre microdatos
- #NadieSinLuz
- Diapositivas de “Modelos rápidos y frugales”, mi charla en Databeers
- Hoy no estaré donde debería: las VIII Jornadas de R
- Detrás de la detección de anomalías en series temporales
- Una fina, tenue, somera capa de sintaxis
- Podcast: “Vivir analizando datos”
- ¿Cuánto tarda en ejecutarse este código?
- Pesadumbre e incertidumbre desencadenadas
- Hablaré en el Databeers de la Universidad Europea el día 16
- ¿Seis sigmas? Porque a mí solo me llegan 4.5 sigmas
- Las dos culturas, con comentarios de 2016
- R en paralelo (pero ahora, con futuros)
- Homeopatía de datos
- Decisiones bajo incertidumbre (I)
- Octubre 2016
- Modelos gráficos probabilísticos en Coursera
- ¿Cuántas veces ha caído el PSOE en el lado malo de la lógica de la teoría de juegos?
- El principio de información
- Recetas y principios
- ¿Os acordáis del rumano de la “fragoneta”? Pues se ha mudado a Chicago
- Probabilidades y probabilidades
- El IVA y las exportaciones
- Dos técnicas fundamentales para gráficos dinámicos de datos: “linking” y “brushing”
- El RMSE es Dios y XGBoost, su profeta
- Acabo de subir una petición a change.org para que el CIS publique sus microdatos en formato reutilizable
- Recordatorio: las VIII Jornadas de Usuarios de R
- Que hagan lo que quieran en Plaza de España; yo, la verdad, no tengo tiempo para leer 350 MB de documentación
- Barómetros del CIS con R
- Si se estudió que las autopistas eran viables, ¿por qué están ahora en quiebra?
- Una jerarquía de analistas de datos en cuatro escalafones
- Septiembre 2016
- Sobre ciencia de datos en UNIR: teoría y gente
- Curso de modelos gráficos probabilísticos en Coursera
- ¿Cómo se escribía “verosimilitud” en francés en 1774?
- Organicemos un referéndum para determinar qué causa las mareas
- Encuestas electorales: una propuesta
- ¿Importa más la causalidad hoy en día?
- Lo que va del 4.4% al 70%
- Votos en la ONU con R
- Tres metaprincipios estadísticos que se quedan en dos que se quedan en uno
- Un curso de 15 horas de introducción a la programación
- Hamilton al rescate de Metropolis-Hastings
- ¿Seguro que aplica lo del secreto estadístico?
- Hamilton, Carnot y el Bosco
- Madrid, ¿“ciudad inteligente”?
- Big vs small data en estadística aplicada aplicada
- Los límites que la varianza impone a las energías renovables
- ¿Quién demonios lee el segundo párrafo?
- Lotería y elecciones: se non è vero…
- Selección de variables con bosques aleatorios
- Mezclas de vectores (III): las funciones involucradas
- Mezclas de vectores (II): un caso de uso
- Mezclas de vectores (I): casi todas las matemáticas de la cosa
- Agosto 2016
- Julio 2016
- Onodo: redes para contar historias
- Ceuta y Melilla, ¿por encima de la renta media española?
- “Mi argumento no era científico, sino empírico”
- Me voy a Gijón toda la semana
- Una abominación gráfica
- Análisis estadístico de formas y perfiles
- Rápido y frugal: una digresión en la dirección inhabitual
- Dos nuevos tutoriales sobre data.table y dplyr
- k-medias es como las elecciones; k-vecinos, como los cumpleaños
- Una estupenda introducción intermedia a data.table
- R I/O (o rio)
- GLMs con prioris (casi) a voluntad
- Este NO es el mapa de la violencia de género en España
- Gestión de la mendacidad encuestoelectoral: los números
- Junio 2016
- Gestión de la mendacidad encuestoelectoral
- Por una vez, accedo a hablar de algo de lo que no sé
- R es un vago
- GBM (III): Más allá de las pérdidas cuadráticas
- Unos lo creen mucho; otros, poco; pero nadie sabe cuánto
- GBM (II): Minización de funciones, pérdidas cuadráticas, residuos y gradientes
- GBM (I): Una mentira sugerente
- 6602.767 km alrededor de España para visitar todas sus capitales de provincia
- Evolución histórica de la deuda del ayuntamiento de Madrid
- Metropolis-Hastings en Scala
- Distribuciones sin media: ¿qué pueden suponer en la práctica?
- Las distribuciones (y platos) con nombre
- Censura a la izquierda en las universidades españolas
- Si vas a Londres, déjate caer por (51.523841, -0.089310)
- Ruido de alarmas, ruido de p-valores; mucho, mucho ruido, tanto, tanto ruido
- Queríamos desentrañar los misterios de las partículas subatómicas y obtuvimos una app para las carreras de caballos
- Acceso a Google Analytcs desde R
- R sobre el EC2 de Amazon hace casi siete años: una concesión a la melancolía
- Detección de “outliers” locales
- ¿Alguien podría identificar tirios y troyanos?
- Mayo 2016
- El extraño caso de la media empírica menguante
- ¿Mis conciudadanos no tienen wifi?
- Coordenadas polares por doquier
- PIB y progreso: ¿mide lo que debe medir?
- Rmd2R: un conversor de lo que su propio nombre indica
- ¿Tanto ha llovido (en términos de precisión numérica) desde 2008?
- Tengo ordenador nuevo con 64GB de RAM (más unas preguntas)
- Descarga de datos del Ibex 35 (¿y otros?) minuto a minuto en tiempo (casi) real
- Cómo capturar datos usados en visualizaciones en la red: una alternativa robusta al scraping
- Transparencia, ley de transparencia y todas esas cosas
- Melt y cast en Spark con scala
- Curvas ROC no cóncavas: ¿por qué, por qué, por qué?
- Tartas con porciones negativas
- Mañana (2016-05-12), caRtociudad en la reunión de usuarios de R de Madrid
- Cartogramas rectangulares con R
- Encuestas electorales: medios y sesgos (II)
- Un corpus de textos en español para NLP
- Encuestas electorales: medios y sesgos (I)
- Transparencia, libertad y carcas (de antaño y hogaño)
- ¡Haced click ya!
- Abril 2016
- Cómo ir de Regumiel de la Sierra a Montejo de la Vega de la Serrezuela
- 90 millones de euros en tecnologías del lenguaje
- Rmarkdown en el panel principal de Shiny
- Gráficos interactivos con R: un resumen
- La ciencia: dos puntos de vista
- Discretización de variables continuas (con árboles)
- En una API de cuyo endpoint no quiero acordarme…
- El cincuenta en raya (y el tres en raya)
- El impacto causal del óbito del Sr. Botín en la cotización bursátil del benemérito Banco de Santander
- Diapositivas de mi charla sobre feather
- Visualización de k-medias y DBSCAN
- Ahora caRtociudad encuentra información administrativa relativa a un punto
- Diapositivas de mi charla “Datos, modelos y parámetros”
- ¿Quieres aprender R? ¡Matricúlate en mi curso en KSchool!
- Este jueves, Feather en la reunión de usuarios de R de Madrid
- Y viene del español, tú
- Clústers de trayectorias con la distancia de Fréchet
- ¿Un libro recomendable de estadística básica?
- rPython + feather
- ¿Nos vemos en el Machine Learning Spain XII?
- Túneles ssh para conectarse de manera segura con RStudio Server
- Redirección dinámica de puertos para conectarse de manera segura con RStudio Server
- Marzo 2016
- Cartociudad
- Funciones de densidad log-cóncavas
- El AUC es la probabilidad de que…
- Un ejemplo de “importance sampling” (que no sé cómo traducir)
- Caret y rejillas: ¿es necesario utilizar fuerza bruta?
- Modelos mixtos para preprocesar datos en un sistema de recomendación de drogas
- ¿Jupyter? Me quedo con Rodeo, creo
- ¿Cómo era el regulador en 1973?
- ¿Se puede explicar la predicción de un modelo de caja negra?
- Dime qué muestreas y te diré cuál es tu sesgo
- GBM sintetizado en una línea
- Hoy que me he puesto traje y corbata…
- Lenguajes de programación probabilísticos
- Sin datos solo eres alguien con una priori
- Sutilezas de las licencias libres
- ¿Quieres presentar algo en las Jornadas de Usuarios de R?
- Mezclas de distribuciones con Stan
- Pequeño bug en ggmap: no pinta el último tramo de una ruta
- Ficheros KML con R y ggmap
- Febrero 2016
- Los tres contraargumentos habituales
- ¿Hay una epidemia en mi grafo?
- Las VIII Jornadas de Usuarios de R, en Albacete
- Validación cruzada en R
- La democracia no representativa no es representativa
- Mucho ha cambiado en 20 años (menos el número de taxis)
- Hoy se ha anunciado la propuesta de nueva página de la Comunidad R Hispano
- Evidencialidad
- Clases sociales y clústering
- Energía solar: instalaciones industriales vs paneles en tejados
- Diapositivas (y código fuente) de mi charla sobre rstan
- ¿Cómo seleccionar un cubo al azar?
- Visualización de datos de salud con nihil obstat científico
- storr: como Redis, pero con R
- rstan y rstanarm en Medialab-Prado este jueves
- Los resultados de esta investigación tienen puntos en común con la metodología científica aunque en ningún momento tendrán la misma validez ni tampoco es su intención que la tenga
- Y termino con lo de los intervalos
- Otra vuelta al caso del test que rechaza y el intervalo que contiene
- Premoniciones de Tirole sobre sobre el R Consortium
- Enero 2016
- El test rechaza pero el intervalo contiene: [contra]ejemplos
- PyData Madrid 2016, en abril de este año
- Internet: la frutería y el sushi bar
- Repensando la tiranía de la anarquía
- Comparaciones de tres grupos: pruebas vs modelos
- Análisis estadístico de respuestas ocultas en encuestas
- ¿A cuántos zombis conoces?
- Por si os interesa el tema de la energía, las centrales, las emisiones, etc.
- El problema de las tres croquetas (o del cuñao [no] envenenao)
- El problema de los tanques alemanes y de la máxima verosimilitud esquinada
- ¿Vive la ciencia (y su prestigio) de las rentas del pasado?
- Construcción de prioris informativas a la de Finetti
- ¿En qué año era la el almacenamiento en disco tan caro como hoy en memoria?
- ¿Qué significa “vinculados de forma muy significativa”?
- Prioris muy informativas y vagamente informativas: un ejemplo
- Conferencia de APis predictivas en Valencia (14-15 de Marzo de 2016)
- Visualizando los quinientos millones de la Begún
- Las magnitudes que se quieren comparar, ¡adyacentes siempre!
- Las prioris no informativas están manifiestamente sobrevaloradas
- Diciembre 2016
- 2015
- Diciembre 2015
- ¿Por qué el empate de la CUP es más raro de lo que parece (y de lo que yo mismo digo)?
- La intersección de lo interesante, lo sorprendente, lo cierto y lo basado en datos
- Empates electorales, sorteos y una inadvertida paradoja
- Un poco más sobre el índice de poder de Banzhaf
- Coaliciones de Banzhaf en el 20D
- La primera víctima será la sintaxis
- La respuesta es: “Yo no”
- CRAN, r-devel, GitHub, Travis CI, pruebas automáticas y todo eso
- La búsqueda de la causa más probable de un efecto
- ¿Por qué dicen “exponencial” cuando quieren decir…?
- La combinación de observaciones y el método de mínimos cuadrados: una revisión histórica
- Pasando data.frames de R como tablas de pandas en Python usando rPython
- Una revisita a “¿Cuántos peces hay en un lago?”
- Droga dura: El retorno de los chamanes
- Contaminación y restricciones de tráfico en Madrid: ¿por qué no se puede ni prevenir ni “estimar”?
- ¿Os lo podéis creer? ¡“Funnel plots” en la prensa española!
- El curioso caso de los suicidios en la villa de Madrid
- Cambio de logo en la Comunidad R Hispano
- Proyectos de fin de máster: ¿alguna sugerencia?
- Noviembre 2015
- ¿Estadística cualitativa?
- “We have analyzed your open source contributions on Github…”
- Mi otra debilidad: procesos de Poisson “autoexcitados”
- Reescrituras interesadas (de resultados estadísticos más o menos conocidos)
- agate: análisis de datos optimizado para humanos (y no para máquinas)
- Lo poco y lo mucho; lo malo, lo regular y lo bueno
- GAM
- Encuestas, censos, elecciones
- Ad more geometrico
- Asignación en R: ¿flecha o lo innombrable?
- Requisitos para mi taller en el “I International Workshop on Advances in Functional Data Analysis”
- Cultura viejuna y anumerismo
- DBSCAN, ¿algo nuevo bajo el sol?
- Esta tarde doy un curso abierto y gratuito de introducción a la programación
- El g-test para tablas de contingencia
- Octubre 2015
- La falacia del fiscal (pero con frecuencias naturales)
- La paradoja de Berkson
- Encuentro Big Data 2015 (.co)
- Google Maps (o CartoDB, etc.) “says ‘NO’”
- Del hombre medio a la factura media
- ¡Qué primitivos eran aquellos antepasados nuestros…! ¿O no?
- Madrid decide, propone, vota, etc.
- Unix para poetas
- Spam 2.0 (increíblemente bien hecho)
- Programa Profesional de Iniciación a R II
- purrr: otro dialecto para la programación funcional en R
- #INKS2015
- Septiembre 2015
- El curioso caso de los suicidios en Madrid
- La funesta manía de querer acertar
- Anunciado el programa de las VII Jornadas de Usuarios de R
- La huelga del metro de Londres y sus efectos beneficiosos
- Curso de ASPgems: Descubre Spark en 8 semanas
- ¿Cómo contar el número de elementos distintos de una lista?
- Mañana participo en el “VIII Machine Learning Spain”
- Las humanidades, ¿socialmente útiles?
- Un problema “sencillo”: posiciones y ruido
- Así no (o los sesgos de las encuestas de respuesta voluntaria)
- Varianza y cuantiles (del capitalismo de baja calidad en España)
- NMF: una técnica mergente de análisis no supervisado
- Correlaciones insospechadas: de la geometría moderna al catalán Hernán Cortés
- Ayer me puse el sombrero negro
- Cosas de R (¿que tal vez alguien sabrá explicar?)
- Voronois con distintas distancias
- Prioris, ¿subjetivas?
- Guías de estilo para programar en R
- Sobre la subida del paro registrado en agosto
- Respuestas distintas, ¿a la misma pregunta?
- Odds = probabilidades
- Agosto 2015
- Golpes de suerte
- Todos los errores son iguales, pero algunos son más iguales que otros
- Tres monedas y un argumento falaz
- Estar en racha (y promediar promedios)
- Una paradoja que no me parece paradójica, la de Bertrand, y una pregunta
- Dos análisis y una pregunta
- “Quién es Quién del Big Data en España 2015” y yo
- ¿Estamos todos anuméricos o qué?
- Ajuste de probabilidades en regresiones logísticas bajo sobremuestreo ( y otros)
- Julio 2015
- Una sociedad para la eliminación del coeficiente de correlación
- Aterrizando en Londres: una frase para meditar
- Explorando la desigualdad en Medialab-Prado
- Mis respuestas en una entrevista sobre “big data”, periodismo de datos, etc.
- La media, medidas de centralidad y distancias
- Estrategias escalables con R
- Un curioso corolario (políticoeconómico) del teorema de Rolle
- No uses el test de Wilcoxon, nos dice Gelman
- La variación y sus negacionistas
- Un modelo jerárquico para lo de Casillas
- Efectos en regresiones logísticas
- Casillas puede ser un portero mediocre, pero quienes analizan sus números lo son aún más
- Calcular una regresión a mano o con un programa puede ser más preciso
- ¿Son normales las alturas (de los individuos)?
- Un problema inverso de regresión
- Estadística descriptiva allende la estadística descriptiva
- Una interpretación (rápida y sucia) de los coeficientes de la regresión logística
- R Consortium
- Mejores mensajes de error con deparse + substitute
- Condicional e incertidumbre
- Junio 2015
- Rapapolvos al INE
- Licencias urbanísticas, no viables (y fin)
- Extraido de un libro de educación primaria
- Diferencia de medias a la bayesiana con salsa de stan
- Busco viñetista (para MicroDatosEs)
- SparkR 1.4: carga de ficheros CSV
- rPython & Anaconda
- La encuesta de presupuestos familiares, en MicroDatosEs
- Liberado Spark 1.4
- Paralelismo en R: memo[rándum]
- ¿Cuánta gente ha habido sobre la faz de la tierra?
- Ver 53000 filas
- Oh, no, ¡datastepr!
- Una de las cosas que me irritan de R
- Herramientas (y consejos) para avanzar en tu carrera
- El lenguaje de los gráficos en las Jornadas de Periodismo de Datos
- Mayo 2015
- Charla de José A. Guerrero
- Grafos por vecindad en mapas
- Ejercicio imperdonable de amateurismo
- Ya que estamos de resaca electoral, ¡Hacking elections!
- Cartogramas vs huertogramas
- Sumar 18: un problema fácil y otro que lo es menos
- Banzhaf y las elecciones que se nos vienen
- Frecuencias naturales (y consumo de cerveza)
- Grafos sobre mapas
- Cualquier parecido con la realidad es pura coincidencia
- Premio al mejor trabajo presentado por un joven en las VII Jornadas de Usuarios de R
- Pocos de los encuestados…
- A cuento de mi clase práctica de modelos no supervisados
- Para los que buscáis proyectos de análisis / visualización de datos
- Podrá… ¿qué significará podrá?
- Intervalos de credibilidad para la beta: una alternativa
- Las VII Jornadas de Usuarios de R buscan patrocinadores
- Charla en Visualizar'15: la tríada del análisis de datos
- Abril 2015
- APIdays Mediterranea vuelve a Barcelona (la semana que viene)
- Una curiosa trasposición legal (hecha, manifiestamente, a malagana)
- Petición al INE: deseadme suerte
- Intervalos de credibilidad para la distribución beta
- ¿13.100 más/menos cuántos parados menos?
- Valores diferentes
- Madrid, ¿ciudad inteligente? ¿O tal vez solo un poco menos sorda?
- Programa Profesional de Iniciación a R
- ¿Si un día faltan 21.63 euros en caja?
- Todo por no RTFM (o cómo usar matplotlib con R)
- Spark ha muerto, ¡larga vida (y buena migración) a Shinyapps!
- La información es sorpresa
- Las VII Jornadas de Usuarios de R, en Salamanca este noviembre
- Restauración de ficheros .bak sin Windows
- Adaequatio rei et intellectus
- TelegRam[.]me!
- Taller de mapas con R el 14 de abril en Madrid
- Visualizar'15 Datos para el bien común: convocatoria de proyectos
- Marzo 2015
- Hoy es el día mundial de la copia de seguridad
- Datos, datos, datos,… ¿pero qué datos?
- Y todo ocurre en un abrir y cerrar de ojos
- Pues sí: un curso de redes sociales con R
- Compresión con SVD
- Mileuristas… anuales
- Campaña de alfabetización numérica… para diputados
- ¿Un curso de redes sociales con R?
- Datos en formato largo y melt
- format( “www.R-project.org”, year = 2015)
- Licencias urbanísticas: datos y votos
- Unas preguntas incómodas
- ¿Cuál es la “mejor” manera de ordenar un dataframe?
- IV Meetup Machine Learning Spain: diapositivas y enlaces
- Adaequatio rei et analysis
- IV Meetup Machine Learning Spain: factorización no negativa de matrices y algunas aplicaciones
- Global Urban Datafest: seré juez pero no parte
- Febrero 2015
- Varianzas y variaciones de netos
- bellostamisc y una moraleja
- Todos contra todos
- Más sobre el error de medida
- Error de medida
- Decisiones “a ojo de buen cubero”
- ¿Vernacularidades? No, gracias
- Un problema de cartas
- Curso de presencial y gratuito en Madrid (mío, para más señas)
- Movilidad municipal
- Parametrización de modelos de supervivencia (paramétricos)
- Recurrencia recurrente
- Vuelvo a España
- Ejercicios de mi clase de R
- Romain François (y Francisco Viciana) en el grupo de usuarios de R de Sevilla
- Parametrización para vagos muy, muy vagos
- Entrevista en Principio de Incertidumbre: “big data” sin artificio
- Enero 2015
- Hackatón de datos abiertos, 21 de febrero en Madrid
- La profesionalización de R
- Grandes datos, máquinas pequeñas (y regresiones logísticas con variables categóricas)
- Cuando dicen que la variable x es exógena, quieren decir…
- Dónde guardar los paquetes de R (en Linux, al menos)
- No me ha salido, pero lo cuento igual
- Huele a bicho (en plyr)
- Rarezas: estadística algebraica
- evtree: árboles globales
- Tres libros más, una biblioteca menos
- Juegos justos con monedas truchas
- La curtosis de una variable aleatoria constante
- Publicada una nueva versión de rPython-win
- Diciembre 2015
- 2014
- Diciembre 2014
- El problema de la estimación inversa
- Cómo no nació el “big data”
- Modelos mixtos por doquier
- ¿Dónde están aquellos caballeros andantes?
- ¿Hubo alguna vez un millón de palentinas?
- Ruido en las estadísticas oficiales
- La correlación ni siquiera implica “correlación”
- R Markdown a la Tufte
- Sí, señor ministro… y encuestas
- Paralelización en R con snow
- Me muerdo la lengua… por no contarlo todo
- Gráficos e interactividad: una ocasión desaprovechada
- Noviembre 2014
- Como no tengo tiempo, voy a publicar una chorrada (y una coda)
- Dualidad en la práctica: lecciones de la guerra fría
- Boceto de entrada sobre bits y referéndums
- Mi querido colega de Iberia:
- Spark gana la competición Gray Sort de 2014
- Dime, ¿qué quieres comparar con qué?
- Sevilla: otro grupo local de usuarios de R
- Los coeficientes de la regresión logística con sobremuestreo
- Proyecciones, estimaciones, previsiones, operaciones… y churros
- Simpson y la plebe anumérica
- Descargar ficheros .gz detrás de HTTPS con R
- ¿Un 30% de probabilidad de que llueva mañana?
- Remuestreos y tests de hipótesis
- Estadística “clásica” vs remuestreo
- Disponibles los vídeos y presentaciones de las VI Jornadas de Usuarios de R
- Dislexia probabilística
- Españoles hererodoxos (¿outliers patrios?)
- Octubre 2014
- ¿Y si no se mantuvieran?
- Análisis discriminante a la Ortega y Gasset
- Tres sigmas o nanay
- Noticia de las VI Jornadas de Usuarios de R
- La aspiradora acosadora
- Parto para las VI Jornadas de Usuarios de R
- Más allá del teorema central del límite
- ROI de ida y vuelta
- Aprende R con swirl
- Watson, no es nada elemental
- Amanece, me cuentan, que no es poco
- Los tests de hipótesis son los macarrones “con cosas de la nevera”
- Bootstrap bayesiano
- Experto en Data Science en la U-tad
- ¿Eres un buen “científico de datos”?
- Como leáis esta entrada aprenderéis tanto como lo que desaprenderéis
- El problema del 100% (y un ensayo de solución)
- “Lengua y Markov” en MartinaCocina este sábado
- ¿Dónde he estado (según Google)?
- Septiembre 2014
- Va sobre el número de palabras
- Decisiones basadas en datos: ¿siempre posibles en la práctica?
- Tirar la piedra, esconder la mano
- plyr, dplyr, data.table: ¿qué opinas?
- El impacto (causal) de Google
- La diapositiva perdida, versión algo más extendida
- Primer elemento de un grupo dentro de un dataframe de R
- Recordatorio: esta tarde participo en el DataBeers de Madrid
- Una transformación (y segmentación) novedosa de variables (lognormaloides)
- R en Nada Es Gratis
- Componentes conexas (de grafos) en Spark
- Bajo el capó del particionamiento recursivo basado en modelos
- Missing
- Modelos, mascotas y rebaños en el DataBeers de Madrid
- Factorización de enteros con grid
- Tres citas para los amantes del análisis de datos públicos
- Agosto 2014
- Mascotas y rebaños
- (Mis) procesos puntuales con glm
- ¿Tienen sentido las tasas municipales de desempleo?
- Procesos puntuales: una primera aproximación
- Procesos de Poisson no homogéneos: la historia de un fracaso
- La historia de la estadística comienza…
- Naive Bayes como red bayesiana
- Solo necesitarás estadística viejuna
- Coclustering con blockcluster
- Julio 2014
- Combinación de probabilidades
- Incrementalidad via particionamiento recursivo basado en modelos
- 60 generaciones
- Datos antes y después del PCA
- Si participase en MadData…
- Ni-nis y estados transitorios
- MadData: datatón de datos abiertos
- En serio con Spark: instalación
- Facetas para entender, tal vez, la evolución del paro
- Dos descomposiciones positivas de tablas de contingencia
- El Partido de la Media Ponderada
- ¿Fascinados por las cosas circulares?
- Estrategias escalables (con R)
- Demasiado bueno para ser cierto
- Por qué soy escéptico con respecto al periodismo de datos
- Vectorización en R: un contraejemplo
- Nueva versión del informe ‘Quién es Quién en el Big Data en España’
- Hacer amigos vs reponer amigos vs reemplazar amigos
- Lecturas disparatadas: la salud de los críos y el desempleo
- Junio 2014
- Disponible una nueva versión de MicroDatosEs
- APIDays Mediterránea: reunión de los forofos de las APIs de Madrid
- El índice de birrieza para distribuciones de probabilidad
- Causalidad a la Pearl y el operador do
- Grupo de usuarios de R de Portugal
- Dos citas de 1983 sobre estadística y métodos computacionales
- Factorizaciones positivas de matrices igualmente positivas
- Tan actual 25 años después
- Agrupación de grafos por topología
- Hoy he echado de menos Scala
- A vueltas con el t-test
- El porqué de los mínimos cuadrados con restricciones
- Validación cruzada en paralelo
- Mínimos cuadrados con restricciones
- Errores de tipo M y de tipo S
- Nuevo curso: “Big & open data: análisis y programación con R”
- Mayo 2014
- Inserción eficiente (?) de datos vía RJDBC
- ¿Dónde estudiar el curso puente hacia la licenciatura en estadística?
- plot.ly: visualización de datos multilenguaje
- APIdays Mediterránea, 29 y 30 de mayo en Barcelona
- La complejidad de la ley
- V Jornadas de la Enseñanza y Aprendizaje de la Estadística y la Investigación Operativa
- 45º
- Imágenes y magia
- R en paralelo
- Nueva versión de MicroDatosEs: héroes, villanos y mejoras
- Y sin embargo, te quiero
- “Visual Explanations” de Tufte: el primer gráfico estadístico
- Grid, Scala y arbolitos fractales
- Dos enlaces (y medio) sobre herramientas: git y APIs
- Tres criterios para evaluar gráficos
- Gráficos de mosaico: ¿sí o no?
- “Accurate”, acurado, preciso y todas esas cosas
- El primer DataBeers de Madrid, el martes en MartinaCocina
- Las VI Jornadas de Usuarios de R, en Santiago
- Abril 2014
- Embalses en España: otro ejercicio inconcluso de “web scraping”
- Todo el mundo habla de cadenas de Markov
- ¿Cinco años y salen sin programar?
- Una de gráficos casi artísticos con R
- Aventuras de “web scraping”: cómo bajarse todo el BOE
- Demasiado simple
- Reponderación de componentes: un ejemplo
- Menos econometría y más precioestatos
- Una cosa que me irrita de muchos artículos de estadística
- @R_Hisp, la cuenta oficial de la Comunidad R Hispano
- No hay motivo para no actualizar tu R a la última versión
- Colusión de anunciantes en perjuicio de navegantes
- La escala natural de la varianza
- V Jornadas de la Enseñanza y Aprendizaje de la Estadística y la Investigación Operativa
- Análisis factorial e ideas que se resisten a morir
- El lenguaje de Wolfram (según Wolfram)
- The Elements of Statistical Craftsmanship
- Varimax: lo que se gana, lo que se pierde
- Componentes principales para quienes cursaron álgebra de primero con aprovechamiento
- Marzo 2014
- Graficaca en Gas Natural Fenosa
- Predictores con varianza casi nula, inflación, loterías y línea de comandos
- Mapas: cosas casi increíbles que pueden hacerse con R
- ykmeans, ¿broma, ironía o triste realidad?
- Totales agregados por bloques en tablas
- Finalmente, se ha inaugurado Martina Cocina
- Cuatro enlaces sobre R: Excel, C++, CSV y paralelización
- Los sospechosos habituales y Python
- Series temporales, datos espaciales y espacio-temporales con R
- Científicos de datos, aprended de los actuarios
- Sobre el artículo de Domingos
- Selección de enlaces: censos, el Titanic, periodistas y mapas
- El escritor exemplar
- Veinte paquetes de R para científicos de datos
- “Beautiful evidence”, de Tufte
- Guarjolización de fotos con R
- Victoria o diferencia de puntos, ahora con “random forests”
- Me han entrevistado en Big Data 4 Success
- ¿Victoria o diferencia de puntos? ¿lm o glm?
- El chocheo de los dioses
- Febrero 2014
- Selección de enlaces: redes sociales, gráficos con R, ofertas de trabajo y p-valores
- D. Hand sobre estadística y minería de datos
- Curso de análisis de datos ‘ómicos’ con R
- ‘Quién es Quién’ del Big Data en España
- Cuatro enlaces: sanidad, correos electrónicos, leyes y errores de programación
- La bolsa intradía y bolsa interdía
- Ofertón: tarifa plana de GasNaturalFenosa
- El yuyuplot en perspectiva
- ¿Dónde estoy? ¿Dónde estaré?
- Memoria de decaimiento exponencial y canutos asíncronos
- Mi solución al otro problema del cumpleaños
- De ratios, apuestas y riesgos
- ¿No sin evidencia?
- Experimentos con el paquete gbm
- El otro problema del cumpleaños
- 10.000 correlaciones por segundo (sin comentarios)
- ¿Qué nos jugamos con la neutralidad en la red?
- Enero 2014
- Algunos problemas de la regresión paso a paso (“stepwise”)
- Guía de estilo de R (de Google)
- Cómo no restar números fuzzy
- En recuerdo de Leo Breiman
- Catorce mitos sobre el mercado eléctrico
- Cambios, cambios, cambios
- Más (y distinto) sobre los censos
- Macros sintácticas con R
- Curso de estadística y R de Hastie y Tibshirani
- Nueva edición de mi taller de R y Hadoop en Zaragoza
- Error de tipo I, error de tipo II
- Cómo apostar si tienes que
- ¿A qué distancia está el horizonte?
- Diagramas de caja, 44 años después
- Los censos huelen a naftalina (y son muy caros)
- Diciembre 2014
- 2013
- Diciembre 2013
- Palabras y pelas: un ejercicio apenas incoado
- Tres artículos curiosos sobre gráficos
- Muestreos aleatorios sobre la península Ibérica, por ejemplo
- ¿Cuánta gente usará R (vs Python vs otros) dentro de 1000 años?
- ¿Te queda lejos el aeropuerto?
- Gradientes e ilusiones ópticas
- ¿Cuántos peces hay en un lago?
- Ayuda de R en español
- Requisitos para mi taller de Hadoop + R en las V Jornadas de Usuarios de R
- Noviembre 2013
- Óscar Perpiñán sobre gráficos base vs. lattice vs ggplot2
- ¿Dónde van los ejes?
- Cuatro principios para tomar mejores decisiones
- Un pequeño problema de probabilidad
- La monitorización del consumo eléctrico de los hogares
- rPython, ya en Windows
- La red Asia
- Statistics Online Computational Resource
- Curso de mapas en línea para principiantes
- 5000 paquetes de R en CRAN
- PC-Axis ha muerto, larga vida a JSON-stat
- Importancia de variables en árboles
- Un récord personal
- Octubre 2013
- Septiembre 2013
- Agosto 2013
- El cuarteto de Anscombe
- Una revisita a “El arte funcional”
- ¿Qué ha hecho el CSIC por mí?
- El pomelazo del CSIC
- “Datathon for Social Good” de Telefónica
- Así las gastan otros INEs
- El carajal de las representaciones gráficas de “redes sociales”
- Mis copias de seguridad
- Mapas, mapas, mapas… ¿y?
- Tres grandes números (con enmienda)
- ¿Suben o bajan?
- ¡Qué solazo anoche!
- Medianas ponderadas en R
- Quiero violar la ley y no sé cómo
- Julio 2013
- Lo relevante, arriba y a la izquierda
- Tres grandes números
- Una macro para generar titulares sobre resultados de encuestas
- La EPA, en Materia (y otros medios)
- Las V Jornadas de Usuarios de R, en Zaragoza
- Mi definición de “big data”
- Conceptos estadísticos que desaprender: suficiencia
- Policía y crimen: algunos números
- Junio 2013
- Mayo 2013
- Vídeo de mi charla en el Taller InnovaData de periodismo de datos
- APIdays Mediterranea, la semana que viene
- Mi charla sobre un lematizador probabilístico con R (vídeo y diapositivas)
- Charla el día 27 en el Taller InnovaData de periodismo de datos
- El error en las encuestas: cuentas en una servilleta
- La media, la mediana y el Bundesbank
- Charla: un lematizador probabilístico con R
- Más sobre la ley de Benford (III): la “mágica” propiedad de los logaritmos decimales
- data.table (II): agregaciones
- Dependencias funcionales en R con foodweb
- Mi primera aplicacion en Shiny: un detector de idiomas
- Más sobre la ley de Benford (II): la distribución de la parte fraccionaria
- data.table (I): cruces
- Abril 2013
- Por qué no deberías compartir tu código: diez motivos
- El casco y las bicis: no porque no
- Todo lo que Vd. siempre quiso saber sobre la EPA (etc.)
- ¿Leemos “Analyzing Linguistic Data” juntos?
- Pero mañana seguiremos usando Excel
- Demanda y uso de gobierno abierto en España
- Más sobre la ley de Benford (I): una condición suficiente
- “Tu tasa de paro” en Medialab Prado
- Un plan de acción para extender el ámbito de la estadística
- Mapa de los terremotos en la península ibérica
- textConnection y ficheros anónimos: cuestión de rendimiento
- Las leyes de Benford
- rPython ya está en CRAN
- Marzo 2013
- Febrero 2013
- Addenda: ¿qué ha pasado en el Ibex durante el último mes?
- ¿Qué ha pasado en el Ibex durante el último mes?
- ¿Cómo vota la gente?
- Estadísticas oficiales alternativas
- Si lees “Nudge” verás las cosas de otra manera
- Me siento reivindicado
- Descarga de ficheros con R a través de sftp
- Voy a partir una lanza a favor de Rosell a cuenta de la EPA
- La ley de Benford en muestras pequeñas: algunas evidencias
- Anonimidad en ficheros de microdatos: un estudio en el contexto español
- ¡Reeditamos el curso básico de R!
- Enero 2013
- Tutoriales de RapidMiner en Youtube
- Casi un ejemplo perfecto
- El estado y la educación, según Gabriel Tortella
- Tu tasa de paro personal
- De los datos al conocimiento científico
- ¿Son sostenibles las pensiones en el largo plazo?
- El primer análisis clínico, ¿en la Biblia?
- ¿Por qué 0.05?
- Algunos resultados de la Encuesta Trimestral de Coste Laboral
- Arte con R: tres enlaces
- Una aplicación SEO con R
- El Ibex 35 al estilo GapMinder
- Los nueve artículos favoritos de Tibshirani
- Sanidad pública, sanidad privada
- ¿Eres un analfabeto numérico?
- Sobre los límites de la minería de datos
- Diciembre 2013
- 2012
- Diciembre 2012
- Un MOOC P2P
- IPC de noviembre: al menos, una buena noticia
- Infografía sobre Big Data Spain
- SAS Stats Wars: comparación de calificaciones por sexo
- Prueba R, gentileza de code school.com
- El (escaso) beneficio marginal de trabajar
- Sólo el 5% ganan dinero con el “análisis técnico”
- Disponibles los vídeos de las sesiones de BigDataSpain
- Más sobre variaciones insignificantes en estadísticas públicas
- Noviembre 2012
- Errores de las encuestas electorales en Cataluña: una hipótesis sugerente
- ¿… coma cero dos por ciento? ¡Anda ya!
- Las ocho peores técnicas analíticas
- 260GB… ¿es “big data”?
- Lo normal: sumar doce, restar seis
- Presentación del libro “Six Sigma with R”
- Como no tengo tiempo, os pongo un biplot y me lo explicáis vosotros
- Capicúa
- Anumerismo en los medios (y seudoperiodismo de datos)
- Entrevista en el portal del RUG Barcelona
- No es país para “biplots”
- MapReduce con mincedmeat
- Tesis de maestría: periodismo de datos, “big data” y “open data”
- ¿Cómo vivir en un mar de datos?
- Octubre 2012
- La crisis es buena para la salud, parece
- Cultura numérica, incultura numérica
- Liberado BioStatFLOSS, una colección de recursos libres para la bioestadística y la epidemiología
- HHH, HHT y el comando “yield” de Python
- “Predictably irrational”
- Veinte herramientas de visualización
- Test de Student e importancia práctica: una solución (para su discusión)
- Nuevo curso (gratuito) de estadística con R
- Reunión del Grupo de Usuarios de R de Madrid
- Algunos gráficos de información bursátil
- Los ingleses me descolocan
- R como herramienta de captura de datos
- Test de Student e importancia práctica: un ejercicio
- Abenjaldún, el precursor
- Gráficos en R a la xkcd
- Balanzas fiscales y periodismo basado en datos
- Las cosquillas de los sondeos electorales
- Datos sobre los presupuestos del País Vasco
- Ley de Transparencia y anonimidad en ficheros de microdatos (II)
- Un pequeño ejercicio de agudeza visual
- El Proyecto Internacional de Alfabetización Estadística
- Septiembre 2012
- Tutorial: cómo analizar datos de Twitter con R
- Ejemplos sobre cómo usar R desde SAS a través de IML
- coursera.es, ya
- Predicciones de series temporales a gran escala y en paralelo con R
- Un (¿sutil?) error en el cálculo de probabilidades en El País
- Las dos preguntas fundamentales de la teoría de los valores extremos
- ¿Cómo votan los diputados?
- PER y EV/EBITDA
- RDataMining, un paquete para minería de datos con R
- El algoritmo PSLQ e identificación de números
- Gosset, el remuestreador de la infinita paciencia
- El arte funcional: una revisión personal
- “Gráficos estadísticos y mapas con R”, un análisis
- Periodismo, metaperiodismo y bienes públicos
- Limpieza de cartera: tres artículos
- Los principales problemas de España
- Agosto 2012
- ¿En qué está pensando el ministro Wert?
- Yendo por moras en el País Vasco
- ¿Estaría el BCE a ciegas?
- p-valores bajo la hipótesis nula tras múltiples comparaciones
- Ajustar o no ajustar, esta es la cuestión
- R en el Software Developer’s Journal
- Incendios en España
- Fallecimientos y microdatos
- Vehículos eléctricos, ¿competitivos?
- Odds ratio vs probabilidad
- El arte funcional
- SAS, R, grandes datos y falta de afabilidad
- Un paseo por el paquete MicroDatosEs (y la EPA, de nuevo)
- El paquete MicroDatosEs para microdatos públicos
- Reetiquetar factores en R
- Julio 2012
- Tres ideas sobre datos abiertos
- La media y el riesgo (de nuevo)
- No es país para estadísticos
- ¡A los datos mismos!
- Hemos cerrado el curso básico de R
- Graficaca 2.0
- Deshaucios en España y su estructura geográfica
- Las IV Jornadas de Usuarios de R están aquí
- Conferencia sobre Grandes Datos
- Dos cursos de R en la U. de Murcia
- El paro, ¿cosa de hombres?
- Edad, nivel de formación, sexo y paro
- Otra oxímoron: notarios y estadísticas
- La desigualdad y cómo medirla
- El precio de la desigualdad (i.e., el bosón de Higgs y fracciones)
- ¿Afectó el fraude de Barclays al Libor?
- Libor, líbor, Fundéu y Barclays, claro
- ¿Regalo o descuento?
- Gráficos estadísticos y mapas con R
- Junio 2012
- Idea peregrina: el taxiván
- Valores perdidos: MCAR, MAR y MNAR
- IVA, IRPF y desigualdad
- Ciencia e ingeniería; estadística y… ¿y qué?
- Para los expertos en series temporales (II)
- Las auditorías bancarias de ayer
- El otro AIC
- useR2013, en Albacete
- El índice de riqueza integral
- Rankings de colegios: problemas y alternativas
- ¿Por qué me quejo del Banco de España?
- Hoy ha comenzado el curso básico de R
- Las IV Jornadas de Usuarios de R están en marcha
- Hoy hablaremos de r-es.org
- Definiciones estadísticas básicas (para los periodistas de “El economista”)
- Medias y medianas en el Banco de España
- La prehistoria de R, según Patrick Burns
- Curso de R gratuito no presencial
- Mayo 2012
- Competición en Forbes: y el peor gráfico es…
- Deuda y apalancamiento
- SAP, HANA, RHANA y R
- Desencriptando (II): la avaricia es mala
- Jugar empobrece
- Patrones hexagonales con R
- La paradoja del cumpleaños y el niño que colecciona cromos de futbolistas
- Desencriptando (I): el problema de un mal amigo
- Modelos exponenciales para grafos aleatorios (y III): inferencia
- Para los expertos en series temporales
- Estadística para periodistas en Idescat
- ¿Se puede predecir con Twitter?
- Modelos exponenciales para grafos aleatorios (II): modelo probabilístico
- Modelos exponenciales para grafos aleatorios (I): motivación
- Todos los modelos son X, pero algunos son Y
- Por un IRPF ergonómico
- Números rojos (y perfectibles)
- Representación de datos asociados a grupos
- Abril 2012
- Contar, ¿fácil?
- España, ¿radial? (II)
- España, ¿radial? (I)
- Segunda reunión de usuarios de R de Madrid: recordatorio
- Gráficos “dinamita”, desaconsejados
- Graficaca en el recibo de la luz (y por imperativo legal, para más inri)
- Variables instrumentales con R
- Periodismo de datos en Via52.com
- Rutas por Zaragoza con R
- Balanzas fiscales (así, en plural)
- Cuando falta la variable más importante (II)
- Corrección por exposición del modelo logístico
- Un intérprete alternativo de R
- Cuando falta la variable más importante
- De D’Hondt a Banzhaf
- Churn y redes sociales: un ejemplo en telecomunicaciones
- ¿Creer o no creer?
- Marzo 2012
- Tolstoi, sobre los mercados ineficientes
- Otra de huelgas
- Contrafactualidad radial
- Acceso y reutilización de datos públicos
- 2013, año internacional de la estadística
- R y la distribución de Rayleigh
- Noticia de la primera reunión del grupo de usuarios de R de Madrid
- Un articulillo de Tukey
- Primera reunión del grupo de usuarios de R de Madrid
- Error de tipo I, error de tipo II y cómo no confundirlos
- I+D+i, Regnum Hispaniarum, circa 2012 A.D.
- ¡Maño qué mapa!
- Las palabras esenciales del diccionario
- Estrenos con ecos estadísticos (II): Contagio
- Las preguntas oportunas brillan por su ausencia
- ¿Varianza explicada?
- Esperanzador no: varianzador
- Más sobre Julia (II): mi primer programa
- Más sobre Julia
- El modelo lineal en Youtube
- Cómo poner una lavadora
- Febrero 2012
- El cuadrante mágico de Gartner y sus contradicciones internas
- Julia, un nuevo lenguaje para la programación científica
- Desconfianza en la estadística pública Argentina
- Estoy muy de acuerdo con la CEOE…
- Higiene numérica para periodistas
- Desempleo, incentivos y geometría
- Artículos interesantes en la bitácora de un colega
- Entrevista con los promotores de RUGBCN
- Estrenos con ecos estadísticos (I): Moneyball
- Virguería con R
- Curso de Estadística Aplicada a la Investigación Biomédica con R en el CNIO
- Guía de econometría básica con R
- R y alRededoRes en MediaLab Prado
- La frontera bayesiana en problemas de clasificación (simples)
- Enero 2012
- Cosa prodigiosa (III): epílogo
- Hay (micro)vida más allá de la (micro)muerte
- Un manifiesto (y juramento “hipocrático”) para los modelizadores
- Limpieza de cartera y miscelánea de artículos
- ¿Qué es un “data scientist”?
- Nueve reinas con SAS (y R también)
- Disponibles los vídeos sobre periodismo de datos en MediaLab Prado
- Cosa prodigiosa, ahora con palabras (II)
- R, en el ’top 20’ de Tiobe
- Muestreando la distribución uniforme sobre la esfera unidad en n dimensiones
- Eles, “casts” y el rizo del rizo de la programación eficiente (con R)
- Localidad, globalidad y maldición de la dimensionalidad
- Cosa prodigiosa, sin palabras (I)
- Una cifra, ya que estamos con el IRPF
- Escribir el libro “Estadística con R” en tres meses, ¿quimera?
- Comienza la lectura de “The Elements of Statistical Learning”
- ¿Cuánto gana el banco con tu hipoteca?
- Un lematizador para el español con R (II)
- Minería de datos: estado de la profesión y tendencias
- Ingeniería fiscal para mi hipoteca: ¿vendo un futuro?
- ¿Curiosidades de la lotería?
- IVA, IRPF y cosas que no entiendo
- Diciembre 2012
- 2011
- Diciembre 2011
- Captura de datos, MediaLab Prado y NeedleBase
- Gráficos de pares de variables mejorados (con R)
- ¿Es rentable invertir en bolsa en el largo plazo?
- El lucero del alba
- IBM sobre Excel como herramienta estadística
- ¿Nos leemos “The Elements of Statistical Learning” de tapa a tapa?
- Hoy, día del sorteo de la Lotería de Navidad, no se publica entrada
- ¿Cuánto vale un billete del AVE a Valencia? Una cota inferior
- p, n y mi moneda de la suerte
- ¿La correlación “del siglo XXI”?
- Disponibles los vídeos de las charlas de las III Jornadas de Usuarios de R
- Gráficos de embudo para controlar la varianza en muestras pequeñas
- Un lematizador para el español con R… ¿cutre? ¿mejorable?
- Estadísticas de incendios forestales en España
- Bajo el capó de teradataR
- Precios de la vivienda e intención de voto, por Nestoria
- The Little Handbook of Statistical Practice
- Grandes avances criptográficos… según El País
- Creación de un “R portable”
- Noviembre 2011
- Google Translate, tamaños muestrales y sesgos
- Doping, héroes patrios y… estadística
- R en la enseñanza: unos comentarios a los comentarios
- ¿Escalas logarítimicas? Puede, pero…
- Vídeos de las charlas de Alberto Cairo y Alberto Alcaraz
- El 3 de diciembre, Open Data Hackathon
- Grupo de trabajo sobre periodismo de datos en Madrid
- III Jornadas de Usuarios de R: algunas reflexiones
- Hoy, el primer encuentro del Grupo de Usuarios de R de Argentina
- 741 millones de barriles de petróleo, ¿mucho o poco?
- “Bump charts” para comparar gráficamente proporciones entre periodos
- Disponible el programa de las III Jornadas de Usuarios de R
- ¿Es abierto todo lo que reluce? Resultados
- Medias de medias… ¿a estas alturas de siglo?
- Twain, Grecia, Pisa, Cataluña y deontología
- Octubre 2011
- Hoy somos 7000 millones
- ¿Es abierto todo lo que reluce?
- Oracle R Enterprise
- Herramientas de depuración en R
- Liquidez y solvencia
- Necesitamos una Asociación de Usuarios de R
- Un problema de probabilidad
- Día mundial de la estadística
- Visualización de la incertidumbre sobre el futuro
- Estrategia, predicción y proyección de la población española
- Riesgo en proyectos de IT
- Gestión avanzada de memoria en R: tracemem (II)
- Causalidad y método científico en El País
- DataWrangler: limpieza y transformación interactiva de datos
- Las proyecciones de la población de España a corto plazo del INE no valen para un carajo
- Numerismo “interruptus” en el FT
- Ley de Transparencia y anonimidad en ficheros de microdatos
- Cálculo mental, alzheimer, anumerismo y 20N
- Puedes probar cualquier cosa (con paciencia)
- Gestión avanzada de memoria en R: tracemem
- Septiembre 2011
- Dont be loopy! (III: jackknife y paralelismo)
- Predicciones a toro pasado y el perro que no ladró
- Datos grandes, colas largas
- Sobre la economía del lenguaje
- Anumerismo: ¿atenuante o agravante?
- Don’t be loopy! (II)
- Anonimidad y cantidad de información
- Facetas en ggplot2 (al hilo de otra gañanada)
- La ley de Benford, revisitada
- Linked, de Barabasi, capítulo I
- Otra sobre polígrafos, terrorismo y periodistas anuméricos
- La ley de Benford
- La estadística del número tres
- Datos patrimoniales de los senadores
- Visualización de la actualización bayesiana (y unas cuantas funciones de R)
- Treemaps en R
- Códigos de caracteres en R
- El paquete reshape de R (I): melt
- Códigos de caracteres, unicode y UTF-8
- Un paseo por cloudnumbers
- Un paseo por Google Fusion Tables
- Agosto 2011
- Diez pasos para construir indicadores compuestos
- Dinero y motivación
- “Arte gráfico” con R
- Clústering (IV): una digresión real como la vida misma
- Ubi ratio, ibi paradoxa (Simpsorum)
- Tasa Tobin: una discusión casi empírica
- Piensa en en términos de inferencia
- Si Feller levantase la cabeza…
- Comparación de variables aleatorias de Poisson
- Rumores: ¿SAS en venta?
- Google, Motorola, móviles, patentes e ideas
- Una feliz conjunción estadístico-algebraica (y II)
- Una feliz conjunción estadístico-algebraica
- Don’t be loopy!
- De la varianza en muestras pequeñas (y el problema del hospital)
- El BPA es un indicador… ¿de qué?
- El juego de las matrículas y su precoda
- SVD de matrices enormes con R
- Desarrollo de paquetes con R (IV): funciones genéricas
- Clústering (III): sobresimplificación
- El borrador de Ley de transparencia, disponible
- Dos aplicaciones (¿sorprendentes?) del análisis de la correlación canónica
- Julio 2011
- Los siete pecados capitales de la minería de datos
- El paquete pxR, en CRAN
- Diagramas de puntos (dotplots)
- ¿Qué es un banco? ¿Qué son las pruebas de resistencia? (En primera derivada)
- La escuela de Chicago se defiende
- Paella sin arroz con sabor a judías enlatadas
- Y Kenia qué, ¿eh?
- Clústering (II): ¿es replicable?
- Competición de estadística con R en las III Jornadas de Usuarios de R
- Nassim Taleb y el problema de la inferencia
- La percepción del riesgo, en la BBC
- SAS 9.3, disponible
- Desarrollo de paquetes con R (III): check, check, check
- Clustering (I): una pesadilla que fue real
- useR!, en Warwick, dentro de un mes
- Disponible el borrador de la ley de acceso a la información
- Miscelánea de citas
- Paquetes huérfanos de R
- Junio 2011
- Desarrollo de paquetes con R (II): primeros pasos
- Visualización de datos con Weave
- Google Refine para analizar, estudiar y limpiar los datos
- Estadística “como Dios manda”
- Sobre el libro “The flaw of averages”
- Sweave, investigación reproducible… y más
- Diez mandamientos del análisis de datos
- Desarrollo de paquetes con R (I): ¿para qué?
- UbiData.org, disponible en beta
- Grandes números
- Una herramienta para construir paquetes de R sobre Windows
- La historia de CART (una segunda parte)
- Minitutorial de subversion
- Datos públicos, datos DUP
- 250 aniversario de la muerte de Bayes
- Gestión de proyectos en R
- NComVa y visualización de datos públicos
- La tragedia del buen rollito
- Explica, el portal divulgativo del INE
- Sobre la encuesta sobre minería de datos de Rexer Analytics
- Micromuertes
- Mayo 2011
- Graficaca en el FT
- Dos perspectivas sobre el problema de los valores no informados
- El problema de la media, el problema con la media
- Los finalistas del Desafío AbreDatos 2011
- Se buscan “alpha testers” para rPython
- La versión 0.7 del paquete colbycol, en CRAN
- Problema de la semana sobre la media
- SAS, ¿el futuro? Una perspectiva demográfica
- Solipsismo, comunidad y rendimiento
- Un curso completo de minería de datos en Youtube
- ¿Qué nos jugamos? (Addenda: no queremos jugarnos nada)
- Consejos para utilizar R “en producción”
- ¿Qué nos jugamos?
- Terrorismo y sesgos en la percepción de la improbabilidad
- Hitler era comunista y judío
- Un rol de herramientas de minería de datos
- Personal data mining
- Abril 2011
- ¿Cuánto cuesta criar un buey?
- Extensiones de la R2
- Incertidumbre, juicios y sesgos
- Gráficos (VI): teoría
- Seis consejos para quienes aspiran a la excelencia
- Causalidad o asociación: indicios de la primera
- Gráficos (V): mapas
- Teradata, R y las III Jornadas de Usuarios de R
- Canadá 1 - EE.UU. 0
- Gráficos (IV): tutoriales
- ¿Nos leen (y más) en El País?
- ¡Qué prensa tan mala!
- Nunca más de cinco
- Paralelización de bucles con foreach
- Nueva versión de paquete colbycol
- ¿Cuál es la esencia de la estadística?
- Gráficos (III): bitácoras
- Anuncio de las III Jornadas de usuarios de R
- A esa gente le había hecho falta un matemático
- Marzo 2011
- Economía y estadística en la Reserva Federal
- Chuletario de estadística con SAS
- Gráficos (II): Herramientas
- Por la apertura de los datos públicos
- ¿Dónde obtengo mis datos? ¡Pregunta!
- R y Excel: una alternativa
- Gráficos (I): introducción
- Estadística para periodistas y escritores
- Asesinatos en perspectiva
- Ya no si sino cuánto
- Paréntesis, llaves y rendimiento en R
- Metodología, casuística y tipología
- Publica o perece
- Riesgo e incertidumbre
- R, HDF5 y bases de datos orientadas a columnas
- Una propuesta de “crowdsourcing analítico”
- ¿Cómo mejorar tu estilo de programación en R?
- Los dinosaurios y R: dos enlaces
- Nuevos comentarios sobre RevoScaleR
- ¿Casi todos los resultados científicos que se publican son falsos?
- ¿Tartas? No gracias
- RStudio, un nuevo editor multiplataforma para R
- Febrero 2011
- Programación funcional en R: Reduce
- Hay vida feliz más allá del PIB
- ¡Que trabaje su tía!
- Centenario de la muerte de Galton
- Sólo quiero saber si basta con tres casos
- Minería de datos: promesas y realidades
- Divide y compararás
- Enredando con el paquete googleVis de R
- Animaciones estadísticas con R
- Cómo reordenar niveles de factores en R
- ¿Más óptimo? Uffff…
- ¿Dónde están las antípodas de Montevideo?
- ¿Puedes todavía vencer a un ordenador?
- ggplot2 en su contexto
- ¿Un torpedo bajo la línea de flotación de SAS?
- Energía y medio ambiente en 2035: algunos números
- Rudimentos para la manipulación de fechas con R
- Enero 2011
- R-node, una interfaz “web” para R
- Un gráfico engañabobos
- Pensiones: ¿duros a pesetas?
- Nueva competición de minería de datos: reconocimiento de instrumentos musicales
- La ley de los grandes números y el teorema central del límite en dos animaciones
- ¿“Acaban” las descargas “ilegales” con la cultura?
- La inesperada aparición del ahorcamiento inesperado
- Verdades, mentiras, estadísticas… y autopistas radiales
- Nuevo paquete para procesar texto en R: stringr
- Dos mapas de distribuciones de probabilidad
- Navegando por ahí: un (otro) curso de estadística con R
- ¿Por qué la otra cola siempre se mueve más aprisa?
- Algoritmos de minería de datos en su contexto
- El misterio de la reducción del paro en diciembre
- El precio del petróleo, reflejo del anumerismo de la prensa
- PIB, economía sumergida, Ley Sinde y cómo ser menos pobre sin trabajar
- ¿Una caída demasiado drástica de la varianza?
- Una frase afortunada que merece ser enmarcada
- Graficaca a tutiplén
- Diciembre 2011
- 2010
- Diciembre 2010
- Noviembre 2010
- De la matriz a de covarianzas a la de correlaciones con Excel
- Transforma (los gráficos de) España
- Programación funcional en R: Filter
- Nuestro mandato: ordenar y simplificar
- ¿Otro bug de Teradata?
- Siete consejos para expertos en análisis de datos
- La Wikipedia te necesita
- Abundando en lo de nuestra ineptitud para estimar la probabilidad condicionada
- Google Refine 2.0, una herramienta con muy buen aspecto
- La función monotonic de PROC SQL de SAS
- Déjese asesorar por Microsoft para reorientar su carrera
- La piratería de libros se dispara en 2010, nos dicen
- Una revisión neoliberal del principio de Peter
- La estadística en los sellos del siglo XX por cortesía del INE
- Comportamiento inesperado… ¿sólo por mí?
- Una (propuesta de) guía de estilo de R
- Octubre 2010
- ¡Qué mala suerte tengo con las anomalías!
- II Jornadas de Usuarios de R
- ¿Siete lenguajes de programación emergentes?
- A vueltas con los fractales
- Una solución al problema de la separación perfecta con regresiones logísticas
- Tutorial: instalación de la extensión de R para RapidMiner
- Hoy me he enamorado en el metro
- ¡Feliz día de la estadística!
- Sin sexo por decisión judicial
- Más sobre lo de Netezza
- El índice de inflación sostenible (que no existe)
- IBM compró Netezza: una taxonomía y algunos comentarios
- ¿Es realmente posible la anonimización?
- Matlab es más rápido que R… ¿y?
- ¿Por qué no una competición?
- Cambios cosméticos en el blog
- Un foro de discusión para usuarios de SAS
- Septiembre 2010
- Liberado KNIME 2.2.2
- Proyectos de R en el Google Summer of Code 2010 (II)
- Huelga el título hoy
- ¿Qué gráfico es mejor?
- Rutinas de C en R
- Tecnologías de la información 2020
- Un grupo de usuarios de R en España… ¿cuándo?
- ¿Cuánta información hay en el mundo?
- ¿153 días de verdad de la buena?
- StatProb: una wikipedia de estadística y probabilidad
- JDM: fuese y no hubo nada
- useR! 2011
- Representando gráficamente conjuntos de datos pequeños
- Más sobre la integración de R y RapidMiner
- Datanalytics: segunda posición en competición internacional de minería de datos
- Más sobre migraciones de SAS a WPS
- Una tarea para mis lectores: ¡resultados!
- El vídeo de la conferencia “alRededores” disponible en DailyMotion
- Paquetes estadísticos: una anécdota sin moraleja
- Muestreando bases de datos
- El paquete multicore de R
- Agosto 2010
- Anuncio de la integración de Rapidminer y R
- Si yo fuera…
- La función ifelse “a la SAS”
- ¿Cuánto cuesta una licencia de SAS?
- Modelos lineales mixtos para la optimización de queries
- Cinco consejos que nunca leerá quien debe
- Más sobre el caso WPS vs. SAS
- Sobre la cuota de mercado mundial de las herramientas analíticas de negocio
- R en Yotube y Facebook
- Una tarea para mis lectores
- Leyendo en diagonal (pero con cuidado)
- ¿Ya has considerado pasarte a WPS?
- Un ilustrador problema de compatibilidad de licencias libres
- Julio 2010
- Un curioso bug de R
- Qué hacer (y no hacer) con los bichitos que uno encuentra
- Más de diez motivos para usar PROC SQL en SAS
- Use SAS para predecir como un pulpo
- rJython: un nuevo paquete para llamar a Python desde R
- Contándoles las papelinas a los “expertos”
- Exagerados
- ¿Programa Vd. en SAS? ¡Aprenda a ser indispensable!
- Junio 2010
- Gráficos en R con símbolos arbitrarios: código, comentarios y fin
- Los “mejores” paquetes de R (II): análisis anual de la red social de los participantes en r-help
- useR! 2010
- Gráficos en R con símbolos arbitrarios
- Algoritmos genéticos para la caracterización de máximos en random forests
- Sobre la probabilidad condicionada y el problema de Monty Hall
- 20-10-2010: Día Mundial de la Estadística (y terremotos)
- Agregador de noticias sobre R en español
- Mayo 2010
- De números y funcionarios
- Google Prediction API
- Sobre la media y la mediana
- La distribución normal y el borracho que perdió sus llaves
- Números estadísticamente transcendentes
- ¿En qué se parecen Oracle y Teradata a Excel y Word?
- Regresión por cuantiles en R y SAS
- Qué hago estos días
- ¡Hasta Microsoft!
- Datatables: tablas con búsqueda binaria en R
- ¿Hemos salido de la recesión? ¡Queremos nuestros intervalos de confianza!
- R, ¿la herramienta de minería de datos más utilizada?
- Abril 2010
- Y yo que pensaba que lo de Will Smith y SAS era una leyenda urbana…
- Goldcorp, Netflix, Kaggle, minería de datos y la nueva economía
- Para que copien, peguen y disfruten: addenda
- Para que copien, peguen y disfruten
- Los “mejores” paquetes de R (I): la red social de los participantes en r-help
- Los mayas y la crisis
- La opinión sobre R de una pobre señora
- Google public data explorer
- El censo del Rey David y el castigo de Yahvé
- Marzo 2010
- ¿Puedo cambiar mi código retroactivamente?
- Proyectos de R en el Google Summer of Code 2010
- Una red social para usuarios y entusiastas de SAS
- La varianza y cifras macroeconómicas
- Leyendo tablas de SAS… sin SAS
- Los portátiles, ¿objetos fálicos?
- La fábula del tendero, la báscula y la caneca (y su desasosegadora moraleja)
- Madre Teresa, patriotas, idiotas… y queries recursivas
- ¿Sabes estadística? ¿Quieres ganar 100K dólares? Pues lee…
- Un vídeo algo viejo sobre estadísticas, expectativas y mentiras
- Ofertas de trabajo en estadística, para consultores SAS, etc.
- R en “The economist”
- Febrero 2010
- Enero 2010