BLAS, eficiencia y lme4
Cada cierto número de años me reencuentro con la cuestión de BLAS, ATLAS y todas esas cosas por tratar de arañar un poco de eficiencia a R.
Existen el BLAS de toda la vida que, parece ser, viene de serie con R y uno puede optar por otras versiones optimizadas como ATLAS u OpenBLAS, cuyas ventajas relativas, de acuerdo con estos benchmarks, no parecen demasiado claras.
Lo novedoso en esta revisita al problema es que he aprendido que a los anteriores se han sumado en estos últimos años, cuando menos:
- nvblas, una extensión de Nvidia, que usa GPUs, CUDAs, etc.
- Eigen, una librería de C++ que puentea a BLAS y todas las anteriores, funciona mejor que ellas en algunos casos concretos y, parece ser, es la que usa internamente
lme4
.