Primer elemento de un grupo dentro de un dataframe de R
Hoy he encontrado una solución decente a un problema que venía arrastrando desde hace un tiempo en R. Tengo una tabla muy grande (decenas de millones de registros) con su id
. Me interesa quedarme con el subconjunto de la tabla original en que para cada id
el valor de una determinada variable es mínimo.
Un caso de uso: esa variable adicional mide la distancia de la observación a los centroides de unos clústers. El registro con el menor valor proporciona la asignación del sujeto a su grupo.