Fallecimientos y microdatos
Hace un tiempo, un amigo me dijo que si en verano tiende a crecer la tasa de fallecimientos. Como de eso no sé y no hay manera de preguntarle a Google cuándo se muere más la gente, acudí a quienes se encargan de recopilar ese tipo de datos. Y construí en relativamente poco rato un gráfico parecido a
que echaba por tierra su hipótesis.
Ahora quiero retomar el asunto aprovechando que he anunciado el paquete MicroDatosEs para indicar cómo se pueden crear los tres ficheros de metadatos necesarios para leer ficheros de microdatos. En concreto, ese tipo de ficheros de microdatos posicionales a los que tan aficionados son los institutos estadísticos españoles.
El primero tiene cinco columnas (separadas por tabuladores):
var
, el nombre de la variablestart
, la posición en la que comienza el datoend
, la posición en la que terminawidth
, la anchura, que podría deducirse de los dos valores previosdescr
, la descripción de la variable
El segundo es otro fichero de texto con cinco columnas también separadas por tabuladores:
var
, el nombre de la variable, que tiene que coincidir con el del fichero anterior, por supuestotipo
, el tipo de variablenulo
, que no me acuerdo para qué lo creé y posiblemente no sirva para nadallave
, el código que asigna el INE (p.e., “01”)valor
, el valor que corresponde al código (p.e., “mujer”)
Los campos de tipo “N”, numérico, no tienen ni llave ni valor. Los campos con llave y valor son de tipo “D”, de diccionario. Es probable que haya más tipos contemplados y que hagan falta otros más en función del caso. Pero no me acuerdo bien de los detalles.
Finalmente, el tercer fichero de metadatos no se usa realmente. Sirve para indicar qué valores corresponden a nulos en cada una de las columnas del fichero de metadatos y tiene sintaxis SPSS, cosa que aún no me queda claro qué es. Tengo que ponerme con ello todavía.
Una vez que construyes tus ficheros de metadatos puedes probarlos con la función test.metadata
(véase también ?test.metadata
) para verificar que funcionan adecuadamente.
Y una vez que funcionan, si eres yo, los puedes integrar en el paquete creando una función tal como defun2011
y su correspondiente fichero de ayuda. Si no eres yo, puedes ponerte en contacto conmigo, enviarme los ficheros de microdatos y los integraría en el paquete con mucho gusto y respetando atribucionalmente tu autoría.
En tanto, ¿algún lector se anima a partir el gráfico que he mostrado más arriba por grupos de edad?