Conferencia
“Edición
e Imputación simultáneas en datos categóricos”
Expositor: Daniel Manrique-Vallier
Profesor Asistente
Departamento de Estadística,
Universidad de Indiana
Organiza:
Maestría
en Estadística.
Día : Miércoles 17 de diciembre
Hora : 8:00 PM.
Lugar : N-204
Ingreso libre. Inscripción previa para acceso al campus.
Resumen
Agencias de estadísticas oficiales y otras organizaciones que
recogen y procesan datos a menudo se encuentran con archivos de datos computarizados
que contienen valores erróneos. Cuando estos errores resultan en respuestas
inconsistentes---como hombres embarazados o niños pequeños casados---las
agencias suelen corregirlos mediante un proceso conocido como
edición-imputación. En la actualidad el modelo dominante para
edición-imputación, propuesto por Fellegi y Holt (1976), divide el proceso en
una etapa de localización de errores y otra de imputación, y se basa en
encontrar el mínimo conjunto de cambios necesarios para que los registros dejen
de ser inconsistentes. Este enfoque tiene la virtud de minimizar las
alteraciones a los registros originales. Sin embargo tiene la desventaja de
ignorar la distribución conjunta de los datos durante la etapa de localización
de errores y, en consecuencia, de producir imputaciones sesgadas. También
ignora la incertidumbre asociada con el proceso de localización de errores. En
esta charla presento un procedimiento alternativo para edición-imputación de
datos categóricos basado en modelado simultáneo bajo un enfoque bayesiano. Este
modelo incluye una representación muy flexible para las respuestas correctas, soportada
exclusivamente en el conjunto de respuestas consistentes; un modelo para la
localización de errores; y un modelo para la observación de valores erróneos.
Usando simulaciones basadas en datos altamente demandantes muestro cómo este
nuevo procedimiento es capaz de producir resultados vastamente superiores a los
obtenidos mediante el método de
Fellegi y Holt.
Mayor
información
Elizabeth
Paredes
Secretaría de la
Maestría en Estadística
Teléfono: 626-2000 anexo 5143
e-mail: m_estadistica@pucp.edu.pe ó paredes.elizabeth@pucp.edu.pe