En el libro Modelos y métodos estadísticos para datos de por vida , está escrito:
Censura: cuando una observación está incompleta debido a alguna causa aleatoria.
Truncamiento: cuando la naturaleza incompleta de la observación se debe a un proceso de selección sistemática inherente al diseño del estudio.
¿Qué se entiende por "proceso de selección sistemática inherente al diseño del estudio" en la definición de truncamiento?
¿Cuál es la diferencia entre censurar y truncar?
self-study
censoring
truncation
A B C
fuente
fuente
Respuestas:
Las definiciones varían, y los dos términos a veces se usan indistintamente. Trataré de explicar los usos más comunes utilizando el siguiente conjunto de datos:
Censura : algunas observaciones serán censuradas, lo que significa que solo sabemos que están por debajo (o por encima) de algún límite. Esto puede ocurrir, por ejemplo, si medimos la concentración de una sustancia química en una muestra de agua. Si la concentración es demasiado baja, el equipo de laboratorio no puede detectar la presencia de la sustancia química. Sin embargo, todavía puede estar presente, por lo que solo sabemos que la concentración está por debajo del límite de detección del laboratorio.
Si el límite de detección es 1.5, de modo que las observaciones que caen por debajo de este límite están censuradas, nuestro conjunto de datos de ejemplo sería: es decir, no sabemos el valores reales de las dos primeras observaciones, pero solo que son menores que 1.5.
Truncamiento : el proceso que genera los datos es tal que solo es posible observar resultados por encima (o por debajo) del límite de truncamiento. Esto puede ocurrir, por ejemplo, si las mediciones se toman utilizando un detector que solo se activa si las señales que detecta están por encima de cierto límite. Puede haber muchas señales entrantes débiles, pero nunca podemos distinguir el uso de este detector.
Si el límite de truncamiento es 1.5, nuestro conjunto de datos de ejemplo se convertiría en y no sabríamos que, de hecho, había dos señales que no se registraron.
fuente
Así como una perspectiva desde otro campo (programación), censurar y truncar son dos operaciones distintas.
Cuando trabajo con un conjunto de datos confidenciales, por ejemplo, números de seguridad social y números de teléfono, podría censurarlo o censurarlo antes de que se otorgue el acceso:
Esto permite que el resto de la aplicación funcione como lo haría normalmente, con estructuras de datos similares, pero sin contenido informativo real o difusión de información privada.
El truncamiento, por el contrario, generalmente solo corta los valores restantes después de un cierto punto. Para trabajar en una aplicación, no necesito cientos de miles de registros, tal vez solo necesito ~ 50 de cada uno, lo que hace que el acceso a los datos sea mucho más rápido y los conjuntos de datos sean más pequeños.
Una variante similar de truncamiento es cuando se inserta un valor en una columna o tipo de datos de longitud o precisión limitadas:
fuente