De acuerdo con The SAGE Encyclopedia of Social Science Research Methods ...
[a] el efecto techo ocurre cuando una medida posee un límite superior distinto para posibles respuestas y una gran concentración de participantes puntúa en o cerca de este límite. La atenuación de escala es un problema metodológico que ocurre cuando la varianza está restringida de esta manera. … Por ejemplo, puede producirse un efecto de techo con una medida de actitudes en la que una puntuación alta indica una actitud favorable y la respuesta más alta no logra capturar la evaluación más positiva posible. ... La mejor solución al problema de los efectos de techo es la prueba piloto, que permite identificar el problema temprano . Si un efecto de techo [énfasis agregado] se encuentra , [y] la medida de resultado es la ejecución de tareas, la tarea puede hacerse más difícil aumentar el rango de respuestas posibles. 1
Parece que hay una gran cantidad de consejos y preguntas ( y aquí ) que se ocupan de analizar los datos que muestran los efectos techo similar a la descrita en la cita anterior.
Mi pregunta puede ser simple o ingenua, pero ¿cómo se detecta realmente que hay un efecto de techo en los datos? Más específicamente, digamos que se crea una prueba psicométrica y se sospecha que conduce a un efecto de techo (solo examen visual) y luego la prueba se revisa para producir un mayor rango de valores. ¿Cómo se puede demostrar que la prueba revisada ha eliminado el efecto techo de los datos que genera? ¿Hay alguna prueba que muestre que hay un efecto techo en el conjunto de datos a pero no hay efecto de techo en el conjunto de datos b ?
Mi enfoque ingenuo sería simplemente examinar el sesgo de distribución y, si no está sesgado, concluir que no hay efecto de techo. ¿Es eso demasiado simplista?
Editar
Para agregar un ejemplo más concreto, digamos que desarrollo un instrumento que mide algún rasgo latente x que aumenta con la edad, pero finalmente se nivela y comienza a disminuir en la vejez. Hago la primera versión, que tiene un rango de 1 a 14, realizo algunas pruebas piloto y descubro que parece que puede haber un efecto de techo (una gran cantidad de respuestas en o cerca de 14, el máximo ... Concluyo esto simplemente por mirando los datos, pero ¿por qué? ¿Existe algún método riguroso para respaldar esa afirmación?
Luego reviso la medida para tener un rango de 1 a 20 y recopilo más datos. Veo que la tendencia coincide más con mis expectativas, pero ¿cómo sé que el rango de medición es lo suficientemente grande? ¿Necesito revisarlo nuevamente? Visualmente, parece estar bien, pero ¿hay alguna forma de probarlo para confirmar mis sospechas?
Quiero saber cómo puedo detectar este efecto de techo en los datos en lugar de solo mirarlo. Los gráficos representan datos reales, no teóricos. Ampliar el alcance del instrumento creó una mejor difusión de datos, pero ¿es suficiente? ¿Cómo puedo probar eso?
1 Hessling, R., Traxel, N. y Schmidt, T. (2004). Efecto techo. En Michael S. Lewis-Beck, A. Bryman y Tim Futing Liao (Eds.), The SAGE Encyclopedia of Social Science Research Methods . (pág. 107). Thousand Oaks, CA: Sage Publications, Inc. doi: 10.4135 / 9781412950589.n102
Respuestas:
En primer lugar, me gustaría decir que ambos gráficos me proporcionan evidencia clara de que hay un efecto de techo presente. Cómo trataría de medir ese efecto en lugar de solo visualmente sería observar que mientras una parte no trivial de las observaciones se encuentre cerca del límite superior del rango del instrumento. Por lo general, un efecto de techo siempre existirá siempre que haya una parte no trivial de los examinados que alcancen la puntuación máxima en la prueba.
Sin embargo, dicho esto, la tecnología de análisis de pruebas ha progresado mucho ya que necesitábamos interpretar directamente los puntajes en un instrumento basado en el puntaje correcto. Ahora podemos usar la teoría de respuesta a ítems para estimar los parámetros de ítems de ítems individuales y usar esos ítems para identificar la habilidad del sujeto. Por supuesto, puede haber efectos de techo en una prueba si hacemos la prueba demasiado fácil. Sin embargo, debido a los poderes de la teoría de respuesta a ítems, deberíamos poder colocar al menos algunos ítems de dificultad suficientemente alta en el instrumento para evitar que solo una porción trivial de la población llegue al techo.
Gracias por la pregunta ¡Es muy interesante!
fuente
Supongo que una forma aproximada y sencilla sería medir la varianza a medida que aumenta la escala. Si esto muestra una reducción, esto es evidencia de un efecto de techo y si no, no hay efecto de techo. Podría hacer una gráfica de homogeneidad de varianza. La prueba de Levene podría ser útil para determinar si la varianza es diferente en diferentes puntos de la escala.
fuente
El problema crítico al decidir si una agrupación alrededor del punto más alto o más bajo se debe a un efecto techo / piso es si los valores de los casos realmente "representan" el valor. Cuando ocurren efectos de techo / piso, algunos de los casos, a pesar de asumir el valor máximo o mínimo, en realidad son más altos / más bajos que el valor máximo o mínimo (imagine que un adulto y un niño terminan una prueba de matemáticas extremadamente simple que pretendía medir la capacidad matemática de uno, y ambos obtuvieron el 100%). Aquí, los datos están censurados.
Otro escenario también es posible cuando usamos escalas acotadas como una escala tipo Likert que tiene límites superiores e inferiores inherentes. Es completamente posible que aquellos que obtuvieron el puntaje más alto realmente valen ese puntaje y no existan diferencias (como el ejemplo matemático anterior) entre todos los que obtuvieron el puntaje más alto. En tal caso, los datos se truncan en los límites, no se censuran.
Basado en el razonamiento anterior, creo que uno debería idear un procedimiento para ajustar cualquier conjunto de datos dado con truncamiento y censura de datos. Si el modelo de censura se ajusta mejor a los datos, creo que uno puede concluir que existe un efecto techo / piso.
fuente