Comparación de dos procedimientos de purificación del test para la evaluación del fdi con el estadístico de lord y con las medidas de área de Raju

  1. Núñez Núñez, Rosa María
  2. Hidalgo Montesinos, María Dolores
  3. López Pina, José Antonio
Revista:
Psicothema

ISSN: 0214-9915

Año de publicación: 2000

Volumen: 12

Número: 2

Páginas: 399-402

Tipo: Artículo

Otras publicaciones en: Psicothema

Resumen

Diversos estudios han comprobado la efectividad de un proceso de purificación iterativo del test para mejorar la identificación del Funcionamiento Diferencial del Ítem (FDI) frente a un proceso no iterativo. Sin embargo, los procedimientos iterativos son muy costosos, ya que implican una elevada cantidad de cálculos. En este estudio se comparan los procedimientos de purificación bietápicos de Miller y Oshima (1992) e Hidalgo y López (1997), tomando como índices las tasas de identificaciones correctas y las tasas de falsos positivos, usando como medidas de evaluación del FDI el estadístico de Lord (1980) y las medidas de área exacta de Raju (1990).

Referencias bibliográficas

  • Baker, F.B. (1993). EQUATE v. 2.0: A computer program for the characteristic curve method of IRT equating. Applied Psychological Measurement, 17, 20.
  • Candell, G.L. y Drasgow, F. (1988). An iterative procedure for linking metrics and assessing item bias in item response theory. Applied Psychological Measurement, 12, 253-260.
  • Gómez, J. e Hidalgo, M.D. (1997). Evaluación del funcionamiento diferencial en ítems dicotómicos: una revisión metodológica. Anuario de Psicología, 74, 3-32.
  • Hidalgo, M.D. y López, J.A. (1995). SIMULA 2.0: Un programa para la simulación de vectores de respuesta al ítem. Demostración de software presentada al IV Symposium de Metodología de las CC. del Comportamiento, La Manga, Murcia.
  • Hidalgo, M.D. y López, J.A. (1997). Detección del DIF en ítems politómicos e igualación iterativa: comparación entre las medidas de área de Raju y el estadístico de Lord. Comunicación presentada en el V Congreso de Metodología de las CC. Humanas y Sociales, Sevilla.
  • Kim, S.H. y Cohen, A.S. (1992). IRTDIF: A computer program for IRT differential item functioning analysis. Applied Psychological Measurement, 16, 158.
  • Lautenschlager, G.J., Flaherty, V.L. y Park, D. (1994). IRT differential item functioning: An examination of ability scale purifications. Educational and Psychological Measurement, 54, 21-31.
  • Lord, F.M. (1980). Applications of item response theory to practical testing problems. Hillsdale, NJ: Erlbaum.
  • Miller, M.D. y Oshima, T.C. (1992). Effect of sample sizes, number of biased items and magnitude of bias on a two-stage item bias estimation method. Applied Psychological Measurement, 16, 381-388.
  • Millsap, R.E. y Everson, H.T. (1993). Methodology review: Statistical approaches for assessing mesurement bias. Applied Psychological Measurement, 16, 297-334.
  • Mislevy, R.J. y Bock, R.D. (1990). PC-BILOG 3.04: Item analysis and test scoring with binary logistic models. Mooresville, IN: Scientific Software.
  • Park, D. y Lautenschlager, G.J. (1990). Improving IRT item bias detection with iterative linking and ability scale purification. Applied Psychological Measurement, 14, 163-173.
  • Raju, N.S. (1988). The area between two item characteristic curves. Psychometrika, 53, 492-502.
  • Raju, N.S. (1990). Determining the significance of estimated signed and unsigned areas between two item response functions. Applied Psychological Measurement, 14, 197-207.
  • Stocking, M.L. y Lord, F.M. (1983). Developing a common metric in item response theory. Applied Psychological Measurement, 7, 201-210.
  • Wilkinson, L. (1990). SYSTAT: The system for Statistics (versión 5). Evanston, IL: Systat Corporation.