Influencia de la igualación iterativa en la detección del funcionamiento diferencial del item mediante las medidas de área de raju y estadístico de lord

  1. López Pina, José Antonio
  2. Núñez Núñez, Rosa María
  3. Hidalgo Montesinos, María Dolores
Revista:
Psicothema

ISSN: 0214-9915

Año de publicación: 2000

Volumen: 12

Número: 3

Páginas: 495-502

Tipo: Artículo

Otras publicaciones en: Psicothema

Resumen

Con objeto de mejorar la identificación correcta de los ítems de un test que presentan funcionamiento diferencial (DIF), se han propuesto diversos procesos de purificación del test. El presente estudio emplea un procedimiento de purificación bietápico (Hidalgo y López, 1997b) para mejorar la detección del DIF con el estadístico de Lord y las medidas de área de Raju. Las condiciones manipuladas fueron: tamaño muestral (250, 500 y 1.000 sujetos), cantidad de DIF (0.4 y 0.6), tipo de DIF (uniforme, no uniforme y mixto) y porcentaje de ítems con DIF en el test (10% y 30%). Los resultados indican que el procedimiento bietápico reduce las tasas de falsos positivos de dichas medidas

Referencias bibliográficas

  • Baker, F.B. (1993). EQUATE 2.0: A computer program for the characteristic curve method of IRT equating. Applied Psychological Measurement, 17, 20.
  • Candell, G.L. y Drasgow, F. (1988). An iterative procedure for linking metrics and assessing item bias in item response theory. Applied Psychological Measurement, 12, 253-260.
  • Cohen, A.S. y Kim, S.H. (1993). A comparison of Lord’s χ2 and Raju’s area measures in detection of DIF. Applied Psychological Measurement, 17, 39-52.
  • Fidalgo, A.M.. y Paz, M.D. (1995). Modelos lineales logarítmicos y funcionamiento diferencial de los ítems. Anuario de Psicología, 64, 57-66.
  • Fi d a l go, A.M., Mellenbergh, G. J. y Muñiz, J. (1998). Comparación del pro c edimiento Mantel-Haenszel frente a los modelos loglineales en la detección del funcionamiento dife rencial de los ítems. P s i c o t h e m a, 1 0, 209-218.
  • Gómez, J. e Hidalgo, M.D. (1997). Evaluación del funcionamiento diferencial en ítems dicotómicos: Una revisión metodológica. Anuario de Psicología, 74, 3-32.
  • Gómez, J. y Navas, M.J. (1996). Detección del funcionamiento diferencial de los ítems mediante regresión logística: Purificación paso a paso de la habilidad. Psicológica, 17, 397-411.
  • Hidalgo, M.D. y López, J.A. (1995). SIMULA 2.0: Un programa para la simulación de vectores de respuesta al ítem. Demostración de software presentada al IV Symposium de Metodología de las CC. del Comportamiento, La Manga, Murcia.
  • Hidalgo, M.D. y López, J.A. (1997a). Comparación entre las medidas de área, el estadístico de Lord y el análisis de regresión logística en la evaluación del funcionamiento diferencial de los ítems. Psicothema, 9, 417-431.
  • Hidalgo, M.D. y López, J.A. (1997b). Detección del DIF en ítems politó micos e igualación iterativa: comparación entre las medidas de área de Raju y el estadístico de Lord. Comunicación presentada en el V Congreso de Metodología de las CC. Humanas y Sociales, Sevilla.
  • Holland, P.W. y Thayer, D.T. (1988). Differential item performance and Mantel-Haenszel procedure. En H. Wainer y H.I. Braun (Eds.), Test Validity. Hillsdale, NJ: Erlbaum.
  • Kim, S.H. y Cohen, A.S. (1992). IRTDIF: A computer program for IRT differential item functioning analysis. Applied Psychological Measurement, 16, 158.
  • Kok, F.G., Mellenbergh, G.J. y Van der Flier, H. (1985). Detecting experimentally induced item bias using the iterative logit method. Journal of Educational Measurement, 22, 295-303.
  • Lautenschlager, G.J., Flaherty, V.L. y Park, D. (1994). IRT differential item functioning: An examination of ability scale purifications. Educational and Psychological Measurement, 54, 21-31.
  • Lautenschlager, G.J. y Park, D. (1988). IRT item bias detection procedures: Issues of model misspecification, robustness and parameter linking. Applied Psychological Measurement, 12, 365-376.
  • Lord, F.M. (1980). Applications of item response theory to practical tes ting problems. Hillsdale, NJ: Erlbaum.
  • Mellenbergh, G.J. (1982). Contigency table models for assessing item bias. Journal of Educational Statistics, 7, 105-118.
  • Miller, M.D. y Oshima, T.C. (1992). Effect of sample sizes, number of biased items and magnitude of bias on a two-stage item bias estimation method. Applied Psychological Measurement, 16, 381-388.
  • Millsap, R.E. y Everson, H.T. (1993). Methodology Review: Statistical approaches for assessing measurement bias. Applied Psychological Measurement, 17, 297-334.
  • Mislev y, R.J. y Bock, R.D. (1990). PC-BILOG 3: Item analysis and test scoring with binary logistic models. Mooresville, IN: Scientific Software.
  • Park, D. y Lautenschlager, G.J. (1990). Improving IRT item bias detection with iterative linking and ability scale purification. Applied Psychological Measurement, 14, 163-173.
  • Raju, N.S. (1988). The area between two item characteristic curves. Psy chometrika, 53, 492-502.
  • Raju, N.S. (1990). Determining the significance of estimated signed and unsigned areas between two item response functions. Applied Psychological Measurement, 14, 197-207.
  • Stocking, M.L. y Lord, F.M. (1983). Developing a common metric in item response theory. Applied Psychological Measurement, 7, 201-210.
  • Van der Flier, H., Mellenbergh, G.J., Adèr, H.J. y Wijn, M. (1984). An iterative item bias detection method. Journal of Educational Measurement, 21, 131-145.