Articulo:

Rehabil. integral 2011; 6 (2): 93-99

Aplicación de la estadística no paramétrica en el área de rehabilitación

Abstract

The use of non-parametric statistics in rehabilitation

In this article, we focus on the importance of obtaining statistics that stray from the usual probabilistic distribution, such as normal distribution. These statistics, known as non-parametric, are especially adequate when analyzing small samples (less than 30 individuals) within biomedical research. We elaborate and show examples of their use in rehabilitation.

Key words: Statistic nonparametric, statistics & numerical data, rehabilitation.

Resumen

En este artículo, se enfatiza la importancia de la obtención de estadísticas que no se ajustan a alguna distribución de probabilidad conocida, como la distribución normal por ejemplo, que se denominan no paramétricas, adecuadas para analizar un conjunto de datos provenientes de muestras de tamaño relativamente pequeño, inferiores a 30 unidades de observación en una investigación biomédica. Se desarrollan y ejemplifican los escenarios más comúnmente encontrados en el área de la rehabilitación.

Palabras clave: Estadística no paramétrica, estadística y datos numéricos,rehabilitación.

Introducción

Cuando se analizan datos medidos para una variable cuantitativa continua, las pruebas estadísticas de estimación y contraste frecuentemente empleadas se basan en suponer que se ha obtenido una muestra aleatoria de una distribución de probabilidad de tipo normal o de Gauss. Pero en muchas ocasiones esta suposición no resulta válida, y la sospecha de que no sea adecuada no resulta fácil de comprobar, por tratarse de muestras pequeñas como es el caso de los trabajos en el área de rehabilitación. En estas situaciones disponemos de dos posibles mecanismos: los datos se pueden transformar mediante funciones matemáticas de tal manera que sigan una distribución normal, o bien se puede acudir a pruebas estadísticas que no se basen en ninguna suposición en cuanto a la distribución de probabilidad a partir de la que fueron obtenidos los datos, y por ello se denominan pruebas de libre disposición o no paramétricas, mientras que las pruebas que suponen una distribución de probabilidad determinada para los datos se denominan pruebas paramétricas. Un parámetro es un valor constante que se obtiene considerando todas las unidades de observación de una población determinada; como esta situación es poco probable, se recurre a las estadísticas que caracterizan a las muestras.
Existe una amplia diversidad de pruebas no paramétricas, las cuales pueden ser utilizadas dependiendo de los objetivos y de la hipótesis planteada en un estudio específico, para establecer conclusiones sobre el comportamiento de variables bajo estudio. Estas pruebas ofrecen algunas ventajas con respecto a las paramétricas, destacándose la rapidez del análisis y facilidad de interpretación de los mismos1.
En la mayor parte de ellas los resultados estadísticos se derivan únicamente a partir de procedimientos de ordenación y recuento, por lo que su base lógica es de fácil comprensión. Cuando se trabaja con muestras pequeñas (n < 30) en las que se desconoce si es válido suponer la normalidad de los datos y éstos son categóricos u ordinales, conviene usar pruebas no paramétricas, al menos para corroborar los resultados obtenidos a partir de la utilización de la teoría basada en la distribución normal2.
En estos casos se emplea como parámetro de centralización la mediana, que corresponde al elemento que divide la serie de datos ordenados en forma creciente en dos partes iguales, superiores e inferiores a él, quiere decir, deja igual número de observaciones a un lado y a otro.
Las pruebas no paramétricas se trabajan con muestras pequeñas de datos categóricos u ordinales, independientemente de la distribución de las muestras que se desea contrastar. Las características que son comunes a las pruebas de hipótesis no paramétricas son 3-6:
1. Independencia de las observaciones aleatorias a excepción de datos emparejados (por ejemplo, evaluaciones al inicio y al final de un tratamiento).
2. Pocos supuestos con respecto a la distribución de la variable en la población.
3. La variable dependiente es medida en escala categórica.
4. El punto primario de cálculo es el ordenamiento por rangos o por frecuencias.
5. Las hipótesis se formulan sobre rangos, medianas o frecuencias de los datos.
6. El tamaño de la muestra requerido es menor (< 30).

La Tabla 1 presenta como resumen las pruebas no paramétricas posibles de ser analizadas a través del programa estadístico SPSS versión 17.07.
Para las pruebas no paramétricas más utilizadas en medicina física y rehabilitación, publicadas hasta la fecha en este Boletín, se realiza una descripción cada una de ellas, dando énfasis a su interpretación.

 Prueba de asociación basada en la distribución Chi-cuadrado (χ2)

Una de las pruebas no paramétricas más conocidas es la prueba de asociación basada en la distribución χ2, la cual tabula una variable en categorías y calcula un estadístico basándose en las diferencias entre las frecuencias observadas derivadas de un estudio en particular y las frecuencias que se esperan de acuerdo a una distribución de probabilidades específica. Una aplicación importante del uso de χ2 son las llamadas “tablas de contingencia” o tablas de dos filas por dos columnas, las cuales buscan probar la hipótesis nula de ausencia de asociación, cuando se tienen dos variables y cada una de ellas presenta dos categorías.
Un ejemplo de este uso aplicado a la investigación en el campo de la rehabilitación se presenta en la Tabla 2. En dicho estudio la hipótesis de nulidad (H0) establece que no existen relaciones significativas entre el diagnóstico nutricional y edad de los niños portadores de enfermedades raquimedulares congénitas. Considerando equivocarnos en 5 de cien muestras (falsos positivos) para un total de 255, es decir, establecer que no hay relación entre diagnóstico nutricional y edad cuando efectivamente existe esa relación (error α = 0,05), se obtuvieron los siguientes resultados: Se pesquisó mayor número de niños obesos en el grupo de 2-7 años, con asociación significativa entre diagnóstico nutricional y edad (valor χ2 = 16,17; p = 0,013)8. En el caso descrito anteriormente, es posible afirmar que se presenta una asociación significativa, porque el hallazgo de falsos positivos es menor a 5%. Sin embargo, uno de los supuestos para aplicar la prueba de asociación basado en χ2 es que las frecuencias (número de casos) esperadas de al menos el 80% de las celdas en una tabla de contingencia sean mayores de 5. Así, en una tabla 2 x 2 será necesario que todas las celdas verifiquen esta condición, si bien en la práctica suele permitirse que una de ellas muestre frecuencias esperadas ligeramente por debajo de este valor. En estos casos, en que no se verifique este requisito, existe un test propuesto por R.A. Fisher, que permite analizar si dos variables dicotómicas están asociadas cuando la muestra a estudiar es demasiado pequeña y no se cumplen las condiciones necesarias para la aplicación del test χ2 9. Este procedimiento consiste en evaluar la probabilidad asociada a todas las tablas 2 x 2 que se puedan formar con los mismos totales marginales que los datos observados, bajo el supuesto de independencia. Los cálculos, aunque elementales, resultan algo engorrosos, por lo que no se incluirán en este trabajo, siendo múltiples las referencias que se pueden consultar al respecto10-15.

Prueba U de Mann Whitney

Se utiliza cuando se desea efectuar la comparación de dos grupos en quienes se ha medido una variable cuantitativa continua o de tipo cuantitativa discreta o cuando las mediciones se pueden ordenar en escala ordinal (es decir cuando los valores tienden a una variable continua, pero no tienen una distribución normal) y resulta aplicable cuando las muestras son independientes y con un tamaño de muestra menor a 30 observaciones. Cuando es mayor el tamaño de muestra, se aproxima bastante bien a la distribución normal.

Esta prueba contrasta si dos poblaciones muestreadas son equivalentes en relación a su centro de equilibrio (mediana). Las observaciones de ambos grupos se combinan y clasifican, asignándose el rango promedio en caso de producirse empates. El número de empates debe ser pequeño en relación con el número total de observaciones. Si el centro de equilibrio de las poblaciones es idéntica, los rangos deberían mezclarse aleatoriamente entre las dos muestras.

Este procedimiento es una buena alternativa cuando no se puede usar la prueba t de Student, en razón de no cumplir con los requisitos que esta prueba exige de normalidad de los datos.
Por ejemplo, se obtienen datos tras una intervención analgésica diferente en dos grupos de pacientes, se pretende examinar si el grado de dolor es el mismo para estos grupos. La escala de dolor tiene una escala de 0 a 10 puntos. Los datos se presentan en la Tabla 316.
Dado este ejemplo, se plantea la hipótesis nula H0: No existen diferencias significativas tras someter a los pacientes a terapias con analgésicos diferentes. Utilizando un nivel de confianza del 95%, es posible concluir que si existen diferencias estadísticamente significativas según el tipo de analgésico utilizado (p < 0,05) en cuanto a dolor percibido por ambos grupos.

Prueba T de Wilcoxon17

Es una prueba flexible7,18 que se puede utilizar en distintas situaciones, con muestras de diferentes tamaños y con pocas restricciones.
Lo único que se requiere es que la variable sea continua y que sean observaciones emparejadas, es decir, que sean sujetos de una misma muestra con medidas pre y post prueba, o bien sujetos que hayan sido emparejados bajo criterios bien definidos. Ahora la hipótesis de nulidad será H0: No existen diferencias significativas entre los resultados obtenidos en el momento basal y después de aplicar la intervención.
Esta prueba consiste en calcular las diferencias entre los pares de datos y se registran los valores absolutos entre ellas. Luego, los valores absolutos de las diferencias entre las dos variables se ordenan del valor menor al mayor y para finalizar, a cada rango se le otorga un signo positivo o negativo, dependiendo del signo de la diferencia original. Los signos positivos y negativos se suman separadamente y se obtienen los promedios. Los pares que no tienen cambio se retiran del análisis.
Según los siguientes datos, se quiere analizar si existen diferencias estadísticamente significativas en distintos ciclos de evaluación con GMFM-6619 y GMFM-8820 en su totalidad y en sus dimensiones tras terapia de neurodesarrollo (NDT)21 (Tabla 4).

 Se tiene entonces, que la medición de logros en habilidades sensoriales y motoras luego de la intervención kinesiológica entre el ciclo inicial y final a través de GMFM-88 fue significativa, es decir, en su total, hubo incremento en el puntaje de la función motora gruesa. Por dimensiones, sólo decúbitos y giros, mostró cambios significativos entre ciclo inicial-final (p = 0,028); en el resto de los ítems la intervención NDT no produjo efectos importantes21.

Prueba H de Kruskal-Wallis

Esta prueba es una extensión a la prueba Uvde Mann-Whitney, para el supuesto de trabajar con tres o más grupos y resulta aplicable cuando las muestras son independientes22.
La prueba de Kruskal-Wallis (K-W) es una alternativa a la prueba F del análisis de varianza para diseños de clasificación simple. En este caso (K-W) se comparan varios grupos pero usando la mediana de cada uno de ellos, en lugar de las medias.
En la Tabla 5 se tiene información resumida de los resultados obtenidos tras la evaluación con GMFM-6619 en niños con PC de nivel GMFCS V durante un periodo del año 2008; se desea analizar si se presentan diferencias significativas entre los Institutos de Rehabilitación (IR).
Con un nivel de confianza del 95%, se obtuvo como resultado la existencia de diferencias significativas entre los resultados del test GMFM-66 en los distintos IR de aplicación.

Prueba χ 2 de Friedman23

Esta prueba es una extensión a la prueba T de Wilcoxon, para el supuesto de trabajar con tres o más grupos. Esta prueba puede utilizarse en aquellas situaciones en las que se seleccionan n grupos de k elementos de forma que los elementos de cada grupo sean lo más parecido posible entre sí, y a cada uno de los elementos del grupo se le aplica uno de entre k “tratamientos”, o bien cuando a cada uno de los elementos de una muestra de tamaño n se le aplican los k “tratamientos”.

Esta prueba consiste en examinar los rangos de los datos generados en cada período de tiempo para determinar si las variables comparten la misma distribución continua de su origen. Es especialmente útil cuando la variable dependiente es continua pero su distribución se encuentra sesgada24.

La hipótesis nula que se contrasta es que las respuestas asociadas a cada uno de los “tratamientos” tienen la misma distribución de probabilidad o distribuciones con la misma mediana, frente a la hipótesis alternativa de que por lo menos la distribución de una de las respuestas difiere de las demás. Para poder utilizar esta prueba las respuestas deben ser variables continuas y estar medidas por lo menos en una escala ordinal.
Se presenta a continuación información de puntajes de la funcionalidad medidos en tres períodos. Se desea establecer si existe diferencia significativa entre los tres períodos de medición de la funcionalidad.
La hipótesis alternativa en que se plantea que los rangos promedio de arcos de movimiento activo y funcionalidad total, son diferentes a través de los tres períodos considerados, se confirma (p < 0,004)25 (Tabla 6).

 

 

Síntesis

Los procedimientos estadísticos no paramétricos descritos buscan ayudar en la planificación, conducción e interpretación de estudios en el área de rehabilitación. En todo caso, se debe tener precaución en cuanto al uso apropiado de éstos y consultar a un especialista en estadística, si existen dudas sobre el buen uso y aplicación de estos análisis.

Referencias

  1. Berenson M, Levine D, Krehbiel T. Basic Business Statistics: Concepts and Applications. EE.UU, Prentice Hall. 2005; p.898.
  2. Milton J, Tsokos J. Estadística para biología y ciencias de la salud. Madrid, Interamericana-McGraw Hill. 1987; p.527.
  3. Pett M. Nonparametrics statistics for health care research. Thousand Oasks, Cal., Sage Publications Inc. 1997; p. 312.
  4. Bradley J. Distribution-free statistical test. Englewood Cliffs NJ, Prentice-Hall. 1968; p. 388.
  5.  Downie N, Heath R. Métodos estadísticos aplicados. México, Harla. 1983; p. 274.
  6. Siegel S, Castellan N. Estadística no paramétrica aplicada a las ciencias de la conducta. México D.F., Editorial Trillas. 1995; p. 207.
  7. Viasuta, B. Análisis Estadístico con SPSS 14. Estadística Básica. Madrid, Mc Graw Hill. 2007; p. 281.
  8. Marín V, Rotter K, Solís F, San Martín P. Enfermedades raquimedulares congénitas en Teletón Santiago: Factores demográficos, sociales, clínicos y funcionales asociados. Rehabil integral 2010; 5 (1): 16-26.
  9. Pita S, Pértega S. Asociación de variables cualitativas: test de Chi-cuadrado. Disponible en http://www.fisterra. com/mbe/investiga/fisher/fisher.asp [Consulta: 21 septiembre 2011].
  10. Altman D. Practical statistics for medical research. London, Chapman & Hall. 1991; p. 611.
  11. Bioestadística: Métodos y Aplicaciones. Disponible en: http://www.bioestadistica.uma.es/libro/ [Consulta: 15 marzo 2010].
  12. Estadística No Paramétrica: Prueba Chi-Cuadrado χ2. Disponible en: http://www.uoc.edu/in3/emath/docs/ Chi_cuadrado.pdf [Consulta: 07 de marzo 2010]
  13. Curso de Estadística I. Disponible en: http://www.itch. edu.mx/academic/industrial/estadistica1/cap04c.html [Consulta: 07 de marzo 2010]
  14. Análisis no paramétrico: El procedimiento Pruebas no paramétricas. Disponible en: http://www.ucm.es/info/ socivmyt/paginas/D_departamento/materiales/analisis_ datosyMultivariable/19nparam_SPSS.pdf [Consulta: 07 de marzo 2010].
  15. Armitage P, Berry G. Estadística para la investigación biomédica. Barcelona, Harcourt Brace. 1999; p. 593.
  16. Pértega S, Pita S. Métodos no paramétricos para la comparación de dos muestras. Cad Aten Primaria 2006;13: 109-113.
  17.  Wilcoxon F. Individual comparision by ranking methods. Biometrika 1945; 1: 80-3.
  18. Gómez M, Danglot C, Velásquez L. Bases para la revisión crítica de artículos médicos. Rev Mex Pediatr 2001; 69: 152-9.
  19. Wang H, Yang Y. Evaluating the responsiveness of 2 versions of the Gross Motor Function Measure for Children with cerebral palsy. Arch Phys Med Rehabil 2006; 87: 51-6.
  20. Russell D, Rosenbaum P, Avery L, Lane M. Gross Motor Function Measure (GMFM-66 & GMFM-88). User´s Manual. Ontario, Canada: Cambridge University. 2002; p. 234.
  21. Barraza M, Illanes H, Keller M. Cambios funcionales en niños con parálisis cerebral sometidos a tratamiento de neurodesarrollo medidos con GMFM y WeeFIM. Rehabil integral 2009; 4: 17-24.
  22. Kruskall W, Wallis A. Use of ranks in one-criterion variance analysis. J Amer Statis Assn 1952; 47 (260): 583-621.
  23. Friedman Test. Disponible en: http://wapedia.mobi/en/ Friedman_Test [Consulta: 14 julio 2010].
  24. Gómez M, Danglot C, Vega L. Sinopsis de pruebas estadísticas no paramétricas. Cuándo usarlas. Rev Mex Pediatr 2003; 70: 91-99. (Link)
  25. Mery H, Lodo R, Zamora V, Solis F. Efecto del tratamiento combinado de toxina botulínica tipo A y terapia ocupacional en la funcionalidad de extremidad superior en pacientes hemiparéticos. Rehabil integral 2009; 4: 9-16.

 

 

APLICACIÓN DE LA ESTADÍSTICA NO PARAMÉTRICA EN EL ÁREA DE REHABILITACIÓN