Documento descargado de http://www.elsevier.es el 17/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. Rehabilitación (Madr). 2012;46(4):271---276 www.elsevier.es/rh ORIGINAL Fiabilidad relativa y absoluta del test de elevación progresiva de carga isoinercial en pacientes afectados por dolor de espalda bajo crónico no específico: un estudio test-retest de 12 semanas B. del Pozo-Cruz a,b,∗ , N. Triviño-Amigo a , J.C. Adsuar-Sala a , M.A. Pérez-Sousa a , M.A. Hernández-Moholí a y M. Madruga-Vicente a a b Facultad de Ciencias del Deporte, Universidad de Extremadura, Cáceres, España Facultad de Ciencias de la Educación, Universidad de Sevilla, Sevilla, España Recibido el 8 de febrero de 2012; aceptado el 19 de junio de 2012 Disponible en Internet el 14 de agosto de 2012 PALABRAS CLAVE Rehabilitación; Capacidad funcional; Terapia física; Dolor lumbar ∗ Resumen Introducción: El dolor de espalda bajo crónico inespecífico es una dolencia cada vez más prevalente. Esta dolencia afecta a la funcionalidad y a la calidad de vida del individuo que la padece. El objetivo de este estudio fue determinar los índices relativos y absolutos de fiabilidad test-retest del protocolo de evaluación de la capacidad isoinercial de carga progresivo, como método de evaluación de la capacidad funcional en estos pacientes. Material y métodos: La muestra se compuso de 10 pacientes con dolor de espalda baja crónico inespecífico derivados por una unidad hospitalaria especializada en pacientes con dolor a los que se aplicó el protocolo del test de evaluación de la capacidad isoinercial de carga progresivo en 2 ocasiones separadas por un período de tiempo de 12 semanas siguiendo el protocolo estandarizado de dicho test. El análisis de los datos consistió en el cálculo de los índices de fiabilidad relativos (coeficiente de correlación intraclase) y absolutos (error estándar de medida y mínima diferencia real), así como la representación de los datos mediante los correspondientes gráficos de Bland-Altman. Resultados: Los resultados obtenidos muestran coeficientes de correlación intraclase altos, así como índices de error absolutos elevados para el test usado tanto en varones como en mujeres. Conclusión: El procedimiento empleado para la determinación de la capacidad funcional mediante del test de evaluación de la capacidad isoinercial de carga progresivo muestra una consistencia temporal alta, por lo que puede ser utilizado como medio para evaluar dicha capacidad en pacientes con dolor de espalda baja crónico inespecífico, en intervenciones inferiores a 12 semanas. © 2012 Elsevier España, S.L. y SERMEF. Todos los derechos reservados. Autor para correspondencia. Correo electrónico: [email protected] (B. del Pozo-Cruz). 0048-7120/$ – see front matter © 2012 Elsevier España, S.L. y SERMEF. Todos los derechos reservados. http://dx.doi.org/10.1016/j.rh.2012.06.002 Documento descargado de http://www.elsevier.es el 17/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. 272 KEYWORDS Rehabilitation; Functional capacity; Physiotherapy; Low back pain B. del Pozo-Cruz et al Relative and absolute reliability of the progressive iso-inertial lifting test in patients affected by non-specific, chronic low back pain: a 12-week test-retest study Abstract Introduction: Chronic non-specific low back pain is an increasingly prevalent ailment. This ailment affects functional capacity and quality of life of individuals who have this condition. The aim of this study was to determine relative and absolute test-retest reliability of the protocol for the evaluation of the progressive isoinertial lifting test as a functional capacity function method. Material and methods: The sample consisted of 10 patients with chronic non-specific low back pain referred from a hospital unit specialized in pain patients who underwent the standardized protocol of the progressive isoinertial lifting test on two occasions separated by a period of 12 weeks. The data analysis consisted of calculating relative reliability (intraclass correlation coefficients) and absolute (standard error of measurement and smallest real difference) indices and the representation of the data using the corresponding Bland-Altman plots. Results: The results obtained show high correlation coefficients and large absolute error rates for the test used both in men and women. Conclusion: The procedure used for determining the functional capacity by means of the progressive isoinertial lifting test shows high temporal consistence. Thus, it can be used as a method to assess functional capacity of patients with chronic non-specific low back pain enrolled in interventions of less than 12 weeks. © 2012 Elsevier España, S.L. and SERMEF. All rights reserved. Introducción El dolor de espalda bajo inespecífico (DEBN) crónico (10% de los casos) es un trastorno muy incapacitante que afecta a la calidad de vida relacionada con la salud (CVRS) y que, además, está asociado a un altísimo impacto socioeconómico1 . El tratamiento del DEBN crónico tiene como objetivo primario mejorar/restaurar la capacidad funcional de los pacientes2 . Normalmente, la evaluación de la funcionalidad de un paciente con DEBN en entorno clínico pasa por preguntarle, a través de cuestionarios estandarizados, sobre la capacidad de realizar diferentes actividades de la vida diaria, tales como asearse, levantar objetos, acostarse, etc. (atendiendo a la dificultad que tiene un individuo en la realización de dichas actividades)3 . Existen algunos estudios que no encontraron una asociación entre la descripción de los individuos acerca de su nivel de funcionalidad autorreportado y el nivel de capacidad funcional evaluado mediante examinación física, concluyendo los autores de estos trabajos que existe la necesidad de evaluar también al paciente mediante test clínicos específicos en población afectada por DEBN4,5 . En este sentido, la evaluación de la capacidad de carga ha sido tomada como medida de referencia, tanto para evaluaciones clínicas, como para monitorizar el progreso a nivel funcional de los individuos afectados de DEBN, ya que dicha capacidad se asocia a las actividades de la vida diaria y se encuentra reducida en estos pacientes6 . Si bien no se ha esclarecido qué tipo de test para evaluar la capacidad de carga en pacientes con DEBN es mejor (isométricos, isocinéticos o isoinerciales), se sugiere que los test isoinerciales son los que presentan más ventajas para su uso al ser más ecológicos y por su facilidad y economía de uso7 . En este sentido, el test de evaluación de la capacidad isoinercial de carga progresivo (EIP) es el test isoinercial más usado, tanto para el diagnóstico8 , como para el tratamiento9 de pacientes con DEBN. Si bien el test de EIP se ha usado tanto en población sana como para discriminar entre esta población y pacientes afectados por DEBN8,10---12 , los estudios realizados para determinar la fiabilidad test-retest de esta prueba son escasos en población clínica con dolor lumbar. Los análisis de fiabilidad mediante test-retest son esenciales para calcular el error estándar de medida (EEM) y el mínimo cambio real (MCR), que nos permiten conocer el valor necesario a obtener tras una intervención para considerar que un cambio ha sido real. Los únicos estudios que han evaluado la fiabilidad test-retest en población con dolor lumbar crónico lo ha hecho en un intervalo de 213 y 9 días14 . Este último no reportó además, datos de fiabilidad absoluta (EEM y MCR). Además, dado que las intervenciones del tratamiento de DEBN duran normalmente varias semanas, es necesario conocer los índices de fiabilidad test-retest en períodos más largos. De hecho, el objetivo de este estudio fue calcular el EEM y el MCR del test EIP en pacientes afectados por DEBN crónico tratados en entorno hospitalario a través de la aplicación de un diseño de fiabilidad test-retest con un intervalo de 12 semanas. Material y métodos Diseño y consideraciones éticas Se llevó a cabo un diseño transversal de medidas repetidas para un solo grupo. Se cumplieron los principios de la declaración de Helsinki y sus revisiones posteriores para estudios en humanos15 . El estudio fue aprobado por el comité de Bioética y Bioseguridad de la Universidad donde se realizó el estudio. Participantes El cálculo del tamaño muestral mínimo se realizó según el procedimiento descrito por Munro16 y requirió la Documento descargado de http://www.elsevier.es el 17/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. Fiabilidad relativa y absoluta del test de elevación progresiva de carga isoinercial participación de 10 sujetos teniendo en cuenta las siguientes especificaciones: hipótesis nula del CCI = 0 (ausencia absoluta de fiabilidad); hipótesis alternativa del CCI = 0,7; considerando este valor como el mínimo para considerar que la fiabilidad del protocolo es alta17 ; potencia del contraste = 0,8; significación = 0,05. Por las muertes experimentales potenciales, un total de 14 pacientes voluntarios diagnosticados con DEBN no específico fueron reclutados procedentes de la Unidad del Dolor del Servicio de Salud Pública de Extremadura (en este caso todos los participantes habían probado sin éxito 2 o 3 tratamientos para su problema). Todos los participantes firmaron su consentimiento de inclusión en el estudio. Los criterios de inclusión del estudio fueron: edad de entre 40 a 70 años, un diagnóstico de DEBN crónico de acuerdo a la Clasificación Internacional de Enfermedades, novena revisión (CIE-9) en ausencia de déficit neurológico importante, y con un mínimo de 6 meses de historia con DEBN. Los criterios de exclusión del estudio fueron: dolor lumbar de etiología conocida o que no fuera crónico, padecimiento de cualquier otra enfermedad importante, realización de actividad física regular durante los últimos 5 años, haber realizado previamente el test de EIP y el uso de cualquier medicamento con potenciales efectos neurotóxicos (por ejemplo, tratamientos farmacológicos para el cáncer o el virus de la inmunodeficiencia humana). Todos los participantes seguían recibiendo atención médica estándar a través del sistema público de salud (atención primaria, hospitalaria y ambulatoria). Procedimiento La evaluación fue llevada a cabo por un investigador experimentado en la aplicación de test de condición física en poblaciones clínicas con más de 3 años de experiencia. En primer lugar se evaluó al paciente en términos de caracterización (tabla 1). Se llevó a cabo el protocolo estandarizado descrito anteriormente en 2 ocasiones (días 1 y 2) separadas con un intervalo de 12 semanas. La medición fue realizada en ambas ocasiones en la misma habitación, a temperatura constante (22◦ ) y a la misma hora del día con el fin de reducir los efectos debidos a variaciones diurnas. Se les pidió a los pacientes que un día antes de su evaluación no tomaran ninguna medicación para eliminar los posibles efectos Tabla 1 Características de la muestra Variable Total (n = 10) a Edad (años) Hábito tabáquico, no fuma (%) Hábito alcohólico, no bebe (%) IMC (kg/m2 )a IDO (%)a EQ-5D-3LUTILITY (puntos)a a 48,93 69,20 14,79 32,68 33,35 0,75 (12,12) (7,32) (16,45) (0,13) Datos presentados como media (DE). EQ-5D-3LUTILITY : índice de utilidad derivado del cuestionario de calidad de vida relacionada con la salud EQ-5D-3L (0, el peor estado de salud posible a 1, el mejor estado de salud posible); IDO: índice de incapacidad de Oswestry (0, mínima incapacidad funcional a 100, máxima incapacidad funcional); IMC: índice de masa corporal; Hábito alcohólico: se consideró como hábito alcohólico beber 2 copas o más al día de vino o cerveza. 273 que estos pudieran tener sobre el dolor. Antes de realizar la evaluación, cada paciente realizó un calentamiento estandarizado. Dicho calentamiento consistió en una caminata de 5 min con el objetivo de aumentar la temperatura corporal. Medidas Se caracterizó a la muestra en términos de edad, sexo, índice de masa corporal, estilos de vida (hábito tabáquico y alcohólico), índice de incapacidad funcional relacionada con el dolor lumbar crónico (mediante el cuestionario de índice de incapacidad de Oswestry)18 y CVRS (mediante el instrumento genérico EQ-5D-3L)19,20 . En este estudio se usó el resultado del test de EIP como medida principal. Esta prueba evalúa la capacidad de realizar levantamientos de carga de forma dinámica a una velocidad controlada (aproximadamente 5 s). Se siguieron con sumo cuidado las instrucciones estandarizadas para este test12 . Cada paciente llevó a cabo el máximo número de series. En cada serie, se le pidió al paciente que levantara una caja (36 × 26 × 18 cm) a una altura aproximada de 76 cm y de nuevo la depositase en el suelo 4 veces durante 20 s aproximadamente (4 repeticiones). Hubo un descanso de 20 s entre serie y serie. Se incrementó de peso en 4,5 kg para los varones y 2,25 kg para las mujeres en cada serie, hasta considerar que llegaba al máximo esfuerzo completando el ciclo de carga correctamente. Tras cada serie, el evaluador anotaba la frecuencia cardiaca y la causa de fin del test en cada caso. El máximo de kilogramos cargados por cada paciente durante las 4 repeticiones se tomó como medida final de la prueba. La prueba se dio por concluida cuando: se alcanzó el esfuerzo máximo admisible; el levantamiento se convirtió en riesgo; el ritmo cardíaco de los participantes alcanzó el 85% de la tasa máxima estimada para su edad; se alcanzó el límite máximo de peso (considerado como el 45 o 55% del peso total del paciente), o si la velocidad de elevación no se mantuvo. Análisis estadístico Se utilizó la prueba t-test para medidas repetidas con el objetivo de detectar la existencia de diferencias entre los valores obtenidos en ambas mediciones en el test de EIP. El nivel de significatividad se estableció para p < ,05. La fiabilidad relativa se determinó mediante el cálculo del coeficiente de correlación intraclase (CCI3,1 ) y su 95% de intervalo de confianza entre los 2 días de medición21 . El CCI fue siguiendo las indicaciones de los expertos: valores de 0,50 a 0,69 se han considerado como «moderado», de 0,70 a 0,89 como «alto» y de 0,90 y superiores como «excelente»22 . La fiabilidad absoluta se determinó mediante √ el cálculo de los índices EEM [EEM = DT (1-CCI). En esta ecuación DT representa la desviación típica del día 1 y día 2] √ y el MCR [MCR = 1,96 × 2 × EEM]23 . Adicionalmente se realizó el gráfico de Bland-Altman para ilustrar las diferencias individuales obtenidas en las 2 sesiones de medición24 . Resultados La tabla 1 muestra las características de los pacientes incluidos en el estudio. Cuatro de los sujetos inicialmente Documento descargado de http://www.elsevier.es el 17/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. 274 B. del Pozo-Cruz et al Test de pile 8 Personas interesadas en participar (n = 14) Excluidas (n = 0) Día 1-Día 2 (seg) 6 + 1,96 DT 4 2 Sesgo 0 -2 - 1,96 DT -4 Personas que realizaron el test día 1 (n = 14) 0 10 20 30 Capacidad de carga (Kg) Figura 2 Gráfico Bland-Altman del test de elevación progresiva de carga isoinercial en pacientes con dolor crónico de espalda baja inespecífico. Personas que realizaron el test día 2 (n = 10) Personas analizadas en el estudio (n = 10) Figura 1 Flujo de participantes en el estudio. evaluados no completaron el test el segundo día (no acudieron a la cita) de evaluación, por lo que fueron excluidos del análisis. Un total de 10 pacientes fueron evaluados (fig. 1). La mayoría de los sujetos estaban en sobrepeso u obesidad tipo I y tenían una afección moderada en términos de incapacidad funcional. No se reportaron efectos adversos relacionados con las evaluaciones llevadas a cabo. Los datos del test en ambos días (días 1 y 2) pueden observarse en la tabla 2. No se detectaron diferencias estadísticamente significativas en los valores obtenidos en el test de EIP de los pacientes evaluados (p = ,447) siendo el grado de fiabilidad relativa obtenido en el test evaluado fue excelente (CCI > ,90 en todos los casos) (tabla 3). La figura 2 muestra el gráfico de Bland-Altman de los resultados derivados del test de EIP en los sujetos de estudio. El error sistemático entre ambas mediciones fue 1,52 (2,94 95% límite de acuerdo entre -4,24 y 7,29). Discusión El principal hallazgo de este estudio fue demostrar que el test de EIP, que evalúa la capacidad de carga isoinercial dinámica, es fiable y replicable en la población española hospitalaria afectada por DEBN crónico en un intervalo test-retest de 12 semanas de duración. Hasta nuestro Tabla 2 Capacidad de carga (kg) de la muestra Muestra (n = 10) Test (día 1) Post-test (día 2) Media Desviación estándar p 10,58 8,87 9,95 6,81 0,447 p: valor de p derivado del análisis T para muestras relacionadas. conocimiento, este es el primer estudio que evalúa la estabilidad de los resultados de este test de evaluación clínica funcional en un período de más de 2 días. Los valores de fiabilidad relativa evaluada mediante el CCI3,1 obtenidos en este estudio han sido excelentes con un CCI de 96.22 . Estos resultados son consistentes con un estudio que evaluó la fiabilidad test-retest del EIP en población sana (r = 0,87), aunque nuestro método estadístico fue diferente y no podemos concluir fehacientemente tal hecho. Smeets et al.13 hallaron resultados ligeramente inferiores a los nuestros usando la misma estadística y refuerzan el hecho de que este test es fiable y replicable, también teniendo en cuenta intervalos de tiempo más extensos (en este caso de 12 semanas). Otro estudio que evaluó la fiabilidad relativa encontró valores de CCI similares14 , aunque los autores concluyeron que el test no era aplicable a nivel clínico. Por otro lado, los valores hallados en términos de fiabilidad absoluta indicados por el EEM y el MCR en nuestro estudio son ligeramente menores a los reportados por Smeets et al.13 . Posiblemente el aumento en la variabilidad relativa y absoluta reportada por estos autores se deba a que no realizaron un calentamiento previo a la realización del test, pudiendo aumentar la variabilidad individual entre el test 1 y el test 2. De hecho, las indicaciones del test de EIP sugieren la realización de un calentamiento previo a la realización de la prueba8,10---12 . Dado que la funcionalidad de los pacientes con DEBN crónico se deteriora con el paso del tiempo25 , es importante conocer cuál es el período máximo de tiempo en el que ese deterioro de la funcionalidad evaluado mediante el test de EIP es debido a la propia variabilidad del instrumento y no al deterioro de la funcionalidad per se. Del mismo modo, podemos conocer si los datos de mejora en la capacidad de carga evaluados mediante este test se deben a dicha variabilidad o, por el contrario, son efecto de la terapia probada. Los resultados procedentes de nuestro estudio indican un MCR de 4,35 kg. En términos clínicos, un paciente con DEBN crónico debería aumentar su capacidad de carga en 4,35 kg para considerar un cambio real en esta capacidad26 . Esta información es importante para asesorar intervenciones que pretendan incrementar la capacidad de carga en esta población en entornos clínicos. Documento descargado de http://www.elsevier.es el 17/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. Fiabilidad relativa y absoluta del test de elevación progresiva de carga isoinercial Tabla 3 275 Fiabilidad Test-post test en el test de EIP en 2 mediciones con un intervalo de 12 semanas entre medición (n = 10) Test de Pile Test de Pile en la muestra total (n = 10) Capacidad de carga (kg) CCI3,1 (IC del 95%) EEM (kg) EEM (%) MCR (kg) MCR (%) 0,96 (0,88-0,98) 1,57 15,3 4,35 42,3 CCI3,1 : coeficiente de correlación Intraclase tipo 3,1; EEM: error estándar de medida; IC del 95%: intervalo de confianza del 95%; MCR: mínimo cambio real. El grado de fiabilidad de una prueba puede verse afectado por factores como la hora del día, si se realiza o no calentamiento previo o si se dan o no instrucciones estandarizadas27 . Para solventar dichas controversias, las mediciones realizadas a nuestros pacientes tanto en el día 1 como en el día 2 fueron realizadas a la misma hora del día y en una habitación a temperatura constante (con el fin de minimizar el posible efecto que la temperatura pudiese tener sobre el rendimiento muscular). Además, fue realizado por el mismo investigador que aseguró una estandarización en el protocolo del test. Este estudio presenta algunas limitaciones. El hecho de que los sujetos no siguieran un protocolo de familiarización previo al día 1 de medición pudo influir en el resultado del test27 . A pesar de esto, todos los sujetos fueron escogidos con la premisa de no tener experiencia en la realización del test, por lo que el efecto aprendizaje pudo afectar a todos los sujetos por igual. En cuanto a la validez externa, es importante establecer que no es posible generalizar los datos a otro tipo de pacientes afectados por DEBN, por ejemplo que se encuentren en una fase subaguda de la enfermedad, ya que la capacidad funcional de estos pacientes se ve afectada por diferentes variables, como psicosociales28 . Además, el entorno puede también influenciar los resultados, ya que en un entorno clínico el control es mayor por lo que se hacen necesarios futuros estudios que analicen tanto la fiabilidad relativa como absoluta en otro tipo de pacientes con DEBN y en otros entornos clínicos, por ejemplo en Atención Primaria. Además, estudios con más muestra y desagregados por género son necesarios para confirmar nuestros resultados en población general. Conclusiones La capacidad de carga evaluada a través del test de EIP es replicable en pacientes afectados por DEBN crónico tratados en entorno hospitalario. Dado el reducido tamaño muestral y la ausencia de distribución por género, los autores recomiendan cautela a la hora de extrapolar estos resultados a otro tipo de poblaciones. Una diferencia en la carga de entre 4 y 5 kg es necesaria para concluir que un cambio en el resultado del test de EIP es real y no debido a la variabilidad del propio test. Responsabilidades éticas Protección de personas y animales. Los autores declaran que los procedimientos seguidos se conformaron a las normas éticas del comité de experimentación humana responsable y de acuerdo con la Asociación Médica Mundial y la Declaración de Helsinki. Confidencialidad de los datos. Los autores declaran que en este artículo no aparecen datos de pacientes. Derecho a la privacidad y consentimiento informado. Los autores declaran que en este artículo no aparecen datos de pacientes. Conflicto de intereses Los autores declaran no tener ningún conflicto de intereses. Bibliografía 1. González Viejo MA, Condón Huerta MJ. [Disability from low back pain in Spain]. Med Clin (Barc). 2000;114:491---2. 2. Del Pozo-Cruz B, Gusi N, del Pozo-Cruz J, Adsuar JC, Hernández-Mocholí M, Parraca JA. Clinical effects of a nine-month web-based intervention in subacute non-specific low back pain patients: a randomized controlled trial. Clin Rehabil. 2012. Disponible en: http://cre.sagepub.com/ content/early/2012/05/30/0269215512444632.long. 3. Beurskens AJ, de Vet HC, Koke AJ, van der Heijden GJ, Knipschild PG. Measuring the functional status of patients with low back pain. Assessment of the quality of four disease-specific questionnaires. Spine (Phila Pa 1976). 1995;20:1017---28. 4. Michel A, Kohlmann T, Raspe H. The association between clinical findings on physical examination and self-reported severity in back pain. Results of a population-based study. Spine (Phila Pa 1976). 1997;22:296---303, discussion -4. 5. Fordyce WE. On the nature of illness and disability: an editorial. Clin Orthop Relat Res. 1997;336:47---51. 6. Pfingsten M, Wendt A, Kroner-Herwig B, Luder S, Hildebrandt J, Petzke F. [Lifting capacity with low back pain: discrepancy between self-rated and real lifting capacity in patients with back pain and pain-free controls]. Schmerz. 2011;25:668---75. 7. Mayer TG, Barnes D, Nichols G, Kishino ND, Coval K, Piel B, et al. Progressive isoinertial lifting evaluation II. A comparison with isokinetic lifting in a disabled chronic low-back pain industrial population. Spine (Phila Pa 1976). 1988;13:998---1002. 8. Del Pozo-Cruz B, Hernández Mocholi MA, Adsuar JC, Parraca JA, Muro I, Gusi N. Effects of whole body vibration therapy on main outcome measures for chronic non-specific low back pain: a single-blind randomized controlled trial. J Rehabil Med. 2011;43:689---94. 9. Mayer T, Gatchel R, Mooney V. Safety of the dynamic progressive isoinertial lifting evaluation (PILE) test. Spine (Phila Pa 1976). 1990;15:985---6. 10. Khalil T, Asfour S, Goldberg M, Moty E, Fishbain D, Santana R, et al. Progressive isoinertial lifting evaluation. Spine (Phila Pa 1976). 1990;15:342---3. 11. Mayer TG, Barnes D, Kishino ND, Nichols G, Gatchel RJ, Mayer H, et al. Progressive isoinertial lifting evaluation I. A standardized protocol and normative database. Spine (Phila Pa 1976). 1988;13:993---7. Documento descargado de http://www.elsevier.es el 17/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. 276 12. Lygren H, Dragesund T, Joensen J, Ask T, Moe-Nilssen R. Testretest reliability of the Progressive Isoinertial Lifting Evaluation (PILE). Spine (Phila Pa 1976). 2005;30:1070---4. 13. Smeets RJ, Hijdra HJ, Kester AD, Hitters MW, Knottnerus JA. The usability of six physical performance tasks in a rehabilitation population with chronic low back pain. Clin Rehabil. 2006;20:989---97. 14. World Medical Association Inc. Declaration of Helsinki. Ethical principles for medical research involving human subjects. J Indian Med Assoc. 2009;107:403---5. 15. Walter S, Eliasziw M, Donner A. Sample size and optimal designs for reliability studies. Stat Med. 1998;17:101---10. 16. Munro BH. Statistical methods for health care research. New York: Ed. Lippincott Williams & Wilkins; 2005. 17. Fairbank JC, Pynsent PB. The oswestry disability index. Spine (Phila Pa 1976). 2000;25:2940---52. 18. EuroQol–a new facility for the measurement of healthrelated quality of life. The EuroQol Group. Health Policy. 1990;16:199---208. 19. Kovacs FM, Fernández C, Cordero A, Muriel A, González-Lujan L, Gil del Real MT. Non-specific low back pain in primary care in the Spanish National Health Service: a prospective study on clinical outcomes and determinants of management. BMC Health Serv Res. 2006;6:57. 20. Shrout PE, Fleiss JL. Intraclass correlations: uses in assessing rater reliability. Psychological Bulletin. 1979;86: 420---8. B. del Pozo-Cruz et al 21. Munro BH, Visintainer MA, Page EB. Statistical methods for health care research. Philadelphia: JB Lippincott; 1986. 22. Weir JP. Quantifying test-retest reliability using the intraclass correlation coefficient and the SEM. J Strength Cond Res. 2005;19:231---40. 23. Bland JM, Altman DG. Statistical methods for assessing agreement between two methods of clinical measurement. Lancet. 1986;1:307---10. 24. Dunn KM, Croft PR. Epidemiology and natural history of low back pain. Eura Medicophys. 2004;40:9---13. 25. McKenna L, Cunningham J, Straker L. Inter-tester reliability of scapular position in junior elite swimmers. Phys Ther Sport. 2004;5:146---55. 26. Farrell M, Richards JG. Analysis of the reliability and validity of the kinetic communicator exercise device. Med Sci Sports Exerc. 1986;18:44---9. 27. Adsuar JC, Olivares PR, del Pozo-Cruz B, Parraca JA, Gusi N. Test-retest reliability of isometric and isokinetic knee extension and flexion in patients with fibromyalgia: evaluation of the smallest real difference. Arch Phys Med Rehabil. 2011;92: 1646---51. 28. Gusi N, del Pozo-Cruz B, Olivares PR, Hernández-Mocholi M, Hill JC. The Spanish version of the STarT Back Screening Tool (SBST) in different subgroups. Aten Primaria. 2011;43: 356---61.