Skip to main content
Revista de Saúde Pública logoLink to Revista de Saúde Pública
. 2016 Jan 14;49:97. doi: 10.1590/S0034-8910.2015049005724
View full-text in Spanish

Content validity and reliability of test of gross motor development in Chilean children

Marcelo Cano-Cappellacci I, Fernanda Aleitte Leyton II, Joshua Durán Carreño II
PMCID: PMC4760713  PMID: 26815160

ABSTRACT

OBJECTIVE

To validate a Spanish version of the Test of Gross Motor Development (TGMD-2) for the Chilean population.

METHODS

Descriptive, transversal, non-experimental validity and reliability study. Four translators, three experts and 92 Chilean children, from five to 10 years, students from a primary school in Santiago, Chile, have participated. The Committee of Experts has carried out translation, back-translation and revision processes to determine the translinguistic equivalence and content validity of the test, using the content validity index in 2013. In addition, a pilot implementation was achieved to determine test reliability in Spanish, by using the intraclass correlation coefficient and Bland-Altman method. We evaluated whether the results presented significant differences by replacing the bat with a racket, using T-test.

RESULTS

We obtained a content validity index higher than 0.80 for language clarity and relevance of the TGMD-2 for children. There were significant differences in the object control subtest when comparing the results with bat and racket. The intraclass correlation coefficient for reliability inter-rater, intra-rater and test-retest reliability was greater than 0.80 in all cases.

CONCLUSIONS

The TGMD-2 has appropriate content validity to be applied in the Chilean population. The reliability of this test is within the appropriate parameters and its use could be recommended in this population after the establishment of normative data, setting a further precedent for the validation in other Latin American countries.

Keywords: Child, Motor Skills, Reproducibility of Results, Validity of Tests, Validation Studies, Translations

INTRODUCTION

The early assessment of motor skills and development has gained great importance recently. International evidence points out to positive aspects on mastering mature motor patterns, which will contribute to physical, cognitive and social development. 5 , 6 , 15 Basic motor skills (BMS) are the foundations that lead to more complex movement sequences. Previously learned skills are refined and combined to be used in the most demanding situations. They contribute to the participation of children, adolescents, and adults in physical activities requiring control of their body in the space, control of antigravity muscles, and precise control of different objects; basic skills for locomotion, stability, and handling, respectively. 6 The mastering of BMS is correlated with different health benefits, related to body weight status, cardiovascular health, and level of physical activity performed by children. 8 , 11

Chile is a country with high prevalence of childhood obesity, sedentary lifestyle, and cardiovascular diseases. a Thus, a motor assessment tool is necessary to investigate the relationship between these health variables and the mastering of BMS and its implications. Investigations about BMS have been done in Chile, using tools without the adequate prior validation process. 7 The international literature describes different types of instruments that allow to assess motor development at different stages of life. 3 Few Chilean studies on the validation of new tools to the national context exist. On the other hand, instruments created and validated for Chilean children have been used for over 30 years, allowing a follow-up up to five years of age. Also, no national statistics that allow knowing the level of motor development with which children start their school life are available.

One of the most used tools in the international literature is the Test of Gross Motor Development version 2 (TGMD-2), designed by Dale Ulrich, in the United States. This tool aims to identify children with deficits in gross motor development, from three to 10 years of age, evaluating 12 BMS grouped in two subtests: one of locomotor skills and other of object control skills. It is a test focused on the process and on the quality of the movement of a particular BMS. It enables to compare the performance of each individual with pre-established movement quality criteria, or with regulatory results of a representative and statistical sample of the population on which the test is validated. 18 Normative data is representative of a specific population; thus, the use of the test in other countries is limited to the existence of normative values for this population in particular. 3 The test has adequate validity and reliability for the USA population, with values of r = 0.88, for test-retest, and 0.98, for inter-rater reliability. However, no intra-rater reliability reports exist. 18 The TGMD-2 has been validated in countries such as China, Belgium, Brazil, among others, which shows the international interest in this tool. 14 , 19 , 21 In Chile, progress has been made on this matter, with initiatives throughout the country, in which the test is used in children. 7 However, a validation process like this has not been developed yet. This study aims to complement those pioneering initiatives, providing the validation of the test in Chile with greater methodological rigor.

It is interesting to investigate the reproducibility of the test in other countries, since it was designed in a specific context. For example, the batting test is considered an important skill for pre-sports development of American boys and girls. However, in Chile and most countries in Latin America, it is not a widely practiced skill.

The purpose of this study was to validate a version in Spanish of the test of gross motor development (TGMD-2) for the Chilean population.

METHODS

This is a descriptive study, part of the validation process of the gross motor instrument, TGMD-2. The study was conducted in three phases. The first consisted of a process of translation and back-translation to obtain a version of the TGMD-2 with translinguistic equivalence to the original test. The second was a content validation. Finally, the third one was an assessment of the inter-rater and intra-rater reliability of the test in Spanish, in addition to test-retest with the purpose of establishing the time stability of the data.

The TGMD-2 was translated from English into Spanish independently by two translators whose native language is Spanish. Two versions of the test were created, which were contrasted by a bilingual investigator to obtain a preliminary version in Spanish. This preliminary version was subjected to a blind and independent back-translation by other two translators, who did not know the original test, thus obtaining two versions of the instrument in its original language. A committee was made up of all the translators: two with knowledge in the area of gross motor skills, and two others familiar with colloquial phrases in both languages. This committee compared the back-translated versions with the original test and the preliminary version in Spanish, thus solving, unanimously, semantic discrepancies, and generating a second version in Spanish (TGMD-2-CH).

The investigation team decided to evaluate a thirteenth skill based on the controversy surrounding the hitting skill. The bat was replaced by a tennis racket, keeping the evaluation criteria, to know how Chilean children behave in the face of both conditions. Therefore, a modified third version, evaluated in parallel to the TGMD-2-CH, was generated.

For content validation, the procedure described by McGartland was conducted. 12 We contacted three experts, physical education professors specialized in child motor skills, who worked between the years 2011-2013 in the area of motor skills, and knew the instrument TGMD-2. This committee evaluated the content validity of the Spanish version agreed upon by the translators, using a Likert-type scale developed by the investigation team. Experts expressed their degree of agreement according to the relevance and clarity of the language of the translation of the TGMD-2, on a scale of 1 to 5, justifying their score (1: nothing relevant or unclear; 5: very relevant or very clear). Comments were accepted, thus modifying the test to a level of acceptable content validity (≥ 0.8), for the content validity index. 12

Once approved, the test was applied to the target population to determine its reliability. Data was collected with the TGMD-2-CH already translated into Spanish and approved by experts. Two raters participated, responsible for applying and then independently rate the videos. One of them was responsible for conducting the intra-rater test, while the other was responsible for the test-retest.

The reliability study was conducted in an urban area in the city of Santiago de Chile. A casual nonprobability sampling was used to select the educational institution. All children between five and 10 years enrolled in the year of 2013 were invited to participate (609 students). Children who refused to participate, or who did not have the consent of their parents (517 children) were excluded from this study. We evaluated 92 children, who were filmed performing the motor skills described in the TGMD-2-CH inside the establishment, during physical education classes, and in the presence of a teacher. Assessments were conducted in groups of three persons according to the test instructions. The recordings were rated by the corresponding rater(s).

To determine the test-retest reliability, 32 children were randomly selected, who were recorded and evaluated for the second time by the rater, two weeks after the first evaluation. To determine the intra-rater agreement, 32 children were randomly selected, and a rater evaluated on two occasions, with an interval of one month, the same video of these children. These periods were determined based on the existing literature and on protocols used in similar studies. These times are considered as appropriate intervals to minimize possible memory bias of the rater, when evaluating again the same child. 1 , 10 , 16

The data was analyzed with the SPSS Program version 20, using measures of central tendency and frequency distribution. In the statistical analysis, we used: the content validity index (CVI); t-test to compare the results of the test using bat versus results using racket; intra-class correlation coefficient (ICC); and the Bland-Altman method for intra-rater, inter-rater and test-retest reliability. 13 , 17

This study followed the “International Guidelines for Biomedical Research Involving Human Subjects” from the World Health Organization, 4 with the approval of the Ethics Commission of the Medical School, University of Chile (Process 074/2013). All participants signed an informed consent form.

RESULTS

We obtained a CVI = 0.88 in the language clarity evaluation of the TGMD-2-CH, and a CVI = 0.83 for the modified TGMD-2. TGMD-2-CH obtained a CVI = 0.90, and the modified test obtained a CVI = 0.84.

The TGMD-2-CH and modified TGMD-2 were applied in 92 children between five and 10 years old, with average age of 7.5 years (SD = 1.6 years), 56 boys and 36 girls. Raw scores for each subtest (Table 1) were calculated.

Table 1. Mean of the raw results of the TGMD-2-CH by sex and age. Santiago de Chile, 2013.

Variable n % Average score TGMD2-CH Standard deviation
Total sample 92 100 65.5 8.6
Locomotor subtest 92 100 34.7 4.7
Object control subtest 92 100 33.1 4.2
Sex
Female 36 39.1 61.2 9.1
Male 56 60.9 68.2 7.1
Age
5 years 16 17.4 57.8 10.1*
6 years 15 16.3 65.2 7.7
7 years 13 14.1 64.6 8.2
8 years 17 18.5 68.9 8.8
9 years 23 25.0 68.2 5.9
10 years 8 8.7 65.5 6.4

TGMD-2: Test of Gross Motor Development version 2

* Significant differences (p < 0.05) of the raw score between the 5-year-old age group and other age groups.

The Kolmogorov-Smirnov test indicated a normal distribution for the studied variables, for which the t-test was used to determine if there were significant differences between using a bat or a racket. We did not observe any significant differences (p = 0.059) in assessing the total score for both tests. However, we observed statistically significant differences (p = 0.038) when comparing the results of the object control subtest.

We randomly selected 32 minors (12 girls) to determine the inter-rater concordance. When analyzing the results of both raters, significant differences between the results of both were obtained (p = 0.006), and a CVI = 0.86 for the total score of the TGMD-2-CH, a CVI = 0.87 for the locomotor subtest, and a CVI = 0.88 for the object control subtest (Table 2). We obtained between 0.82 and 0.89 for each of the skills in the locomotor subtest, while, in the object control subtest, we obtained values between 0.80 and 0.92. The modified TGMD-2 obtained CVI = 0.83 in its total score, CVI = 0.85 for the control object subtest, and score of 0.63 in the skill to hit a ball with a racket.

Table 2. Results of reliability tests. Santiago de Chile, 2013.

Variable Age (years) Sex Evaluation 1 (score) Evaluation 2 (score) Concordance T-test

Mean DE Female Male Mean DE Mean DE CVI 95%CI p
Inter-rater (n = 32) 8.2 1.4 12 20
Total score 69.5 6.3 67.0 7.6 0.86 0.72;0.93 0.006
Locomotor subtest 36.7 3.3 36.1 3.5 0.87 0.73;0.93 0.14
Object control subtest 32.7 5.5 30.9 6.3 0.88 0.77;0.94 0.01
Intra-rater (n = 38) 7.5 1.9 15 23
Total score 66.9 9.2 66.4 9.8 0.91 0.83;0.95 0.91
Locomotor subtest 35.2 4.9 35.1 5.1 0.92 0.83;0.95 0.92
Object control subtest 31.6 6.6 31.3 7.5 0.86 0.76;0.93 0.86
Retest test (n = 32) 7.2 1.3 12 20
Total score 61.6 8.4 61.8 8.3 0.88 0.75;0.94 0.88
Locomotor subtest 32.5 5.1 32.4 4.5 0.86 0.71;0.93 0.86
Object control subtest 29.1 5.5 29.4 5.6 0.80 0.59;0.90 0.80

TGMD-2: Test of Gross Motor Development version 2

Results are expressed in mean and standard deviation.

We assessed 38 children randomly (15 girls and 23 boys) to determine the intra-rater concordance. We did not observe any significant differences between the results of both evaluations (p = 0.55). The CVI value for intra-rater concordance of the total score of the GMD-2-CH was 0.91, with CVI = 0.92 for the locomotor subtest and CVI = 0.86 for the object control subtest. For the intra-rater concordance of the modified test, a CVI = 0.93 was obtained for the total score and the object control subtest.

We evaluated 32 children (12 girls and 20 boys) to determine test-retest concordance. We did not obtain any significant differences between the results of both evaluations (p = 0.84). The CVI value for the total score of the TGMD-2-CH was 0.88, while for the modified test was 0.90. In the locomotor subtest, the CVI was 0.86; in the object control subtest with bat was 0.80, while with racket was 0.89.

Data was distributed homogeneously in the inter-rater, intra-rater and test-retest concordance, concentrating most of them within two standard deviations (Figures 1, 2 and 3). We have observed more values below the 0 line, being the average of the differences -2.5 points in the inter-rater graph (Figure 1). There was a partially homogenous distribution above and below the 0 line, existing only 1.0% of difference between the two assessments with average of the differences of -0.5 points in the intra-rater graph (Figure 2). We observed a homogeneous distribution above and below the zero line, obtaining a negative average of -0.2 points for the test-retest graph (Figure 3).

Figure 1. Bland-Altman inter-rater. Comparison of TGMD-2-CH scores obtained by two independent raters. Santiago de Chile, 2013. (N = 32).

Figure 1

TGMD-2: Test of Gross Motor Development version 2

Figure 2. Bland-Altman inter-rater. Comparison of the scores obtained to assess the same video twice. Santiago de Chile, 2013. (N = 38).

Figure 2

TGMD-2: Test of Gross Motor Development version 2

Figure 3. Bland-Altman Test-retest. Comparison of TGMD-2-CH scores achieved by a sample evaluated twice. Santiago de Chile, 2013. (N = 32).

Figure 3

TGMD-2: Test of Gross Motor Development version 2

DISCUSSION

In the light of the relations established between the mastery of BMS and factors such as cardiorespiratory status, obesity, long term physical activity, academic performance, among others, 11 , 20 it is important to have a method for the evaluation of motor skills promoting the investigation and knowledge of this area in the Chilean population. The TGMD-2 has established itself as one of the major evaluation tools, which encourages its validation around the world. 9 , 20 It is vital to support the use of an evaluation tool, through the knowledge of the reliability and content validity values, with the purpose of obtaining a standardized tool for massive use. Without this support, the obtained results could be inaccurate concerning motor development evaluation, thus causing improper use of resources. 1

This study generated a version of the TGMD-2 in Spanish, with high content validity index, 12 based on a clear and appropriate language for the Chilean population. For this purpose, an independent translation process and the formation of a panel were required to solve discrepancies and generate a final version, which diminished the subjectivity bias of each translator.

Our results are similar to those of Valentini 19 (CV = 0.93 for language clarity, and CV = 0.91 for relevance). However, the values obtained in the modified TGMD-2 are smaller, reaching adequate indexes, but close to the lower limit. The experts rated the skill with racket application as of low relevance for different reasons: the racket weight, or its size, could affect the performance of the children’s motor skill. Although relevant safeguards for the pilot implementation have been taken, selecting a racket weight similar to the bat weight and adequate size for children, effectively replacing the bat with a racket affected the result of the last test criterion: “the bat/racket contacts the ball”. This happens because the racket has more surface area for contact, and therefore, it is easier, in a way that this criterion does not discriminate between children who have greater precision and those who do not. One of the experts pointed out, based on his studies, that although the hitting skill is not usual in the Chilean culture, children have good performance of this motor skill. 7

The inter-rater, intra-rater and test-retest reliability were found to be high according to the values established by Streiner: 16 the CVI is higher than 0.8 in all of these, so it has proper concordance. The intra-rater reliability obtained concordance values for the score per subtest and for the total score higher than for the inter-rater reliability in similar studies. 10 , 19 This relates to the rater’s subjectivity, because although there is clear description to rate whether or not he or she meets certain criteria, the determination of whether his or her performance is or not creditor of the positive rating will always be subject to the rater’s discretion, which may not always be equal to the second rater.

In the graphic representation using the Bland-Altman method for intra-rater concordance (Figure 2), we could inferred that, in the second evaluation, slightly higher scores were assigned, although without significant differences between them (p = 0.55). We obtained a negative average for the total test-retest score (Figure 3), from which we deduce that the second evaluation was slightly lower than the first, but without statistical significance (p = 0.84). There are more values under the 0 line in the graph for the inter-rater concordance (Figure 1), thus indicating that the second rater gave children a higher grade, reaching statistical significance (p = 0.006). There are studies not showing significant differences; however, we observe values close to the significance limits. 10 However, the magnitude of this difference is less than 5.0% of the total score.

Although the reliability values obtained are lower than those obtained by Ulrich 18 in the original test in the USA population, he used correlation statistic, and not concordance statistic. The results of this study show an acceptable level of validity and reliability, 16 thus the TGMD-2-CH could be used in Chilean population without drawbacks. Therefore, we propose it as the tool of choice to determine the level of motor development of Chilean children, due to its wide application as a follow-up and evaluation method, 6 , 18 and its worldwide use. 9 , 19 , 20

The limitations of this study were the sample size, and the age group of the sample, since they constitute only a segment of the target population. The question of what happens to Chilean children from three to four years old remain a pending challenge for further investigations. It is also a challenge to establish in the future normative values for Chilean population, to adjust the raw scores according to age, thus completing the validation process of the TGMD-2-CH. We propose to perform test reliability studies in a representative sample of the Chilean population, to obtain definitive results with reliability values greater than those obtained in this study, and similar to those found in the literature. 2 , 19 We also propose to expand the investigation around the validation of instruments in Chile and Latin America. The use of non-validated instruments involves building knowledge on questionable grounds, which could mean a significant loss of efforts and resources.

Footnotes

a

Organization for Economic Co-operation and Development. Health at a glance 2011: OECD indicators. Paris; 2011 [cited 2015 May 19]. Available from: http://www.oecd.org/els/health-systems/49105858.pdf

REFERENCES

  • 1.Alarcón AM, Muñoz-N S. Medición en salud: algunas consideraciones metodológicas. 10.4067/S0034-98872008000100016Rev Med Chile. 2008;136(1):125–130. [PubMed] [Google Scholar]
  • 2.Barnett LM, Minto C, Lander N, Hardy LL. Interrater reliability assessment using the Test of Gross Motor Development-2. 10.1016/j.jsams.2013.09.013J Sci Med Sport. 2014;17(6):667–670. doi: 10.1016/j.jsams.2013.09.013. [DOI] [PubMed] [Google Scholar]
  • 3.Cools W, De Martelaer K, Samaey C, Andries C. Movement skill assessment of typically developing preschool children: a review of seven movement skill assessment tools. J Sports Sci Med. 2009;8(2):154–168. [PMC free article] [PubMed] [Google Scholar]
  • 4.Council for International Organizations of Medical Sciences (CIOMS) Pautas éticas internacionales para la investigación biomédica en seres humanos. Ginebra: 2002. [citado 2015 mai 19]. http://www1.paho.org/Spanish/BIO/CIOMS.pdf. [Google Scholar]
  • 5.Fisher A, Reilly J, Kelly LA, Montgomery C, Williamson A, Paton J, et al. Fundamental movement skills and habitual physical activity in young children. 10.1249/01.MSS.0000159138.48107.7DMed Sci Sports Exerc. 2005;37(4):684–688. doi: 10.1249/01.mss.0000159138.48107.7d. [DOI] [PubMed] [Google Scholar]
  • 6.Gallahue DL, Ozmun JC. Understanding motor development: infants, childhood, adolescents, adults. 6.ed. Boston: McGraw-Hill; 2006. pp. 15–109. [Google Scholar]
  • 7.Gatica P. Evaluación del desarrollo motor de los escolares de 6 a 10 años en la Región del Maule. Rev Cienc Activ Fis. 2004;7:67–79. [Google Scholar]
  • 8.Hardy LL, Reinten-Reynolds T, Espinel P, Zask A, Okely AD. Prevalence and correlates of low fundamental movement skill competency in children. 10.1542/peds.2012-0345Pediatrics. 2012;130(2):e390–e398. doi: 10.1542/peds.2012-0345. [DOI] [PubMed] [Google Scholar]
  • 9.Holfelder B, Schott N. Relationship of fundamental movement skills and physical activity in children and adolescents: a systematic review. 10.1016/j.psychsport.2014.03.005Psychol Sport Exerc. 2014;15(4):382–391. [Google Scholar]
  • 10.Houwen S, Hartman E, Jonker L, Visscher C. Reliability and validity of the TGMD-2 in primary-school-age children with visual impairments. 20440025Adapt Phys Activ Q. 2010;27(2):143–159. doi: 10.1123/apaq.27.2.143. [DOI] [PubMed] [Google Scholar]
  • 11.Lubans DR, Morgan PJ, Cliff DP, Barnett LM, Okely AD. Fundamental movement skills in children and adolescents: review of associated health benefits. 10.2165/11536850-000000000-00000Sports Med. 2010;40(12):1019–1035. doi: 10.2165/11536850-000000000-00000. [DOI] [PubMed] [Google Scholar]
  • 12.McGartland-Rubio D. Kempf-Leonard K.editor . Encyclopedia of social measurement. Pittsburgh: Elsevier; 2005. Content validity; pp. 495–498. [Google Scholar]
  • 13.Rankin G, Stokes M. Reliability of assessment tools in rehabilitation: an illustration of appropriate statistical analyses. 10.1191/026921598672178340Clin Rehabil. 1998;12(3):187–199. doi: 10.1191/026921598672178340. [DOI] [PubMed] [Google Scholar]
  • 14.Simons J, Daly D, Theodorou F, Caron C, Simons J, Andoniadou E. Validity and reliability of the TGMD-2 in 7-10-year-old Flemish children with intellectual disability. Adapt Phys Activ Q. 2008;25(1):71–82. doi: 10.1123/apaq.25.1.71. [DOI] [PubMed] [Google Scholar]
  • 15.Stodden DF, Goodway JD, Langendorfer SJ, Roberton MA, Rudisill ME, Garcia C, et al. A developmental perspective on the role of motor skill competence in physical activity: an emergent relationship. 10.1080/00336297.2008.10483582Quest. 2008;60(2):290–306. [Google Scholar]
  • 16.Streiner DL. A checklists for evaluating the usefulness of rating scales. Can J Psychiatry. 1993;38(2):140–148. doi: 10.1177/070674379303800214. [DOI] [PubMed] [Google Scholar]
  • 17.Streiner DL, Norman G. Health Measurement Scales. A practical guide to their development and use. 4ª Edición. New York: Oxford University; 2008. [Google Scholar]
  • 18.Ulrich DA. TGMD-2: Test of Gross Motor Development. 2.ed. Austin: Pro-ed; 2000. [Google Scholar]
  • 19.Valentini NC. Validity and reliability of the TGMD-2 for Brazilian children. 10.1080/00222895.2012.700967J Mot Behav. 2012;44(4):275–280. doi: 10.1080/00222895.2012.700967. [DOI] [PubMed] [Google Scholar]
  • 20.Westendorp M, Hartman E, Houwen S, Smith J, Visscher C. The relationship between gross motor skills and academic achievement in children with learning disabilities. 10.1016/j.ridd.2011.05.032Res Dev Disabil. 2011;32(6):2773–2779. doi: 10.1016/j.ridd.2011.05.032. [DOI] [PubMed] [Google Scholar]
  • 21.Wong KYA, Cheung SY. Confirmatory factor analysis of the Test of Gross Motor Development-2. 10.1080/10913671003726968Meas Phys Educ Exerc Sci. 2010;14(3):202–209. [Google Scholar]
Rev Saude Publica. 2016 Jan 14;49:97. [Article in Spanish]

Confiabilidad y validez de contenido de test de desarrollo motor grueso en niños chilenos

Marcelo Cano-Cappellacci I, Fernanda Aleitte Leyton II, Joshua Durán Carreño II

RESUMEN

OBJETIVO

Validar una versión en español de la prueba de desarrollo motor grueso TGMD-2 para la población chilena.

MÉTODOS

Estudio de validez y confiabilidad, no experimental, transversal, de tipo descriptivo. Participaron cuatro traductores, tres expertos y 92 niños chilenos, entre cinco y 10 años, alumnos de un colegio de Santiago de Chile. Se realizaron los procedimientos de traducción, retro-traducción y revisión, por parte del comité de expertos, para determinar la equivalencia trans-lingüística y la validez de contenido del test, usando el índice de validez de contenido en 2013. También se realizó una aplicación piloto para determinar la confiabilidad del test en español, utilizando el coeficiente de correlación intraclase y el método Bland-Altman. Se evaluó si existían diferencias significativas en los resultados, al reemplazar el bate por una raqueta, usando la prueba T-test.

RESULTADOS

Se obtuvo un índice de validez de contenido mayor de 0,8 para pertinencia y claridad del lenguaje del test TGMD-2 para los niños. Hubo diferencias significativas en el subtest de control de objetos, al comparar los resultados con bate y raqueta. El coeficiente de correlación intraclase para la confiabilidad interevaluador, intraevaluador y test re-test, resultó ser mayor de 0,8 en todos los casos.

CONCLUSIONES

El test TGMD-2 presenta adecuada validez de contenido para ser aplicado en la población chilena. La confiabilidad de este test está dentro de los parámetros adecuados y su uso sería recomendado en esta población luego de establecer los datos normativos, sentando un precedente adicional para la validación en otros países latinoamericanos.

Keywords: Niño, Destreza Motora, Reproducibilidad de Resultados, Validez de las Pruebas, Estudios de Validación, Traducciones

INTRODUCCIÓN

La evaluación temprana del desarrollo y habilidades motrices ha cobrado gran importancia recientemente. Existe evidencia internacional que señala los aspectos positivos sobre los cuales repercute dominar patrones motores maduros que contribuirán al desarrollo físico, cognitivo y social. 5 , 6 , 15 Las habilidades motoras básicas (HMB) son los cimientos que conducen a secuencias de movimiento más complejas. Las habilidades previamente aprendidas son perfeccionadas y combinadas para ser usadas en situaciones cada vez más demandantes. Contribuyen en la participación de niños, adolescentes y adultos en actividades físicas que requieran control de su cuerpo en el espacio, control de la musculatura anti-gravitatoria y control preciso de diferentes objetos; habilidades esenciales para la locomoción, la estabilidad y la manipulación, respectivamente. 6 El dominio de las HMB se correlaciona con diferentes beneficios en salud, relacionados con el estado del peso corporal, la salud cardiovascular y el nivel de actividad física realizada por los niños. 8 , 11

Chile es un país con alta prevalencia de obesidad infantil, sedentarismo y enfermedades cardiovasculares. a Así, es importante disponer de una herramienta de evaluación motora para indagar acerca de la relación entre estas variables de salud, con el dominio HMB y sus implicancias. En Chile se han realizado investigaciones en torno a las HMB, utilizando herramientas sin el adecuado proceso de validación previo. 7 La literatura internacional describe diversos tipos de instrumentos que permiten evaluar el desarrollo motor en las distintas etapas de la vida. 3 Existen pocos estudios chilenos en torno a la validación de nuevas herramientas para el contexto nacional. Por el contrario, se utilizan instrumentos creados y validados para niños chilenos, desde hace más de 30 años, que permiten un seguimiento hasta los cinco años. Tampoco existen estadísticas nacionales que permitan conocer el nivel de desarrollo motor con el cual los niños inician su periodo escolar.

Una de las herramientas más utilizadas en la literatura internacional es el Test of Gross Motor Development versión 2 (TGMD-2), diseñado por Dale Ulrich, en Estados Unidos. Esta herramienta busca identificar a los niños con déficit en el desarrollo motor grueso, entre los tres y 10 años, evaluando 12 HMB agrupadas en dos subtest: uno de habilidades locomotoras, y otro de habilidades de control de objetos. Es un test enfocado en el proceso y en la calidad del movimiento de una determinada HMB. Permite comparar el desempeño de cada individuo con criterios pre-establecidos, de calidad de movimiento, o con los resultados normativos de una muestra estadística y representativa de la población en la que el test está validado. 18 Los datos normativos son representativos de una población específica; así, el uso del test en otros países está limitado a la existencia de valores normativos para esa población en particular. 3 El test posee adecuada validez y confiabilidad para la población estadounidense, con valores de r = 0,88, para la prueba test re-test, y de 0,98, para la confiabilidad inter-evaluador. Sin embargo, no existen reportes de confiabilidad intraevaluador. 18 El TGMD-2 ha sido validado en países como China, Bélgica, Brasil, entre otros, lo que muestra el interés internacional por esta herramienta. 14 , 19 , 21 En Chile, se ha avanzado al respecto, con iniciativas a lo largo del país, en las cuales se utiliza el test en niños; 7 no obstante, aún no se ha desarrollado un proceso de validación como tal. Este estudio pretende complementar aquellas iniciativas pioneras, aportando con mayor rigurosidad metodológica a la validación del test en Chile.

Resulta interesante indagar en la reproductibilidad del test en otros países, ya que este fue diseñado en un contexto determinado. Por ejemplo, la prueba de batear es considerada una habilidad importante para el desarrollo pre-deportivo de los niños y niñas estadounidenses. No obstante, en Chile y en la mayoría de los países en Latinoamérica, esa no es una habilidad ampliamente practicada.

El objetivo de este estudio fue validar una versión en español de la prueba de desarrollo motor grueso TGMD-2 para la población chilena.

MÉTODOS

Estudio descriptivo que constituye parte del proceso de validación del instrumento de motricidad gruesa TGMD-2. El estudio se desarrolló en tres fases. La primera constó de un proceso de traducción y retro-traducción para obtener una versión del TGMD-2 con equivalencia translingüística con el test original. La segunda, de una validación de contenido; y la tercera, de una evaluación de la confiabilidad interevaluador e intraevaluador del test en español, además del test re-test, con el objeto de establecer la estabilidad temporal de los datos.

El TGMD-2 fue traducido del inglés al español independientemente por dos traductores, cuya lengua nativa es el español. Fueron generadas dos versiones del test, las cuales fueron contrastadas junto a un investigador bilingüe, para obtener una versión preliminar en español. Esta versión preliminar fue sometida a una retro-traducción ciega e independiente por otros dos traductores, quienes no conocían el test original, obteniendo nuevamente dos versiones del instrumento en su lenguaje original. Se conformó un comité con todos los traductores: dos con conocimiento en el área de la motricidad gruesa, y otros dos familiarizados con frases coloquiales de ambos idiomas. Este comité contrastó las versiones retro-traducidas con el test original y con la versión preliminar en español, resolviendo, por unanimidad, discrepancias semánticas, y generando una segunda versión en español (TGMD-2-CH).

El equipo de investigación decidió evaluar una decimotercera habilidad, con base en la controversia en torno a la habilidad de batear. Se reemplazó el bate por una raqueta de tenis, manteniendo los criterios de evaluación, para conocer cómo se comportan los niños chilenos frente a ambas condiciones. Por tanto, se generó una tercera versión, modificada, que se evaluó paralelamente al TGMD-2-CH.

Para la validación de contenido, se llevó a cabo el procedimiento descrito por McGartland. 12 Se contactó a tres expertos, profesores de educación física especialistas en motricidad infantil, quienes trabajaron entre los años 2011 y 2013 en el área de la motricidad, y conocían el instrumento TGMD-2. Este comité evaluó la validez de contenido de la versión en español consensuada por los traductores, utilizando una escala tipo Likert confeccionada por el equipo de investigación. Los expertos expresaron su grado de acuerdo con la pertinencia y claridad del lenguaje de la traducción del test TGMD-2, en una escala de 1 a 5, justificando su puntuación (1: nada pertinente o nada claro; 5: muy pertinente o muy claro). Las observaciones fueron acogidas, modificando el test hasta alcanzar un nivel de validez de contenido aceptable (≥ 0,8), para el índice de validez de contenido. 12

Una vez aprobado, el test fue aplicado en la población objetivo para determinar su confiabilidad. Los datos fueron recolectados con el test TGMD-2-CH ya traducido al español y aprobado por los expertos. En ella, participaron dos evaluadores, quienes se encargaron de aplicar y luego puntuar independientemente los videos. Uno de ellos se encargó de realizar la prueba de intraevaluador, mientras que el otro, de los test re-test.

El estudio de la confiabilidad fue realizado en un sector urbano en la ciudad de Santiago de Chile. Se utilizó un muestreo no probabilístico de tipo causal para seleccionar la institución educativa. Todos los niños entre cinco y 10 años matriculados durante el año 2013 fueron invitados a participar (609 alumnos). Fueron excluidos de este estudio los niños que se negaron a participar, o que no tenían el consentimiento de sus apoderados (517 niños). Fueron evaluados 92 niños, quienes fueron filmados realizando las habilidades motoras descritas en el TGMD-2-CH al interior del establecimiento, durante las clases de educación física, y en presencia de un profesor. Las evaluaciones se realizaron en grupos de tres personas, conforme a las indicaciones del test. Las grabaciones fueron calificadas por el o los evaluadores correspondientes.

Para determinar la confiabilidad test re-test, 32 niños fueron seleccionados al azar, los cuales fueron grabados y evaluados por segunda vez por el evaluador, dos semanas después de la primera evaluación. Para determinar la concordancia intraevaluador, 32 niños fueron seleccionados al azar, y un evaluador calificó en dos oportunidades, con intervalo de un mes, el mismo video de estos niños. Estos periodos fueron determinados con base en la literatura existente y en los protocolos utilizados en estudios similares. Se consideran estos tiempos como intervalos apropiados para minimizar eventual sesgo de memoria del examinador, al evaluar nuevamente al mismo niño. 1 , 10 , 16

Los datos fueron analizados con el Programa SPSS versión 20, mediante medidas de tendencia central y distribución de frecuencias. En el análisis estadístico, se utilizó: el índice de validez de contenido (CVI); el t-test para comparar los resultados del test usando bate versus los resultados usando raqueta; el coeficiente de correlación intra-clase (ICC); y el método Bland-Altman para la confiabilidad intraevaluador, interevaluador y test re-test. 13 , 17

Este estudio siguió las “Pautas Éticas Internacionales para la Investigación y Experimentación Biomédica en Seres Humanos” de la Organización Mundial de la Salud, 4 y contó con la aprobación del Comité de Ética de la Facultad de Medicina de la Universidad de Chile (Proceso 074/2013). Los participantes firmaron el proceso de consentimiento informado.

RESULTADOS

Se obtuvo un CVI = 0,88 en la evaluación de la claridad del lenguaje del test TGMD-2-CH, y un CVI = 0,83 para el TGMD-2 modificado. El TGMD-2-CH obtuvo un CVI = 0,90, y el test modificado obtuvo un CVI = 0,84.

El TGMD-2-CH y TGMD-2 modificado fueron aplicados en 92 niños entre 5 y 10 años, con media de edad de 7,5 años (DE = 1,6 años), 56 hombres y 36 mujeres. Se calcularon los puntajes brutos de cada subtest (Tabla 1).

Tabla 1. Media de los resultados brutos del TGMD-2-CH por sexo y edad. Santiago de Chile, 2013.

Variable n % Media puntaje TGMD2-CH Desviación estándar
Muestra total 92 100 65,5 8,6
Sub-test locomotor 92 100 34,7 4,7
Sub-test control objetos 92 100 33,1 4,2
Sexo
Mujeres 36 39,1 61,2 9,1
Hombres 56 60,9 68,2 7,1
Edad
5 años 16 17,4 57,8 10,1*
6 años 15 16,3 65,2 7,7
7 años 13 14,1 64,6 8,2
8 años 17 18,5 68,9 8,8
9 años 23 25,0 68,2 5,9
10 años 8 8,7 65,5 6,4

TGMD-2: Test of Gross Motor Development versión 2

* Diferencias significativas (p < 0,05) del puntaje bruto entre el grupo de 5 años y los demás grupos etarios.

La prueba de Kolmogorov-Smirnov indicó una distribución normal para las variables estudiadas, por lo cual se usó la prueba T para determinar si existían diferencias significativas entre usar un bate o una raqueta. No se observaron diferencias significativas (p = 0,059) al evaluar el puntaje total de ambas pruebas, No obstante, se observaron diferencias estadísticamente significativas (p = 0,038) al comparar los resultados del sub-test de control de objetos.

Fueron seleccionados 32 menores (12 niñas) al azar para determinar la concordancia inter-evaluador. Al analizar los resultados de ambos evaluadores, fueron obtenidas diferencias significativas entre los resultados de ambos (p = 0,006), y un ICC = 0,86 para el puntaje total del TGMD-2-CH, un ICC = 0,87 para el subtest locomotor, y un ICC = 0,88 para el sub-test de control de objetos (Tabla 2). Fueron alcanzados valores entre 0,82 y 0,89 para cada una de las habilidades en el sub-test locomotor, mientras que en el sub-test control de objetos fueron alcanzados valores entre 0,80 y 0,92. El TGMD-2 modificado obtuvo ICC = 0,83 en su puntaje total, ICC = 0,85 para el sub-test de control de objetos, y puntaje de 0,63 en la habilidad golpear una pelota con raqueta.

Tabla 2. Resultados de las pruebas de confiabilidad. Santiago de Chile, 2013.

Variable Edad (años) Sexo Evaluación 1 (puntaje) Evaluación 2 (puntaje) Concordancia T test

Media DE Mujeres Hombres Media DE Media DE ICC IC95% p
Interevaluador (n = 32) 8,2 1,4 12 20
Puntaje total 69,5 6,3 67,0 7,6 0,86 0,72;0,93 0,006
S. Locomotor 36,7 3,3 36,1 3,5 0,87 0,73;0,93 0,14
S. Control de objetos 32,7 5,5 30,9 6,3 0,88 0,77;0,94 0,01
Intraevaluador (n = 38) 7,5 1,9 15 23
Puntaje total 66,9 9,2 66,4 9,8 0,91 0,83;0,95 0,91
S. Locomotor 35,2 4,9 35,1 5,1 0,92 0,83;0,95 0,92
S. Control de objetos 31,6 6,6 31,3 7,5 0,86 0,76;0,93 0,86
Test re-test (n = 32) 7,2 1,3 12 20
Puntaje total 61,6 8,4 61,8 8,3 0,88 0,75;0,94 0,88
S. Locomotor 32,5 5,1 32,4 4,5 0,86 0,71;0,93 0,86
S. Control de objetos 29,1 5,5 29,4 5,6 0,80 0,59;0,90 0,80

TGMD-2: Test of Gross Motor Development versión 2

Resultados se expresan en media y desviación estándar.

Fueron evaluados 38 niños al azar (15 niñas y 23 niños) a fin de determinar la concordancia intraevaluador. No fueron obtenidas diferencias significativas entre el resultado de ambas evaluaciones (p = 0,55). El valor del ICC para concordancia intraevaluador del puntaje total del TGMD-2-CH fue de 0,91, con ICC = 0,92 para el sub-test locomotor e ICC = 0,86 para el sub-test de control de objetos. Para la concordancia intraevaluador del test modificado, fue obtenido un ICC = 0,93 para el puntaje total y para el sub-test de control de objetos.

Fueron evaluados 32 niños (12 niñas y 20 niños) para determinar la concordancia test re-test. No fueron obtenidas diferencias significativas entre los resultados de ambas evaluaciones (p = 0,84). El valor del ICC para el puntaje total del TGMD-2-CH fue de 0,88, mientras que para el test modificado fue de 0,90. En el sub-test locomotor, el ICC fue 0,86; en el sub-test de control de objetos con bate fue 0,80, mientras que con raqueta fue 0,89.

Existió una distribución homogénea de los datos en la concordancia interevaluador, intraevaluador y test re-test, concentrando la mayoría de ellos dentro de las dos desviaciones estándar (Figuras 1, 2 y 3). Se observan más valores bajo la línea del 0, siendo el promedio de las diferencias -2,5 puntos en el gráfico inter-evaluador (Figura 1). Existió una distribución parcialmente homogénea sobre y bajo la línea del 0, existiendo sólo un 1,0% de diferencia entre las dos evaluaciones con promedio de las diferencias de -0,5 puntos en el gráfico intra-evaluador (Figura 2). Se observó una distribución homogénea sobre y bajo la línea del cero, obteniendo un promedio negativo de -0,2 puntos para el gráfico test re-test (Figura 3).

Figura 1. Bland-Altman inter-evaluador. Comparación de los puntajes de TGMD-2-CH obtenidos por dos evaluadores independientes. Santiago de Chile, 2013. (N = 32).

Figura 1

TGMD-2: Test of Gross Motor Development versión 2

Figura 2. Bland-Altman inter-evaluador. Comparación de los puntajes obtenidos al evaluar en dos oportunidades un mismo video. Santiago de Chile, 2013. (N = 38).

Figura 2

TGMD-2: Test of Gross Motor Development versión 2

Figura 3. Bland-Altman Test re-test. Comparación de los puntajes TGMD-2-CH alcanzados por una muestra evaluada dos veces. Santiago de Chile, 2013. (N = 32).

Figura 3

TGMD-2: Test of Gross Motor Development versión 2

DISCUSIÓN

A la luz de las relaciones establecidas entre el dominio de las HMB y factores como el estado cardio-respiratorio, obesidad, actividad física a largo plazo, y rendimiento académico, entre otros, 11 , 20 se torna importante contar con un método de evaluación de habilidades motrices que fomente la investigación y el conocimiento de esta área en la población chilena. El TGMD-2 se ha posicionado como una de las principales herramientas de evaluación, lo cual incentiva su validación alrededor del mundo. 9 , 20 Resulta de vital importancia respaldar el uso de una herramienta de evaluación, por medio del conocimiento de los valores de confiabilidad y validez de contenido, con el fin de obtener una herramienta estandarizada para uso masivo. Sin este sustento, se podrían obtener resultados imprecisos en lo relacionado a la evaluación del desarrollo motor, con lo cual se podría incurrir en una mala utilización de recursos. 1

Este estudio generó una versión del test TGMD-2 en español, con alto índice de validez de contenido, 12 con base en un lenguaje claro y pertinente para la población chilena. Para esto, fue necesario un proceso de traducción independiente, y la conformación de un panel para resolver discrepancias y para generar una versión final, que disminuyera el sesgo de subjetividad propia de cada traductor.

Nuestros resultados son similares con los de Valentini 19 (CV = 0,93 para claridad del lenguaje, y 0,91 para pertinencia). No obstante, los valores obtenidos en el TGMD-2 modificado son menores, alcanzando índices adecuados, pero cercanos al límite inferior. Los expertos calificaron con baja pertinencia la aplicación de la habilidad con raqueta por varias razones: el peso de la raqueta, o el tamaño de esta, podría afectar el desempeño del gesto motor de los niños. A pesar de que se tomaron los resguardos pertinentes para la aplicación piloto, seleccionando una raqueta de peso similar al del bate, y de tamaño adecuado para niños, efectivamente el cambiar el bate por la raqueta afectó el resultado del último criterio de la prueba: “el bate/la raqueta contacta la pelota”. Esto, porque la raqueta posee mayor área de superficie para el contacto, y por tanto, resulta más fácil, provocando que este criterio no discrimine entre los niños que poseen mayor precisión de los que no la tienen. Uno de los expertos señaló, con base en sus estudios, que pese a que la habilidad de batear no es usual en la cultura chilena, los niños poseen buen desempeño en este gesto motor. 7

La confiabilidad interevaluador, intraevaluador y test re-test, resultaron ser altas de acuerdo a los valores establecidos por Streiner: 16 el ICC es mayor a 0,8 en todos estos, por lo cual posee apropiada concordancia. La confianza intra-evaluador obtuvo valores mayores de concordancia para el puntaje por subtest y para el puntaje total, que para la confianza inter-evaluador, al igual que estudios similares. 10 , 19 Esto guarda relación con la subjetividad del evaluador, pues aunque exista descripción clara para calificar si cumple o no cierto criterio, la determinación de si su desempeño es o no acreedor de la calificación positiva, siempre estará sujeta al criterio del evaluador, que no siempre será igual al del segundo evaluador.

En la representación gráfica utilizando el método Bland-Altman para concordancia intra-evaluador (Figura 2), se puede inferir que en la segunda evaluación se asignaron puntajes levemente mayores, aunque sin diferencias significativas entre ellas (p = 0,55). Se obtuvo un promedio negativo para el puntaje total test re-test (Figura 3), de lo cual se deduce que la segunda evaluación fue levemente menor que la primera, aunque sin significancia estadística (p = 0,84). Existen más valores bajo la línea del 0 en el gráfico para la concordancia inter-evaluador (Figura 1), con lo se infiere que el segundo evaluador puntuó con mayor calificación a los niños, alcanzando significancia estadística (p = 0,006). Sin embargo, la magnitud de esta diferencia es menor al 5,0% del puntaje total. Existen estudios que no presentan diferencias significativas; no obstante, se observan valores cercanos a los límites de significancia. 10

A pesar de que los valores de confiabilidad obtenidos son menores a los obtenidos por Ulrich 18 en el test original en población estadounidense, él utilizó estadístico de correlación, y no de concordancia. Los resultados de este estudio muestran un nivel de validez y confiabilidad aceptable, 16 por lo cual el TGMD-2-CH podría ser utilizado en población chilena sin inconvenientes. Por lo tanto, se propone como la herramienta de elección para determinar el nivel de desarrollo motriz de los niños chilenos, por su amplia aplicación como método de evaluación y seguimiento, 6 , 18 y por su uso generalizado a nivel internacional. 9 , 19 , 20

Las limitaciones de este estudio fueron el tamaño muestral, y el rango etario de la muestra utilizada, ya que constituyen solo un segmento de la población objetivo. Queda la interrogante de lo que sucede con los niños chilenos de tres a cuatro años, desafío pendiente para futuras investigaciones. Es también un desafío, establecer en el futuro valores normativos para la población chilena, con el objetivo de ajustar los puntajes brutos según edad, y así concluir el proceso de validación del TGMD-2-CH. Se propone realizar estudios de confiabilidad del test en una muestra representativa de la población chilena, para obtener resultados definitivos, con valores de confiabilidad mayores a los obtenidos en la presente investigación, y similares a los que se han encontrado en la literatura. 2 , 19 Se propone también ampliar la investigación en torno a la validación de instrumentos en Chile y Latinoamérica. El uso de instrumentos no validados implica construir conocimiento sobre bases cuestionables, lo cual podría significar una pérdida importante de esfuerzos y recursos.

Footnotes

a

Organization for Economic Co-operation and Development. Health at a glance 2011: OECD indicators. Paris; 2011 [citado 2015 mai 19]. Disponible en: http://www.oecd.org/els/health-systems/49105858.pdf


Articles from Revista de Saúde Pública are provided here courtesy of Universidade de São Paulo. Faculdade de Saúde Pública.

RESOURCES