Skip to main content
Revista Peruana de Medicina Experimental y Salud Publica logoLink to Revista Peruana de Medicina Experimental y Salud Publica
. 2023 Sep 26;40(3):267–277. doi: 10.17843/rpmesp.2023.403.12571
View full-text in Spanish

Cultural adaptation to quechua and psychometric analysis of the patient health questionnaire (PHQ-9) in a peruvian population

Julio Cjuno 1, Félix Julca-Guerrero 2, Yulisa Oruro-Zuloaga 3, Frinee Cruz-Mendoza 4, Admirson Auccatoma-Quispe 5, Heber Gómez Hurtado 6,7, Frank Peralta-Alvarez 8, Juan Carlos Bazo-Alvarez 9,10
PMCID: PMC10959517  PMID: 37991030

ABSTRACT

Objective

. To translate and culturally adapt the Patient Health Questionnaire (PHQ-9) to three varieties of Quechua and analyse their validity, reliability, and measurement invariance.

Materials and methods

. 1) Cultural adaptation phase: the PHQ-9 was translated from English into three variants of Quechua (Central, Chanca, Cuzco-Collao) and translated again into English. Then, experts and focus groups allowed the translations to be culturally adapted. 2) Psychometric phase: the unidimensionality of the adapted PHQ-9 was evaluated by using Confirmatory Factor Analysis (CFA), reliability was evaluated by internal consistency (Alpha and Omega), and measurement invariance according to Quechua varieties and sociodemographic variables was evaluated by using CFA, multigroups and MIMIC models (Multiple Indicator Multiple Cause).

Results

. Each of the adaptations of the PHQ-9 to the three Quechua varieties reported clear and culturally equivalent items. Subsequently, data from 970 Quechua-speaking adult men and women were analyzed. The general one-dimensional model reported an adequate fit (Comparative fit index = 0.990, Tucker-Lewis index = 0.987, Standardized root mean squared residual= 0.048, Root mean squared error of approximation=0.071); each of the Quechua varieties also showed an adequate fit. Reliability was high for all varieties (α = 0.865 - 0.915; ω = 0.833 - 0.881). The results of the multigroup CFA and MIMIC models confirmed measurement invariance according to Quechua variant, sex, residence, age, marital status and educational level.

Conclusions

. The PHQ-9 adaptations to Central Quechua, Chanca and Cuzco-Collao offer a valid, reliable and invariant measurement, confirming that comparisons can be made between the evaluated groups. Its use will benefit mental health research and care for Quechua-speaking populations.

Keywords: Patient Health Questionnaire, depression, Indigenous Peoples, Psychometrics

INTRODUCTION

Depression is a frequent mental disorder, and is caused by complex interactions between social, psychological and biological factors 1. According to the World Health Organization, more than 5% of the world population had depression in 2021 2, increasing by 25% during the COVID-19 pandemic 3. In Peru, of 57,446 respondents, 60.1% of 9383 persons with a mental health diagnosis living in the Peruvian highlands and coast, with the exception of Metropolitan Lima, had depressive symptoms during the pandemic 4. Another Peruvian study, that evaluated 31,996 participants, found that living in the highland region was an important factor for the increase in clinically relevant depressive symptoms, reporting 9.0% of moderate to severe cases, compared with 5.8% in other regions 5.

The Patient Health Questionnaire (PHQ-9) is a psychometric instrument designed to assess depressive symptoms according to the criteria of the Diagnostic and Statistical Manual of Mental Disorders - IV 6. Originally written in English with a single factor 7, it is widely used in clinical practice and research internationally 8. It has been adapted to more than 18 languages in 24 countries 9, such as French 10, Mandarin Chinese 11, Spanish 12, Russian 13, German 14, Norwegian 15, Farsi 16, Lithuanian 17) and even Kinyarwanda 18. The Spanish version of this instrument has shown good properties among Spanish speakers in Peru 1.

In a previous study on the Peruvian version of the PHQ-9 (in Spanish) 1, we reported evidence of measurement invariance according to socio-demographic variables: sex, age, educational level, socioeconomic status, marital status and area of residence (rural/urban). Such evidence allows comparisons between different groups (according to the categories of these variables), ensuring that PHQ-9 results indicate a similar underlying experience of depressive symptoms across these groups (e.g., men and women) 19. This invariance assessment has not been applied to any version of the PHQ-9 in Quechua yet. Without invariance analysis, there is no guarantee that the PHQ-9 measures depression in the same way in all Quechua-speaking groups, hence its necessity 20.

However, there is still no Quechua version of the PHQ-9 for the Peruvian population. Peru has 3,799,780 inhabitants who have Quechua as their first language, representing 13.6% of the census population in 2017 21. People ethnically self-identified as Quechua may perceive and express depressive symptoms differently than a Spanish speaker, which makes it difficult to use the PHQ-9 in Spanish. On the other hand, Quechua is a family of languages and presents much dialectal variation 22. The main varieties by number of speakers and geographical extension are: Central Quechua (CQ), Ayacucho-Chanka Quechua (ACQ) and Cuzco-Collao Quechua (CCQ), which present many differences 23,24. Phonologically, CQ has 24 phonemes, ACQ has 19 phonemes and CCQ has 28 phonemes. Morphologically, for example, the progressive action and the first person “I am going”; in QC is marked with -yka and -V (aywa-yka-a), in ACQ it is marked with -chka and -ni (ri-chka-ni) and in CCQ it is marked with -sha and -ni (ri-sha-ni). Likewise, lexically, the translation of the words “yellow” and “accelerate” is qallwash and wip in CQ, hillu and utqay in ACQ and q’illu and utqhay in CCQ, respectively 24. Thus, the linguistic variation is wide and; consequently, mutual intercomprehension among speakers of the various variants of Quechua is very difficult and almost impossible; therefore, a single survey could not be conducted using only one of the varieties. The ad hoc solution typically adopted by local users is to have a third bilingual person “translate” the questions and answers to the questionnaire (e.g., a younger family member with a different worldview than the person being assessed). However, this practice is not recommended because it introduces noise into the assessment 25. In Peru, most health personnel are not fluent in Quechua as a first or second language, as mentioned by Montesinos-Segura et al. 26 in the discussion of their study. In this sense, an appropriate assessment of depressive symptoms by health personnel in the general Quechua-speaking population is very difficult at present, given this inherent language limitation.

Therefore, the aim of our study was to translate and culturally adapt the PHQ-9 to three varieties of Quechua, and to analyze the internal structure validity, reliability and measurement invariance (by Quechua variants and sociodemographic variables) of the adapted instrument.

KEY MESSAGES

Motivation for the study. Peru is the country with the largest Quechua-speaking population in South America, but it does not have an instrument to assess depression culturally adapted to Quechua populations.

Main findings. A valid and reliable version of the PHQ-9 was obtained for use in Quechua-speaking populations of the Central, Chanca and Cuzco-Collao varieties.

Implications. This new version could be implemented in national health surveys and community mental health centers for screening and evaluation of depressive symptoms.

MATERIAL AND METHODS

Design and context

Instrumental study 27, carried out in four departments of Peru (Ancash, Ayacucho, Puno and Cuzco) according to the variety of Quechua. We selected adults from the departments of Puno and Cuzco, located in southwestern Peru in order to evaluate the Cuzco-Collao variety. Puno has 538,127 (57.0%) and Cuzco has 709,892 (74.7%) Quechua speakers 28; both departments are characterized by commercial activities, livestock farming and tourism due to their richness in historical and archaeological sites. To evaluate the variety of Quechua Chanca, we selected inhabitants of the department of Ayacucho, which has 389,045 (81.2%) Quechua speakers, mostly dedicated to commerce, livestock farming and agriculture 28. In order to evaluate the variety of Central Quechua, we selected inhabitants of the department of Ancash, which has 289,172 (34.0%) Quechua speakers, mostly engaged in commerce, agriculture and tourism 28.

Cultural adaptation phase

Translation

We used the forward translation and back translation methods during the translation process 27. The original version of the PHQ-9 (English) was translated directly into each variety of Quechua (Central, Cuzco-Collao, Chanca) by two independent translators, who are native Quechua speakers of each variety and with advanced knowledge of English. Once the translation for each variety was completed, the two translators and two native Quechua-speaking researchers met to discuss the differences in the translations. Once the discrepancies were resolved and the translations unified, we proceeded with the back translation (Quechua to English) of the three Quechua variants of the PHQ-9. This process was carried out by two translators who had English as their native language and advanced knowledge of Quechua for each variant. Once the back translations were completed, the translators for each variant met with two study researchers to verify the back translation along with the first translation, fine-tuning details and giving their approval to the final version for the three languages.

Cultural adaptation to Quechua contexts

By applying the Delphi method, we created a cultural adaptation form, which can be found at: https://doi.org/10.5281/zenodo.8312191. This form included some open questions for uncommon words in Quechua such as “depression” or “without hope”. We also sought to consult on the change of “reading newspaper” to “listening to radio”, this change involves the PHQ-9 response categories and the relationship between the PHQ-9 in Quechua with the DSM-V for the diagnosis of major depression. The Central Quechua version of the PHQ-9 was reviewed by two Quechua-speaking psychologists, who had at least three years of experience in the care of Quechua-speaking patients with depression in the provinces of Ancash; one of them had a master’s degree and the other a bachelor’s degree in psychology. The Cuzco-Collao Quechua version was evaluated by five Quechua-speaking psychologists, all with professional degrees and at least one year of experience in the care of Quechua-speaking patients with depression in Puno or Cuzco. The Chanca Quechua version was evaluated by two psychologists with professional degrees and at least one year of experience in the care of Quechua-speaking patients with depression in the provinces of Ayacucho. The interaction between each expert and the research team took place in two (Central) and four rounds (Cuzco-Collao and Chanca) of mailings. In addition, we assessed the improvements (based on the recommendations of the experts) using indicators of relevance, representativeness, clarity and cultural equivalence on a scale of 0 to 3 (where 3 was the best rating). Once all the experts rated the improvements in all indicators with a score of 3, we held a virtual meeting with the research team to evaluate the suggestions and reach a consensus.

Subsequently, a focus group (via Zoom) was organized for each variety of Quechua. The moderator for each variety was a Quechua-speaking psychologist proficient in qualitative methods. The meetings lasted approximately 60 minutes. First, we asked participants to answer the PHQ-9 in Quechua through an online version shared via Google Forms. Then, the moderator invited the participants to provide their opinion on the clarity and comprehension of the items in a language that was common and simple for Quechua speakers. Five Quechua speakers participated (three women and two men) in the focus group for the Cuzco-Collao variety; four people participated (two women and two men) for the Quechua Chanca variety; and four adults participated (three men and one woman) in the focus group for the Central Quechua variety. We considered, for the three varieties of Quechua, that the participants be bilingual (speak Quechua and Spanish) and over 18 years of age (Figure 1). The focus group participants provided a favorable opinion regarding the clarity and comprehension of the PHQ-9 in the three variants of Quechua, confirming that this adaptation is clear and in accordance with their cultural context.

Figure 1. Flow chart of the translation and cultural adaptation of the PHQ-9.

Figure 1

Psychometric analysis phase

Participants

The final version of the instrument, obtained after the previous phase, was applied to a sample of 970 adults selected by non-probabilistic convenience sampling, ensuring that for each variety of Quechua we had no less than 200 participants. This number is even higher than the recommended standard for factor analyses (20 participants per item and considering that there are 9 items, the minimum size would be 180 participants) and reported as adequate in simulation studies 29. It also complies with the minimum size calculated for factor analysis (n=218, see: https://doi.org/10.5281/zenodo.8312191). Six surveyors participated in the data collection, they presented the study to the participants, and once informed consent was obtained, they requested the participants to complete the survey via Google Forms. The collection was carried out in those towns and cities with the greatest Quechua presence. Men and women, over 18 years of age, living in urban and rural settings, located in three regions (according to Quechua variant) were included. We included inhabitants of the departments of Puno and Cusco (n=525) to evaluate the Cuzco-Collao variant, inhabitants of Ayacucho (n=226) to evaluate the Chanca variant, and inhabitants of the department of Ancash (n=219) to analyze the Central Quechua variant. All participants were bilingual Quechua speakers (Quechua and Spanish), with sufficient academic background to read Quechua (at least incomplete primary school). Those who spoke a variety of Quechua other than the three studied were excluded.

Instrument

The PHQ-9 consists of 9 items corresponding to DSM-IV depressive symptoms 6. The response options evoke the frequency of occurrence of such symptoms in the last two weeks, considering the following Likert-type scale: 0 = not at all, 1 = several days (1-6 days), 2 = most days (7-11 days), 3 = almost every day (12 days or more). The Spanish version of the PHQ-9 has demonstrated validity (e.g., goodness of fit as a unidimensional measure: CFI [comparative fit index] = 0.936; RMSEA [root mean square error of approximation] = 0.089; SRMR [standardized root mean square residual] = 0.039), as well as adequate reliability (α = ω = 0.87) in the Spanish-speaking Peruvian population 1.

Covariates

They were used to characterize the population, as well as to study the measurement invariance of the unidimensional model according to age (in years), sex (female, male), education (incomplete primary, complete primary, incomplete secondary, complete secondary, incomplete higher, complete higher), marital status (single, married/cohabiting, divorced/separated, widowed) and place of residence (rural/urban).

Procedure

For data collection, one interviewer for the Central Quechua variety, two interviewers for the Chanca Quechua variety, and three interviewers for the Cuzco-Collao Quechua variety were trained in the use and application of the instrument. All interviewers were third- or fourth-year psychology students. The interviewers identified WhatsApp groups of parents from educational institutions, Christian churches and groups of peasant community associations to whom they presented the survey in Google Forms format. Data collection began in February and ended in June 2022.

Statistical analysis

Relative and absolute frequencies were used during descriptive analysis 30. Subsequently, we conducted a Confirmatory Factor Analysis (CFA) of the unidimensional model (its unidimensionality was verified in Peru in a representative sample of 30,449 individuals: https://doi.org/10.5281/zenodo.8312191) using a WLSMV estimator (weighted robust squares with adjusted mean and variance), as we did previously 1. In addition, the WLSMV is an unbiased estimator for items with ordinal responses and non-normal distribution 31. We report the standardized betas of the model and standard goodness-of-fit measures: the chi-square (X2) for the model versus baseline, considering values <3 as acceptable; the CFI, which is adequate when >0.90; the TLI (Tucker-Lewis index), which is acceptable with values >0.90. Likewise, the SRMR and RMSEA, were considered adequate with values ≤ 0.08 32.

We assessed measurement invariance across groups defined by Quechua variants, sex and location using a multigroup CFA. The change in CFI (ΔCFI) and RMSEA (ΔRMSEA) was used as the main criterion to compare models with more constraints versus models with fewer constraints. Models first assumed configurational invariance (i.e., similar factor structure across groups) as the base model, moving up to metric invariance (i.e., similar factor loadings and factor structure across groups), strong invariance (i.e., similar thresholds, factor loadings, and factor structure across groups), and strict invariance (i.e., similar residual variances of items, thresholds, factor loadings, and factor structure across groups). Between each model, we examined whether ΔCFI < 0.01 or ΔRMSEA < 0.01 in order to establish whether the more restricted model was appropriate 30.

Alternatively, MIMIC (Multiple Indicators and Multiple Causes) models were adjusted for the evaluation of measurement invariance according to age, marital status and educational level (variables for which the multigroup CFA was not feasible). We assessed the invariance of indicator intercepts and mean differences of latent dimensions, all across groups according to these covariates. We preferred to use ∆CFI rather than ΔX2 because the former is not affected by sample size or model complexity 32. For multigroup CFA, we performed a sensitivity analysis using the method recommended by Yoon and Lai 33 for dissimilar sample sizes. In fact, each covariate was evaluated separately, comparing two types of models for each of them: 1) a saturated version where the covariate explains all the observed items, but not the latent dimensions, and 2) a version of the invariant intercept model where the covariate explains all the latent dimensions, but not the items. Similarly, the above fit indices are reported and interpreted.

Finally, reliability was determined using Cronbach’s Alpha 34) and McDonald’s Omega 35) coefficients. To ensure reproducibility, the main codes of the analysis can be found at: https://github.com/JCBAZO/R-PHQ9-Quechua. All analyses were performed in R Studio version 4.0.4, with the packages “lavaan” 36, “lavaan.survey” 37 “semTools” 38, “semPlot” 39) and “Psych” 40.

Ethical Considerations

This study was evaluated and approved by the Ethics Committee of the Faculty of Health Sciences of the Universidad Peruana Unión with report number 2022-CE-FCS-UPeU-059. The instrument was applied as a self-report in virtual format (Google Forms), designed to present the informed consent first, so only those who agreed to participate in the study accessed the survey. Authorization was requested from the copyright owner of the original instrument (Pfizer) via e-mail, who authorized its use and adaptation.

RESULTS

Cultural adaptation phase

The experts and the research team interacted until achieving the highest rating of appropriateness for each item with respect to its cultural adaptation (3 on a range of 0 to 3), highlighting its relevance, representativeness, clarity and cultural equivalence. Additionally, they provided valuable suggestions which are mentioned below.

Some recommendations contributed to improve the adaptation of the word “depression”, which was initially translated as “llaqui”. Experts suggested to add “sinchi”, which gives a greater intensity, leaving “sinchi llakisqa” (a lot sadness) as the best understanding of depression (item 2). Regarding the expression “without hope”, the experts recommended implementing the question as “manañan q’anchay karqanchu kausayñiykipi / yanqallañan kausaranki” (item 2). For contextual reasons, the daily activity “reading the newspaper” was changed to “listening to the radio”, because the latter is the most used media in the three regions (item 7).

The response options (Likert-type) of the translated PHQ-9 also required special attention on the part of the judges and focus group participants. In particular, the category “almost every day” presented problems of clarity in its translation. The team’s final recommendation was to use the expressions “Mana hayk’aqpas”, “Wakin p’unchawkunalla”, “Ashka p’unchawkuna”, “Yaqa llapa p’unchawkuna”, representing the Spanish equivalent of “Never”, “Some days”, “Several days”, “Almost every day”.

Psychometric analysis phase

Characterization data

Of the 970 bilingual participants, 560 (57.7%) were female, 580 (59.8%) were between 18 and 30 years old, 621 (64%) reported being currently at or having completed college, 577 (59.5%) were single, and 614 (63.3%) lived in an urban area (Table 1).

Table 1. Characteristics of the study participants.

Characteristics Total Central Chanca Cuzco-Collao
(n=970) (n=219) (n=226) (n=525)
n (%) n (%) n (%) n (%)
Sex
Women 560 57.7 122 55.7 141 62.4 297 56.6
Men 410 42.3 97 44.3 85 37.6 228 43.4
Age (years)
18-30 580 59.8 115 52.5 178 78.8 287 54.7
31-40 166 17.1 41 18.7 22 9.7 103 19.6
41-50 120 12.4 23 10.5 18 8.0 79 15.1
51-68 104 10.7 40 18.3 8 3.5 56 10.6
Education
Incomplete primary school 42 4.3 0 0.0 9 4.0 33 6.3
Complete primary school 38 3.9 4 1.8 2 0.9 32 6.1
Incomplete secondary school 40 4.2 8 3.7 8 3.5 24 4.6
Complete secondary school 229 23.6 35 16.0 19 8.4 175 33.3
Incomplete higher education 325 33.5 75 34.2 114 50.4 136 25.9
Complete higher education 296 30.5 97 44.3 74 32.8 125 23.8
Civil status
Single 577 59.5 131 59.8 167 73.9 279 53.1
Married/Cohabitant 335 34.5 68 31.1 53 23.4 214 40.7
Divorced/Separated 36 3.7 16 7.3 4 1.8 16 3.1
Widow 22 2.3 4 1.8 2 0.9 16 3.1
Residence
Urban 614 63.3 155 70.8 144 63.7 315 60.0
Rural 356 36.7 64 29.2 82 36.3 210 40.0

Validity of internal structure

The three final instruments (one for each variety of Quechua) were validated independently. The single-factor model reported adequate goodness-of-fit values for the three varieties of Quechua (Central, Chanca and Cuzco-Collao), as well as for the total sample (CFI= 0.990; TLI= 0.987; SRMR=0.048; RMSEA= 0.071) (Table 2). On the other hand, the sensitivity analysis for the multigroup CFA reported results similar to those shown here. The only latent factor of the measurement model (depression) loaded a minimum of λ = 0.57 and a maximum of λ = 0.79 to the PHQ-9 items (Figure 2).

Table 2. Goodness of fit of the unidimensional PHQ-9 measurement model and reliability, of the total sample and by Quechua variants.

Goodness-of-fit index Total (N=970) Central (n=219) Chanca (n=226) Cuzco-Collao (n=525)
χ2 (36) 13513 2381 2653 10041
CFI 0.990 0.968 0.998 0.995
TLI 0.987 0.958 0.997 0.994
SRMR 0.048 0.082 0.029 0.042
RMSEA 0.071 0.112 0.048 0.058
Alpha 0.895 0.865 0.877 0.915
Omega 0.861 0.834 0.833 0.881

X2: Chi-square, X2(df): for model versus baseline, df: degrees of freedom, CFI: comparative fit index, TLI: Tucker-Lewis Index, SRMR: standardized root mean square residual, RMSEA: root mean square error of approximation.

Figure 2. General measurement model of the PHQ-9 with betas and standardized errors (N=970).

Figure 2

Reliability

The PHQ-9 reported good reliability for all Quechua varieties, with Cronbach’s Alpha values between 0.865 and 0.915, and with Omega values between 0.833 and 0.881 (Table 2).

Measurement invariance

The results of the multigroup CFA confirm the invariance of measurement according to Quechua variants, sex and place of residence (Table 3). The configural model showed good fit to the data (CFI = 0.935) for the three Quechua variants. After confirming configural invariance, metric invariance was proven with ΔCFI = 0.001 and ΔRMSEA=0.007 (both <0.01). Then, the values of ΔCFI=0.018 and ΔRMSEA=0.005 demonstrated strong invariance, with at least the latter being <0.01. Finally, strict invariance was confirmed with ΔCFI=0.009 and ΔRMSEA=0.001. The results and interpretation were similar for the invariance models according to sex and residence (Table 3).

Table 3. Fit indices of the measurement invariance tests between groups according to Quechua variants, sex and place of residence (N=970).

Variable PHQ-9 (Internal structure) Invariance (Model) X2 df p-value CFI Δ CFI RMSEA Δ RMSEA
Quechua variant Unidimensional 1. Configural 207.1 81 - 0.965 - 0.100 -
2. Metric 296.3 97 <0.001 0.964 0.001 0.093 0.007
3. Strong 423.2 131 <0.001 0.947 0.018 0.097 0.005
4. Strict 523.9 149 <0.001 0.938 0.009 0.098 0.001
Sex Unidimensional 1. Configural 182.0 54 - 0.963 - 0.098 -
2. Metric 192.0 62 0.683 0.971 0.008 0.082 0.017
3. Strong 201.3 79 0.539 0.970 0.001 0.074 0.008
4. Strict 212.1 88 0.443 0.971 0.002 0.068 0.006
Residence (urban/rural) Unidimensional 1. Configural 180.5 54 - 0.962 - 0.098 -
2. Metric 220.7 62 <0.001 0.962 0.000 0.091 0.007
3. Strong 214.3 79 1.000 0.965 0.003 0.078 0.013
4. Strict 241.8 88 0.005 0.963 0.002 0.075 0.002

X2: Chi-square, df: degrees of freedom, CFI: comparative fit index, RMSEA: root mean squared error of approximation, Δ: difference, X2(df): for model versus baseline (Satorra-Betler).

The results of the MIMIC models confirmed the invariance by age, marital status and educational level (Table 4). The CFI and TLI values were >0.98 for all the variables, while the SRMR and RMSEA values were <0.08. Likewise, the absolute values of ΔCFI, ΔTLI and ΔRMSEA were <0.01.

Table 4. Goodness of fit of the MIMIC models for the PHQ-9 (N=970).

Covariable Model CFI TLI RMSEA SRMR Δ CFI Δ TLI Δ RMSEA
Age Saturated MIMIC 0.990 0.984 0.071 0.048 - - -
MIMIC of invariant intercept 0.990 0.987 0.063 0.048 0.000 0.003 -0.008
Civil status Saturated MIMIC 0.990 0.984 0.070 0.048 - - -
MIMIC of invariant intercept 0.990 0.987 0.064 0.048 0.000 0.003 -0.006
Education Saturated MIMIC 0.991 0.985 0.069 0.047 - - -
MIMIC of invariant intercept 0.990 0.987 0.064 0.047 -0.001 0.002 -0.005

MIMIC: Multiple Indicators and Multiple Causes, CFI: comparative fit index, TLI: Tucker-Lewis index, SRMR: standardized root mean square residual, RMSEA: root mean square error of approximation, Δ: difference. Comparisons (Δ) were made between the saturated MIMIC model and the MIMIC of invariant intercept model for each covariate studied.

DISCUSSION

This is the first study on the cultural adaptation to Quechua of the PHQ-9, a standardized instrument used internationally to assess depressive symptoms. After completing a back-and-forth translation (English-Quechua-English) for the three variants of Quechua, we carried out the cultural adaptation with the help of expert judges and members of the target population, all Quechua speakers. The adapted version offers a unidimensional, reliable and invariant measurement across groups according to Quechua variant, gender, residence, age, marital status and educational level. This invariance confirms that comparisons can be made with the PHQ-9 Quechua measurements across the aforementioned groups. The final instruments can be found in the Supplementary Material.

This cultural adaptation opens new possibilities for the assessment of depression in the Peruvian Quechua-speaking population, both for research and clinical purposes. Previously, a narrative review that searched Pubmed, Web of Science and Scopus, included studies in English and/or Spanish, found seven studies that assessed depression in Quechua-speaking populations 41. Only two of these studies used an instrument translated and adapted into Quechua, the Hopkins Symptoms Checklist (HSCL-25); however, this adaptation only considered one variant: Ayacuchan Quechua 42. The distinction of variants is essential to be able to cover larger groups of people in the different regions of Peru, otherwise, the problem of having to resort to a third person to translate or interpret the questions and answers at the time of application persists. The PHQ-9 adapted to three versions of Quechua reduces the need for such support, facilitating assessment both in research (e.g., DHS-type health surveys) and in clinical settings (e.g., standardized instrument required according to DSM-V diagnostic criteria).

The adapted instruments have psychometric properties similar to those of the original PHQ-9 and the one validated for Spanish-speaking Peruvians. In both cases, the internal structure of the PHQ-9 was determined to be unidimensional, i.e., a single latent representing depression and expressed through each of the nine symptoms assessed by the instrument 1,7. Internationally, recent systematic evidence supports the unidimensional model across cultures 43, with such acceptance that the debate is now focused on defining the most accurate cut-off points for a single measure of the PHQ-9 when used, for example, to screen for depression 44. Likewise, the good reliability of the PHQ-9 in Quechua is in agreement with the findings of the study in Spanish-speaking Peruvians 1, and with what has been observed in countries with a similar sociocultural context such as Chile (α=0.891 and ω=0.896) 45, even in other very different sociocultural contexts such as Kenya (α=0.840 and ω=0.840) 46.

The PHQ-9 in the three varieties of Quechua have shown measurement invariance, similar to the version for Peruvian Spanish speakers and other versions of the PHQ-9 internationally. In China, invariance was reported according to age and sex groups, as well as strict invariance 11. In Kenya, configurational, metric and scalar invariance of the model was determined according to the presence of HIV infection, sex and age groups 46. In the United States, the instrument showed configurational, metric and scalar measurement invariance when comparing English-speaking and Spanish-speaking women 47, as well as when comparing college students by age group and race 48. A Norwegian study reported invariance according to the presence or absence of eating disorders in the female population 15. A recent systematic review confirmed measurement invariance in at least 18 groups, including those determined by the sociodemographic variables included in this study 43.

The present study demonstrates configurational, metrical, scalar and strict invariance according to Quechua variants, gender and place of residence. Thus, our findings suggest that it is possible to make comparisons between Peruvians who speak different Quechua variants, as well as comparisons between men and women and between urban and rural residents. In the same sense, the PHQ-9 in Quechua showed measurement invariance according to age, marital status and educational level, with similar practical implications.

We recognize some strengths and limitations of the present study that should be highlighted. This is the first study of cultural adaptation to Quechua of the PHQ-9, a tool widely used internationally for the assessment of depressive symptoms. This research was carried out in three different regions of Peru, which are usually neglected in the study and care of their mental health. However, since this was a written version, participants were required to have a minimum level of schooling, which is not always possible to find in the target population. Future studies should overcome this barrier in order to reach Quechua speakers who do not yet know how to read or write. Also, although our study adhered to international standards in order to achieve the best possible cultural adaptation, we understand that there are subtle aspects specific to each Quechua-speaking culture that we have not been able to assess regarding their experiences related to the symptoms that universally define depression. Therefore, it is possible that the adapted instrument may not be able to measure some of the depressive symptoms in a completely correct and/or accurate way in regions of Peru where the Spanish-speaking culture still has very little presence. On the other hand, altitude may be associated with the presence of certain depressive symptoms, and therefore its inclusion may be informative (e.g., in an invariance analysis). Unfortunately, we were unable to assess altitude for logistic reasons, so it would be useful for future studies to include this variable. Also, unlike the multigroup CFA, the MIMIC models can only evaluate the invariant intercept models and factorial means. Therefore, for the variables where we applied MIMIC, we assume that the rest of the structural and measurement parameters (e.g., factor loadings, variance/covariance error, variance/covariance factor) are the same across all levels of these variables. Another limitation is related to the change made in item 7, from “reading newspaper” to “listening to radio”. Although this change is intended to improve the cultural adaptation of the instrument, it is possible that it could cause variations in the measurement of symptoms compared to the Spanish version of the PHQ-9. These variations could be caused by the different cultural characteristics of each Quechua-speaking society. Also, the number of participants was different for each department/variety, and the sampling was non-probabilistic, which formally affects the external validity of the estimates. Nevertheless, this is the best estimate of validity/reliability of the PHQ-9 in Quechua available to date.

In terms of public health, this is an important first step towards knowledge and attention to the mental health of historically underserved populations. The three versions of the PHQ-9 in Quechua can be gradually incorporated into national health surveys (e.g. ENDES), and can also be used by community mental health centers in the different regions of the country as a valid and reliable screening tool.

In conclusion, the PHQ-9 adapted to three variants of Quechua (Central, Chanca and Cuzco-Collao) offers a valid, reliable and invariant unidimensional measurement across groups according to Quechua variant, sex, residence (rural/urban), age, marital status and educational level. This invariance confirms that comparisons can be made with the measurements of the three Quechua versions of the PHQ-9 across the aforementioned groups.

Funding.: The research was partially funded by the Universidad Peruana Unión.

Supplementary material.
Available in the electronic version of the RPMESP.
Cite as:

Cjuno J, Julca-Guerrero F, Oruro-Zuloaga Y, Cruz-Mendoza F, Auccatoma A, Gómez-Hurtado H, et al. Cultural adaptation to quechua and psychometric analysis of the patient health questionnaire (PHQ-9) in a peruvian population. Rev Peru Med Exp Salud Publica. 2023;40(3):267-77. doi: 10.17843/rpmesp.2023.403.12571.

References

  • 1.Villarreal-Zegarra D, Copez-Lonzoy A, Bernabé-Ortiz A, Melendez-Torres GJ, Bazo-Alvarez JC. Valid group comparisons can be made with the Patient Health Questionnaire (PHQ-9) A measurement invariance study across groups by demographic characteristics. PLOS ONE. 2019;14(9):e0221717. doi: 10.1371/journal.pone.0221717. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 2.World Health Organization . Depression. Geneva: WHO; 2021. [5 de julio de 2022]. Internet. Disponible en: https://www.who.int/health-topics/depression . [Google Scholar]
  • 3.World Health Organization . COVID-19 pandemic triggers 25% increase in prevalence of anxiety and depression worldwide. Geneva: WHO; 2022. [5 de julio de 2022]. Disponible en: https://www.who.int/news/item/02-03-2022-covid-19-pandemic-triggers-25-increase-in-prevalence-of-anxiety-and-depression-worldwide . [Google Scholar]
  • 4.Antiporta DA, Cutipé YL, Mendoza M, Celentano DD, Stuart EA, Bruni A. Depressive symptoms among Peruvian adult residents amidst a National Lockdown during the COVID-19 pandemic. BMC Psychiatry. 2021;21(1):111–111. doi: 10.1186/s12888-021-03107-3. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 5.Hernández-Vásquez A, Vargas-Fernández R, Bendezu-Quispe G, Grendas LN. Depression in the Peruvian population and its associated factors analysis of a national health survey. J Affect Disord. 2020;273(1):291–297. doi: 10.1016/j.jad.2020.03.100. [DOI] [PubMed] [Google Scholar]
  • 6.American Psychiatric Association . The Diagnostic and Statistical Manual of Mental Disorders, Fouth Edition, Text Revision (DSM-4) 2013. [13 de julio de 2022]. Internet. Disponible en: https://psychiatry.org:443/psychiatrists/practice/dsm . [Google Scholar]
  • 7.Kroenke K, Spitzer RL, Williams JBW. The PHQ-9 Validity of a Brief Depression Severity Measure. J Gen Intern Med. 2001;16(9):606–613. doi: 10.1046/j.1525-1497.2001.016009606.x. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 8.Obbarius A, van Maasakkers L, Baer L, Clark DM, Crocker AG, de Beurs E. Standardization of health outcomes assessment for depression and anxiety recommendations from the ICHOM Depression and Anxiety Working Group. Qual Life Res. 2017;26(12):3211–3225. doi: 10.1007/s11136-017-1659-5. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 9.El-Den S, Chen TF, Gan YL, Wong E. O'Reilly CL. The psychometric properties of depression screening tools in primary healthcare settings A systematic review. J Affect Disord. 2018;225(1):503–522. doi: 10.1016/j.jad.2017.08.060. [DOI] [PubMed] [Google Scholar]
  • 10.Arthurs E, Steele RJ, Hudson M, Baron M, Thombs BD. Group Canadian Scleroderma Research Are Scores on English and French Versions of the PHQ-9 Comparable An Assessment of Differential Item Functioning. PLOS ONE. 2012;7(12):e52028. doi: 10.1371/journal.pone.0052028. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 11.Leung D, Wah Y, Leung SF, Chiang V, Yuen A. Measurement invariances of the PHQ-9 across gender and age groups in Chinese adolescents. Asia-Pacific Psychiatry. 2020;12:e12381. doi: 10.1111/appy.12381. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 12.Muñoz-Navarro R, Cano-Vindel A, Medrano LA, Schmitz F, Ruiz-Rodríguez P, Abellán-Maeso C. Utility of the PHQ-9 to identify major depressive disorder in adult patients in Spanish primary care centres. BMC Psychiatry. 2017;17(1):291–291. doi: 10.1186/s12888-017-1450-8. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 13.Pogosova NV, Dovzhenko TV, Babin AG, Kursakov AA, Vygodin VA. Russian version of PHQ-2and 9 questionnaires: Sensitivity and specificity in detection of depression in outpatient general medical practice. Cardiovascular Therapy and Prevention. 2014;13(3):18–24. https://cardiovascular.elpub.ru/jour/article/view/51 [Google Scholar]
  • 14.Reich H, Rief W, Brähler E, Mewes R. Cross-cultural validation of the German and Turkish versions of the PHQ-9 an IRT approach. BMC Psychology. 2018;6(1):26–26. doi: 10.1186/s40359-018-0238-z. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 15.Wisting L, Johnson SU, Bulik CM, Andreassen OA, Rø Ø, Bang L. Psychometric properties of the Norwegian version of the Patient Health Questionnaire-9 (PHQ-9) in a large female sample of adults with and without eating disorders. BMC Psychiatry. 2021;21(1):6–6. doi: 10.1186/s12888-020-03013-0. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 16.Maroufizadeh S, Omani-Samani R, Almasi-Hashiani A, Amini P, Sepidarkish M. The reliability and validity of the Patient Health Questionnaire-9 (PHQ-9) and PHQ-2 in patients with infertility. Reprod Health. 2019;137(16):e. doi: 10.1186/s12978-019-0802-x. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 17.Pranckeviciene A, Saudargienne A, Gecaite-Stonciene J, Liaugaudaite V, Griskova-Bulanova I, Simkute D. Validation of the patient health questionnaire-9 and the generalized anxiety disorder-7 in Lithuanian student sample. Plos One. 2022;27(1):e0263027. doi: 10.1371/journal.pone.0263027. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 18.Sebera F, Nickenig JR, Umwiringirwa J, Teuwen D, Boon P, Dedeken P. Validity, reliability and cut-offs of the Patient Health Questionnaire-9 as a screening tool for depression among patients living with epilepsy in Rwanda. Plos One. 2020;12(6):e0234095. doi: 10.1371/journal.pone.0234095. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 19.Baas KD, Cramer AOJ, Koeter MWJ, van de Lisdonk EH, van Weert HC, Schene AH. Measurement invariance with respect to ethnicity of the Patient Health Questionnaire-9 (PHQ-9) J Affect Disord. 2011;129(1):229–235. doi: 10.1016/j.jad.2010.08.026. [DOI] [PubMed] [Google Scholar]
  • 20.Putnick DL, Bornstein MH. Measurement Invariance Conventions and Reporting The State of the Art and Future Directions for Psychological Research. Dev Rev. 2016;41:71–90. doi: 10.1016/j.dr.2016.06.004. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 21.Andrade L. Diez noticias sobre el quechua en el último censo peruano. Letras (Lima) 2019;90(132):41–70. doi: 10.30920/letras.90.132.2. [DOI] [Google Scholar]
  • 22.Luykx A, Rivera FG, Julca F. Communicative strategies across Quechua languages. International Journal of the Sociology of Language. 2016;2016(240):159–191. doi: 10.1515/ijsl-2016-0018. [DOI] [Google Scholar]
  • 23.Julca F. Quechua ancashino. Una mirada actual. Lexis. 2011;35(2):430–430. https://repositorio.pucp.edu.pe/index/handle/123456789/183128 [Google Scholar]
  • 24.Cerrón-Palomino R. Lingüística quechua. Vol. 2. Lima: Centro de Estudios Rurales Andinos "Bartolomé de las Casas"; 1987. pp. 434–434.https://cbc.org.pe/producto/linguistica-quechua-2/ [Google Scholar]
  • 25.American Educational Research Association American Psychological Association National Council on Measurement in Education . Estándares para Pruebas Educativas y Psicológicas. 2. Estados Unidos: American Educational Research Association; 2018. https://www.testingstandards.net/uploads/7/6/6/4/76643089/spanish_standards_pdf.pdf [Google Scholar]
  • 26.Montesinos-Segura R, Maticorena-Quevedo J, Chung-Delgado K, Pereyra-Elías R, Taype-Rondan A, Mayta-Tristán P. Place of origin associated with depressive symptoms in health professionals performing social health service in Ancash, Peru, 2015. Rural Remote Health. 2018;18(2):4331–4331. doi: 10.22605/RRH4331. [DOI] [PubMed] [Google Scholar]
  • 27.Hambleton R, Merenda M, Spielberger C. Adapting Educational and Psychological Tests for Cross-Cultural Assessment. [21 de mayo de 2021];Psychology Press. 2005 1 Internet. Disponible en: https://www.routledge.com/Adapting-Educational-and-Psychological-Tests-for-Cross-Cultural-Assessment/Hambleton-Merenda-Spielberger/p/book/9780805861761 . [Google Scholar]
  • 28.Instituto Nacional de Estadística e Informática . Perú: Perfil sociodemográfico Informe nacional - Censos nacionales 2017: XII de Población, VII de Vivienda y III de Comunidades Indígenas. Lima: INEI; 2018. https://www.inei.gob.pe/media/MenuRecursivo/publicaciones_digitales/Est/Lib1539/libro.pdf [Google Scholar]
  • 29.Kyriazos TA. Applied Psychometrics Sample Size and Sample Power Considerations in Factor Analysis (EFA, CFA) and SEM in General. Psychology. 2018;09(08):2207–2207. doi: 10.4236/psych.2018.98126. [DOI] [Google Scholar]
  • 30.Widaman KF, Reise SP. The science of prevention: Methodological advances from alcohol and substance abuse research. Washington, DC, US: American Psychological Association; 1997. Exploring the measurement invariance of psychological instruments: Applications in the substance use domain; pp. 281–324. [Google Scholar]
  • 31.Brauer K, Ranger J, Ziegler M. Confirmatory Factor Analyses in Psychological Test Adaptation and Development. Psychological Test Adaptation and Development. 2023;4(1):4–12. doi: 10.1027/2698-1866/a000034. [DOI] [Google Scholar]
  • 32.Cheung GW, Rensvold RB. Evaluating Goodness-of-Fit Indexes for Testing Measurement Invariance. Structural Equation Modeling: A Multidisciplinary Journal. 2002;9(2):233–255. doi: 10.1207/S15328007SEM0902_5. [DOI] [Google Scholar]
  • 33.Yoon M, Lai MHC. Testing Factorial Invariance With Unbalanced Samples. Structural Equation Modeling: A Multidisciplinary Journal. 2018;25(2):201–213. doi: 10.1080/10705511.2017.1387859. [DOI] [Google Scholar]
  • 34.Domínguez-Lara SA, Merino-Soto C. ¿Por qué es importante reportar los intervalos de confianza del coeficiente alfa de Cronbach? Revista Latinoamericana de Ciencias Sociales, Niñez y Juventud. 2015;13(2):4–4. https://www.redalyc.org/pdf/773/77340728053.pdf Internet. [Google Scholar]
  • 35.McDonald R. Test Theory : A Unified Treatment. [1 de julio de 2022];Psychology Press. 1999 Internet. Disponible en: https://www.taylorfrancis.com/books/mono/10.4324/9781410601087/test-theory-roderick-mcdonald . [Google Scholar]
  • 36.Rosseel Y. lavaan: An R Package for Structural Equation Modeling. Journal of Statistical Software. 2012;48(2):1–36. doi: 10.18637/jss.v048.i02. [DOI] [Google Scholar]
  • 37.Oberski D. lavaan.survey: An R Package for Complex Survey Analysis of Structural Equation Models. Journal of Statistical Software. 2014;57:1–27. doi: 10.18637/jss.v057.i01. [DOI] [Google Scholar]
  • 38.Terrence DJ. Useful Tools for Structural Equation Modeling. 2022. https://cran.r-project.org/web/packages/semTools/semTools.pdf Internet. [Google Scholar]
  • 39.Epskamp S. semPlot: Unified Visualizations of Structural Equation Models. Structural Equation Modeling A Multidisciplinary Journal. 2015;22(3):474–483. doi: 10.1080/10705511.2014.937847. [DOI] [Google Scholar]
  • 40.Komperda R. Computer-Aided Data Analysis in Chemical Education Research (CADACER): Advances and Avenues. American Chemical Society; 2017. Likert-Type Survey Data Analysis with R and RStudio; pp. 91–116. ACS Symposium Series; vol. 1260. [DOI] [Google Scholar]
  • 41.Cjuno J, Figueroa-Quiñones J, Marca-Dueñas GG, Esteban RFC. Producción científica sobre depresión en poblaciones quechua hablantes: una revisión narrativa. Terapia Psicológica. 2021:163–174. doi: 10.4067/s0718-48082021000200163. [DOI] [Google Scholar]
  • 42.Tremblay J, Pedersen D, Errazuriz C. Assessing Mental Health Outcomes of Political Violence and Civil Unrest in Peru. Int J Soc Psychiatry. 2009;55(5):449–463. doi: 10.1177/0020764009103214. [DOI] [PubMed] [Google Scholar]
  • 43.Lamela D, Soreira C, Matos P, Morais A. Systematic review of the factor structure and measurement invariance of the Patient Health Questionnaire-9 (PHQ-9) and validation of the Portuguese version in community settings. J Affect Disord. 2020;276:220–233. doi: 10.1016/j.jad.2020.06.066. [DOI] [PubMed] [Google Scholar]
  • 44.Negeri ZF, Levis B, Sun Y, He C, Krishnan A, Wu Y. Accuracy of the Patient Health Questionnaire-9 for screening to detect major depression updated systematic review and individual participant data meta-analysis. BMJ. 2021;375:n2183–n2183. doi: 10.1136/bmj.n2183. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 45.Saldivia S, Aslan J, Cova F, Vicente B, Inostroza C, Rincón P. Propiedades psicométricas del PHQ-9 (Patient Health Questionnaire) en centros de atención primaria de Chile. Rev Med Chil. 2019;147(1):53–60. doi: 10.4067/S0034-98872019000100053. [DOI] [PubMed] [Google Scholar]
  • 46.Mwangi P, Nyongesa M, Koot H, Cuijpers P, Newton C, Abubakar A. Validation of a Swahili version of the 9-item Patient Health Questionnaire (PHQ-9) among adults living with HIV compared to a community sample from Kilifi, Kenya. J Affect Disord Rep. 2020;1 doi: 10.1016/j.jadr.2020.100013. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 47.Merz EL, Malcarne VL, Roesch SC, Riley N, Sadler GR. A Multigroup Confirmatory Factor Analysis of the Patient Health Questionnaire-9 among English- and Spanish-speaking Latinas. Cultur Divers Ethnic Minor Psychol. 2011;17(3):309–316. doi: 10.1037/a0023883. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 48.Keum BT, Miller MJ, Inkelas KK. Testing the factor structure and measurement invariance of the PHQ-9 across racially diverse U S. college students. Psychological Assessment. 2018;30(8):1096–1106. doi: 10.1037/pas0000550. [DOI] [PubMed] [Google Scholar]
Rev Peru Med Exp Salud Publica. 2023 Sep 26;40(3):267–277. [Article in Spanish]

Adaptación cultural al Quechua y análisis psicométrico del Patient Health Questionnaire (PHQ-9) en población peruana

Julio Cjuno 1, Félix Julca-Guerrero 2, Yulisa Oruro-Zuloaga 3, Frinee Cruz-Mendoza 4, Admirson Auccatoma-Quispe 5, Heber Gómez Hurtado 6,7, Frank Peralta-Alvarez 8, Juan Carlos Bazo-Alvarez 9,10

RESUMEN

Objetivo

. Traducir y adaptar culturalmente el Patient Health Questionnaire (PHQ-9) a tres variedades del quechua y analizar su validez, confiabilidad e invarianza.

Materiales y métodos

. 1) Fase de adaptación cultural: el PHQ-9 fue traducido del inglés a tres variantes del quechua (Central, Chanca, Cuzco-Collao) y traducido nuevamente al inglés, posteriormente expertos y grupos focales permitieron adaptar culturalmente las traducciones. 2) Fase psicométrica: se evaluó la uni-dimensionalidad del PHQ-9 adaptado mediante un Análisis Factorial Confirmatorio (CFA), la confiabilidad se evaluó mediante consistencia interna (Alpha y Omega), y la invarianza de medida según variedades del quechua y variables sociodemográficas se evaluó empleando CFA multigrupos y modelos MIMIC (Múltiples Indicadores y Múltiples Causas).

Resultados

. Cada una de las adaptaciones del PHQ-9 a las tres variedades de quechua reportaron ítems claros y culturalmente equivalentes. Posteriormente, con 970 datos de quechuahablantes adultos varones y mujeres, el modelo general unidimensional reportó un ajuste adecuado (índice de ajuste comparativo: 0,990, índice de Tucker-Lewis: 0,987, residuo estandarizado cuadrático medio: 0,048, raíz del error cuadrático medio de aproximación: 0,071), lo mismo ocurrió para cada variedad del quechua. La confiabilidad fue alta para todas las variedades (α = 0,865 - 0,915; ω = 0,833 - 0,881). Los resultados del CFA multigrupos y modelos MIMIC confirmaron invarianza de medida según variante del quechua, sexo, residencia, edad, estado civil y nivel educativo.

Conclusiones

. Las adaptaciones del PHQ-9 a Quechua Central, Chanca y Cuzco-Collao ofrecen una medición válida, confiable e invariante, confirmando que se pueden hacer comparaciones en los grupos evaluados. Su uso beneficiará a la investigación y a la atención en salud mental de poblaciones quechuahablantes.

Palabras clave: Cuestionario de Salud del Paciente, Depresión, Pueblos Indígenas, Psicometría

INTRODUCCIÓN

La depresión es un trastorno mental común, cuyas causas incluyen interacciones complejas entre factores sociales, psicológicos y biológicos 1. Según el reporte de la Organización Mundial de la Salud, durante el 2021 la depresión estuvo presente en más del 5% de adultos de la población mundial 2, incrementándose en un 25% más durante la pandemia por COVID-193. En Perú, de 57 446 encuestados, el 60,1% de personas con algún diagnóstico (n=9383) de salud mental que vivían en la sierra y costa peruana a excepción de Lima Metropolitana presentaron síntomas depresivos durante la pandemia 4. Otro estudio peruano, que evaluó a 31 996 participantes, encontró que vivir en la región de la sierra era un factor importante para el incremento de síntomas depresivos clínicamente relevantes, reportando 9,0% de casos moderados a severos, frente a un 5,8% en otras regiones 5.

El Patient Health Questionnaire (PHQ-9) es un instrumento psicométrico diseñado para evaluar síntomas depresivos según los criterios del Diagnostic and Statistical Manual of Mental Disorders - IV6. Originalmente escrito en inglés con un solo factor 7, es muy usado en la práctica clínica e investigación a nivel internacional 8. Cuenta con numerosas adaptaciones en más de 18 idiomas en 24 países 9, tales como francés 10, chino mandarín11, español 12, ruso 13, alemán 14, noruego 15, persa 16, lituano 17) e incluso kinyarwanda 18. La versión en español de este instrumento ha mostrado buenas propiedades entre hispanohablantes del Perú 1.

En un estudio previo sobre la versión peruana del PHQ-9 (en español) 1, reportamos evidencias de invarianza de medida según variables socio-demográficos: sexo, edad, nivel educativo, nivel socioeconómico, estado civil y área de residencia (rural/urbano). Dicha evidencia permite realizar comparaciones entre diferentes grupos (según las categorías de estas variables), garantizando que las mediciones del PHQ-9 señalan una experiencia subyacente de síntomas depresivos ‘similar a través de estos grupos’ (v.g., hombres y mujeres) 19. Esta evaluación de invarianza no se ha realizado aún para ninguna versión del PHQ-9 en quechua. Sin el análisis de invarianza, no hay una garantía de que el PHQ-9 mida la depresión de la misma manera en todos los grupos de quechuahablantes, de allí su necesidad 20.

No obstante, aún no se tiene una versión en quechua del PHQ-9 para población peruana. El Perú cuenta con 3 799 780 habitantes que tienen al quechua como primera lengua, lo que representa un 13,6% de la población censada en 2017 21. Las personas autoidentificadas étnicamente como quechuas pueden percibir y expresar los síntomas depresivos de forma diferente a un hispano hablante lo que dificulta el uso del PHQ-9 en español. Por otro lado, el quechua es una familia de lenguas y presenta mucha variación dialectal 22. Las variedades mayores por el número de hablantes y extensión geográfica son: quechua Central (QC), quechua Ayacucho-Chanka (QAC) y quechua Cuzco-Collao (QCC), los cuales presentan muchas diferencias 23,24. En lo fonológico, el QC tiene 24 fonemas, el QAC tiene 19 fonemas y el QCC cuenta con 28 fonemas. En lo morfológico, por ejemplo, la acción progresiva y la primera persona actora ‘estoy yendo’; en el QC se marca con -yka y -V (aywa-yka-a), en QAC se marca con -chka y -ni (ri-chka-ni) y en QCC se marca con -sha y -ni (ri-sha-ni). Asimismo, en lo léxico, las palabras ‘amarillo’ y ‘acelerar’ en el QC corresponden a qallwash y wip, en QAC hillu y utqay y en QCC q’illu y utqhay, respectivamente 24. Así, la variación lingüística es amplia y; consecuentemente, la intercomprensión mutua entre los hablantes de las diversas variantes del quechua es muy difícil y casi imposible, por lo que no se podría realizar una encuesta única usando solo una de las variedades. La solución ad hoc típicamente adoptada por usuarios locales consiste en asistirse de una tercera persona bilingüe que “traduzca” las preguntas y respuestas al cuestionario (v.g., un familiar más joven con una cosmovisión distinta a la persona evaluada). Sin embargo, esta práctica no es recomendable pues introduce ruido en la evaluación 25. En Perú, la mayor parte del personal de salud no domina el quechua como primer o segundo idioma, tal y como lo menciona Montesinos-Segura et al. 26 en la discusión de su estudio. En tal sentido, una apropiada evaluación de los síntomas depresivos realizada por el personal de salud a la población general quechua-hablante es muy difícil en la actualidad, dada esta limitación inherente al idioma.

Por lo tanto, el objetivo de nuestro estudio fue desarrollar la traducción y adaptación cultural del PHQ-9 para tres variedades del quechua, y analizar la validez de estructura interna, confiabilidad e invarianza de medida (por variantes del quechua y variables sociodemográficas) del instrumento adaptado.

MENSAJE CLAVE

Motivación para realizar el estudio. Perú es el país con mayor población quechuahablante en Sudamérica, pero no cuenta con un instrumento para evaluar la depresión adaptado culturalmente a poblaciones quechuas.

Principales hallazgos. Se obtuvo una versión del PHQ-9 válida y confiable para ser usada en poblaciones quechuahablantes de la variedad Central, Chanca y Cuzco-Collao.

Implicancias. Esta nueva versión podrá implementarse en las encuestas de salud nacionales y centros de salud mental comunitarios para tamizaje y evaluación de síntomas depresivos.

MATERIAL Y MÉTODOS

Diseño y contexto

Estudio instrumental 27, desarrollado en cuatro departamentos del Perú (Ancash, Ayacucho, Puno y Cuzco) según la variedad del quechua. Para evaluar la variedad Cuzco-Collao, seleccionamos adultos de los departamentos de Puno y Cuzco, ubicados al suroeste del territorio peruano. Puno cuenta con 538 127 (57,0%) y Cuzco con 709 892 (74,7%) quechuahablantes 28; ambos departamentos se caracterizan por desarrollar actividades comerciales, ganadería y turismo por estar en lugares históricos y arqueológicos. Para evaluar la variedad de quechua Chanca, seleccionamos a habitantes del departamento de Ayacucho, el que reporta 389 045 (81,2%) quechuahablantes, dedicados mayormente al comercio, ganadería y agricultura 28. Para evaluar la variedad del quechua central, seleccionamos a pobladores del departamento de Ancash, el cual cuenta con 289 172 (34,0%) quechuahablantes, dedicados mayormente al comercio, agricultura y turismo 28.

Fase de adaptación cultural

Traducción

Los métodos empleados durante el proceso de traducción fueron forward translation y back translation27. El PHQ-9 en su versión original (inglés) fue traducido directamente a cada variedad del quechua (Central, Cuzco-Collao, Chanca). Esto fue realizado por dos traductores independientes, quienes son nativos quechuahablantes de cada variedad y con conocimientos avanzados de inglés. Culminada la traducción para cada variedad, los dos traductores y dos investigadores quechuahablantes nativos se reunieron para discutir sobre las diferencias en las traducciones. Una vez resueltas las discrepancias y unificadas las traducciones, se procedió con la traducción inversa (quechua a inglés) de las tres variantes en quechua del PHQ-9. Esto fue realizado por dos traductores que tenían al inglés como lengua nativa y con conocimiento avanzado del quechua para cada variante. Una vez completada las traducciones inversas, los traductores de cada variante se reunieron con dos investigadores del estudio para verificar la traducción inversa junto con la primera traducción, afinando detalles y brindando su visto bueno a la versión final de las tres versiones.

Adaptación cultural a contextos quechuas

Aplicando el método Delphi, se elaboró una ficha de adaptación cultural que se encuentra en: https://doi.org/10.5281/zenodo.8312191. Esta ficha incluyó algunas preguntas abiertas para palabras no comunes en quechua como «Depresión» o «Sin esperanzas». También se buscó consultar el cambio de «leer periódico» por «escuchar radio», cambio de las categorías de respuesta del PHQ-9 y sobre la relación entre el PHQ-9 en quechua con el DSM-V para el diagnóstico de depresión mayor. La versión del PHQ-9 en quechua central fue revisada por dos psicólogos quechuahablantes, que tenían mínimo tres años de experiencia en la atención de pacientes quechua hablantes con depresión de las provincias de Ancash; uno de ellos tenía grado de maestro y el otro licenciado en psicología. La versión en quechua Cuzco-Collao fue evaluada por cinco psicólogos quechuahablantes, todos con título profesional y al menos un año de experiencia en la atención de pacientes quechuas con depresión en Puno o Cuzco. La versión en quechua Chanca fue evaluada por dos psicólogos con título profesional y con experiencia de al menos un año en la atención de pacientes quechuahablantes con depresión en las provincias de Ayacucho. La interacción entre cada experto y el equipo de investigación se dio en dos (Central) y cuatro rondas (Cuzco-Collao y Chanca) de correos. Adicionalmente, en cada correo se consultó sobre las mejoras realizadas (v.g. basadas en las recomendaciones de los expertos) empleando indicadores de relevancia, representatividad, claridad y equivalencia cultural en una escala de 0 a 3 (donde 3 fue la mejor calificación). Cuando todos los expertos calificaron con 3 las mejoras en todos los indicadores se realizó una reunión virtual en conjunto con el equipo de investigación, con el objetivo de evaluar las sugerencias y llegar a un consenso.

Posteriormente, se organizó un grupo focal (vía Zoom) para cada variedad del quechua. El moderador para cada variedad del quechua fue un psicólogo quechuahablante con dominio de métodos cualitativos. Las reuniones duraron 60 minutos aproximadamente. Al inicio, se solicitó responder el PHQ-9 en quechua mediante una versión en línea compartida vía formulario de Google. Luego, el moderador invitó a los participantes a opinar sobre la claridad y comprensión de los ítems en un lenguaje habitual y sencillo para el quechuahablante. Para la variedad Cuzco-Collao se contó con la participación de cinco personas quechua hablantes (tres mujeres y dos hombres), para el Quechua Chanca participaron cuatro personas (dos mujeres y dos hombres), para el Quechua Central participaron cuatro adultos (tres hombres y una mujer). Para las tres variedades del quechua se tomó en consideración que los participantes sean bilingües (hablen quechua y español) y mayores de 18 años (Figura 1). Los participantes del grupo focal brindaron una opinión favorable respecto a la claridad y comprensión del PHQ-9 en las tres variantes de quechua, confirmado que esta adaptación es clara y acorde a su contexto cultural.

Figura 1. Diagrama de flujo de la traducción y adaptación cultural del PHQ-9.

Figura 1

Fase de análisis psicométrico

Participantes

Se aplicó la versión final de la fase anterior a una muestra de 970 adultos seleccionados por muestreo no probabilístico por conveniencia, asegurándonos que para cada variedad del quechua contásemos con no menos de 200 participantes. Este número es incluso mayor que el estándar recomendado para análisis factoriales (20 participantes por ítem y teniendo en cuenta que son 9 ítems, el tamaño mínimo sería 180 participantes) y reportado como adecuado en estudios de simulaciones 29. Asimismo, cumple con el tamaño mínimo calculado para el análisis factorial (n=218, ver: https://doi.org/10.5281/zenodo.8312191). Seis encuestadores participaron en la recolección de datos, quienes presentaron el estudio a los participantes y una vez obtenido el consentimiento informado solicitaron completar la encuesta en un formulario de Google. La recolección se llevó a cabo en aquellos pueblos y ciudades con mayor presencia quechua. Se incluyeron a hombres y mujeres, mayores de 18 años, que viven en entornos urbanos y rurales, ubicados en tres regiones (según variante del quechua). Para evaluar la variante Cuzco-Collao incluimos habitantes de los departamentos de Puno y Cusco (n=525), para la evaluar la variante Chanca incluimos habitantes de Ayacucho (n=226), y para el analizar la variante de quechua Central incluimos habitantes del departamento de Ancash (n=219). Todos los participantes eran quechuahablantes bilingües (quechua y español), con una formación académica suficiente como para leer en quechua (v.g. primaria incompleta como mínimo). Se excluyeron a aquellos que hablaban una variedad de quechua diferente a las tres estudiadas.

Instrumento

El PHQ-9 consta de nueve ítems que se corresponden con síntomas depresivos del DSM-IV 6. Sus opciones de respuesta evocan la frecuencia de aparición de tales síntomas en las últimas dos semanas, considerando la siguiente escala tipo Likert: 0=para nada, 1=varios días (1-6 días), 2=la mayoría de los días (7-11 días), 3=casi todos los días (12 días a más). Luego de aplicar el cuestionario se obtiene una puntuación cruda entre 0 y 27. La versión en español del PHQ-9 ha demostrado validez (v.g., buena bondad de ajuste como medida unidimensional: CFI [índice de ajuste comparativo] = 0,936; RMSEA [raíz del error cuadrático medio de aproximación]= 0,089; SRMR [residuo estandarizado cuadrático medio]= 0,039), así como adecuada confiabilidad (α=ω = 0,87) en población peruana hispanohablante 1.

Covariables

Fueron utilizadas para caracterizar a la población, así como para estudiar la invarianza de medida del modelo unidimensional según edad (en años), sexo (femenino, masculino), educación (primaria incompleta, primaria completa, secundaria incompleta, secundaria completa, superior incompleta, superior completa), estado civil (soltero, casado/conviviente, divorciado/separado, viudo) y lugar de residencia (rural/urbano).

Procedimiento

Para la recolección de datos, se capacitó en el uso y aplicación del instrumento a un encuestador para la variedad de quechua Central, dos encuestadores para el quechua Chanca y tres encuestadores para la variedad del quechua Cuzco-Collao. Todos los encuestadores fueron estudiantes de psicología del tercero o cuarto año de estudios. Los encuestadores identificaron grupos de WhatsApp de padres de familia de instituciones educativas, iglesias cristianas y grupos de asociaciones de comunidades campesinas a quienes presentaron la encuesta en formulario de Google. La recolección de datos inició en febrero y terminó en junio del 2022.

Análisis estadístico

Se realizó el análisis descriptivo mediante frecuencias relativas y absolutas para las variables de caracterización 30. Posteriormente, se realizó un Análisis Factorial Confirmatorio (CFA, por sus siglas en inglés) del modelo unidimensional (se verificó su unidimensionalidad en Perú en una muestra representativa de 30 449 individuos: https://doi.org/10.5281/zenodo.8312191) utilizando un estimador WLSMV (cuadrados ponderados robustos con media y varianza ajustada), tal y como lo hicimos previamente 1. Además, el WLSMV es un estimador insesgado para ítems con respuestas ordinales y distribución no normal 31. Reportamos las betas estandarizadas del modelo y las medidas estándar de bondad de ajuste: el chi cuadrado (X2) para el modelo versus la línea de base, considerando aceptables valores <3; el CFI, que es adecuado cuando es >0,90; el índice de TLI (índice de Tucker-Lewis), que es aceptable con valores >0,90. Asimismo, el SRMR y la RMSEA, se consideraron adecuados con valores ≤ 0,08 32.

Se evaluó la invarianza de medida a través de grupos definidos por variantes del quechua, sexo y ubicación, mediante un CFA multigrupos. El cambio en el CFI (ΔCFI) y RMSEA (ΔRMSEA) se utilizó como criterio principal para comparar modelos con más restricciones contra modelos con menos restricciones. Los modelos primero asumieron la invarianza configuracional (es decir, estructura factorial similar entre grupos) como modelo base, subiendo a invarianza métrica (es decir, cargas factoriales y estructura factorial similares entre grupos), invarianza fuerte (es decir, umbrales, cargas factoriales y estructura factorial similares entre grupos), e invarianza estricta (es decir, varianzas residuales de elementos, umbrales, cargas factoriales y estructura factorial similares entre grupos). Entre cada modelo, se examinó si ΔCFI < 0,01 o ΔRMSEA < 0,01 para establecer si el modelo más restringido era apropiado 30.

Alternativamente, se ajustaron modelos MIMIC (Múltiples Indicadores y Múltiples Causas) para la evaluación de la invarianza de medida según edad, estado civil y nivel educativo (variables para las que el CFA multigrupos no fue viable). Se evaluó la invarianza de los interceptos de los indicadores y las diferencias de medias de las dimensiones latentes, todo a través de grupos según dichas covariables. Hemos preferido usar ∆CFI en lugar de ΔX2, porque el primero no se ve afectado por el tamaño de la muestra o la complejidad del modelo 32. Para el CFA multigrupos, realizamos un análisis de sensibilidad usando el método recomendado por Yoon y Lai 33 para tamaños de muestras disímiles. De hecho, se evalúa cada covariable por separado, comparando para cada una de ellas dos tipos de modelos: 1) una versión saturada donde la covariable explica a todos los ítems observados, pero no a las dimensiones latentes, y 2) una versión del modelo de intercepto invariante donde la covariable explica a todas las dimensiones latentes, pero no a los ítems. De igual forma, se reportan e interpretan los índices de ajuste arriba señalados.

Finalmente, se determinó la confiabilidad empleando el coeficiente Alpha de Cronbach 34 y el Omega de McDonald 35) . Para garantizar reproducibilidad, los principales códigos del análisis se encuentran en: https://github.com/JCBAZO/R-PHQ9-Quechua. Todos los análisis se realizaron en R Studio versión 4.0.4, con los paquetes “lavaan” 36, “lavaan.survey” 37 “semTools” 38, “semPlot” 39) y “Psych” 40.

Consideraciones Éticas

Este estudio fue evaluado y aprobado por el Comité de Ética de la Facultad de Ciencias de la Salud de la Universidad Peruana Unión con informe n.° 2022-CE-FCS-UPeU-059. El instrumento fue aplicado como auto reporte en formato virtual (formulario de Google), programado para presentar el consentimiento informado primero, por lo que sólo aquellos que aceptaron participar en el estudio desarrollaron la encuesta. Se solicitó la autorización del dueño del copyright del instrumento original (Pfizer) a través de un correo electrónico, quien finalmente autorizó su uso y adaptación.

RESULTADOS

Fase de adaptación cultural

Los expertos y el equipo de investigación interactuaron hasta lograr la máxima calificación de adecuación por cada ítem respecto a su adaptación cultural (3 en un rango de 0 a 3), resaltando su relevancia, representatividad, claridad y equivalencia cultural. Adicionalmente, brindaron valiosas sugerencias que se mencionan a continuación.

Algunas recomendaciones contribuyeron a mejorar la adaptación de la palabra depresión, la cual inicialmente estuvo traducida como “llaqui”. Se sugirió agregar “sinchi”, que da una mayor intensidad, quedando “sinchi llakisqa” (mucha tristeza) como la mejor comprensión de la depresión (ítem 2). Mientras que para la expresión sin esperanzas, los expertos recomendaron implementar la pregunta como “manañan q’anchay karqanchu kausayñiykipi / yanqallañan kausaranki” (ítem 2). Por razones de contexto, se cambió la actividad cotidiana «leer periódico» por «escuchar radio», debido a que este último es el medio informativo más utilizado en las tres regiones (ítem 7).

Las opciones de respuesta (tipo Likert) del PHQ-9 traducido también requirieron una reflexión especial por parte de los jueces y participantes del grupo focal. En especial, la categoría «casi todos los días» presentó problemas de claridad en su traducción. La recomendación final del equipo fue utilizar las expresiones “Mana hayk’aqpas”, “Wakin p’unchawkunalla”, “Ashka p’unchawkuna”, “Yaqa llapa p’unchawkuna”, representando el equivalente en español de Nunca», «Algunos días», «Varios días», «Casi todos los días».

Fase de análisis psicométrico

Datos de caracterización

De los 970 participantes bilingües, 560 (57,7%) fueron del sexo femenino, 580 (59,8%) tenían entre 18 y 30 años, 621 (64%) reportaron tener estudios universitarios en proceso o concluidos, 577 (59,5%) eran solteros, y 614 (63,3%) indicaron residir en zona urbana (Tabla 1).

Tabla 1. Características de los participantes del estudio.

Características Total Central Chanca Cuzco-Collao
(n=970) (n=219) (n=226) (n=525)
n (%) n (%) n (%) n (%)
Sexo        
Mujeres 560 57,7 122 55,7 141 62,4 297 56,6
Hombres 410 42,3 97 44,3 85 37,6 228 43,4
Edad (años)        
18-30 580 59,8 115 52,5 178 78,8 287 54,7
31-40 166 17,1 41 18,7 22 9,7 103 19,6
41-50 120 12,4 23 10,5 18 8,0 79 15,1
51-68 104 10,7 40 18,3 8 3,5 56 10,6
Educación        
Primaria incompleta 42 4,3 0 0,0 9 4,0 33 6,3
Primaria completa 38 3,9 4 1,8 2 0,9 32 6,1
Secundaria incompleta 40 4,2 8 3,7 8 3,5 24 4,6
Secundaria completa 229 23,6 35 16,0 19 8,4 175 33,3
Superior incompleta 325 33,5 75 34,2 114 50,4 136 25,9
Superior completa 296 30,5 97 44,3 74 32,8 125 23,8
Estado Civil        
Soltero(a) 577 59,5 131 59,8 167 73,9 279 53,1
Casado/conviviente 335 34,5 68 31,1 53 23,4 214 40,7
Divorciado/separado 36 3,7 16 7,3 4 1,8 16 3,1
Viudo(a) 22 2,3 4 1,8 2 0,9 16 3,1
Residencia        
Urbana 614 63,3 155 70,8 144 63,7 315 60,0
Rural 356 36,7 64 29,2 82 36,3 210 40,0

Validez de estructura interna

Los tres instrumentos finales (uno por cada variedad de quechua) fueron validados de forma independiente. El modelo de un solo factor reportó adecuados valores de bondad de ajuste para las tres variedades del quechua (Central, Chanca y Cuzco-Collao), así como para la muestra total (CFI= 0,990; TLI= 0,987; SRMR=0,048; RMSEA= 0,071) (Tabla 2). Por otro lado, el análisis de sensibilidad para el CFA multigrupos reportó resultados similares a los aquí mostrados. El único factor latente del modelo de medida (depresión) cargó un mínimo de λ = 0,57 y un máximo de λ = 0,79 a los ítems del PHQ-9 (Figura 2).

Tabla 2. Bondad de ajuste del modelo unidimensional de medida de la PHQ-9 y confiabilidad, total y por variantes de quechua.

Índice de bondad de ajuste Total (N=970) Central (n=219) Chanca (n=226) Cuzco-Collao (n=525)
χ2 (36) 13513 2381 2653 10041
CFI 0,990 0,968 0,998 0,995
TLI 0,987 0,958 0,997 0,994
SRMR 0,048 0,082 0,029 0,042
RMSEA 0,071 0,112 0,048 0,058
Alpha 0,895 0,865 0,877 0,915
Omega 0,861 0,834 0,833 0,881

X2: Chi-cuadrado, X2(gl): para el modelo versus la línea de base, gl: grados de libertad, CFI: índice de ajuste comparativo, TLI: Índice Tucker-Lewis, SRMR: residuo estandarizado cuadrático medio, RMSEA: raíz del error cuadrático medio de aproximación.

Figura 2. Modelo general de medida de la PHQ-9 con betas y errores estandarizados (N=970).

Figura 2

Confiabilidad

El PHQ-9 reportó buena confiabilidad para todas las variedades de quechua, con valores de Alfa de Cronbach entre 0,865 y 0,915, y con valores Omega entre 0,833 y 0,881 (Tabla 2).

Invarianza de medida

Los resultados del CFA multigrupos confirman la invarianza de medida según variantes del quechua, sexo y lugar de residencia (Tabla 3). El modelo configural presentó un buen ajuste a los datos (CFI = 0,935) para las tres variantes de quechua. Luego de confirmar la invarianza configural, se comprobó la invarianza métrica con ΔCFI = 0,001 y ΔRMSEA=0,007 (ambos <0,01). Luego, para la invarianza fuerte, se obtuvo ΔCFI=0,018 y ΔRMSEA=0,005, siendo al menos este último <0,01, por lo que se concluyó también una invarianza fuerte. Finalmente, se confirmó la invarianza estricta con ΔCFI=0,009 y ΔRMSEA=0,001. Los resultados e interpretación fueron similares para los modelos de invarianza según sexo y residencia (Tabla 3).

Tabla 3. Índices de ajuste de las pruebas de invarianza de medida entre grupos según variantes de quechua, sexo y lugar de residencia (N=970).

Variable de agrupamiento PHQ-9 (Estructura Interna) Invarianza (Modelo) X2 gl Valor de p CFI Δ CFI RMSEA Δ RMSEA
Variante Quechua Unidimensional 1. Configural 207,1 81 - 0,965 - 0,100 -
2. Métrica 296,3 97 <0,001 0,964 0,001 0,093 0,007
3. Fuerte 423,2 131 <0,001 0,947 0,018 0,097 0,005
4. Estricta 523,9 149 <0,001 0,938 0,009 0,098 0,001
Sexo Unidimensional 1. Configural 182,0 54 - 0,963 - 0,098 -
2. Métrica 192,0 62 0,683 0,971 0,008 0,082 0,017
3. Fuerte 201,3 79 0,539 0,970 0,001 0,074 0,008
4. Estricta 212,1 88 0,443 0,971 0,002 0,068 0,006
Residencia (urbano/rural) Unidimensional 1. Configural 180,5 54 - 0,962 - 0,098 -
2. Métrica 220,7 62 <0,001 0,962 0,000 0,091 0,007
3. Fuerte 214,3 79 1,000 0,965 0,003 0,078 0,013
4. Estricta 241,8 88 0,005 0,963 0,002 0,075 0,002

X2: Chi-cuadrado, gl: grados de libertad, CFI: índice de ajuste comparativo, RMSEA: raíz del error cuadrático medio de aproximación, Δ: diferencia, X2(gl): para el modelo versus la línea de base (Satorra-Betler).

Los resultados de los modelos MIMIC confirmaron la invarianza por edad, estado civil y nivel educativo (Tabla 4). Para todas las variables estudiadas, los valores de CFI y TLI fueron >0,98, mientras que los valores de SRMR y RMSEA fueron <0,08. Asimismo, los valores absolutos de ΔCFI, ΔTLI y ΔRMSEA fueron <0,01.

Tabla 4. Bondad de ajuste de los modelos MIMIC para el PHQ-9 (N=970).

Covariable Modelo CFI TLI RMSEA SRMR Δ CFI Δ TLI Δ RMSEA
Edad MIMIC saturado 0,990 0,984 0,071 0,048 - - -
MIMIC de intercepto invariante 0,990 0,987 0,063 0,048 0,000 0,003 -0,008
Estado civil MIMIC saturado 0,990 0,984 0,070 0,048 - - -
MIMIC de intercepto invariante 0,990 0,987 0,064 0,048 0,000 0,003 -0,006
Educación MIMIC saturado 0,991 0,985 0,069 0,047 - - -
MIMIC de intercepto invariante 0,990 0,987 0,064 0,047 -0,001 0,002 -0,005

MIMIC: Múltiples Indicadores y Múltiples Causas, CFI: índice de ajuste comparativo, TLI: índice Tucker-Lewis, SRMR: residuo estandarizado cuadrático medio, RMSEA: raíz del error cuadrático medio de aproximación, Δ: Diferencia. Las comparaciones (Δ) se realizaron entre el modelo MIMIC saturado y el modelo MIMIC de intercepción invariante para cada covariable estudiada.

DISCUSIÓN

Este es el primer estudio sobre la adaptación cultural al quechua del PHQ-9, un instrumento estandarizado utilizado internacionalmente para evaluar síntomas depresivos. Tras completar una traducción de ida y vuelta (inglés-quechua-inglés), considerando tres variantes del quechua, completamos la adaptación cultural con ayuda de jueces expertos y representantes de la población objetivo, todos quechuahablantes. La versión adaptada ofrece una medición unidimensional, confiable e invariante a través de grupos según variante del quechua, sexo, residencia, edad, estado civil y nivel educativo. Dicha invarianza confirma que se pueden hacer comparaciones con las mediciones del PHQ-9 quechua a través de los grupos mencionados. Los instrumentos finales se encuentran en el Material Suplementario.

Esta adaptación cultural abre nuevas posibilidades para la evaluación de la depresión en población quechuahablante peruana, tanto con fines de investigación como clínicos. Previamente, a través de una revisión narrativa realizada con búsqueda en PubMed, Web of Science y Scopus, incluyendo estudios en inglés y/o español, se encontraron siete estudios que evaluaron la depresión en poblaciones quechuahablantes 41. Únicamente dos de estos estudios usaron un instrumento traducido y adaptado al quechua, la Hopkins Symptoms Checklist (HSCL-25). Sin embargo, esta adaptación sólo consideró una variante: el quechua ayacuchano 42. La distinción de variantes es esencial para poder abarcar un mayor universo de personas en las distintas regiones del Perú, de otro modo, persiste el problema de acudir a una tercera persona que traduzca o interprete las preguntas y respuestas al momento de la aplicación. El PHQ-9 adaptado a tres versiones de quechua reduce la necesidad de dicho apoyo, facilitando la evaluación tanto en investigación (v.g. encuestas de salud tipo ENDES) como en espacios clínicos (v.g. instrumento estandarizado requerido según los criterios diagnósticos DSM-V).

El instrumento adaptado cuenta con propiedades psicométricas similares a las del PHQ-9 original y al validado para peruanos hispanohablantes. En ambos casos, la estructura interna del PHQ-9 se determinó como unidimensional, vale decir, un latente único que representa la depresión y se expresa a través de cada uno de los nueve síntomas evaluados por el instrumento 1,7. A nivel internacional, la evidencia sistemática reciente sostiene el modelo unidimensional a través de diversas culturas 43, con una aceptación tal que el debate se centra ahora en definir los puntos de corte más precisos para una medida única del PHQ-9 cuando se le usa, por ejemplo, para el tamizaje de la depresión 44. Asimismo, la buena confiabilidad del PHQ-9 en quechua guarda concordancia con los hallazgos del estudio en peruanos hispanohablantes 1 y lo observado en países con un contexto sociocultural similar como Chile (α=0,891 y ω = 0,896) 45, incluso en otros contextos socioculturales muy diferentes como Kenia (α=0,840 y ω=0,840) 46.

El PHQ-9 en las tres variedades de quechua ha mostrado invarianza de medida, tal y como ocurrió con la versión para hispanohablantes peruanos y otras versiones del PHQ-9 a nivel internacional. En China, se reportó invarianza según grupos de edad y sexo, incluyendo la invarianza estricta 11. En Kenia, se determinó la invarianza configuracional, métrica y escalar del modelo según presencia de infección por VIH, sexo y grupos de edad 46. En Estados Unidos, el instrumento mostró invarianza de medida configuracional, métrica y escalar al comparar mujeres de habla inglesa e hispanohablantes 47, así como al comparar estudiantes universitarios según grupos de edad y raza 48. En Noruega, se reportó invarianza según presencia o ausencia de desórdenes alimenticios en población femenina 15. Una revisión sistemática reciente confirmó la invarianza de medida en al menos 18 grupos, incluyendo aquellos determinados por las variables sociodemográficas incluidas en este estudio 43.

El presente estudio demuestra invarianza configuracional, métrica, escalar y estricta, según las variantes de quechua, sexo y lugar de residencia. De esta manera, los hallazgos sugieren que, en la población peruana, es posible realizar comparaciones entre pobladores quechuahablantes de distintas variantes, así como comparaciones entre varones y mujeres y entre pobladores urbanos y rurales. En ese mismo sentido, el PHQ-9 en quechua demostró invarianza de medida según edad, estado civil y nivel educativo, con repercusiones prácticas similares.

Hemos detectado algunas fortalezas y limitaciones del presente estudio que es preciso resaltar. Este es el primer estudio de adaptación cultural al quechua del PHQ-9, una herramienta muy utilizada a nivel internacional para la evaluación de los síntomas depresivos. Esto implicó un despliegue en tres regiones diferentes del Perú, usualmente desatendidas en el estudio y cuidado de su salud mental. No obstante, por tratarse de una versión escrita, los participantes requerían tener una escolaridad mínima indispensable que no siempre es posible encontrar en la población objetivo. Futuros estudios deberán superar esta barrera, para procurar llegar a quechuahablantes que aún no saben escribir o leer. Así también, aunque nuestro estudio se adhirió a los estándares internacionales para lograr la mejor adaptación cultural posible, entendemos que existen aspectos sutiles propios de cada cultura quechuahablante que no hemos podido rescatar sobre sus experiencias respecto a los síntomas que definen universalmente a la depresión. Por lo tanto, es posible que el instrumento adaptado no logre medir algunos de los síntomas depresivos en forma totalmente correcta y/o precisa en regiones del Perú donde la cultura hispanohablante tiene aún muy poca presencia. Por otra parte, la altitud puede estar asociada con la presencia de ciertos síntomas depresivos, y por ello su inclusión puede ser informativa (v.g., en un análisis de invarianza). Lamentablemente, no pudimos evaluar la altitud por razones logísticas, por lo sería útil que futuros estudios incluyan esta variable. Así también, a diferencia del CFA multigrupos, los modelos MIMIC solo pueden evaluar los modelos de intercepto invariante y las medias factoriales. Por ello, para las variables donde utilizamos MIMIC, asumimos que el resto de los parámetros estructurales y de medida (v.g., cargas factoriales, error de varianza/covarianza, factor de varianza/covarianza) son los mismos a través de todos los niveles de estas variables. Otra limitación está relacionada al cambio realizado en el ítem 7, de «leer periódico» por «escuchar radio». Si bien este cambio tiene la intención de mejorar la adaptación cultural del instrumento, es posible que pueda ocasionar variaciones en la medición con respecto a la versión del PHQ-9 en español. Estas variaciones podrían ser ocasionadas por las diferentes características culturales propias de cada sociedad quechuahablante. Asimismo, el número de participantes fue diferente para cada departamento/variedad, y el muestreo fue no-probabilístico, lo que formalmente afecta la validez externa de las estimaciones. No obstante, esta es la mejor estimación de validez/confiabilidad del PHQ-9 en quechua disponible a la fecha.

En términos de salud pública, este es un primer paso importante hacia el conocimiento y atención de la salud mental de poblaciones históricamente desatendidas. Las tres versiones del PHQ-9 en quechua pueden incorporarse paulatinamente en las encuestas de salud nacionales (v.g. ENDES), de la misma forma podrán ser utilizados por los centros comunitarios de salud mental en las distintas regiones del país, como una herramienta de tamizaje valida y confiable.

En conclusión, el PHQ-9 adaptado a tres variantes de quechua (Central, Chanca y Cuzco-Collao) ofrece una medición unidimensional válida, confiable e invariante a través de grupos según variante del quechua, sexo, residencia (rural/urbano), edad, estado civil y nivel educativo. Dicha invarianza confirma que se pueden hacer comparaciones con las mediciones de las tres versiones en quechua del PHQ-9 a través de los grupos mencionados.

Financiamiento.: La investigación fue parcialmente financiada por la Universidad Peruana Unión.

Material Suplementario.
Disponible en la versión electrónica de la RPMESP.

Citar como: Cjuno J, Julca-Guerrero F, Oruro-Zuloaga Y, Cruz-Mendoza F, Auccatoma A, Gómez-Hurtado H, et al. Adaptación cultural al Quechua y análisis psicométrico del Patient Health Questionnaire (PHQ-9) en población peruana. Rev Peru Med Exp Salud Publica. 2023;40(3):267-77. doi: 10.17843/rpmesp.2023.403.12571.

Associated Data

    This section collects any data citations, data availability statements, or supplementary materials included in this article.

    Supplementary Materials

    Supplementary material.

    Available in the electronic version of the RPMESP.

    Material Suplementario.

    Disponible en la versión electrónica de la RPMESP.


    Articles from Revista Peruana de Medicina Experimental y Salud Publica are provided here courtesy of Instituto Nacional de Salud

    RESOURCES