Skip to main content
Revista Peruana de Medicina Experimental y Salud Publica logoLink to Revista Peruana de Medicina Experimental y Salud Publica
letter
. 2025 Jun 2;42(2):225–226. doi: 10.17843/rpmesp.2025.422.14223
View full-text in Spanish

Genetic ancestry and the SNP RS4988235 of lactose tolerance in the population of Lima

Sergio Vladimir Flores 1, Ángel Roco-Videla 2, Román M Montaña 3
PMCID: PMC12377878  PMID: 40900492

To the Editor, The rs4988235 polymorphism, located in the regulatory region of the MCM6 gene, influences the expression of the LCT gene, which is responsible for lactase production, and is associated with lactose intolerance. This polymorphism shows population variability, with the A allele (associated with lactose tolerance) prevalent in northern Europe, while the G allele (associated with intolerance) is more common in Asia and Africa 1,2. In Latin American populations, the frequency of these alleles varies considerably due to genetic mixing and migratory history 3. Integrating the proportion of genetic ancestry into the analysis of tolerance or intolerance alleles is relevant for understanding the distribution of lactose intolerance in these populations. Therefore, the objective of this preliminary study was to evaluate the relationship between the proportions of genetic ancestry (European, Native American, and African) and the genotypes of the SNP (Single Nucleotide Polymorphism) rs4988235 associated with lactose tolerance or intolerance in the population of Lima, Peru.

The genotypes for rs4988235 were obtained from the public database of the 1000 Genomes Project (https://www.internationalgenome.org), selecting the sample from Lima (n=85). To estimate genetic ancestry proportions, 446 SNPs from a panel of informative ancestry markers were used, as described by Galanter et al. 4, considering five macro-populations: African, East Asian, South Asian, European, and Latin American.

The proportions of genetic ancestry were modeled using the STRUCTURE program 5,6. The Shapiro-Wilk test confirmed that ancestry distributions did not follow a normal distribution (p<0.05). The nonparametric Kruskal-Wallis and Mann-Whitney U tests were applied to evaluate the association between genetic ancestry proportions (independent variables) and lactose intolerance genotypes (dependent variables).

The Kruskal-Wallis test showed differences in the proportion of European ancestry among the three genotypes (AA, N= 9; AG, N = 34 and GG, N= 42) of lactose tolerance and intolerance (p=0.018), but no significant differences were found for Native American (p=0.089) or African (p=0.772) ancestry. Post hoc analysis with the Mann-Whitney U test revealed no significant differences between genotypes for the proportion of Native American and European ancestry (p>0.05). Figure 1 shows the distribution of genetic ancestries according to LCT genotypes.

Figure 1. Genetic ancestry and rs4988235 in the LCT gene in the Lima population. Figures A, B, and C show the proportions of genetic ancestry according to the genotypes of the rs4988235 polymorphism in the LCT gene.

Figure 1

This study has some limitations. First, the sample is limited to the population of Lima, Peru, so the conclusions cannot be extrapolated to other populations. In addition, the estimation of genetic ancestry is based on a specific panel of SNPs, which may not reflect all relevant genetic variants. Given the exploratory nature of the study and the use of a public database, the statistical power was not calculated.

In conclusion, our results suggest that the proportion of European ancestry is associated with lactose tolerance. These findings highlight the importance of considering the genetic heterogeneity of populations in Latin America to understand the population distribution of biomedical phenotypes of interest.

Biographies

Doctor of Biomedical Sciences

Doctor of Education

Master’s degree in Statistics

Funding.: The authors did not receive funding for the development of this research.

Cite as.

Flores SV, Roco-Videla A, Montaña RM. Genetic ancestry and the SNP rs4988235 of lactose tolerance in the population of Lima. Rev Peru Med Exp Salud Publica. 2025;42(2). doi: 10.17843/rpmesp.2025.422.14223.

References

  • 1.Enattah NS, Sahi T, Savilahti E, Terwilliger JD, Peltonen L, Järvelä I. Identification of a variant associated with adult-type hypolactasia. Nat Genet. 2002;30(2):233–237. doi: 10.1038/ng826. [DOI] [PubMed] [Google Scholar]
  • 2.Itan Y, Powell A, Beaumont MA, Burger J, Thomas MG. The Origins of Lactase Persistence in Europe. PLoS Comput Biol. 2009;5(8) doi: 10.1371/journal.pcbi.1000491. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 3.Adhikari K, Mendoza-Revilla J, Chacón-Duque JC, Fuentes-Guajardo M, Ruiz-Linares A. Admixture in Latin America. Curr Opin Genet Dev. 2016;41:106–114. doi: 10.1016/j.gde.2016.09.003. [DOI] [PubMed] [Google Scholar]
  • 4.Galanter JM, Fernandez-Lopez JC, Gignoux CR, Barnholtz-Sloan J, Fernandez-Rozadilla C, Via M, et al. Development of a panel of genome-wide ancestry informative markers to study admixture throughout the Americas. PLoS Genet. 2012;8(3) doi: 10.1371/journal.pgen.1002554. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 5.Pritchard JK, Stephens M, Donnelly P. Inference of population structure using multilocus genotype data. Genetics. 2000;155(2):945–959. doi: 10.1093/genetics/155.2.945. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 6.Falush D, Stephens M, Pritchard JK. Inference of population structure using multilocus genotype data linked loci and correlated allele frequencies. Genetics. 2003;164(4):1567–1587. doi: 10.1093/genetics/164.4.1567. [DOI] [PMC free article] [PubMed] [Google Scholar]
Rev Peru Med Exp Salud Publica. 2025 Jun 2;42(2):225–226. [Article in Spanish]

Ancestría genética y el SNP RS4988235 de tolerancia a la lactosa en población de Lima

Sergio Vladimir Flores 1, Ángel Roco-Videla 2, Román M Montaña 3

Sr. Editor. El polimorfismo rs4988235, ubicado en la región reguladora del gen MCM6, influye en la expresión del gen LCT, responsable de la producción de lactasa, y está asociado con la intolerancia a la lactosa. Este polimorfismo presenta variabilidad poblacional, siendo el alelo A (asociado a la tolerancia a la lactosa) prevalente en el norte de Europa, mientras que el alelo G (asociado a la intolerancia) es más común en Asia y África 1,2. En las poblaciones de América Latina, la frecuencia de estos alelos varía considerablemente debido a la mezcla genética y la historia migratoria 3. Integrar la proporción de ancestría genética en el análisis de los alelos de tolerancia o intolerancia es relevante para comprender la distribución de la intolerancia a la lactosa en estas poblaciones. Por lo tanto, el objetivo de este estudio preliminar es evaluar la relación entre las proporciones de ancestría genética (europea, indígena americana y africana) y los genotipos del SNP (Single Nucleotide Polimorphism) rs4988235 asociado a la tolerancia o intolerancia a la lactosa en la población de Lima, Perú.

Los genotipos para rs4988235 se obtuvieron de la base de datos pública del Proyecto 1000 Genomas (https://www.internationalgenome.org), seleccionando la muestra de Lima (n=85). Para estimar las proporciones de ancestría genética, se utilizaron 446 SNP de un panel de marcadores informativos de ancestría, según lo descrito por Galanter et al. 4, considerando cinco macropoblaciones: africana, asiática oriental, asiática meridional, europea y latinoamericana.

Las proporciones de ancestría genética se modelaron utilizando el programa STRUCTURE 5,6. La prueba de Shapiro-Wilk confirmó que las distribuciones de ancestría no seguían una distribución normal (p<0,05). Se aplicaron las pruebas no paramétricas de Kruskal-Wallis y U de Mann-Whitney para evaluar la asociación entre las proporciones de ancestría genética (variables independientes) y los genotipos de intolerancia a la lactosa (variables dependientes).

La prueba de Kruskal-Wallis mostró diferencias en la proporción de ancestría europea entre los tres genotipos (AA, N= 9; AG, N = 34 y GG, N= 42) de tolerancia e intolerancia a la lactosa (p=0,018), pero no se observaron diferencias significativas para las ancestrías indígena americana (p=0,089) ni africana (p=0,772). El análisis post hoc con la prueba U de Mann-Whitney no reveló diferencias significativas entre los genotipos para la proporción de ancestría indígena americana y europea (p>0,05). La figura 1 muestra la distribución de las ancestrías genéticas según los genotipos de LCT.

Figura 1. Ancestría genética y rs4988235 en el gen LCT en la población de Lima. Las figuras A, B y C muestran las proporciones de ancestría genética según los genotipos del polimorfismo rs4988235 en el gen LCT.

Figura 1

Este estudio presenta algunas limitaciones. En primer lugar, la muestra se limita a la población de Lima, Perú, por lo que las conclusiones no pueden extrapolarse a otras poblaciones. Además, la estimación de la ancestría genética se basa en un panel específico de SNP, lo que podría no reflejar todas las variantes genéticas relevantes. Dado el carácter exploratorio del estudio y el uso de una base de datos pública, no se realizó un cálculo de potencia estadística.

En conclusión, nuestros resultados sugieren que la proporción de ancestría europea se asocia con la tolerancia a la lactosa. Estos hallazgos destacan la importancia de considerar la heterogeneidad genética de las poblaciones en América Latina para comprender la distribución poblacional de los fenotipos biomédicos de interés.

Biographies

Doctor en Ciencias Biomédicas

Doctor en Educación

Magister en Estadística

Financiamiento.: Los autores no recibieron financiamiento para el desarrollo de esta investigación.

Citar como: Flores SV, Roco-Videla A, Montaña RM. Ancestría genética y el SNP rs4988235 de tolerancia a la lactosa en población de Lima. Rev Peru Med Exp Salud Publica. 2025;42(2):225-6. doi: 10.17843/rpmesp.2025.422.14223.


Articles from Revista Peruana de Medicina Experimental y Salud Publica are provided here courtesy of Instituto Nacional de Salud

RESOURCES