Skip to main content
Revista Española de Salud Pública logoLink to Revista Española de Salud Pública
. 2020 Sep 16;94:e202009101. [Article in Spanish]
View full-text in English

Determinantes sociales de la incidencia de la Covid-19 en Barcelona: un estudio ecológico preliminar usando datos públicos

Social determinants of the incidence of Covid-19 in Barcelona: a preliminary ecological study using public data

Miquel Amengual-Moreno 1,2, Marina Calafat-Caules 1,2, Aina Carot 1,2, Ana-Rita Rosa-Correia 1,2, Clàudia Río-Bergé 1, Jana Rovira-Plujà 1, Clàudia Valenzuela-Pascual 1, Cèlia Ventura-Gabarró 1
PMCID: PMC11582832  PMID: 32935664

RESUMEN

Fundamentos:

Los determinantes sociales tienen un gran impacto en la salud de las poblaciones. Es relevante estudiar su papel en la gestión de la epidemia de la Covid-19, especialmente en las ciudades, pues ciertas variables como el número de tests realizados o la disponibilidad de recursos sanitarios no se pueden asumir por igual. El objetivo de este trabajo fue estimar la relación de los determinantes sociales en la incidencia de la Covid-19 en Barcelona.

Métodos:

Se realizó un estudio ecológico, observacional retrospectivo, con el barrio como unidad de población, basado en los datos publicados a fecha de 14 de mayo de 2020 sobre incidencia acumulada de Covid-19 confirmada por PCR. Se estimó la diferencia de incidencia de la Covid-19 en función de la renta de los barrios, la correlación lineal de Pearson de las distintas variables seleccionadas (edad, sexo, densidad neta, inmigrantes, comorbilidades, tabaquismo, Índice de Masa Corporal (IMC) e Índice de Renta Familiar Disponible (IRFD)) con la incidencia acumulada y se llevó a cabo un análisis multivariante mediante un Modelo Lineal Generalizado (GLM).

Resultados:

Los barrios del quintil de menor renta presentaban un 42% más de incidencia que aquellos del quintil con más renta: 942 casos por cada 100.000 habitantes frente a los 545 casos por cada 100.000 habitantes. La correlación de Pearson se mostró estadísticamente significativa entre la incidencia de la Covid-19 y el porcentaje de población mayor de 75 años (r=0,487), el porcentaje de inmigrantes (r=-0,257) y el origen de dichos inmigrantes, el IRFD (r=-0,462), el porcentaje de fumadores (r=0,243) y de personas con un IMC mayor de 25 (r=0,483). En GLM las variables que más correlación tenían con la incidencia entre barrios eran el porcentaje de población mayor de 75 años (Z-score=0,258), el porcentaje de inmigrantes latinoamericanos (Z-score=0,19) y magrebíes (Z-score=-0,206), y el porcentaje de personas con IMC>25 (Z-score=0,334). Los resultados del GLM fueron estadísticamente significativos.

Conclusiones:

Los determinantes sociales se correlacionan con una modificación de la incidencia de la Covid-19 en los barrios de Barcelona, con especial relevancia de la prevalencia de IMC>25 y del porcentaje de inmigrantes y de su origen.

Palabras clave: Covid-19, Pandemia, Determinantes sociales de la salud, Incidencia, Barcelona

INTRODUCCIÓN

En diciembre de 2019, un nuevo virus denominado SARS-CoV-2, causante de la Covid-19, emergió en la ciudad china de Wuhan, y desde ese momento se ha expandido por todo el mundo originando una pandemia que ha supuesto un reto sin precedentes para los sistemas sanitarios y de salud pública.

La evidencia científica señala el impacto significativo de los determinantes sociales de la salud y de las inequidades existentes en el ámbito del acceso a los recursos y dispositivos de atención sanitaria como variables relevantes de la salud de las poblaciones 1 . Asimismo, la literatura científica ha descrito la importancia de los determinantes sociales y económicos en la modificación de la incidencia y de la mortalidad de las epidemias 2 , 3 . Así pues, éstos pueden ser usados para definir potenciales determinantes de la evolución de las epidemias que sirvan para dirigir de forma específica las políticas de salud pública a ciertos grupos poblacionales.

En el caso de la ciudad de Barcelona, existen datos históricos recogidos en las Encuestas de Salud realizadas por la Agencia de Salud Pública de Barcelona (ASPB) 4 que muestran diferencias significativas entre barrios en lo referido a variables sociales, económicas y demográficas. El modelo causal del trabajo se basó en que dichas diferencias entre barrios en lo referido a estas variables podían haber influido en el modo en que había incidido la Covid-19 en la ciudad, modificando bien la transmisión del virus, bien la susceptibilidad al mismo.

El objetivo de este trabajo fue determinar mediante un estudio ecológico, retrospectivo observacional, y con el barrio como unidad de población, la influencia de los determinantes socioeconómicos en la modificación de la incidencia de la Covid-19 en Barcelona.

MATERIALES Y MÉTODOS

Selección inicial de las variables

Para desarrollar el estudio se seleccionaron una serie de variables indicativas de distintas circunstancias y determinantes sociales que podían tener correlación con la incidencia de la Covid-19.

En el ámbito de la demografía se seleccionaron los porcentajes de población entre 65-74 años y de más de 75 años, por ser representativas del envejecimiento de la población en los barrios. Para caracterizar el hacinamiento en las viviendas o la cantidad de personas habitando un mismo espacio se optó por utilizar la densidad neta, que corresponde al cociente entre habitantes por hectáreas de superficie habitable. En lo referente al nivel socioeconómico se seleccionó el Índice de Renta Familiar Disponible (IRFD), por ser una variable que se calcula en base a diversos parámetros indicativos de la clase social (como se explica en el punto 4 de la tabla 1). En cuanto a la inmigración, se usó el porcentaje total de habitantes inmigrantes, así como los porcentajes desglosados por origen, ya que esto podría tener alguna implicación en la correlación con la incidencia de la Covid-19. Por último, para caracterizar la prevalencia de comorbilidades en los barrios se seleccionaron tres indicadores: el porcentaje de personas con una o más comorbilidades, por resultar una buena estimación de la prevalencia de las mismas; el porcentaje de fumadores, por ser indicativo de los hábitos tóxicos; y el porcentaje de personas con Índice de Masa Corporal IMC>25, por estar dicho valor asociado a la presencia de otras comorbilidades y por ser un importante factor de riesgo de hospitalización en infecciones por Covid-19.

Obtención de los datos

Se obtuvieron datos de diferentes fuentes (tabla 1): el padrón de 2019 del Departamento de Estadística del Ayuntamiento de Barcelona 5 en lo referido a población y distribución de los grupos de edad en la misma, y a Índice de renta familiar disponible; la Encuesta de Salud de Barcelona de 2016-2017 4 de la ASPB en lo relativo a prevalencia de comorbilidades; la plataforma InfoBarris 6 de la ASPB en lo relativo a porcentaje de inmigrantes, y la plataforma Covid-19alDiaBCN 7 de la ASPB en lo referido a la incidencia acumulada de Covid-19. Todos los datos estaban disponibles a nivel de barrio, a excepción de aquellos referidos a la prevalencia de comorbilidades, que se encontraban por distritos. En este caso se asumió la misma prevalencia en los barrios que la de cada uno de los 10 distritos al que pertenecían. Se asumió igual número de tests PCR y de implantación de las medidas de salud pública en toda la ciudad, así como del sexo de la población, pues las diferencias entre barrios eran menores.

Tabla 1. Datos y fuentes del estudio.

graphic file with name 1135-5727-resp-94-e202009101-g001.jpg

(*) El tamaño de la muestra solo procede en los datos de comorbilidades y hábitos tóxicos, 4.000 personas; (**) ASPB: Agencia de Salud Pública de Barcelona; INE: Instituto Nacional de Estadística; Inst Mpal: Instituto Municipal.

Análisis estadístico

El análisis estadístico, llevado a cabo en el entorno estadístico SPSS®, consistió en dos partes. La primera, en un análisis descriptivo y de riesgo: se calcularon la media, el mínimo y el máximo, así como la desviación estándar de cada variable (tabla 2) y la incidencia de la Covid-19 a 14 de mayo de 2020 en los barrios dependiendo del quintil de Índice de Renta Familiar Disponible (IRFD) y la Ratio de Ratios de Incidencia (RRI) para estimar el riesgo (figura 1). Para calcular la incidencia en cada tramo de renta se consideró a todos los barrios con un mismo nivel como una unidad poblacional, y se sumaron los casos correspondientes a los mismos, dividiendo por la suma de sus poblaciones. La RRI se calculó considerando a aquellos barrios en el tramo más alto de IRFD (Q5) como el grupo no expuesto, y dividiendo la incidencia en cada tramo de renta por la incidencia en Q5. El intervalo de confianza se calculó con la fórmula e{log (RRI)±(1,96•SE(logRRI))}, donde SE era el error estándar.

Tabla 2. Análisis descriptivo de las variables seleccionadas para los barrios de Barcelona (n=73).

graphic file with name 1135-5727-resp-94-e202009101-g002.jpg

Se presenta la media de los barrios para cada variable, así como el mínimo-máximo y la desviación estándar. La población total de la ciudad era de 1,6 millones de habitantes. (*) Datos de casos confirmados por PCR a día 14 de mayo de 2020.

Figura 1. Incidencia acumulada y ratio de ratios de incidencia según quintiles de IRFD (índice de renta familiar disponible) en los barrios.

Figura 1

También se calculó la correlación de Pearson entre las variables seleccionadas y la incidencia acumulada de Covid-19 a 14 de mayo de 2020.

La segunda parte consistió en un análisis multivariante de la asociación entre los determinantes socioeconómicos y demográficos y la incidencia de la Covid-19 (variable dependiente) usando un Modelo Lineal Generalizado (GLM), en el que se incluyeron las siguientes variables como independientes: porcentaje de población del Magreb y de América Latina, porcentaje de población por encima de los 75 años y porcentaje de población con un IMC por encima de 25. Las variables fueron estandarizadas.

Con tal de determinar si una variable debía ser incluida o no, puesto que la independencia entre las mismas es una asunción básica del modelo, se llevó a cabo un diagnóstico de multicolinealidad, y las variables con un Factor de Inflación de la Varianza (FIV) mayor a 5 fueron excluidas. Todas las variables incluidas tenían un FIV menor a 1,8 (tabla 3).

Tabla 3. Correlación de la incidencia acumulada confirmada por PCR a día 14 de mayo de 2020 con las variables independientes en los barrios de Barcelona.

graphic file with name 1135-5727-resp-94-e202009101-g004.jpg

Datos extraídos de las mismas fuentes que en la tabla 1; (*) La correlación es significativa en el nivel 0,05 (bilateral); (**) La correlación es significativa en el nivel 0,01 (bilateral).

Para estimar el efecto de las condiciones de salud en las diferencias sobre la incidencia se seleccionó el porcentaje de personas con un IMC mayor de 25, pues éste puede representar mejor la prevalencia de enfermedades crónicas y de estilos de vida que interfieren en la susceptibilidad de la población a la Covid-19. El porcentaje de habitantes procedentes del Magreb y de América Latina se seleccionaron como indicadores de cómo la inmigración y el origen de la misma podían tener un impacto, ya que puede afectar tanto a la susceptibilidad sobre la enfermedad como a la transmisión de la misma por modos de vida determinados, o bien por la estructura demográfica de estos colectivos. El resto de los grupos inmigrantes se excluyeron puesto que mostraban correlación entre ellos y no eran significativos en el modelo. El IRFD se excluyó también por no mostrar significación estadística en el modelo.

Se configuró un modelo de distribución normal y una función de identidad de enlace para el GLM, dado que el test de Saphiro-Wilk y el gráfico Q-Q mostraron normalidad en la distribución de la variable dependiente (p=0,103).

Un barrio (código 12, la Marina del Prat Vermell-AEI Zona Franca) se excluyó del análisis estadístico por resultar un valor atípico que alteraba las tendencias que mostraban el resto de barrios. Probablemente esto se debiera a las singulares características de esta unidad de población, pues se trata de un área industrial grande con una baja población. Asimismo, se excluyeron los casos de residencias de ancianos porque podrían haber modificado significativamente la distribución de casos entre barrios, ocasionando diferencias en las que realmente no mediaban las características de dicha unidad de población y sobreestimando su incidencia. Además, las encuestas de salud en las que se basaban algunas variables excluían a las personas institucionalizadas.

Validez del modelo

Para seleccionar el modelo que mejor explicase las variaciones entre barrios se usó el Criterio de Información de Akaike (AIC) y el modelo con un valor menor (AIC=120) fue seleccionado, esto es, el modelo con las variables anteriormente expuestas.

Otra asunción básica del modelo era la homocedasticidad. Para determinar si el modelo violaba o no la asunción de homocedasticidad se realizó un diagrama de dispersión del valor predicho por el modelo frente a la desviación residual, que mostró un patrón de desviación aleatorio, tal y como se espera en un modelo homocedástico. La desviación residual mostró normalidad en su distribución (p>0,05 en el test de Saphiro-Wilk) y, en consecuencia, se configuró un estimador basado en el modelo para testar la significación estadística de cada variable.

RESULTADOS

El análisis descriptivo de las variables (media, mínimo y máximo y desviación estándar) mostró diferencias en la distribución de estas en los barrios (tabla 2). El estudio de la incidencia en los barrios dependiendo del quintil de IRFD (figura 1) mostró claras diferencias entre ellos. Los barrios con menor renta presentaron un 42% más de incidencia, 942 casos por cada 100.000 habitantes, que aquellos con mayor renta, que tuvieron una incidencia de 545 casos por cada 100.000 habitantes. En la estimación del riesgo mediante la RRI, los barrios con menos renta mostraron un RRI de 1,73 (IC 95% 1,56; 1,92) tomando como referencia aquellos con mayor renta.

El análisis de correlación lineal de Pearson (tabla 3) mostró que existía una correlación estadísticamente significativa entre la incidencia acumulada de Covid-19 a 14 de mayo de 2020 y las siguientes variables: el porcentaje de personas mayores de 75 años (r=0,487; p<0,01), el porcentaje de inmigrantes (r=-0,257; p<0,05), el Índice de Renta Familiar Disponible (IRFD) (r=-0,462; p<0,01), el porcentaje de personas con IMC>25 (r=0,483; p<0,01) y los fumadores (r=0,243; p<0,05).

Analizado el porcentaje de inmigrantes en función de su origen, se revelaron diferencias entre los mismos: mientras los porcentajes de población de Asia y Oceanía (r=-0,275; p<0,05) y del Magreb (r=-0,197; p>0,05) mostraron una correlación negativa estadísticamente significativa y no significativa, respectivamente, el porcentaje de población de América Latina mostró una correlación positiva significativa (r=0,322; p<0,01). El porcentaje de población del resto de África mostró una débil correlación estadísticamente no significativa (r=0,034; p>0,05).

En el GLM (tabla 3), las siguientes variables mostraron significación estadística: el porcentaje de población mayor de 75 años (Z-score=0,258; p<0,01), el porcentaje de población del Magreb (Z-score=-0,206; p<0,01), el porcentaje de población de América Latina (Z-score=0,190; p<0,01) y el porcentaje de personas con IMC>25 (Z-score=0,334; p<0,01).

El parámetro D2, que muestra la variación explicada por el modelo, obtuvo un valor de 0,52 (52% de la variación fue explicada por el modelo).

DISCUSIÓN

Aunque de este estudio ecológico no se puede inferir que las variables estudiadas sean la causa directa de las diferencias en la incidencia acumulada de Covid-19 en los barrios de Barcelona, sí que ofrece una buena perspectiva de su relación y una valoración preliminar de cómo los determinantes sociales pueden haber modificado la incidencia de la enfermedad.

El estudio muestra que existe una correlación entre la incidencia acumulada de Covid-19 a 14 de mayo de 2020 y las distintas variables socioeconómicas, y que las unidades de población más socioeconómicamente deprimidas tienen mayor incidencia de Covid-19, un 42% más en los de menor IRFD respecto a los de mayor, así como mayor riesgo de incidencia, con una RRI de 1,73 en los barrios con menor IRFD respecto a los de mayor. Esto sugiere que existe una correlación entre la renta de los barrios y la incidencia acumulada, y que existe un mayor riesgo de contraer la enfermedad en los barrios más limitados económicamente.

A pesar de que la densidad neta no se muestra como significativa en la correlación de Pearson y presenta una intensidad muy débil (r=-0,01; p>0,05), el rol de la transmisión en los hogares no se puede desechar como una variable que haya influido en las diferencias entre barrios, pues posiblemente las estadísticas oficiales no reflejan situaciones específicas de hacinamiento en viviendas.

El GLM puede ser una herramienta útil para comprender qué variables tienen más efecto en la modificación de la incidencia de la Covid-19. El porcentaje de personas con un IMC>25 parece ser la variable que mayor efecto muestra en las diferencias entre barrios (Z-score=0,334; p<0,01). El IMC no representa únicamente una condición individual, sino la prevalencia de hábitos tóxicos y otros determinantes de salud. Además, la obesidad se correlaciona con un peor pronóstico de la enfermedad, según el estudio de Tamara A y Tahapary DL 8 . Esto podría explicar por qué los barrios con una mayor prevalencia de obesidad presentan una mayor incidencia de Covid-19 y por qué es la variable que refleja mayor intensidad en la correlación. Los estudios de factores de riesgo de mortalidad en pacientes hospitalizados en Cataluña 9 ) también muestran peor pronóstico para los pacientes con obesidad. La prevalencia de obesidad se asocia, asimismo, con menor IRFD (r=-0,767; p<0,01).

El porcentaje de personas mayores de 75 años aparece también como una variable relevante (Z-score=0,258; p<0,01), pues incrementa la susceptibilidad sobre la enfermedad. Es una variable que no muestra correlación con la renta, con lo que podría explicar una parte importante de las diferencias observadas.

La inmigración se presenta como significativa tanto en las correlaciones de Pearson como en el GLM. El porcentaje de población asiática refleja una correlación negativa con la incidencia (r=-0,275; p<0,01), lo que podría explicarse por diferencias culturales o una mayor consciencia de la situación por la afectación en sus países de origen, que los llevó a practicar medidas de distancia social y de cierre de establecimientos antes de que fuesen recomendados a la población.

La inmigración del Magreb se correlaciona con una menor incidencia. La causa de dicha correlación podría ser la edad de estas poblaciones, más jóvenes que la media 10 , además de barreras lingüísticas y culturales que podrían haber provocado un infradiagnóstico de la enfermedad.

Por otra parte, la inmigración de América Latina se correlaciona con una mayor incidencia. No existe relación entre este grupo y la edad, así que las diferencias podrían deberse a peores condiciones de higiene y de vivienda, menores tasas de educación o diferencias en la susceptibilidad individual.

Todas las variables estudiadas no representan únicamente una condición específica de una unidad poblacional, sino que representan también modos y hábitos de vida que son consecuencia de una mayor privación socioeconómica. Así mismo, discernir cuáles son los mecanismos causales que pueden provocar las diferencias en la incidencia acumulada de Covid-19 es de especial relevancia para una comprensión de cómo los determinantes sociales afectan al comportamiento de las epidemias sobre los grupos más desfavorecidos y sobre la salud de la población.

Una clara correlación entre los determinantes sociales con la incidencia parece existir y, en consecuencia, esta epidemia podría ser un importante catalizador de la pobreza y, consiguientemente, de peores condiciones de salud. De hecho, estudios anteriores como el de Bambra C, et al 11 sobre la epidemia de la gripe de 1918, la epidemia del virus H1N1 y el presente SARS-CoV2 también demuestran que los barrios o países más privados económicamente, con menores ingresos, han presentado mayor incidencia de dichos virus. Es por ello que son de vital importancia programas específicos y con carácter universal dirigidos a disminuir y paliar las inequidades tanto en salud como en el acceso a la salud, pues reducirían a su vez el impacto de las epidemias. Así mismo, se sugiere que deberían implementarse programas e intervenciones comunitarias específicas para determinados grupos de inmigrantes.

Como limitaciones del estudio, por la naturaleza ecológica del mismo, únicamente se pueden identificar variables que han modificado la incidencia a nivel de unidades de población y establecerse hipótesis del porqué, pero no pueden establecerse inferencias causales, pues únicamente se han estudiado las diferencias entre barrios y no entre individuos.

La validez externa de los resultados es otra limitación. El estudio muestra claras correlaciones entre la incidencia y las distintas variables socioeconómicas. No obstante, esto debe ser extrapolado a otras poblaciones con precaución. La exclusión de los casos de residencias puede ser otra importante limitación y estudios específicos sobre el impacto en estos centros deberían llevarse a cabo.

Otra limitación yace en los datos, en especial aquellos referidos a las encuestas de salud, pues se llevan a cabo con muestras poblacionales de la ciudad y pueden no reflejar de forma totalmente fidedigna la prevalencia de una enfermedad o condición descrita. Tampoco se puede ignorar que los datos de incidencia acumulada de Covid-19 también se han visto afectados por falta de calidad. Debe tenerse en cuenta, así mismo, que la ulterior evolución de la epidemia puede modificar las correlaciones descritas en este trabajo preliminar.

Finalmente, un punto importante a considerar es que, debido a la saturación de la asistencia sanitaria a causa de la epidemia, la mayoría de pruebas PCR, en las que se basan los datos de este estudio, se realizaron a los casos con una peor presentación clínica. Así pues, probablemente, este estudio esté estimando las diferencias en la agravación de la presentación clínica de la Covid-19, y no tanto las diferencias reales en la incidencia. Son por ello necesarios más estudios con datos consolidados sobre el impacto de las variables socioeconómicas en la incidencia de la Covid-19, así como en la mortalidad. En cualquier caso, dichas variables muestran correlación y, por tanto, pueden haber influido, bien en la incidencia, bien en la agravación del cuadro clínico, y debieran ser consideradas a la hora de afrontar y manejar la epidemia.

AGRADECIMIENTOS

Al Dr. José Aramburu, del Departamento de Ciencias Experimentales y de la Salud de la Universitat Pompeu Fabra, por la tutorización del trabajo, y al Dr. Manuel Pastor, de ese mismo departamento, por su asesoramiento estadístico.

Cita sugerida: Amengual-Moreno M, Calafat-Caules M, Carot A, Rosa Correia AR, Río-Bergé C, Rovira Plujà J, Valenzuela Pascual C, Ventura-Gabarró C. Determinantes sociales de la incidencia de la Covid-19 en Barcelona: un estudio ecológico preliminar usando datos públicos. Rev Esp Salud Pública. 2020; 94: 16 de septiembre e202009101.

Anexo I.

Tabla Anexo I. Tablas de datos.

Anexo I.

Anexo I.

Anexo I.

Anexo I.

Anexo I.

Anexo I.

Anexo I.

Anexo I.

Anexo I.

BIBLIOGRAFÍA

  • 1.. Braveman P, Gottlieb L. The Social Determinants of Health: It's Time to Consider the Causes of the Causes. Public Health Rep. 2014;129(Suppl 2):19-31. [DOI] [PMC free article] [PubMed]; Braveman P, Gottlieb L. The Social Determinants of Health It's Time to Consider the Causes of the Causes. Public Health Rep. 2014;129(Suppl 2):19–31. doi: 10.1177/00333549141291S206. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 2.. Mamelund SE. A socially neutral disease? Individual social class, household wealth and mortality from Spanish influenza in two socially contrasting parishes in Kristiania 1918-19. Soc Sci Med. 1 de febrero de 2006;62(4):923-40. [DOI] [PubMed]; Mamelund SE. A socially neutral disease Individual social class, household wealth and mortality from Spanish influenza in two socially contrasting parishes in Kristiania 1918-19. Soc Sci Med. 1 de febrero de. 2006;62(4):923–940. doi: 10.1016/j.socscimed.2005.06.051. [DOI] [PubMed] [Google Scholar]
  • 3.. Soyemi K, Medina-Marino A, Sinkowitz-Cochran R, Schneider A, Njai R, McDonald M, et al. Disparities among 2009 Pandemic Influenza A (H1N1) Hospital Admissions: A Mixed Methods Analysis - Illinois, April-December 2009. PLOS ONE. 28 de abril de 2014;9(4):e84380. [DOI] [PMC free article] [PubMed]; Soyemi K, Medina-Marino A, Sinkowitz-Cochran R, Schneider A, Njai R, McDonald M. Disparities among 2009 Pandemic Influenza A (H1N1) Hospital Admissions A Mixed Methods Analysis - Illinois, April-December 2009. PLOS ONE. 28 de abril de. 2014;9(4):e84380. doi: 10.1371/journal.pone.0084380. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 4.. Agència de Salut Pública de Barcelona. Enquesta de salut de Barcelona 2016/17 (Internet). (citado 3 de mayo de 2020). Disponible en: https://www.aspb.cat/docs/enquestasalutbcn/.; Agència de Salut Pública de Barcelona [citado 3 de mayo de 2020];Enquesta de salut de Barcelona 2016/17 . Internet. Disponible en: https://www.aspb.cat/docs/enquestasalutbcn/
  • 5.. Ajuntament de Barcelona. Departament d'Estadística i Difusió de Dades (Internet). 2001 (citado 26 de mayo de 2020). Disponible en: https://www.bcn.cat/estadistica/catala/index.htm.; Ajuntament de Barcelona [citado 26 de mayo de 2020];Departament d'Estadística i Difusió de Dades. 2001 Internet. Disponible en: https://www.bcn.cat/estadistica/catala/index.htm .
  • 6.. Infobarris (Internet). (citado 26 de mayo de 2020). Disponible en: https://www.aspb.cat/docs/infobarris/.; Infobarris . [citado 26 de mayo de 2020]. Internet. Disponible en: https://www.aspb.cat/docs/infobarris/
  • 7.. Agència de Salut Pública de Barcelona. #COVID19aldiaBCN (Internet). (citado 18 de mayo de 2020). Disponible en: https://aspb.shinyapps.io/COVID19_BCN/.; Agència de Salut Pública de Barcelona [citado 18 de mayo de 2020];#COVID19aldiaBCN. Internet. Disponible en: https://aspb.shinyapps.io/COVID19_BCN/
  • 8.. Tamara A, Tahapary DL. Obesity as a predictor for a poor prognosis of COVID-19: A systematic review. Diabetes Metab Syndr Clin Res Rev. 1 de julio de 2020;14(4):655-9. [DOI] [PMC free article] [PubMed]; Tamara A, Tahapary DL. Obesity as a predictor for a poor prognosis of COVID-19 A systematic review. Diabetes Metab Syndr Clin Res Rev. 1 de julio de. 2020;14(4):655–659. doi: 10.1016/j.dsx.2020.05.020. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 9.. Agència de Qualitat i Avaluació Sanitàries de Catalunya. Factors de risc de mortalitat dels pacients hospitalitzats per COVID-19 (Internet). (citado 30 de mayo de 2020). Disponible en: http://aquas.gencat.cat/.content/Enllac/factors-risc-mortalitat-covid19-hospitalitzats.html.; Agència de Qualitat i Avaluació Sanitàries de Catalunya [citado 30 de mayo de 2020];Factors de risc de mortalitat dels pacients hospitalitzats per COVID-19 . Internet. Disponible en: http://aquas.gencat.cat/.content/Enllac/factors-risc-mortalitat-covid19-hospitalitzats.html .
  • 10.. Departament d'Estadística A de B. Immigrants per edats quinquenals (Internet). (citado 30 de mayo de 2020). Disponible en: https://www.bcn.cat/estadistica/angles/dades/tdemo/imi/i2018/t54.htm.; Departament d'Estadística A de B [citado 30 de mayo de 2020];Immigrants per edats quinquenals . Internet. Disponible en: https://www.bcn.cat/estadistica/angles/dades/tdemo/imi/i2018/t54.htm .
  • 11.. Bambra C, Riordan R, Ford J, Matthews F. The COVID-19 pandemic and health inequalities. J Epidemiol Community Health (Internet). 12 de junio de 2020 (citado 25 de julio de 2020); Disponible en: https://jech.bmj.com/content/early/2020/06/13/jech-2020-214401. [DOI] [PMC free article] [PubMed]; Bambra C, Riordan R, Ford J, Matthews F. The COVID-19 pandemic and health inequalities. [citado 25 de julio de 2020];J Epidemiol Community Health. 2020 Jun 12; doi: 10.1136/jech-2020-214401. Internet. Disponible en: https://jech.bmj.com/content/early/2020/06/13/jech-2020-214401 . [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 12.. Índex dades per barris (Internet). (citado 29 de junio de 2020). Disponible en: https://www.bcn.cat/estadistica/catala/dades/barris/index.htm.; [citado 29 de junio de 2020];Índex dades per barris. Internet. Disponible en: https://www.bcn.cat/estadistica/catala/dades/barris/index.htm .
  • 13.. Superfície i densitat dels districtes i barris. 2018 (Internet). (citado 17 de julio de 2020). Disponible en: https://www.bcn.cat/estadistica/catala/dades/anuari/cap01/C0101050.htm.; [citado 17 de julio de 2020];Superfície i densitat dels districtes i barris. 2018 Internet. Disponible en: https://www.bcn.cat/estadistica/catala/dades/anuari/cap01/C0101050.htm .
  • 14.. Renda familiar disponible 2017 (Internet). (citado 17 de julio de 2020). Disponible en: https://www.bcn.cat/estadistica/catala/dades/economia/renda/rdfamiliar/a2017/rfbarris.htm.; [citado 17 de julio de 2020];Renda familiar disponible 2017 . Internet. Disponible en: https://www.bcn.cat/estadistica/catala/dades/economia/renda/rdfamiliar/a2017/rfbarris.htm .
Rev Esp Salud Publica. 2020 Sep 16;94:e202009101. [Article in English]

Social determinants of the incidence of COVID-19 in Barcelona: a preliminary ecological study using public data

Miquel Amengual-Moreno 1,2, Marina Calafat-Caules 1,2, Aina Carot 1,2, Ana-Rita Rosa-Correia 1,2, Clàudia Río-Bergé 1, Jana Rovira-Plujà 1, Clàudia Valenzuela-Pascual 1, Cèlia Ventura-Gabarró 1

INTRODUCTION

In December 2019, a new virus called SARS-CoV-2, which causes COVID-19, emerged in the Chinese city of Wuhan, since then it has expanded across the world creating a pandemic that has resulted in a challenge without precedents both for Healthcare and Public Health systems.

Scientific evidence has shown the significant impact of social determinants of health and of the inequalities that exist in the access to healthcare resources as relevant variables for the populations’ health 1 . Additionally, scientific literature has described the importance of social and economic determinants in the modification of incidence and of mortality in epidemics 2 , 3 . Therefore, these can be used to define potential determinants in the evolution of epidemics that can be used to direct in a more specific way Public Health policies to certain groups of the population.

In the case of the city of Barcelona there is historic data gathered in the Health Surveys of the Public Health Agency of Barcelona (ASPB) 4 that show significant differences between neighbourhoods regarding social, economic and demographic variables. The causal model of the work was based on the idea that those differences between neighbourhoods regarding these variables could have influenced the way Covid-19 affected the city, modifying either the virus’ transmission or the susceptibility to it.

The goal of the work was to determine the influence of the socioeconomic determinants in the modification of the COVID-19 incidence in Barcelona, performing an observational retrospective ecological study with the neighbourhood as the population unit.

MATERIALS AND METHODS

Initial selection of the variables

In order to develop the study, a series of variables were selected as indicative of the different circumstances and social determinants that could be correlated to the COVID-19 incidence.

In the field of demography, the percentages of population between 65 and 74 years and older than 75 years old were selected, as they represent the ageing of the population in the neighbourhoods. In order to characterize the overcrowding of the housings, or the quantity of people living in the same space, the net density was selected, which corresponds to the quotient between habitants per habitable surface in hectares. Regarding the socioeconomic level, the Available Income per Family Index (AIFI) was selected, since it is a value calculated using different parameters indicative of the social class (explained in the point 4 in table 1). Concerning immigration, the total percentage of immigrants, together with the percentages broken down by origin, was used, since this could have an implication in the correlation with the COVID-19 incidence. Lastly, in order to characterize the prevalence of comorbidities in neighbourhoods, three indicators were selected: the percentage of people with one or more comorbidities, since it results in a good estimation of the prevalence of them; the percentage of smokers, since it is an indicator of toxic habits; and the percentage of people with Body Mass Index (BMI) higher than 25, since this value is associated to the presence of other comorbidities and it is an important risk factor in hospitalizations of COVID-19 infections.

Data obtention

They were obtained through different sources (table 1): the 2019 census of the Statistics Department of the City Council of Barcelona 5 referring the population and distribution of the age group in it, and the Available Income per Family Index (AIFI); the 2016-2017 Health Survey of Barcelona 4 of the ASPB referring to the prevalence of comorbidities; the platform InfoBarris 6 of the ASPB referring to the percentage of immigrants, and the platform Covid-19alDiaBCN 7 of the ASPB referring to the cumulative incidence of COVID-19. All the data was available at the level of neighbourhoods, excepting those referred to the prevalence of comorbidities that were at the level of districts. In the latter case, and for the 10 different districts, the same prevalence was assumed for the neighbourhoods that belonged to the same district. The same number of PCR tests and the same public health measures applied were assumed for the whole city, this was also done for the sex of the population, since the differences between the neighbourhoods were small.

Table 1. Sources of the data.

graphic file with name 1135-5727-resp-94-e202009101-g014.jpg

(*) Sample size only referred to comorbidities and toxic habits data, 4,000 inhabitants; (**) ASPB: Public Health Agency of Barcelona; INE: Spain’s National Institute of Statistics; Mpal. Inst: Municipal Institute.

Statistical analysis

The statistical analysis, carried out using SPSS®, consisted of two parts. The first one, a descriptive analysis and of risk: the mean, minimum and maximum and standard deviation of every variable were calculated (table 2). The incidence of COVID-19 until May 14th, 2020 in the neighbourhoods depending on the quintile of Available Income per Family Index and the Incidence Rate Ratio (IRR) waswere also calculated to estimate the risk (figure 1). In order to calculate the incidence in every income bracket all neighbourhoods in the same level were considered as a population unit, and the corresponding cases were added, dividing by the sum of its populations. The IRR was calculated considering those neighbourhoods in the higher bracket of the AIFI (Q5) as the non-exposed group and dividing the incidence in each income bracket by the incidence in Q5. The confidence interval was calculated using the formula e{log(IRR) ±[1.96xSE(logIRR)]}, where SE was the standard error.

Table 2. Descriptive analysis of the selected variables for the neighbourhoods of Barcelona (n=73).

graphic file with name 1135-5727-resp-94-e202009101-g015.jpg

It shows the average, the minimum-maximum and the standard deviation for each variable. The total population of the city was of 1.6 million inhabitants. (*) Confirmed cases by PCR at May 14th, 2020.

Figura 1. Incidencia acumulada y ratio de ratios de incidencia según quintiles de IRFD(índice de renta familiar disponible) en los barrios.

Figura 1

The Pearson correlation was also calculated between the selected variables and the cumulative incidence of COVID-19 until 14th May 2020.

The second part consisted of a multivariate analysis of the association between the socioeconomic and demographic determinants and the COVID-19 incidence (dependent variable) using a Generalized Linear Model (GLM), in which the following variables were included as independent variables: percentage of population from Maghreb and Latin America, percentage of population older than 75 years old and percentage of population with a BMI higher than 25. The variables were standardized.

In order to determine if a variable should be included, considering that the independence between them is a basic assumption of the model, a multicollinearity analysis was carried out, and the variables with a Variance Inflation Factor (VIF) higher than 5 were excluded. All the variables had a VIF smaller than 1.8 (table 3).

Table 3. Correlation of the cumulative incidence confirmed by PCR at May 14th, 2020 with the independent variables in the neighbourhoods of Barcelona.

graphic file with name 1135-5727-resp-94-e202009101-g017.jpg

Data extracted from the same sources of table 1; (*) The correlation is significant at the level 0.05 (bilateral); (**) The correlation is significant at the level 0.01 (bilateral).

To estimate the effect of the health conditions in the differences in the incidence, the percentage of people with a BMI higher than 25 was selected, since it strongly represents the prevalence of chronic illnesses and a lifestyle that interferes in the population’s susceptibility to COVID-19. The percentage of citizens from Maghreb and Latin America were selected as indicators of how immigration on itself and its origin could have an impact, since it can affect both the susceptibility to suffer the diseases as well as on the transmission of it through specific lifestyles, or for the demographic structure of these communities. The rest of migrant groups were excluded since they showed correlation between themselves and were not significant in the model. The AIFI was excluded as well because it didn’t show statistical significance in the model.

A model of normal distribution and an identity link function for the GLM were configured, since the Saphiro-Wilk test and the Q-Q graph showed normal distribution for the dependent variable (p=0.103).

One neighbourhood (code 12, Marina del Prat Vermell-AEI Zona Franca) was excluded from the statistical analysis since it showed an outlying value that altered the tendencies that the other neighbourhoods followed. This is probably due to singular characteristics within this population unit, since it is a big industrial area with little population. Likewise, the cases in retirement homes were excluded because they could significantly modify the distribution of cases between neighbourhoods, creating differences that were not really a consequence of the characteristics of the population unit and overestimating the incidence. Furthermore, the health questionnaires in which some variables were based, excluded those that were institutionalized.

Validity of the model

In order to select the model that better explained the variations between neighbourhoods, the Akaike Information Criterion (AIC) was used and the model with the lowest value (AIC=120) was selected, corresponding to the model with the variables previously exposed.

Another basic assumption in the model was the homoscedasticity. To determine if the model violated or not the assumption of homoscedasticity a dispersion diagram of the predicted value for the model against the residual deviation was done, which showed a pattern of random deviation, just as it would be expected from a homoscedastic model. The residual deviation showed normality in its distribution (p>0.05 in Saphiro-Wilk’s test) and, in consequence, an estimator based on the model was configured in order to test the statistical significance for each variable.

RESULTS

The descriptive analysis of the variables (mean, minimum and maximum and standard deviation) showed differences in their distribution amongst the neighbourhoods (table 2). The study of the incidence in the neighbourhoods depending on their quintile of AIFI (figure 1) showed clear differences between them. The neighbourhoods with a lower income showed a 42% higher incidence, 942 cases for every 100,000 citizens, than those with a higher income, which had an incidence of 545 cases for every 100,000 citizens. The risk estimation through the IRR, the neighbourhoods with a lower income showed an IRR of 1.73 (IC 95% 1.56; 1.92), taking as reference those with a higher income.

The analysis of the Pearson linear correlation (table 3) showed that there was a statistically significant difference between the cumulative incidence of COVID-19 until 14th May 2020 and the following variables: percentage of people older than 75 years old (r=0.487; p<0.01), percentage of immigrants (r=-0.257; p<0.05), the Available Income per Family Index (AIFI) (r=-0.462; p<0.01), the percentage of people with BMI>25 (r=0.483; p<0.01) and the smokers (r=0.243; p<0.05).

Analysing the percentage of immigrants according to their origin, differences were observed: while the percentages of population from Asia and Oceania (r=-0.275; p<0.05) and Maghreb (r=-0.197; p>0.05) showed a statistically significant and non-significant negative correlation, respectively; the percentage of population from Latin America showed a statistically significant positive correlation (r=0.322; p<0.01). The percentage of population from the rest of Africa showed a weak correlation which was non-significant (r=0.034; p>0.05).

In the GLM (table 3), the following variables showed a statistical significance: the percentage of population older than 75 years old (Z-score=0.258; p<0.01), the percentage of population from Maghreb (Z-score=-0.206; p<0.01), the percentage of population from Latin America (Z-score=0.190; p<0.01) and the percentage of people with BMI>25 (Z-score=0.334; p<0,01).

The D2 parameter, which showed the variation explained by the model, obtained a value of 0.52 (52% of the variance is being explained by this model).

DISCUSSION

Even though from this ecological study it cannot be inferred that the variables are a direct cause of the difference in the cumulative incidence of COVID-19 in the neighbourhoods of Barcelona, it does offer a good perspective of its relation and a preliminary assessment of how social determinants could have modified the incidence of the disease.

The study shows that there is a correlation between the cumulative incidence of COVID-19 until the 14th of May 2020 and the different socioeconomic variables, and that the population units more socioeconomically deprived have a higher incidence of COVID-19 -a 42% more in those with the lowest AIFI when compared with those with the highest- as well as a higher risk of incidence -with an IRR of 1.73 in the neighbourhoods with lower IRFD in relation to those with a higher one-. This suggests that there is a correlation between the income of the neighbourhoods and the cumulative incidence, and that there exists a higher risk to contract the diseases in the neighbourhoods that are more economically limited.

In the Pearson correlation, even though the net density does not show significance and presents a weak intensity (r=-0.01; p>0.05), the role of transmission in homes cannot be discarded as a variable that could have modified the incidence between neighbourhoods, since the official statistics probably do not reflect specific overcrowding situations in housings.

The GLM is a useful tool to understand what variables have a stronger effect in the modification of incidence of COVID-19. The percentage of people with a BMI>25 seems to be the variable with the higher effect in the differences between neighbourhoods (Z-score=0.334; p<0.01). The BMI does not only represent an individual condition, but the prevalence of toxic habits and other health determinants. Furthermore, obesity has been correlated with a worse prognosis of the disease, according to a study by Tamara A and Tahapary DL 8 . This could explain why the neighbourhoods with higher obesity prevalence show a higher incidence of COVID-19 and why it is the variable that reflects more intensity in the correlation. The studies of risk factors of mortality in hospitalized patients in Catalonia 9 also show a worse prognosis for the patients with obesity. The obesity prevalence is additionally associated with a lower AIFI (r=-0.767; p<0.01).

The percentage of people older than 75 years old also appears to be a relevant variable (Z-score=0.258; p<0.01), since it increases the susceptibility of the disease. It is a variable that does not show a correlation with the income, which could explain an important part of the observed differences.

The immigration appears to be significant both in the Pearson correlation and the GLM. The percentage of Asian population reflexes a negative correlation with the incidence (r=-0.275; p<0.01), which could be explained by cultural difference or a higher awareness of the situation caused by the previous affectation in their home countries, which may have lead them to take measures of social distancing and closure of their establishments before it was recommended to the general public.

The Maghreb immigration is correlated with a lower incidence. The cause of this correlation might be the age of this population, younger than the mean 10 , as well as language and cultural barriers that could have caused an underdiagnosis of the disease.

On the other hand, the immigration from Latin America has been correlated with a higher incidence. There is no relationship with this group and the age, so the differences could be due to poorer hygiene and housing conditions, lower education rates or individual susceptibility differences.

All the studied variables do not represent solely a specific condition of the population unit, but they represent as well lifestyles that are a consequence of a higher socioeconomic deprivation. Furthermore, to discern which are the mechanisms that can cause the differences in the cumulative incidence of COVID-19, it is of special relevance to comprehend how social determinants affect the behaviour of epidemics upon the more deprived groups and on the population’s health.

There seems to be a clear correlation amongst the social determinants against the incidence and, therefore, this epidemic could be an important catalyst for poverty and, accordingly, worse health conditions. In fact, previous studies such as the one done by Bambra C et al 11 on the flu epidemic of 1918, the epidemic of the virus H1N1 and the present SARS-CoV2 also show that the neighbourhoods or countries more economically deprived, with a lower income, have shown more incidences of said viruses. For this reason, specific programs with a universal character aimed at reducing and easing the inequalities both in health and the access to the health system are of vital importance, since they could as well reduce the impact of the epidemics. Moreover, it is suggested that programs and specific community interventions targeted at specific immigrant groups should be implemented.

As for the limitations of the study, because it is an ecological study, it can solely identify variables that have modified the incidence at a level of population unit and establish hypotheses as to why, but no causalities can be inferred, since only the differences between neighbourhoods have been studied instead of those at an individual level.

Another limitation is the external validity of the results. The study shows clear correlations between the incidence and different socioeconomic variables. However, this should be extrapolated to other populations with caution. The exclusion of retirement homes cases can be another important limitation and specific studies on the impact on these centres should be carried out.

Data is also a major limitation, especially in those acquired in the health questionnaires, since they are done with samples of the city’s population and cannot reflect in a completely reliable way the prevalence of a disease or described condition. It also cannot be ignored that the data on cumulative incidence of COVID-19 has been affected by a lack of quality. Therefore, it must be considered that the subsequent evolution of the epidemic can modify the correlations described in this preliminary study.

Finally, an important point to consider is that, because of the saturation of the healthcare system caused by the epidemic, most part of the PCR tests, which data this study relies on, were made to the cases with a worse clinical presentation. So, probably, this study is estimating the differences in the worsening of the clinical presentation of COVID-19, and not so much the real differences in the incidence. This proves that more studies with consolidated data on the impact of the socioeconomic variables on the incidence of COVID-19 are needed, as well as the mortality. Regardless, said variables show a correlation and, therefore, can have influences, both in the incidence and in the worsening of the clinical profile, and they should be considered when facing and managing an epidemic.

ACKNOWLEDGMENTS

To Dr. José Aramburu, from the Department of Experimental and Health Sciences of the Pompeu Fabra University, for his support and help on the paper, and to Dr. Manuel Pastor, from the same department, for his statistical advice.

Cita sugerida: Amengual-Moreno M, Calafat-Caules M, Carot A, Rosa Correia AR, Río-Bergé C, Rovira Plujà J, Valenzuela Pascual C, Ventura-Gabarró C. Social determinants of the incidence of COVID-19 in Barcelona: a preliminary ecological study using public data. Rev Esp Salud Pública. 2020; 94: September 16th e202009101.

Annex I.

Table Annex I. Data tables.

Annex I.

Annex I.

Annex I.

Annex I.

Annex I.

Annex I.

Annex I.

Annex I.

Annex I.


Articles from Revista Española de Salud Pública are provided here courtesy of Dirección General de Salud Pública - Ministerio de Sanidad

RESOURCES