Skip to main content
CoDAS logoLink to CoDAS
. 2022 Jan 7;34(3):e20200207. doi: 10.1590/2317-1782/20212020207
View full-text in Portuguese

Masking Level Difference: test-retest reliability assessment in normal hearing female university students

Silvana Maria Monte Coelho Frota 1,, Carlos Alberto Leite Filho 2, Carolina Salomone Bruno 3, Lanna Borges Carvalho 3, Natalia Almeida Riegel 3, Sascha Ariel da Silva Rodrigues de Souza 3, Fátima Cristina Alves Branco-Barreiro 4
PMCID: PMC9851185  PMID: 35019083

ABSTRACT

Purpose

To verify the test-retest reliability of the Masking Level Difference in normal hearing female university students.

Methods

Prospective descriptive study with 78 young female adults without hearing complaints, submitted to the compact disc version of the Masking Level Difference by Auditec of Saint Louis. The threshold was determined by the difference between signal-to-noise ratios at hearing thresholds found in the antiphasic and homophasic conditions. The test was applied by the same examiner in two moments (test and retest) with an interval of seven to 14 days between them. Inferential statistical analysis included comparison of test and retest situations using Student's t test for paired samples, calculation of the intraclass correlation coefficient and calculation of 95% confidence intervals for signal-to-noise ratios at hearing thresholds found in the antiphasic and homophasic conditions and for masking level difference.

Results

The average signal-to-noise ratio at hearing threshold ​​in the homophasic condition was -12.59 dB and -12.46 dB in the Test and Retest situations, respectively, and -21.54 dB and -21.08 dB in the antiphasic condition. The average value ​​in the final Masking Level Difference result was 8.95 dB in the Test and 8.74 dB in the Retest. Intraclass correlation coefficient values ​​obtained were 0.436, 0.625 and 0.577 for homophasic, antiphasic and Masking Level Difference conditions, respectively.

Conclusion

The Masking Level Difference showed moderate test-retest reliability in normal hearing adults female university students.

Keywords: Hearing Tests, Reproducibility of Results, Auditory Perception, Auditory Perceptual Disorders, Hearing

INTRODUCTION

Central Auditory Processing (CAP) is defined as the perceptual processing of auditory information derived from the neurobiological activity in the Central Auditory Nervous System (CANS). The CAP is constituted of mechanisms of auditory discrimination, temporal processing, and binaural processing that originate its hearing skills. Indeed, CAP Disorders is the term used to designate damages in these processes (CAPD)(1).

Performance throughout a behavioral testing battery is an important piece in the CAPD diagnosis puzzle, which includes the Masking Level Difference (MLD) test to assess binaural interaction, that is, the ability of the CANS to process different sound stimuli – complementary or not – introduced on both ears. It consists of listening and synthesis of acoustic information, resulting in a single perceptual event that allows a better hearing performance for benefiting sound source localization and direction, background noise perception, and good performance when associated with competing linguistic message. The results of tests to assess such phenomenon allow inferences on the functional integrity of brainstem – the main structure related to binaural interaction(1-4).

The MLD is based on the masking release phenomenon, described for the first time in 1948 for pure tones(5), which occurs upon the binaural introduction of words or pure tone (generally known “signal”) on both ears, which are sent a narrowband masking noise simultaneously, thus generating auditory competition. The introduction of two stimuli on both ears in homophasic condition, that is, the same sound wave phase, leads to a greater masking noise effect on the signal and consequently higher auditory threshold. Conversely, a weaker noise masker effect on the signal and a lower auditory threshold occur when one of these stimuli is introduced in inverted phase on one ear, characterizing an antiphasic condition. Such improvement characterizes the masking release phenomenon, which can be quantified based on the difference between the thresholds obtained in the monophasic and anti-phase conditions, known as MLD(6,7). This release can contribute to a better understanding on speech situations of competing noise or in the presence of several speakers, since the signal perception is improved when the differences between the binaural tracks of the signal and the masking appear simultaneously(8).

Even though we could not find any other similar studies in adults, tonal MLD proved efficient at distinguishing normal children from those with suspected of CAPD with a sensitivity of 79% and specificity of 88%(9,10). The currently used commercial version of the test was developed in 2003(11), and international studies indicate that a MLD higher than or equal 10 dB is expected for individuals within the normality standards(3). A Brazilian study with the participation of normal-hearing young adults showed an average MLD of 10.83 dB(12).

Tonal MLD is a non-linguistic test that represents an important instrument in a behavioral assessment battery of CAP as it can be applied to individuals with limited linguistic skills or language disorders, in addition to providing simple application and analysis. The main national and international scientific societies in the Audiology field(13-16) recommend the use of a test to assess the auditory skill of binaural interaction and non-linguistic tests in the CAPD diagnosis battery.

The tests used for CAPD diagnosis must provide reliable measures for professionals; therefore, it is fundamental to learn the validity and reliability of the tests contained in the battery to determine the clinical use of these tools(16).

Reliability is among the main quality criteria for an instrument and reflects its capacity to reproduce a result consistently over time. This parameter can be assessed by measuring test-retest reliability, that is, the degree at which similar results are achieved at two distinct moments. Intraclass Correlation Coefficient (ICC) is regarded as the most adequate index to quantify this parameter for reflecting not only its degree of correlation, but also the degree of agreement between situations(17).

Although some studies aimed to establish MLD reliability, important limitations were involved, such as small sample size(11) and samples consisting of children(18,19), while samples composed of adults are recommended for reliability studies due to the maturational stability of the CANS(20). Furthermore, we could not find any national studies addressing the analysis of MLD test-retest reliability in the Brazilian population. Thus, despite its wide clinical use and long existence, MLD is yet to be further explored in studies ranging the stage of reliability verification according to adequate methodological rigor. In this context, our goal was to analyze the MLD test-retest reliability in normal-hearing female university students.

METHODS

This is a descriptive prospective study carried out at the Outpatient Audiology Clinic of the University Hospital Clementino Fraga Filho at the Federal University of Rio de Janeiro (Universidade Federal do Rio de Janeiro (UFRJ)) after being approved by the ethics and research committee of the institution (number 941,370). All participants signed an Informed Consent Form (ICF).

Undergraduate students at the Medical School of UFRJ aged between 20 and 25 years were invited to participate in our study, thus characterizing a convenience sample. The participants were selected by means of sociodemographic and health questionnaire, pure-tone audiometry (250 to 8000 Hz), speech audiometry (Speech Reception Threshold (SRT)), and Binaural integration task in the Dichotic Digit Test (DDT)(21) – here used as CAP screening.

The sample included all students who did not report otological complaints (tinnitus, hearing difficulty, dizziness, ear fullness), history of surgeries, otological changes, acoustic trauma, or neurological alterations. Upon not meeting the following requirements, the subjects were excluded from the sample: audiometry thresholds within the normality standard (≤ 20 dBNA, 250-8000 Hz)(22); SRT compatible with the thresholds found in the three-tone average (500, 1000, and 2000 Hz), and hit ratio above or equal 95% on both ears at the Binaural integration task of DDT(23).

Altogether, 80 subjects were assessed and two were excluded for having presented a hit ratio below 95% in the DDT. Thus, the sample consisted of 78 female young adults aged between 20 and 25 years from undergraduate programs at the Medical School of UFRJ.

The participants were subjected to the commercial version of the tonal MLD test available by the Auditec of Saint Louis, whose recording had an approximate duration of four minutes consisting of the introduction of 33 noise segments at the same phase on both ears along with a pure pulsing tone of 500Hz (signal), in different Signal-to-noise ratios (S/N), in which the signal can be in either of the two following conditions: at the same phase on both ears (homophasic condition – SoNo) or at inverted phase on one of the ears (antiphasic condition – SπNo). Furthermore, some of the items in the test were composed only by the noise, thus presenting no signal (No Tone – NT) as control condition. The subject was asked to raise their hand upon hearing the pure tone, thus ignoring the noise masker. By the end of the test application, the hits per condition was quantified and then the MLD was calculated through the equation MLD = S/N in the SπNo threshold – S/N in the SoNo threshold, in which the threshold corresponding to the number of hits per condition was obtained according to the conversion presented in the test manual(24).

The test was applied in two stages: test and retest, with a time interval from seven to 14 days between, conducted by a single examiner under the same methodological precautions and equipment (Aurical Aud – Software OTOsuite). It is worth emphasizing that the literature recommends a time interval from seven to 14 days for retest(25-27).

The statistical analysis was performed on the SPSS Statistics software, version 25.0 (IBM Corp., Armonk, NY, USA) according to concepts and tools recommended by the literature(28). The descriptive analysis characterized the data collected by calculating the mean, standard deviation, median, and minimum and maximum values. Parametric tests were applied for the inferential analysis since the sample was sufficiently large to allow their direct use due to the Central Limit Theorem(29). The inferential analysis encompassed a comparison of test and retest situations through Student t-test for paired samples, calculation, and interpretation of ICC based on a single measures, absolute agreement, two-way mixed-effects model(17). According to the literature(17), ICCs below 0.5, between 0.5 and 0.75, between 0.76 and 0.9, and above 0.9 were considered to indicate weak, moderate, good, and excellent reliability, respectively. The effect size was measured by calculating the coefficient d. Finally, the Confidence Intervals (CI) of 95% were calculated based on bias-corrected and accelerated method for 2000 bootstrap samples.

RESULTS

We did not find any significant statistical differences between test and retest situations regarding the three MLD conditions, and the comparisons revealed very small effect sizes. Furthermore, the difference between the situations remained ranging the values of -4 and 4 dB, with an average of -0.21 dB and CI of 95% encompassing the value of 0.00 dB, suggesting similar values for both situations (Table 1).

Table 1. Descriptive values and comparative analysis of the test-retest situations regarding the MLD parameters.

Parameters Stage Mean SD Median Min. Max. p d
[CI 95%] [CI 95%]
S/N S0N0 (dB) Test -12.59 2.60 -12.00 -20.00 -8.00 0.687 0.049
[-13.13, -12.03] [-12.00, -12.00]
Retest -12.46 2.66 -12.00 -18.00 -2.00
[-13.03, -11.87] [-12.00, -12.00]
S/N SπN0 (dB) Test -21.54 2.95 -22.00 -30.00 -14.00 0.118 0.156
[-22.16, -21.74] [-22.00, -20.00]
Retest -21.08 3.04 -21.00 -30.00 -14.00
[-21.74, -20.44] [-22.00, -20.00]
MLD (dB) Test 8.95 2.34 8.00 4.00 18.00 0.413 0.088
[8.46, 9.41] [8.00, 8.00]
Retest 8.74 2.44 8.00 2.00 16.00
[8.23, 9.26] [8.00, 8.00]
MLD – Difference between Test and Retest (dB) - -0.21 2.20 0.00 -4.00 4.00 - -
[-0.67, 0.26] [0.00, 0.00]

Student t-test for paired samples

Caption: MLD: Masking Level Difference; S/N: Signal-to-Noise Ratio; SD: Standard Deviation; Min.: Minimum; Max.: Maximum; CI: Confidence Interval

The mean value of S/N in the auditory threshold at the test-retest stages were -12.59 ± 2.60 dB and -12.46 ± 2.66 dB for homophasic condition, and -21.54 ± 2.95 dB and -21.08 ± 3.04 dB for antiphasic condition, respectively. The mean MLD was 8.95 ± 2.34 dB for the Test, and 8.74 ± 2.44 dB for the Retest.

The ICC to assess reliability through test-retest reached 0.436 for the condition SoNo, 0.625 for SπN0, and 0.577 for final MLD (Table 2), indicating weak, moderate, and moderate reliability, respectively(17).

Table 2. Analysis of the test-retest reliability regarding MLD.

Parameters n ICC [CI 95%] p
S/N S0N0 78 0.436 [0.237. 0.600] < 0.001*
S/N SπN0 78 0.625 [0.470. 0.743] < 0.001*
MLD 78 0.577 [0.408. 0.708] < 0.001*

Caption: MLD: Masking Level Difference; S/N: Signal-to-Noise Ratio; ICC: Intraclass Correlation Coefficient; CI: Confidence Interval;

*

statistically significant value at 5% level (p ≤ 0,05)

DISCUSSION

Although the MLD test has unique characteristics for enabling to assess binaural interaction through non-verbal stimuli, thus contributing to CAPD diagnosis and therapeutic(2,3,14), its reliability, which assures the accuracy of CAPD diagnosis and intervention, is yet to be further studied. Following the trends of other researches(11,18,19,25), this study could establish a comparison between test and retest stages to assess MLD reliability by verifying the occurrence of statistical significant differences between test and retest stages. However, as proposed in more modern statistical approaches(17-19), a more specific assessment of reliability through ICC suggested a moderate degree of test-retest reliability.

Although this study was conducted in female young adults, the few studies on MLD reliability reported in the literature were carried out in children(18,19), except for Wilson et al.(11).

A previous study(18) assessed the MLD test-retest reliability in a group of 24 Norwegian children aged 10 years at an interval of approximately two weeks between test and retest. The authors suggested that the degree of reliability achieved was satisfactory since the ICC value was 0.6 (IC 95%: 0.3-0.8). Even though the age group considered in the study was not the most adequate for studies of test-retest reliability(20), the ICC value obtained was statistically similar to our findings. A possible explanation is the early maturation of the binaural interaction mechanism, as the MLD presents similar results for preschool children and adults(30).

When studying the elaboration and validation of the commercially available version of the MLD test(11), the authors suggested that the instrument provided good reliability based on the absence of significant statistical differences between test and retest stages for 15 college students subjected to the same assessment session. However, in this study, we found a not so optimistic reliability. It is worth highlighting that both studies used different statistical methods to measure test-retest reliability; in addition, the literature suggests that tests for hypothesis of comparing averages of paired samples – as used by Wilson et al.(11) – do not serve such purpose. Furthermore, performing both test and retest in a single session can characterize a very short period to assess reliability due to the influence of factors like memory and learning; therefore, the recommended interval ranges from seven to 14 days(25-27).

An international study(19) assessed the MLD test-retest reliability in 45 English children aged between six and 10 years in a single session and found different results comparing with our study, with a general ICC of 0.36, which can be regarded as indicator of a weak test-retest reliability. However, it is worth highlighting that this latter study included children under seven years old and did not regard the optimum time between the test repetitions, which can characterize a bias. Other factors such as different levels of language development, level of attention, motivation, and understanding regarding the instructions given can justify the unsatisfactory results of the study.

Test-retest reliability establishes the degree at which a certain population is able to maintain the stability of results using a given assessment instrument along time. Thus, it is not a fixed property since many are the factors interfering with the observation of such phenomenon, including sample size, interval between test and retest, studied population, and method of result analysis. Therefore, an instrument may be reliable in certain circumstances, but not in others(26,27).

As to sample size, the literature recommends samples of more than 50 participants to assess test-retest reliability(25), and this study encompasses a sample of 78 normal-hearing adults.

It is known that the interval between test and retest repetitions must be long enough to avoid the effect of memory, but short enough to prevent clinical alterations that could influence the interpretation(27). Therefore, we chose a time interval ranging from seven to 14 days – regarded as adequate to such purpose(25-27).

Regarding the analysis of results, Pearson’s correlation coefficient, t-test for paired samples and Bland-Altman plot are often used for reliability assessment. However, while the former is a simple correlation measure and the latter two only correspond to agreement measures, the ICC indicates both the degrees of correlation and agreement between the measures, thus representing a more desirable reliability measure(17).

We sought to ensure a reliable measurement of the MLD test-retest reliability, and its moderate classification in this study offers some implications to the test interpretation in the context of its clinical practice application. For example, using it in a scenario of pre- and post-auditory training comparison must consider that the test involves a certain degree of instability, consequently, its results must be analyzed carefully and bearing into consideration all other tests in the auditory processing assessment battery.

A potential limitation of our study was associated with the convenience sample including only adults, female university students, despite the prospective descriptive design. The high educational level of such population may have influenced the responses positively. However, it is worth pointing out that previous could not find differences between genders regarding the MLD values(7,9). Furthermore, the lack of research on the Brazilian population narrows the possibilities of comparing studies, leading to the need for further studies to learn the MLD test reliability for male subjects in populations formed by children and elderly, as well as in populations of different socioeconomic or educational levels.

CONCLUSION

The MLD test showed a moderate degree of test-retest reliability in normal-hearing university students.

Footnotes

Study conducted at Universidade Federal do Rio de Janeiro (URFJ) – Rio de Janeiro (RJ), Brasil.

Financial support: nothing to declare.

REFERENCES

  • 1.ASHA: American Speech-Language-Hearing Association Central Auditory Processing Disorder (Practice Portal) 2021. [citado em 2021 Mar 12]. Internet. Disponível em: www.asha.org/Practice-Portal/Clinical-Topics/Central-Auditory-Processing-Disorder/
  • 2.Baran JA. In: Handbook of central auditory processing disorder: auditory neuroscience and diagnosis. 2nd. Musiek FE, Chermak GD, editors. San Diego: Plural Publishing; 2013. Test battery principles and considerations. pp. 291–323. [Google Scholar]
  • 3.Pereira LD, Frota S. In: Tratado de Audiologia. 2ª. Boéchat EM, Menezes PL, Couto CM, Frizzo ACF, Scharlach RC, Anastasio ART, editors. Rio de Janeiro: Guanabara Koogan; 2015. Avaliação do processamento auditivo: testes comportamentais. pp. 161–170. [Google Scholar]
  • 4.Santiago JM, Luiz CBL, Garcia M, Gil D. Masking level difference and electrophysiological evaluation in adults with normal hearing. Int Arch Otorhinolaryngol. 2020;24(4):e399–406. doi: 10.1055/s-0040-1701266. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 5.Hirsh IJ. The influence of interaural phase on interaural summation and inhibition. J Acoust Soc Am. 1948;20(4):536–544. doi: 10.1121/1.1906407. [DOI] [Google Scholar]
  • 6.Olsen WO, Noffsinger D, Carhart R. Masking level differences encountered in clinical populations. Int J Audiol. 1976;15(4):287–301. doi: 10.3109/00206097609071789. [DOI] [PubMed] [Google Scholar]
  • 7.Burnham MN. Normal masking level difference parameters for use in the clinical evaluation of auditory processing disorders. Provo: Brigham Young University; 2010. [Google Scholar]
  • 8.Sutojo S, van de Par S, Schoenmaker E. Contribution of binaural masking release to improved speech intelligibility for different masker types. Eur J Neurosci. 2020;51(5):1339–1352. doi: 10.1111/ejn.13980. [DOI] [PubMed] [Google Scholar]
  • 9.Martins QP, Faccin VA, Brückmann M, Gil D, Garcia MV. Masking Level Difference em escolares: análises ambientais. CoDAS. 2018;30(3):e20170048. doi: 10.1590/2317-1782/20182017048. [DOI] [PubMed] [Google Scholar]
  • 10.Sweetow RW, Reddell RC. The use of masking level differences in the identification of children with perceptual problems. J Am Aud Soc. 1978;4(2):52–56. [PubMed] [Google Scholar]
  • 11.Wilson RH, Moncrieff DW, Townsend EA, Pillion AL. Development of a 500-Hz Masking-Level Difference protocol for clinic use. J Am Acad Audiol. 2003;14(1):1–8. doi: 10.3766/jaaa.14.1.2. [DOI] [PubMed] [Google Scholar]
  • 12.Mendes SC, Branco-Barreiro FCA, Frota S. Limiar diferencial de mascaramento: valores de referência em adultos. Audiol Commun Res. 2017;22(0):e1746. doi: 10.1590/2317-6431-2016-1746. [DOI] [Google Scholar]
  • 13.ABA: Academia Brasileira de Audiologia Recomendações e valores de referência para o protocolo de avaliação do PAC: comportamental e eletrofisiológica.; Anais do 31º Encontro Internacional de Audiologia; 2016; São Paulo. São Paulo: ABA; 2016. Fórum: Diagnóstico Audiológico. [Google Scholar]
  • 14.CFFa: Conselho Federal de Fonoaudiologia Avaliação e Intervenção no Processamento Auditivo Central. 2020. [citado em 2021 Mar 1]. 40. Internet. Disponível em: https://www.fonoaudiologia.org.br/wp-content/uploads/2020/10/CFFa_Guia_Orientacao_Avaliacao_Intervencao_PAC.pdf .
  • 15.ASHA: American Speech-Language-Hearing Association Central) auditory processing disorders - the role of the audiologist [Position Statement]. 2005. [citado em 2020 Jan 10]. Internet. Disponível em: www.asha.org/policy/
  • 16.AAA: American Academy of Audiology Clinical Practice Guidelines: Diagnosis, treatment and management of children and adults with central auditory processing disorder. 2010. [citado em 2020 Mar 26]. 51. Internet. Disponível em: https://audiology-web.s3.amazonaws.com/migrated/CAPDGuidelines 8-2010.pdf_539952af956c79.73897613.pdf.
  • 17.Koo TK, Li MY. A guideline of selecting and reporting intraclass correlation coefficients for reliability research. J Chiropr Med. 2016;15(2):155–163. doi: 10.1016/j.jcm.2016.02.012. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 18.Mattsson TS, Follestad T, Andersson S, Lind O, Øygarden J, Nordgård S. Normative data for diagnosing auditory processing disorder in Norwegian children aged 7-12 years. Int J Audiol. 2018;57(1):10–20. doi: 10.1080/14992027.2017.1366670. [DOI] [PubMed] [Google Scholar]
  • 19.Moore DR, Cowan JA, Riley A, Edmondson-Jones AM, Ferguson MA. Development of auditory processing in 6- to 11-yr-old children. Ear Hear. 2011;32(3):269–285. doi: 10.1097/AUD.0b013e318201c468. [DOI] [PubMed] [Google Scholar]
  • 20.Musiek FE, Chermak GD. In: Handbook of central auditory processing disorder: auditory neuroscience and diagnosis. 2nd. Musiek FE, Chermak GD, editors. San Diego: Plural Publishing; 2013. Auditory neuroscience and central auditory processing. pp. 3–16. [Google Scholar]
  • 21.Matos GGO, Frota S. Frota S. A influência das perdas auditivas sensorioneurais na ordenação temporal. Rev CEFAC. 2013;15(6):1435–1440. doi: 10.1590/S1516-18462013005000008. [DOI] [Google Scholar]
  • 22.Frota S. Avaliação básica da audição: fundamentos em fonoaudiologia. 2ª. Rio de Janeiro: Guanabara Koogan; 2003. pp. 41–60. [Google Scholar]
  • 23.Pereira LD, Schochat E. Testes auditivos comportamentais para avaliação do processametno auditivo central. Barueri: Pró-Fono; 2011. 82 [Google Scholar]
  • 24.Auditec of Saint Louis . Masking Level Difference: evaluation manual. St. Louis: Auditec, Inc.; [Google Scholar]
  • 25.Souza AC, Alexandre NMC, Guirardello EB, Souza AC, Alexandre NMC, Guirardello EB. Propriedades psicométricas na avaliação de instrumentos: avaliação da confiabilidade e da validade. Epidemiol Serv Saude. 2017;26(3):649–659. doi: 10.5123/S1679-49742017000300022. [DOI] [PubMed] [Google Scholar]
  • 26.Keszei AP, Novak M, Streiner DL. Introduction to health measurement scales. J Psychosom Res. 2010;68(4):319–323. doi: 10.1016/j.jpsychores.2010.01.006. [DOI] [PubMed] [Google Scholar]
  • 27.Terwee CB, Bot SDM, de Boer MR, van der Windt DAWM, Knol DL, Dekker J, et al. Quality criteria were proposed for measurement properties of health status questionnaires. J Clin Epidemiol. 2007;60(1):34–42. doi: 10.1016/j.jclinepi.2006.03.012. [DOI] [PubMed] [Google Scholar]
  • 28.Field A. Discovering statistics using IBM SPSS statistics. 5th. California: SAGE Plubications; 2017. 1070 [Google Scholar]
  • 29.Kwak SG, Kim JH. Central limit theorem: the cornerstone of modern statistics. Korean J Anesthesiol. 2017;70(2):144–156. doi: 10.4097/kjae.2017.70.2.144. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 30.Litovsky R. Development of the auditory system. Handb Clin Neurol. 2015;129:55–72. doi: 10.1016/B978-0-444-62630-1.00003-2. [DOI] [PMC free article] [PubMed] [Google Scholar]
Codas. 2022 Jan 7;34(3):e20200207. [Article in Portuguese]

Masking Level Difference: avaliação da confiabilidade teste-reteste em estudantes universitárias normo-ouvintes

Silvana Maria Monte Coelho Frota 1, Carlos Alberto Leite Filho 2,, Carolina Salomone Bruno 3, Lanna Borges Carvalho 3, Natalia Almeida Riegel 3, Sascha Ariel da Silva Rodrigues de Souza 3, Fátima Cristina Alves Branco-Barreiro 4

RESUMO

Objetivo

Verificar a confiabilidade teste-reteste do Masking Level Difference em estudantes universitárias normo-ouvintes.

Método

Estudo prospectivo descritivo com 78 adultos jovens do gênero feminino sem queixas auditivas, submetidas à versão, em compact disc, do Masking Level Difference da Auditec of Saint Louis. O Masking Level Difference foi determinado por meio da diferença entre as relações sinal-ruído nos limiares auditivos encontrados nas condições antifásica e homofásica. O teste foi aplicado pelo mesmo examinador em dois momentos (teste e reteste) com intervalo de sete a 14 dias entre eles. A análise estatística inferencial incluiu comparação das situações teste e reteste por meio do teste t de Student para amostras pareadas, cálculo do coeficiente de correlação intraclasse e dos intervalos de confiança de 95% para as relações sinal/ruído nos limiares auditivos nas condições antifásica e homofásica e para o cálculo do Masking Level Difference.

Resultados

A média da relação sinal-ruído no limiar auditivo na condição homofásica foi -12,59 dB e -12,46 dB nas situações teste e reteste, respectivamente, e -21,54 dB e -21,08 dB na condição antifásica. A média do Masking Level Difference foi 8,95 dB no teste e 8,74 dB no reteste. Os coeficientes de correlação intraclasse obtidos foram 0,436, 0,625 e 0,577 para as condições homofásica, antifásica e Masking Level Difference, respectivamente.

Conclusão

O teste Masking Level Difference mostrou grau moderado de confiabilidade teste-reteste em estudantes universitárias normo-ouvintes.

Keywords: Descritores Testes Auditivos, Reprodutibilidade dos Testes, Percepção Auditiva, Transtornos da Percepção Auditiva, Audição

INTRODUÇÃO

Define-se como processamento auditivo central (PAC) o processamento perceptual da informação auditiva decorrente da atividade neurobiológica do sistema nervoso auditivo central. O PAC é composto pelos mecanismos de discriminação auditiva, processamento temporal e processamento binaural e destes emergem as habilidades auditivas que compõem o PAC. Prejuízos nestes processos são identificados como transtornos do processamento auditivo central (TPAC)(1).

O desempenho na bateria de testes comportamentais é uma peça importante do quebra-cabeça do diagnóstico do TPAC. Dentre os testes comportamentais utilizados para o diagnóstico do PAC está o Masking Level Difference (MLD), que avalia a interação binaural, ou seja, a capacidade do sistema nervoso auditivo central de processar estímulos sonoros diferentes, complementares ou não, apresentados nas duas orelhas. Ela consiste na escuta e síntese de informações acústicas, resultando num único evento perceptual que permite melhor desempenho auditivo, pois auxilia na localização e direcionamento da fonte sonora, percepção de ruído de fundo e bom desempenho quando associado à mensagem linguística competitiva. Os resultados dos testes que avaliam este fenômeno permitem inferir sobre a integridade funcional do tronco encefálico, principal estrutura associada à interação binaural(1-4).

O MLD se baseia no fenômeno de liberação do mascaramento, descrito pela primeira vez em 1948 para tons puros(5). Este evento é observado quando da apresentação binaural de palavras ou tom puro (denominados genericamente de “sinal”) nas duas orelhas, que, ao mesmo tempo, recebem um ruído mascarador de banda estreita, gerando competição auditiva. Quando os dois estímulos são apresentados nas duas orelhas em condição homofásica, isto é, mesma fase de onda sonora, observa-se maior efeito de mascaramento do ruído sobre o sinal e, portanto, limiar auditivo mais alto. No entanto, quando um destes estímulos é apresentado com fase invertida em uma das orelhas, caracterizando uma condição antifásica, o efeito mascarador do ruído sobre o sinal é atenuado e observa-se melhora do limiar auditivo. Esta melhora caracteriza o fenômeno de liberação do mascaramento, que pode ser quantificado por meio da diferença entre os limiares obtidos nas condições homofásica e antifásica, denominada MLD(6,7). Essa liberação pode contribuir para uma melhor compreensão da fala em situações de ruído competitivo ou na presença de vários falantes, uma vez que há melhora da percepção do sinal quando as diferenças entre as pistas binaurais do sinal e do mascaramento aparecem simultaneamente no tempo(8).

O MLD tonal se mostrou eficiente para separar crianças normais de crianças com suspeita de transtorno do processamento auditivo central com sensibilidade de 79% e especificidade de 88%(9,10), embora não tenham sido encontrados estudos semelhantes em adultos. A versão comercial do teste utilizada atualmente foi desenvolvida em 2003(11) e estudos internacionais indicam que MLD maior ou igual a 10 dB é esperado em indivíduos dentro dos padrões de normalidade(3). Um estudo brasileiro com adultos jovens normo-ouvintes mostrou média de MLD de 10,83 dB(12).

O MLD tonal é importante para uma bateria comportamental de avaliação do PAC, pois, por ser um teste não-linguístico, pode ser usado em indivíduos com habilidades linguísticas limitadas ou com transtornos de linguagem, além de ser simples e de fácil aplicação e análise. A inclusão de um teste que avalie a habilidade auditiva de interação binaural e de testes não-linguísticos na bateria de diagnóstico do TPAC é recomendada pelas principais sociedades científicas nacionais e internacionais na área da Audiologia(13-16).

Os testes utilizados no diagnóstico do TPAC devem fornecer medidas confiáveis para os profissionais que os utilizam. Portanto, conhecer a validade e a confiabilidade dos testes dessa bateria é crítico para a determinação da utilidade clínica dessas ferramentas(16).

A confiabilidade é um dos principais critérios de qualidade de um instrumento e reflete a sua capacidade de reproduzir um resultado de forma consistente no tempo. Esse parâmetro pode ser avaliado por meio da medida de confiabilidade teste-reteste, ou seja, o grau em que resultados similares são obtidos em dois momentos distintos. O coeficiente de correlação intraclasse (CCI) é considerado o índice mais adequado para quantificação deste parâmetro, uma vez que reflete não só o grau de correlação, mas também o grau de concordância entre as situações(17).

Alguns estudos buscaram estabelecer a confiabilidade do MLD, entretanto apresentaram importantes limitações, como baixo número amostral(11) e amostras compostas por crianças(18,19), sendo que o recomendado para o estudo da confiabilidade é fazê-lo em adultos, devido à estabilidade maturacional do sistema nervoso auditivo central(20). Além disso, não foram encontrados estudos nacionais que tenham analisado a confiabilidade teste-reteste do MLD na população brasileira. Assim, apesar de sua ampla utilização clínica e longo tempo de existência, o MLD ainda carece de estudos que tenham cumprido a etapa de verificação da confiabilidade com rigor metodológico adequado. Deste modo, o objetivo desta pesquisa foi verificar a confiabilidade teste-reteste do MLD em estudantes universitárias normo-ouvintes.

MÉTODO

O estudo prospectivo descritivo foi realizado no Ambulatório de Audiologia do Hospital Universitário Clementino Fraga Filho da Universidade Federal do Rio de Janeiro (UFRJ) e aprovado pelo comitê de ética e pesquisa da instituição, sob o número 941.370. Todas as participantes do estudo assinaram o Termo de Consentimento Livre e Esclarecido (TCLE).

Foram convidados a participar do estudo estudantes de graduação da Faculdade de Medicina da UFRJ, na faixa etária de 20 a 25 anos, caracterizando uma amostra de conveniência. A seleção das participantes foi feita por meio de questionário sociodemográfico e de saúde, audiometria tonal básica (250 a 8000 Hz), logoaudiometria (Limiar de Reconhecimento de Fala - LRF) e etapa de integração binaural do Teste Dicótico de Dígitos (TDD)(21), utilizado neste estudo como um rastreio do PAC.

Foram incluídas na amostra as estudantes que não referiram queixas otológicas (zumbido, dificuldade auditiva, tontura, plenitude auricular) e sem histórico de cirurgias ou alterações otológicas, trauma acústico ou alterações neurológicas. Foram excluídos da amostra os indivíduos que não cumpriram pelo menos um dos seguintes requisitos: limiares audiométricos dentro do padrão de normalidade (≤ 20 dBNA, 250-8000 Hz)(22); LRF compatível com os limiares encontrados na média tritonal (500, 1000 e 2000 Hz); e índice de acertos maior ou igual a 95% nas duas orelhas na etapa de integração binaural do TDD(23).

Ao todo, 80 indivíduos foram avaliados, sendo que dois foram excluídos por apresentarem índice de acertos menor que 95% no TDD. Assim, a amostra foi composta por 78 adultos jovens do gênero feminino com idades entre 20 e 25 anos, estudantes de cursos de graduação da Faculdade de Medicina da UFRJ.

As participantes foram submetidas ao teste MLD tonal na versão comercializada pela Auditec of Saint Louis, cuja gravação tem duração aproximada de quatro minutos e consiste na apresentação de 33 segmentos de ruído na mesma fase nas duas orelhas juntamente com um tom puro pulsátil de 500Hz (sinal), em diferentes relações sinal/ruído (S/R), podendo estar o sinal em duas condições: na mesma fase nas duas orelhas (condição homofásica - SoNo) ou em fase invertida em uma das orelhas (condição antifásica - SπNo). Além disso, alguns itens do teste são compostos apenas pelo ruído e sem o sinal (No Tone – NT) como condição controle. O indivíduo é orientado a levantar a mão quando ouve o tom puro, ignorando assim o ruído mascarador. Ao final da aplicação do teste, foram quantificados os acertos em cada uma das condições e o cálculo do limiar diferencial de mascaramento foi realizado por meio da equação MLD = S/R no Limiar SπNo – S/R no Limiar SoNo, sendo que o limiar correspondente ao número de acertos para cada condição foi obtido de acordo com a conversão apresentada no manual do teste(24).

O teste foi aplicado em dois momentos: teste e reteste, com um intervalo de tempo de sete a 14 dias entre eles, por um único examinador, sob os mesmos cuidados metodológicos e mesmo equipamento (Aurical Aud – Software OTOsuite). Cabe ressaltar que a literatura recomenda intervalo de tempo de sete a 14 dias para o reteste(25-27).

A análise estatística foi realizada por meio do software SPSS Statistics, versão 25.0 (IBM Corp., Armonk, NY, EUA) e se baseou na utilização de conceitos e ferramentas preconizados pela literatura(28). A análise descritiva caracterizou os dados coletados por meio do cálculo da média, desvio padrão, mediana e valores mínimo e máximo. Para a análise inferencial, foram utilizados testes paramétricos, uma vez que a amostra foi grande o suficiente para permitir a utilização direta destes em virtude do Teorema Central do Limite(29). A análise inferencial incluiu comparação das situações teste e reteste por meio do teste t de Student para amostras pareadas, cálculo e interpretação do coeficiente de correlação intraclasse (CCI) por medidas únicas baseado em um modelo misto de dois fatores do tipo concordância absoluta(17). Conforme recomendado pela literatura(17), CCIs abaixo de 0,5, entre 0,5 e 0,75, entre 0,76 e 0,9 e acima de 0,9 foram considerados, respectivamente, indicativos de confiabilidade fraca, moderada, boa e excelente. O tamanho do efeito foi mensurado por meio do cálculo do coeficiente d. Por fim, para calcular os intervalos de confiança de 95%, utilizou-se o método de viés corrigido e acelerado com base em 2000 amostras bootstrap.

RESULTADOS

Não foram observadas diferenças estatisticamente significantes entre as situações teste e reteste em relação às três condições do MLD, bem como foram observados tamanhos de efeito muito pequenos para as comparações. Além disso, a diferença entre as duas situações se manteve entre os valores -4 e 4 dB, com média de -0,21 dB e intervalo de confiança de 95% englobando o valor 0,00 dB, sugerindo semelhança dos valores obtidos nas duas situações (Tabela 1).

Tabela 1. Valores descritivos e análise comparativa das situações Teste e Reteste em relação aos parâmetros do MLD.

Parâmetros Momento Média DP Mediana Mín. Máx. p d
[IC 95%] [IC 95%]
S/R S0N0 (dB) Teste -12,59 2,6 -12,00 -20,00 -8,00 0,687 0,049
[-13,13, -12,03] [-12,00, -12,00]
Reteste -12,46 2,66 -12,00 -18,00 -2,00
[-13,03, -11,87] [-12,00, -12,00]
S/R SπN0 (dB) Teste -21,54 2,95 -22,00 -30,00 -14,00 0,118 0,156
[-22,16, -21,74] [-22,00, -20,00]
Reteste -21,08 3,04 -21,00 -30,00 -14,00
[-21,74, -20,44] [-22,00, -20,00]
MLD (dB) Teste 8,95 2,34 8,00 4,00 18,00 0,413 0,088
[8,46, 9,41] [8,00, 8,00]
Reteste 8,74 2,44 8,00 2,00 16,00
[8,23, 9,26] [8,00, 8,00]
MLD – Diferença entre Teste e Reteste (dB) - -0,21 2,2 0,00 -4,00 4,00 - -
[-0,67, 0,26] [0,00, 0,00]

Teste t de Student para amostras pareadas

Legenda: MLD: Limiar Diferencial de Mascaramento; S/R: Relação Sinal-Ruído; DP: Desvio padrão; Mín.: Mínimo; Máx.: Máximo; IC: Intervalo de confiança

O valor médio da S/R no limiar auditivo dos momentos de Teste e Reteste foram, respectivamente, -12,59 ± 2,60 dB e -12,46 ± 2,66 dB para a condição homofásica e -21,54 ± 2,95 dB e -21,08 ± 3,04 dB para a condição antifásica. A média do MLD foi de 8,95 ± 2,34 dB no Teste e 8,74 ± 2,44 dB no Reteste.

O coeficiente de correlação intraclasse (CCI), que avalia a confiabilidade por meio do teste-reteste, foi de 0,436 para a condição SoNo, 0,625 para a SπN0 e de 0,577 para o MLD final (Tabela 2), indicando confiabilidades fraca, moderada e moderada, respectivamente(17).

Tabela 2. Análise da confiabilidade teste-reteste do MLD.

Parâmetro n CCI p
[IC 95%]
S/R S0N0 78 0,436 < 0,001*
[0,237, 0,600]
S/R SπN0 78 0,625 < 0,001*
[0,470, 0,743]
MLD 78 0,577 < 0,001*
[0,408, 0,708]

Legenda: MLD: Limiar Diferencial de Mascaramento; CCI: Coeficiente de correlação intraclasse; IC: Intervalo de confiança;

*

valor estatisticamente significante no nível de 5% (p ≤ 0,05)

DISCUSSÃO

O MLD é um teste com características únicas, uma vez que possibilita a avaliação, por estímulos não-verbais, da interação binaural, contribuindo para o diagnóstico e direcionamento terapêutico do TPAC(2,3,14). Apesar disso, sua confiabilidade, que é determinante na garantia da precisão do diagnóstico e da intervenção no TPAC, ainda foi pouco estudada. No presente estudo, seguindo a tendência de outras pesquisas(11,18,19,25), a comparação dos momentos teste e reteste foi usada para avaliar a confiabilidade do MLD, observando-se ausência de diferenças estatisticamente significantes entre os momentos teste e reteste. Porém, conforme proposto por abordagens estatísticas mais modernas(17-19), a avaliação mais específica da confiabilidade por meio do CCI sugeriu confiabilidade teste-reteste de grau moderado.

Embora o presente estudo tenha sido realizado em adultos jovens do gênero feminino, os poucos estudos sobre a confiabilidade do MLD encontrados na literatura foram realizados com crianças(18,19), com exceção do estudo de Wilson et al.(11).

Um estudo(18) avaliou a confiabilidade teste-reteste do MLD em um grupo de 24 crianças norueguesas de 10 anos com intervalo de aproximadamente duas semanas entre teste e reteste. Os autores sugeriram que o grau de confiabilidade obtido foi satisfatório, pois obtiveram um CCI de 0,6 (IC 95%: 0,3-0,8). Apesar de a faixa etária utilizada pelo estudo não ter sido a mais adequada para estudos de confiabilidade teste-reteste(20), o valor de CCI obtido foi estatisticamente semelhante ao do presente estudo. Uma possível justificativa seria a maturação precoce do mecanismo de interação binaural, sendo que crianças pré-escolares já apresentam resultados semelhantes aos de adultos no MLD(30).

No estudo de desenvolvimento e validação da versão do teste MLD disponível comercialmente(11), os autores sugeriram que o instrumento tem boa confiabilidade ao não encontrarem diferenças estatisticamente significantes entre os momentos teste e reteste para 15 universitários numa mesma sessão de avaliação. No presente estudo, a confiabilidade encontrada foi menos otimista. É válido salientar que as duas pesquisas utilizaram métodos estatísticos diferentes para mensuração da confiabilidade teste-reteste e que a literatura sugere que testes de hipótese para comparação de médias de amostras pareadas, como o utilizado por Wilson et al.(11), não são suficientes para este fim. Além disso, a realização de teste e reteste numa mesma sessão pode caracterizar um período muito curto para avaliar a confiabilidade devido à influência de fatores como memória e aprendizagem, sendo recomendado o intervalo de 7 a 14 dias(25-27).

Ao avaliar a confiabilidade teste-reteste do MLD em 45 crianças inglesas de seis a 10 anos numa mesma sessão, um estudo internacional(19) obteve resultados discrepantes aos do presente estudo ao observar CCI geral de 0,36, que pode ser considerado indicativo de uma confiabilidade teste-reteste fraca. Porém, vale ressaltar que esse último estudo foi realizado com crianças abaixo de sete anos e sem respeitar o período de tempo ideal entre a repetição das administrações do teste, o que pode ser considerado um viés. Fatores outros como diferentes níveis de desenvolvimento de linguagem, nível de atenção, motivação e entendimento das instruções dadas para a realização do teste podem ajudar a justificar os resultados insatisfatórios desse estudo.

A confiabilidade teste-reteste estabelece o grau no qual uma determinada população é capaz de manter a estabilidade de seus resultados em um determinado instrumento de avaliação ao longo do tempo. Assim, não se trata de uma propriedade fixa, de tal maneira que diversos fatores podem interferir na observação deste fenômeno, incluindo tamanho amostral, tempo entre teste e reteste, população estudada e método de análise dos resultados. Dessa forma, um instrumento pode ser confiável em determinadas circunstâncias e em outras, não(26,27).

Quanto ao tamanho amostral, este estudo contou com uma amostra de 78 adultos normo-ouvintes, sendo que a literatura recomenda amostras superiores a 50 participantes para avaliação da confiabilidade teste-reteste(25).

Em relação ao tempo entre teste e reteste, sabe-se que o período entre a repetição das administrações deve ser longo o suficiente para impedir o efeito da memória, mas curto o suficiente para garantir que não ocorram alterações clínicas, influenciando sua interpretação(27). Deste modo, escolheu-se um intervalo de tempo de sete a 14 dias, considerado adequado para esse fim(25-27).

Quanto à análise dos resultados, o coeficiente de correlação de Pearson, o teste t para amostras pareadas e o gráfico de Bland-Altman são muitas vezes utilizados para avaliar a confiabilidade. No entanto, enquanto o primeiro se trata apenas de uma medida de correlação e os dois últimos correspondem apenas a medidas de concordância, o CCI reflete tanto o grau de correlação quanto a concordância entre as medidas, representando uma medida de confiabilidade mais desejável(17).

Buscou-se, portanto, garantir a mensuração fidedigna da confiabilidade teste-reteste do MLD. O fato de esta ter sido classificada como moderada traz algumas implicações na interpretação do teste no contexto da sua utilização na prática clínica. Por exemplo, seu uso em uma situação de comparação pré e pós-treinamento auditivo deve levar em consideração que o teste possui certo grau de instabilidade e, portanto, seus resultados devem ser analisados com cautela e levando em consideração os demais testes da bateria de avaliação do processamento auditivo.

Uma possível limitação deste estudo se deve ao fato que, mesmo sendo um estudo com delineamento prospectivo descritivo, a amostra da pesquisa foi de conveniência, formada somente por adultos, estudantes universitários e do gênero feminino. Portanto, nessa população o nível de escolaridade é alto, o que pode ter influenciado positivamente nas respostas. No entanto, é válido notar que estudos anteriores não encontraram diferenças entre os gêneros em relação aos valores do MLD(7,9). Além disso, a escassez de pesquisas na população brasileira reduz as possibilidades de comparações entre estudos. Assim, observa-se a necessidade de outros estudos para conhecer a confiabilidade do teste MLD no gênero masculino, em populações formada por crianças e idosos e em populações de diferentes níveis socioeconômicos ou de escolaridade.

CONCLUSÃO

O teste Masking Level Difference (MLD) mostrou grau moderado de confiabilidade teste-reteste em estudantes universitárias normo-ouvintes.

Footnotes

Trabalho realizado na Universidade Federal do Rio de Janeiro – UFRJ - Rio de Janeiro (RJ), Brasil.

Fonte de financiamento: nada a declarar.


Articles from CoDAS are provided here courtesy of Sociedade Brasileira de Fonoaudiologia

RESOURCES