Skip to main content
CoDAS logoLink to CoDAS
. 2022 Feb 2;34(4):e20200333. doi: 10.1590/2317-1782/20212020333
View full-text in Portuguese

Word and pseudoword reading in young adults: an eye-tracking study

Fernanda Marchezini 1,, Peter Maurice Erna Claessens 2, Maria Teresa Carthery-Goulart 2,3,4
PMCID: PMC9886113  PMID: 35137892

ABSTRACT

Purpose

To evaluate and characterize the oculomotor behavior during the reading of words and pseudowords in Brazilian Portuguese organized by frequency, length and regularity and verify its association with performance on neuropsychological tests.

Methods

21 university students, with a mean age of 20.9 years, were submitted to a word and pseudoword reading task (TLPP) from the Anele Battery, in addition to verbal fluency and phonological working memory tests. The patterns of first fixation duration, gaze duration and rate of refixation were studied.

Results

The first fixation duration and the gaze duration were significantly lower for words if compared to pseudowords and the gaze duration was also lower for high-frequency and short words. Significant interactions were also found between verbal fluency performance and the first fixation duration.

Conclusion

Our results demonstrate the applicability of eye tracking to study reading patterns at the word-level in Brazilian Portuguese. The eye tracker can be an additional tool in the investigation of acquired and developmental reading disorders and can assist in the detection of reading difficulties based on comparisons of the oculomotor behavior between fluent and non-fluent readers.

Keywords: Reading, Language, Psycholinguistics, Eye Movements, Eye Movement Measurements, Dyslexia

INTRODUCTION

Decoding can be analyzed by the dual-route model that explains the reading of isolated words through two processes: the lexical route and the phonological route. When a sequence of graphemes is visually processed, the lexical route allows direct access to the word representation in the internal lexicon, being the route used to read familiar regular and irregular words (actually the pronunciation of the latter stimuli cannot be supplied by grapheme-phoneme conversion). The phonological route involves the use of grapheme-phoneme correspondence rules and allows the reading of unfamiliar regular words and pseudowords(1,2). The initial reader uses both reading routes in parallel and becomes consistent in the use of phonological and orthographic clues for the activation or inhibition of words. As he becomes a skilled reader, the reading speed increases, especially in shorter and more frequent words(3).

During reading, the main oculomotor behaviors analyzed are the fixations and the saccades. Fixations are pauses that the eyes make to analyze an area of the word in a region called ‘fovea’, located in the center of the retina and capable of extracting the linguistic information more efficiently(4,5). Saccades are the movements that conduct the eyes from one point to another that will be fixated. The first fixation describes the initial stages of the lexical processing and the total time of all fixations corresponds to the integration of the lexical access with the semantic and morphosyntactic systems, driving to the total word recognition(6) and in skilled readers, the most frequent and shorter words are recognized faster and need less fixations(7). Studies using eye tracking have already been developed with Brazilian young individuals, aiming at characterizing the eye movement patterns during the reading of words and pseudowords. They found that the fixation duration and the number of fixations are higher for pseudowords than for words, for low-frequency words and longer words(5,8), confirming the findings of studies carried out in other languages(7). Regarding the word regularity, significant differences on the oculomotor parameters were found for this psycholinguistic factor in a study conducted in Brazilian Portuguese with young university adults, showing that regular words were processed with lower fixation durations than the irregular ones(5).

Efficient reading also depends on other cognitive functions, such as phonological working memory, a temporary system with limited capacity for storage and processing of verbal information. During reading, it has already been observed through eye tracking techniques that with better phonological working memory capacity, more accurate is the reader’s foveal fixation on the correct position on the word(9) and lower is the occurrence of regressive saccades in order to refixate(10). Another important cognitive function for reading is verbal fluency: the ability to retrieve and evoke the linguistic information stored in semantic memory. The practice of reading strengthens the verbal fluency skill, because it improves metalinguistic awareness and increases vocabulary(11). In fact, the more developed this skill is, the lower the need of rereading and refixating the words(12).

Thinking about the psychological properties and individual cognitive skills that can influence the performance on reading tests, the aim of this study was to analyze the oculomotor behavior during the reading of single words and pseudowords in a population of young adults and confirm the characteristics found in other Brazilian studies. Besides that, by analyzing the oculomotor behavior, we investigated how psycholinguistic factors can interact during reading tasks and how oculomotor parameters are associated with performance on phonological working memory and verbal fluency cognitive tasks. We used the Anele Battery, authorized by the authors, which is a validated protocol for reading assessment which is available for clinical use, in order to demonstrate how eye trackers can complement the reading evaluation.

METHODS

This study was approved by the Ethics Committee under protocol 15305813.5.0000.0082 - 310.077. Twenty-one right-handed university students, being 8 men and 13 women, with a mean age of 20.9 years, participated in this study and all of them signed an Informed Consent Form. In the initial interview, none of the participants reported visual or hearing deficits uncorrected, attention-deficit / hyperactivity disorder, previous learning difficulties, neurological or psychiatric diseases or using drugs with action on the Central Nervous System. Phonological working memory tests with digit span tasks and verbal fluency tests were also applied. On verbal fluency tests, the participants were asked to generate animal names and words that start with the phonemes /f/, /a/ and /s/, in one minute for each category.

The Stimuli were those of the Word and Pseudoword Reading Task (TLPP)(13) of Anele Battery consisting of 48 words and 24 pseudowords. This task was designed to assess the lexical and phonological routes in reading i.e., lexicality, length, regularity and frequency effects by a balanced distribution of short / long, regular / irregular and high-frequency / low-frequency words in Brazilian Portuguese. To assess the length effect, the TLPP stimuli comprise “short” words (with up to two syllables and no more than 5 letters) and “long” words (three or more syllables or above five letters). For regularity, the Task adopts as “regular” (transparent correspondence between graphemes and phonemes for the pronunciation of the word) and “irregular” when the grapheme-phoneme conversion has ambiguities for pronunciation. Regarding frequency, the elaboration was based on the occurrences of the Portuguese Bank of Brazilian Corpus – PUC-SP(14). In order to manipulate the lexicality effect, the Task included 24 pseudowords that were created from 24 words contained in the battery, keeping the same syllabic structure. The final task resulted in 72 stimuli presented in 12 lists with six stimuli on each one, written in black color on a white background, using the Arial text font, capital letter and size 20. The font size, in pixels, varied depending on the letter, as well as the distance between one letter to another within the same word. There was no variation among the rows, with a distance of 205 pixels among them.

An Arrington Research (AR) binocular system equipment with pupil capture was used to record the eye movements at a rate of 60Hz. Information about the oculomotor behavior was extracted from the ViewPoint software, version 2.8.6, to interface with the AR equipment. The stimuli were projected on a Hewlett-Packard (HP) LCD monitor with resolution of 1440 x 960 pixels with a visible area of 41 x 25.6 cm, positioned at a distance of 40 cm from the chin and forehead support of the participants and the experiments were run in a low-light room. The equipment was calibrated for each participant according to their pupil size and the observers were asked to fix their gaze on 16 points arranged in a grid line and presented in random order on the computer monitor. Before the beginning of each block of words and pseudowords, a fixed point was presented in the center of the screen so that the participants could prepare their eyes to start the next step of the task. All participants were instructed to read the word lists in a low voice and the ViewPoint software produced numerical records with the values of the total time of signal capture, the horizontal and vertical positions of fixations for each eye and the horizontal and vertical axes of the pupils. These parameters were used to calculate, offline, the number of fixations, the duration of each fixation and the duration of the first fixation in reading the words. The analysis of the results was executed using The R Project for Statistical Computing software (R, version 3.1.2) and the Jamovi 1.6.15 software. The significance level adopted was 0.05. Multifactorial ANOVAs were executed to analyze the interaction of fixation durations and psycholinguistic variables among them and with performance on verbal fluency tests and phonological working memory.

During the reading, the oculomotor behavior was analyzed according to these psycholinguistic variables: lexicality, frequency, length and regularity. The dependent variables were: First Fixation Duration (FFD), corresponding to the duration of the first fixation on a word before the first saccade and Gaze Duration (GD), which represents the sum of all fixations within the word, before the saccade to another word. All parameters were analyzed by the mean and by the median of the durations in milliseconds. The medians presented lower values than the means, indicating right skewed distributions and/or presence of excessively long durations, which are violations of normality and it could weaken the assumptions for the analysis of raw data. Therefore, to ensure the validity of approximate normality and the robustness of the measurements, the medians were adopted for all analysis. The probability of refixing each stimulus was also analyzed and defined as refixation rate (rate of returns to the stimulus).

RESULTS

A repeated measures ANOVA revealed main effects of lexicality, length and frequency on First Fixation Duration (FFD) and Gaze Duration (GD), as shown in Table 1, in which the value of these parameters was significantly lower for real and high-frequency words in comparison with the stimuli they were paired with, i.e., pseudowords and low-frequency words. In the isolated effect of length, in particular, we also found that Gaze Duration was significantly lower for short words than for long words, while the First Fixation Duration was higher for short words than for long words. Although, in the effect of length, First Fixation Duration exhibited a p-value slightly over 0.05, we observed a large effect size according to the guidelines by Cohen(15,16), with F(1,20) = 4.07; p=0.057; η2 p = 0.169. No significant differences were found for the isolated effect of regularity.

Table 1. Median and standard deviation for First Fixation Duration and Gaze Duration in milliseconds for the main effect of lexicality, frequency and length.

Median SD F(1,20) p η2 p
FFD Lexicality Words 300 287.41 7.24 0.014 0.266
Pseudowords 366.66 417.34
GD Lexicality Words 366.66 465.51 46.8 <0.001 0.701
Pseudowords 700 728.13
FFD Frequency High 300 244.94 5.38 0.031 0.212
Low 333.33 323.09
GD Frequency High 333.33 399.40 12.4 0.002 0.383
Low 433.33 431.51
FFD Length Short 333.33 322.16 4.07 0.057 0.169
Long 300 382.85
GD Length Short 400 503.38 5.77 0.026 0.224
Long 466.66 595.79
FFD Regularity Regular 300 241.27 0.02 0.875 0.001
Irregular 300 327.07
GD Regularity Regular 366.66 374.79 0.77 0.390 0.037
Irregular 366.66 455.75

Caption: FFD = First Fixation Duration; GD = Gaze Duration; SD = Standard Deviation; F = F-Statistic; p = significance level; η2 p = partial eta squared - effect size

For Gaze Duration, repeated measures ANOVA showed an interaction effect between lexicality and length (F[1,20] = 16.00; p = <0.001, η2 p = 0.444). Table 2 shows the results of the post-hoc analysis (Tukey), which revealed differences between the psycholinguistic variables, in which GD for short words was lower than for long words, that, in turn, was lower than for short pseudowords and long pseudowords, respectively. A repeated measures ANOVA also revealed a marginally significant three-way interaction effect between frequency, length and regularity, with F(1,20) = 4.57; p = 0.045, η2 p = 0.186, in which, although the obtained p-value is close to the significance level of 0.05, we found a large effect size that could explain the interaction of these three psycholinguistic factors on Gaze Duration. A post-hoc test (Tukey) analyzing all possible interactions revealed that GD in ‘short, high-frequency and regular’ words was significantly lower (median 333.33 ms) than on ‘long, low-frequency and regular’ words (median 466.66 ms), showing that length and frequency are decisive for the difference in time involved in decoding and that ‘long, high-frequency and regular’ words (median 333.33 ms) are read significantly faster than ‘long, low-frequency and regular’ words (median 466.66 ms), showing that frequency, again, can be a decisive factor in reading processing.

Table 2. Median and standard deviation for Gaze Duration in milliseconds for the interaction effect between lexicality and length.

Short Words Long Words Short Pseudowords Long Pseudowords F(1,20) p η2 p
GD 366.66 (409.37) 366.66 (427.31) 566.66 (647.08) 816.66 (792.05) 16.00 <0.001 0.444

Caption: GD = Gaze Duration; F = F-Statistic; p = significance level; η2 p = partial eta squared - effect size

In order to evaluate refixation rate, we executed generalized linear mixed model analyses in which we verified the probability of refixations occurring within a word before the observer's gaze leaves the stimulus. This category of linear models extends the general linear model, which considers both continuous and discrete independent variables, either fixed or random across individuals, but with a continuous dependent variable, to binary dependent variables, among other types. In the current study, the act of refixating at least once, or not, was the binary variable. In practice, as is the case in logistic regression, each response was viewed as a realization of a Bernoulli trial, with a certain probability of refixation related to the independent variables through the link function, the logit, or log(θ)-log(1-θ), a linear function of predictor variables with coefficients estimated through a maximum likelihood method. These analyses were implemented using the Jamovi Software – 2021(17,18) with the Linear Models module(19) and a logistic link function, which is equivalent to mixed logistic regression, but in this case with discrete predictors. The lexicality, length, frequency and regularity characteristics were transformed through contrast coding and represented by a dummy variable with numerical values -0.5 or 0.5. The model is mixed because, while the effects for these variables were considered fixed across the population of individuals, a variable contribution was added per individual as a random factor, with a stipulated normal population distribution. In the current context, this term can be interpreted as representing the interindividual variation in the base rate of refixation for linguistic stimuli in general. We thus seek to analyze the combined psycholinguistic characteristics and study how one variable might influence another in the probability of refixation during the processing of reading. Analyses compared words and pseudowords, including the effect of length and tested the influences of word length, frequency and regularity. In order to check for statistical significance, the Wald test based on a Χ2 statistic was adopted, using a chi-squared distribution with one degree of freedom. All analyses considered a random intercept across volunteers, but fixed effects for the experimental manipulations. The effects will be presented through their linear contribution to the logit of the refixation probability, with their corresponding odds serving as effect size measures. The odds factor indicates with which multiplicative constant the probability ratio of refixating versus not refixating, with other variables already taken into account, is modulated by the difference in levels of the independent variable under scrutiny. A positive logit coefficient corresponds to a larger probability of refixation and will correspond to an odds-factor greater than 1.0.

In a first analysis, main and interaction effects between lexicality and length were determined. Short pseudowords were refixated 38.49% of the time, while long pseudowords were refixated 57.14% of the time. Words were refixated 20.95% of the time when short and 31.91% of time when long. The apparent pattern of a larger number of refixations on pseudowords than on words, as well as on the longer stimuli, independently of lexicality, was confirmed in the logistic regression with lexicality and length as factors. The main effects of word-length (long-short) and lexicality (pseudowords-words) were strongly significant, with linear estimates ± standard errors of 0,7308±0,1175 and 1,0512±0,1181, Χ2 of 38.67 and 79.19, respectively and p < 0.0001 for both. The effect size was large, with odds of 2.077 and 2.861, respectively; the interaction, however, did not reach statistical significance (0.2104±0.2340, Χ2 = 0.8081, p = 0.37). The odds factor indicating the probability ratio of fixating versus not fixating and was calculated as a part of the mixed logistic model, taking interindividual variation in refixation tendency into account(20,21).

A second mixed logistic regression analysis was conducted with only words in order to investigate the effects of length, regularity and frequency within this group of stimuli. Among the regular words, long and low-frequency ones were refixated 42.18% of the time, the short and low-frequency ones 21.43%, the long and high-frequency ones 20.83% and the short and high-frequency ones 18.37% of the time. Among the irregular words, the rates were 31.55%, 21.77%, 34.69% and 22.02% respectively. The fit of a random intercept model across volunteers indicated statistical significance, according to the Wald chi-squared test, for frequency (low-frequency - high-frequency, linear estimate ± standard error 0.2896±0.1371, Χ2 = 4.4634, p = 0.035, odds 1.336), for length (long-short, 0.6256±0.1375, Χ2 = 20.7091, p < 0.0001, odds 1.869), for the interaction between regularity (irregular-regular) and frequency (-0.7527±0.2743, Χ2 = 7.5305, p = 0.006, odds 0.4711) and marginal significance for the three-way interaction between length, frequency and regularity (-1.0561±0.5482, Χ2 = 3.7114, p = 0.054, odds 0.3478). Positive values for linear estimates and odds greater than 1 indicate a larger number of refixations for long and less frequent words. The main effect of regularity was not significant, and neither were the two-way interactions (all p>0.15); note that a positive value for regularity would mean a larger number for regular than for irregular words. Also, a model with a crossed random intercept individual-item, with similar results in terms of effect size, but in which all p-values increased, with loss of significance at 5% level for frequency and for the three-way interaction (although not for the frequency-regularity interaction). Due to the fact that the same effect sizes produced p>0.05, one should take a loss of statistical power into account. A paired comparison of conditions with Holm correction shows the main cause of the frequency-regularity interaction to be the difference between high-frequency and low-frequency regular words (p < 0.005; but after correction, p > 0.5 for the same difference among irregular words) and also, to a lesser extent, the difference between irregular and regular words among the high-frequency words (p<0.10). The first interaction modulates the main effect of frequency, and therefore, the effect of frequency seems to be larger for regular words. Complementarily, the marginally significant difference between high-frequency irregular and regular words indicates that the regular words elicit less refixations than would be expected. Although not significant after the Holm correction, the tendency in the difference between high-frequency regular words and low-frequency irregular words is in the same direction as the differences between high-frequency regular words and the other combinations of frequency and regularity. The pattern that emerges is that words that are, at the same time, high-frequency and regular are less often refixated than other words.

Post-hoc analyses of the three-way interaction, that is, between all 28 pairs of combinations of levels of the three independent linguistic variables, showed that the group of ‘long, low-frequency and regular’ words is refixated significantly more often than all the conditions with short words and also more often than the ‘long, high-frequency and regular’ words. ‘Long, high-frequency and irregular’ words are refixated more often than ‘short, high-frequency and regular’ words, and with marginal significance (p < 0.10), more than ‘long, high-frequency and regular’ words. It is notable that the refixation rate of this last group is at the level of the short words, in which all the p-values for the paired comparison with all of the of the short word conditions is over 0.5 even before the correction, even given the particularly strong main effect of length.

The set of effects (Figure 1) showed that, on average, short words are refixated less often than long words, with the exception of ‘long, high-frequency and regular’ words. Regularity and frequency do not have a meaningful role within the group of short words. The most refixated words are the ‘long, low-frequency and regular’ ones, at a level that is approximately equivalent as that of the long irregular words. Among long-irregular words, frequency does not seem to matter. Among long regular words, however, frequency is decisive in reducing refixation probability from the highest rate (42.28% for low-frequency ones) to the second lowest among the eight word conditions (20.83% for high-frequency ones).

Figure 1. Refixation rate for the three-way interaction effect between length, frequency and regularity.

Figure 1

A model with crossed random effects was also used and produced effect sizes compatible with the previously calculated ones, but again with larger numbers for the p-values, resulting in the loss of significance at the 5% level, for frequency and for the three-way interaction. Length and interaction between frequency and regularity were maintained as statistically significant effects, which emphasizes the importance of these variables. The frequency x regularity interaction was again caused, in the first place, by the fact that ‘regular and high-frequency’ words elicit less refixations than ‘regular and low-frequency’ words, with a corrected p-value <0.10. Post hoc analyses of the three-way interaction also showed, in this case, that the most important difference is between ‘long, low-frequency and regular’ words at the one hand, and short words at the other, especially those that are, additionally, regular and high-frequency. Considering the large number of simultaneous tests (28) involved in the correction and the lower statistical power upon introducing item as a random variable, the difference between long words, regular high-frequency and low-frequency words should be considered statistically significant (corrected p = 0.073).

Finally, as to the neuropsychological tests, the average performance of the sample of participants in the verbal fluency test with semantic categories was 21.52 words per minute, with a standard deviation of 3.47. In the verbal fluency test with phonemic categories, the mean of the three letters was 16.23 words per minute, with standard deviation of 3.23. In order to study the interaction between the dependent variables of eye movement patterns and neuropsychological profile, a split-plot ANOVA and post-hoc analyses showed that individuals with better semantic verbal fluency showed a lower First Fixation Duration (FFD) for long words, with a median of 266.66 ms, when compared to individuals with worse performance on this test, with median of 328.20 ms: F(3,21) = 3.69; p = 0.027. No significant interactions between oculomotor patterns and the participants' performance on the phonological working memory were found.

DISCUSSION

In Table 1, the analysis showed that the First Fixation Duration and the Gaze Duration were lower for words than for pseudowords, since the last ones need grapheme-phoneme conversion and exclusive use of the phonological route, besides they do not give any semantic information to the visual and cognitive systems. In skilled readers, as the population in this research, the saccades move the eyes on some characters between the fixations that will extract the linguistic information from the stimuli(7,22). In these fixations, there is often the processing of neighboring letters that have already been or that will still be run by the saccades while just one letter is fixated on the word(23), having, therefore, a perceptual window of more than one letter in a single fixation(24). The first fixation on the word corresponds to the lexical access, while the total time of all fixations on the word, called gaze duration, describes the integration of the lexical access with the semantic system(5,25). As shown in Table 1, we found that short words had a lower Gaze Duration than long words, because they need fewer fixations to be processed, as confirmed by the probability of refixations found in the mixed logistic regression analysis. But we found that short words had longer durations on first fixation than long words. Our explanation for this finding is that for short words, the perceptual window of a single fixation provides access to the orthographic lexicon and allows for semantic integration, resulting in a longer time for its full recognition. On the other hand, for long words, the first fixation is not be enough for lexical access so the reader tends to reduce the time of the first fixation and need more fixations on the word to complete the lexicon access and recognition(26). Our findings replicate and corroborate the findings of previous study with Brazilian adults(5).

Regarding the frequency, we found that high-frequency words had lower First Fixation Duration and Gaze Duration, because the most frequent and predictable words in the language tend to have more familiar orthographic representations with easier and faster recognition(27). Therefore, these words receive a smaller number of fixations and of shorter duration until their full recognition, confirming the results of previous studies carried out in Portuguese and in other languages(5,7,8). The results about the relationship between first fixation duration and gaze duration and psycholinguistic variables, particularly length and frequency effects, were also confirmed by the results found in the mixed logistic regression model, in which we investigated the probability of refixation (or not) of the linguistic stimuli. In this analysis, we found that positive values for linear estimates and odds above 1 indicated a greater number of refixations for longer words and for low-frequency words, confirming that high-frequency (and possibly more familiar) and shorter words tend to have a smaller number of fixations(7,8).

Considering the regularity, a previous study of single word reading in adults speakers of Brazilian Portuguese(5) found significant differences between regular and irregular words, so that the latter were processed longer than the former ones (longer first fixation duration and higher number of fixations), suggesting the involvement of a higher cognitive and linguistic load for irregular word reading. Based on the dual-route model, irregular words, which do not use grapheme-phoneme conversion rules, can be activated directly by the lexical route through visual input, so they would take shorter times for full recognition as they do not depend exclusively on the phonological route, which is slower for decoding stimuli. To investigate this finding, we analyzed the regularity effect separately, but we did not find any significant differences in the oculomotor parameters when comparing regular and irregular words. When analyzing the interactions between regularity and other psycholinguistic factors, the post-hoc analysis showed that the significant differences were among ‘short, high-frequency and regular’ words, whose gaze duration and refixation rate were lower than ‘long, low-frequency and regular’ words, showing once again that length and frequency are very relevant in the reading process. Another relevant finding was that ‘long, high-frequency and regular’ words had also a significantly lower gaze duration and refixation rate than ‘long, low-frequency and regular’ words, confirming that the frequency can indeed be a determining factor in decoding.

In Figure 1, it is possible to observe that short words are less refixated than long words, but in the analysis with the three psycholinguistic factors together, we find that regularity and frequency are not significant within the short words group, which points to a lower refixation rate for these stimuli anyway. The reduced length allows for the words to be processed with few fixations or even with only one fixation. So in the group of long words, we observed that the most refixated words were the ‘long, low-frequency and regular’, at an approximately similar level than ‘long and irregular’ words, showing that there is no difference related to the frequency. However, among ‘long and regular’ words, the frequency was decisive in reducing the probability of refixation from 42.28% in low-frequency words to 20.83% in high-frequency words. The reason for this reduction can be the nature of the access of irregular words, necessarily carried out through the lexical route, that is, the direct access route from the visual input. In skilled readers, as the sample of the present study, difficulties in spelling or failures are not expected. Therefore, the processing of this group of irregular words would occur directly (as a result of reading from the lexical route). As the sample consists of skilled readers, it was expected that the readers could also read the regular words through the lexical route, considering their efficiency and fluency to decode and recognize words, but even in this population we cannot discard the parallel and simultaneous participation of the phonological route in the reading of regular words. The phonological route is slower and in this additional time of processing, the frequency is decisive in reducing the decoding duration. We must also consider that the stimuli were presented in lists, without any linguistic context, and that the participants may have used the phonological route to reread and confirm what they had already read.

Regarding the oculomotor behavior and its interaction with neuropsychological factors, a study carried out in English(12) using eye-tracking to investigate the reading of sentences with and without semantic ambiguities showed that healthy younger and elder adults, with greater scores in verbal fluency presented longer times in their first reading of the sentence whereas the adults with worse verbal fluency presented the opposite pattern (shorter duration on this parameter). The authors explain that high verbal fluency can justify the longer fixations in first reading of the sentence, being compensated by the lesser need to reread and to refixate sentence segments, while the readers with worse verbal fluency would presented faster first-pass measurements, because they would spend more time reading and rereading all the sentence in order to resolve ambiguities, since they would recruit and organize fewer strategies for word-retrieval. In this study, we found that participants with better semantic verbal fluency had lower First Fixation Duration in long words. Thinking about the interaction with the length, this data may suggest that high verbal fluency may also be associated with less need of rereading. However, differently from that study, the present study investigated single word reading, with no linguistic context that could help the reader to predict or integrate the word’s meaning. The difference of tasks limits the interpretation of our findings so the relationship between verbal fluency and refixation should be investigated in future studies.

We did not find interactions between oculomotor patterns and performance in phonological working memory tests. The type of linguistic stimuli used in this study (single words presented in lists), may have influenced this result and the use of reading protocols with sentences and texts may provide more possibilities for the investigation of associations between reading and working memory.

Finally, considering the studies on this subject in speakers of Brazilian Portuguese, some studies(5,8) have already investigated the correlation of ocular parameters with psycholinguistic variables by using lists of words and pseudowords and found effects of lexicality, frequency, length and regularity that contribute to the discussion about linguistic and cognitive aspects that may be related to reading. In this study, we investigated in more detail the interaction between psycholinguistic variables, ocular parameters and cognitive functions (phonological working memory and verbal fluency). These aspects were less explored in eye tracking and reading studies in Brazilian Portuguese. The measures that we evaluated (first fixation duration, gaze duration and refixation - probability of return to the stimulus) brought additional information to the traditional application of the word and pseudoword reading task that may be relevant for a more accurate clinical diagnosis, as well as helpful to plan interventions for dyslexic patients. It is also important to emphasize that dyslexia can have mild, moderate and severe manifestations. When the difficulty is very mild, for example, in a very early stage of a neurodegenerative condition, a tool that can detect behaviors that suggest an initial dysfunction can be relevant to clinical practice. As a future perspective, more studies with larger and more representative samples are needed, including more variability in education, age, socioeconomic level and also individuals of different regions of Brazil. It will be also necessary to develop tools to facilitate acquisition, analysis and interpretation of eye-tracking data, so that professionals who work in the diagnosis and intervention with individuals with dyslexia can benefit from the additional parameters that can be obtained with this technology. There is a long way to go, and this study aims to inspire further research in this area.

CONCLUSION

Word and pseudoword reading tests are frequently used for the assessment of people with developmental and acquired dyslexia, informing about the functioning of reading routes. The eye-tracker allows for an objective analysis of the reading process and can be a complementary tool to investigate these aspects, but research is not yet integrated with clinical practice in Brazil. The reason for investigating oculomotor patterns in skilled readers of Portuguese was to contribute to the characterization of the profile of this population. We evidenced the effects of lexicality, frequency and length in stimuli typically used for reading assessment in clinical practice. This study is a proof of concept in which eye-tracking data and reference values obtained in research may have a clinical applicability in the diagnostic investigation. We suggest that eye-tracking data may provide a more sensitive measure of mild deficits. Moreover, some characteristics of oculomotor behavior can be associated with reading performance. More studies are necessary in Portuguese, considering larger samples, different populations, other linguistic stimuli, such as phrases and texts, and investigation of the correlation of oculomotor behavior with higher cognitive functions, especially with phonological working memory and verbal fluency.

ACKNOWLEDGEMENTS

FM was supported by an Institutional Scholarship from Universidade Federal do ABC (UFABC).

MTCG is supported by the Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP, grant number 2019/25795-2). She is affiliated to the Instituto Nacional de Ciência e Tecnologia sobre Comportamento, Cognição e Ensino INCT-ECCE, with support from the Conselho Nacional de Pesquisa (CNPq, grant number # 465686/2014-1), the Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES, grant number # 88887.136407/2017-00) and FAPESP (grant number # 2014/50909-8).

This study was financed in part by the CAPES – Finance Code 001.

Footnotes

Study conducted at Universidade Federal do ABC – UFABC – São Bernardo do Campo (SP), Brasil.

Financial support: nothing to declare.

REFERENCES

  • 1.Coltheart M, Rastle K, Perry C, Langdon R, Ziegler J. DRC: a dual route cascaded model of visual word recognition and reading aloud. Psychol Rev. 2001;108(1):204–256. doi: 10.1037/0033-295X.108.1.204. [DOI] [PubMed] [Google Scholar]
  • 2.Ellis AW. Leitura, escrita e dislexia: uma análise cognitiva. Porto Alegre: Artes Médicas; 1995. [Google Scholar]
  • 3.Ardila A, Cuetos F. Applicability of dual-route reading models to Spanish. Psicothema. 2016;28(1):71–75. doi: 10.7334/psicothema2015.103. [DOI] [PubMed] [Google Scholar]
  • 4.Hohenstein S, Matuschek H, Kliegl R. Linked linear mixed models: a joint analysis of fixation locations and fixation durations in natural reading. Psychon Bull Rev. 2017;24(3):637–651. doi: 10.3758/s13423-016-1138-y. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 5.Macedo EC, Lukasova K, Yokomizo JE, Ariente LC, Koakutu J, Schwartzman JS. Processos perceptuais e cognitivos na leitura de palavras: propriedades dos movimentos oculares. Psicol Esc Educ. 2007;11(2):275–283. doi: 10.1590/S1413-85572007000200007. [DOI] [Google Scholar]
  • 6.Lázaro M, Pérez E, Martínez R. Perceptual salience of derivational suffixes in visual word recognition. Scand J Psychol. 2020;61(3):348–360. doi: 10.1111/sjop.12617. [DOI] [PubMed] [Google Scholar]
  • 7.Rayner K. Eye movements in reading and information processing: 20 years of research. Psychol Bull. 1998;124(3):372–422. doi: 10.1037/0033-2909.124.3.372. [DOI] [PubMed] [Google Scholar]
  • 8.Ogusuko MT, Lukasova K, Macedo EC. Movimentos oculares na leitura de palavras isoladas por jovens e adultos em alfabetização. Psicol Teor Prat. 2008;10(1):113–124. [Google Scholar]
  • 9.Tanaka T, Sugimoto M, Tanida Y, Saito S. The influences of working memory representations on long-range regression in text reading: an eye-tracking study. Front Hum Neurosci. 2014;8:765. doi: 10.3389/fnhum.2014.00765. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 10.Nicenboim B, Vasishth S, Gattei C, Sigman M, Kliegl R. Working memory differences in long-distance dependency resolution. Front Psychol. 2015;6:312. doi: 10.3389/fpsyg.2015.00312. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 11.Moraes AL, Guimarães LSP, Joanette Y, Parente MAMP, Fonseca RP, Almeida RMM. Effect of aging, education, reading and writing, semantic processing and depression symptoms on verbal fluency. Psicol Reflex Crit. 2013;26(4):680–690. doi: 10.1590/S0102-79722013000400008. [DOI] [Google Scholar]
  • 12.Stites MC, Federmeier KD, Stine-Morrow EAL. Cross-age comparisons reveal multiple strategies for lexical ambiguity resolution during natural reading. J Exp Psychol Learn Mem Cogn. 2013;39(6):1823–1841. doi: 10.1037/a0032860. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 13.Rodrigues JC, Nobre AP, Gauer G, Sales JF. Construção da tarefa de leitura de palavras e pseudopalavras (TLPP) e desempenho de leitores proficientes. Temas Psicol. 2015;23(2):413–429. doi: 10.9788/TP2015.2-13. [DOI] [Google Scholar]
  • 14.Sardinha TB. The Bank of Portuguese. São Paulo: LAEL, PUCSP; 2003. (DIRECT Papers). [Google Scholar]
  • 15.Cohen J. Statistical power analysis for the behavioral sciences. Hillsdale: Lawrence Earlbaum Associates; 1988. [Google Scholar]
  • 16.Espírito-Santo H, Daniel F. Calcular e apresentar tamanhos do efeito em trabalhos científicos (3): guia para reportar os tamanhos do efeito para análises de regressão e ANOVAs. Rev Por Investig Comport Soc. 2018;4(1):43–60. doi: 10.31211/rpics.2018.4.1.72. [DOI] [Google Scholar]
  • 17.The Jamovi Project [citado em 2020 Out 24];Jamovi. (Version 1.6). Computer software. 2021 Internet. Disponível em: https://www.jamovi.org .
  • 18.R Core Team . R: a language and environment for statistical computing. (Version 4.0). Computer software. Vienna: R Foundation for Statistical Computing; 2020. [citado em 2020 Out 24]. Internet. R packages retrieved from MRAN snapshot 2020-08-24. Disponível em: https://cran.r-project.org . [Google Scholar]
  • 19.Gallucci M. [citado em 2020 Out 24];GAMLj: General analyses for linear models - jamovi module. 2019 Internet. Disponível em: https://gamlj.github.io/
  • 20.Locker L, Jr, Hoffman L, Bovaird JA. On the use of multilevel modeling as an alternative to items analysis in psycholinguistic research. Behav Res Methods. 2007;39(4):723–730. doi: 10.3758/BF03192962. [DOI] [PubMed] [Google Scholar]
  • 21.Quené H, Van den Bergh H. Examples of mixed-effects modeling with crossed random effects and with binomial data. J Mem Lang. 2008;59(4):413–425. doi: 10.1016/j.jml.2008.02.002. [DOI] [Google Scholar]
  • 22.Blais C, Fiset D, Arguin M, Jolicoeur P, Bub D, Gosselin F. Reading between eye saccades. PLoS One. 2009;4(7):e6448. doi: 10.1371/journal.pone.0006448. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 23.Trauzettel-Klosinski S, Koitzsch AM, Dürrwächter U, Sokolov AN, Reinhard J, Klosinski G. Eye movements in German-speaking children with and without dyslexia when reading aloud. Acta Ophthalmol. 2010;88(6):681–691. doi: 10.1111/j.1755-3768.2009.01523.x. [DOI] [PubMed] [Google Scholar]
  • 24.Rayner K, Reichle ED, Pollatsek A. In: Cognitive processes in eye guidance. Underwood G, editor. Oxford: Oxford University Press; 2005. Eye movement control in reading and the E-Z Reader model. pp. 131–162. [DOI] [Google Scholar]
  • 25.Inhoff AW. Two stages of word processing during eye fixations in the reading of prose. J Verbal Learn Verbal Behav. 1984;23(5):612–624. doi: 10.1016/S0022-5371(84)90382-7. [DOI] [Google Scholar]
  • 26.Sereno SC, Rayner K. Measuring word recognition in reading: eye movements and event-related potentials. Trends Cogn Sci. 2003;7(11):489–493. doi: 10.1016/j.tics.2003.09.010. [DOI] [PubMed] [Google Scholar]
  • 27.Fonseca MCM. Noções sobre a leitura vista pela cognição. Cad Trad. 2020;40(esp2):125–148. doi: 10.5007/2175-7968.2020v40nesp2p125. [DOI] [Google Scholar]
Codas. 2022 Feb 2;34(4):e20200333. [Article in Portuguese]

Leitura de palavras e pseudopalavras em adultos jovens: um estudo de rastreamento ocular

Fernanda Marchezini 1,, Peter Maurice Erna Claessens 2, Maria Teresa Carthery-Goulart 2,3,4

RESUMO

Objetivo

Avaliar e caracterizar o comportamento oculomotor durante a leitura de pseudopalavras e palavras do português brasileiro caracterizadas quanto à frequência, extensão e regularidade e verificar sua relação com o desempenho em testes neuropsicológicos.

Método

21 alunos universitários com média de idade de 20,9 anos realizaram a Tarefa de Leitura de Palavras e Pseudopalavras (TLPP) da Bateria Anele, além de testes de fluência verbal e de memória operacional fonológica. Foram estudados os padrões de duração da primeira fixação do olhar no estímulo, duração total das fixações no estímulo e a taxa de refixações (taxa de retornos ao estímulo).

Resultados

A duração da primeira fixação e a duração total das fixações foram significativamente menores para palavras em relação às pseudopalavras, bem como a duração total das fixações foi menor para palavras frequentes e curtas. Também foram encontradas interações significativas entre o desempenho na fluência verbal e a duração da primeira fixação.

Conclusão

Nossos resultados demonstram a aplicabilidade do rastreador ocular para avaliar a leitura no nível da palavra no Português Brasileiro. O rastreador ocular pode ser um instrumento adicional na investigação de transtornos de leitura do desenvolvimento e adquiridos, podendo auxiliar na detecção de dificuldades de leitura a partir da análise de diferenças do comportamento oculomotor entre leitores fluentes e não-fluentes.

Descritores: Leitura, Linguagem, Psicolinguística, Movimentos Oculares, Medições dos Movimentos Oculares, Dislexia

INTRODUÇÃO

A decodificação pode ser analisada pelo modelo teórico de dupla rota que explica a leitura de palavras isoladas através de duas vias: a lexical e a fonológica. A primeira permite que na visualização de uma sequência de grafemas aconteça o acesso direto à representação no léxico mental do leitor, sendo a rota usada para a leitura de palavras conhecidas e palavras irregulares, cuja pronúncia não pode ser aferida pela conversão grafofonêmica. Já a via fonológica envolve a conversão grafema-fonema por meio da aplicação de regras e permite a leitura de palavras não familiares, regulares e pseudopalavras(1,2). À medida que se torna um bom leitor, o indivíduo passa a usar as duas rotas de leitura em paralelo e se torna consistente no uso das pistas fonológicas e ortográficas para a ativação ou inibição de vocábulos, aumentando a velocidade de leitura global, especialmente nas palavras mais curtas e mais frequentes(3).

Os principais comportamentos oculares analisados durante a leitura são as fixações e as sacadas. As fixações são pausas que o olhar faz para analisar na fóvea, região central da retina, uma determinada área da palavra e extrair de forma mais eficaz a informação linguística(4,5). Já as sacadas são os movimentos que os olhos executam de um ponto a outro que deve ser fixado. A primeira fixação na palavra corresponde às etapas iniciais do processamento lexical, já a duração total de todas fixações descreve a integração do acesso lexical com os sistemas semântico e morfossintático, havendo então o total reconhecimento da palavra(6) e nos bons leitores, as palavras mais frequentes e curtas tendem a ser reconhecidas mais rapidamente e precisar de menos fixações(7). Trabalhos usando a técnica de rastreamento ocular já foram realizados no Brasil com o objetivo de caracterizar os padrões oculares durante a leitura de estímulos isolados (palavras e pseudopalavras) em adultos e encontraram que o número e a duração das fixações é maior para pseudopalavras do que para palavras reais, bem como para palavras menos frequentes e mais longas(5,8), confirmando os achados de estudos realizados em outras línguas(7). Ao que se refere à regularidade das palavras, um estudo realizado no Português Brasileiro também com jovens adultos universitários encontrou diferenças significativas dos parâmetros oculomotores nesta condição psicolinguística, sendo as palavras regulares processadas mais rapidamente com tempos de fixações menores que as irregulares(5).

A leitura eficiente também depende de outras funções cognitivas, como a memória operacional fonológica, um sistema de armazenamento e processamento temporário de informações verbais e que tem capacidade limitada. Durante a leitura, já foi observado por meio de técnicas de rastreamento ocular que quanto melhor é a capacidade de memória operacional fonológica do leitor, mais precisa é a fixação da fóvea na posição correta(9) e menor ocorrência de sacadas regressivas no conteúdo linguístico para refixar(10). Outra função cognitiva importante para a leitura é a fluência verbal, habilidade de recuperar e evocar a informação linguística armazenada na memória semântica. A prática da leitura fortalece a habilidade de fluência verbal, pois melhora a consciência metalinguística, aumenta o vocabulário(11) e, quanto melhor for essa habilidade, menor tende ser a necessidade de reler e refixar as palavras(12).

Pensando nas propriedades psicolinguísticas e nas habilidades cognitivas individuais que podem influenciar o desempenho em provas de leitura, o presente estudo teve como objetivo analisar o comportamento oculomotor durante a leitura de palavras e pseudopalavras isoladas em uma população de jovens adultos e confirmar as características encontradas em outros estudos brasileiros. Além disso, através do comportamento oculomotor, buscamos entender neste trabalho como os fatores psicolinguísticos podem interagir durante as tarefas de leitura e como os parâmetros oculomotores podem se correlacionar com o desempenho em tarefas cognitivas de memória operacional fonológica e de fluência verbal. Utilizamos a Bateria Anele com autorização dos autores, que é um protocolo de avaliação de leitura validado e disponível para a prática clínica, a fim de demonstrar como o rastreador ocular pode complementar a avaliação de leitura.

MÉTODO

Este estudo foi aprovado pelo Comitê de Ética em Pesquisa sob o CAAE no. 15305813.5.0000.0082 e parecer n. 310.077. Participaram do estudo 21 alunos universitários, destros, 8 homens e 13 mulheres, com idade média de 20,9 anos e todos assinaram o Termo de Consentimento Livre e Esclarecido. Na entrevista inicial, nenhum participante relatou ter déficits visuais ou auditivos não corrigidos, Transtorno do Déficit de Atenção e Hiperatividade, dificuldades de aprendizagem prévias, doenças neurológicas ou psiquiátricas ou fazia uso de drogas com ação no Sistema Nervoso Central. Também foram realizados testes de memória operacional fonológica de dígitos e testes de fluência verbal, sendo solicitado que os participantes gerassem nomes de animais e de palavras iniciadas pelos fonemas /f/, /a/ e /s/ em um minuto para cada categoria.

Para avaliar a leitura, foi usada a Tarefa de Leitura de Palavras e Pseudopalavras (TLPP)(13) da Bateria Anele composta por 48 palavras e 24 pseudopalavras. Esta tarefa verifica a participação das rotas lexical e fonológica na leitura, incluindo estímulos com efeitos de lexicalidade, extensão, regularidade e frequência e foi escolhida por ser equilibrada na distribuição de palavras curtas e longas, regulares e irregulares, assim como frequentes e não frequentes na Língua Portuguesa. Quanto à extensão, as autoras da TLPP consideraram “curtas” as palavras com até duas sílabas ou até cinco letras e “longas” as palavras com três ou mais sílabas ou acima de seis fonemas. Para a regularidade, a Tarefa adotou como “regular” toda palavra que corresponde o grafema ao seu fonema com transparência e “irregular” quando a correspondência grafofonêmica não segue uma regra transparente na conversão. Ao que se refere à frequência, a elaboração foi baseada nas ocorrências do Banco de Português do Corpus Brasileiro da PUC-SP(14). Para manipular o efeito de lexicalidade, a Tarefa incluiu 24 pseudopalavras que foram criadas a partir de 24 palavras reais da bateria, mas que tiveram suas letras e/ou sílabas trocadas ou omitidas, porém com a mesma estrutura silábica. A tarefa final totalizou 72 estímulos apresentados em 12 listas com seis estímulos em cada uma, escritos em fonte Arial, caixa alta, cor preta, tamanho 20, justificados e em fundo branco. O tamanho da letra, em pixels, variava discretamente a depender da letra, assim como a distância entre uma letra e outra dentro de uma mesma palavra. Não houve variação entre as linhas, com distância de 205 pixels entre elas.

Para registro dos movimentos oculares foi usado o equipamento Arrington Research (AR) de sistema binocular com captura das pupilas a uma taxa de 60Hz. As informações do comportamento oculomotor foram extraídas do software ViewPoint, versão 2.8.6, à interface com o equipamento AR. Os estímulos foram projetados em um monitor LCD Hewlett-Packard (HP) em resolução de 1440 x 960 pixels com área visível de 41 x 25,6 cm, posicionado a uma distância de 40 cm do apoio de queixo e testa dos participantes e os experimentos foram executados em uma sala com baixa iluminação. O equipamento foi calibrado para cada participante em função do tamanho da sua pupila e foi solicitado ao participante fixar o olhar em 16 pontos dispostos em linha de grade e apresentados em ordem aleatória sobre o monitor do computador. Antes do início de cada bloco de palavras ou pseudopalavras foi apresentado um ponto fixo no centro da tela para que o participante preparasse o olhar para iniciar a próxima etapa da tarefa. Todos foram instruídos a ler mentalmente as listas de palavras e o software ViewPoint produziu registros numéricos com os valores de tempo total da captura de sinais, as posições horizontais e verticais das fixações para cada olho e os eixos horizontais e verticais das pupilas. Esses parâmetros foram usados para calcular, off-line, o número de fixações, a duração de cada fixação e a duração da primeira fixação na leitura das palavras. A análise dos resultados foi realizada pelo software The R Project for Statistical Computing (R, versão 3.1.2) e pelo software Jamovi 1.6.15 e o nível de significância adotado foi de 0,05. Foram realizadas ANOVAs multifatoriais para as análises de interação das durações das fixações e das variáveis psicolinguísticas entre si e com o desempenho nos testes de fluência verbal e de memória operacional fonológica.

O comportamento oculomotor durante a leitura silenciosa foi analisado em função das seguintes variáveis psicolinguísticas: lexicalidade, frequência, extensão e regularidade. As variáveis dependentes foram: Duração da Primeira Fixação (DPF), correspondente à duração do primeiro olhar na palavra antes da primeira sacada e Duração Total das Fixações (DTF), correspondente à soma de todas as fixações realizadas dentro da palavra antes do olhar executar a sacada para o próximo estímulo. Todos os parâmetros foram analisados pela média e pela mediana da duração em milissegundos. As medianas apresentaram valores menores que as médias, indicando distribuições positivamente assimétricas e/ou presença de durações excessivamente longas, que são violações de normalidade e que prejudicariam os pressupostos para as análises dos dados brutos. Portanto, para garantir a validade da normalidade aproximativa e a robustez das medidas, foram adotadas as medianas para todas as análises. Também foi analisada a probabilidade de refixar cada estímulo, aqui definida como taxa de refixações (taxa de retornos ao estímulo).

RESULTADOS

ANOVA de medidas repetidas revelou na Duração da Primeira Fixação (DPF) e na Duração Total das Fixações (DTF) o efeito principal de lexicalidade, extensão e de frequência conforme descrito na Tabela 1, onde o valor desses parâmetros foi significativamente menor para palavras reais e palavras frequentes em comparação com seus pares: pseudopalavras e palavras infrequentes. Particularmente no efeito isolado de extensão, encontramos também que a Duração Total das Fixações foi significativamente menor para palavras curtas que para palavras longas, enquanto a Duração da Primeira Fixação foi maior para palavras curtas que para palavras longas. Embora a Duração da Primeira Fixação no efeito de extensão tenha apresentado p valor ligeiramente maior do que 0,05, observamos tamanho de efeito grande de acordo com o guia de interpretação de Cohen(15,16), com F(1,20) = 4,07; p = 0,057, η2 p = 0,169. Não foram encontradas diferenças significativas para o efeito isolado de regularidade.

Tabela 1. Valores de mediana e desvio-padrão para a Duração da Primeira Fixação e Duração Total das Fixações em milissegundos em função do efeito principal de lexicalidade, de frequência e de extensão.

Mediana DP F(1,20) p η2 p
DPF Lexicalidade Palavras 300 287,41 7,24 0,014 0,266
Pseudopalavras 366,66 417,34
DTF Lexicalidade Palavras 366,66 465,51 46,8 <0,001 0,701
Pseudopalavras 700 728,13
DPF Frequência Alta 300 244,94 5,38 0,031 0,212
Baixa 333,33 323,09
DTF Frequência Alta 333,33 399,40 12,4 0,002 0,383
Baixa 433,33 431,51
DPF Extensão Curta 333,33 322,16 4,07 0,057 0,169
Longa 300 382,85
DTF Extensão Curta 400 503,38 5,77 0,026 0,224
Longa 466,66 595,79
DPF Regularidade Regular 300 241,27 0,02 0,875 0,001
Irregular 300 327,07
DTF Regularidade Regular 366,66 374,79 0,77 0,390 0,037
Irregular 366,66 455,75

Legenda: DPF = Duração da Primeira Fixação; DTF = Duração Total das Fixações; DP = Desvio Padrão; F = estatística F do Teste ANOVA; p = nível de significância; η2 p = eta-quadrado parcial - tamanho do efeito

Para a Duração Total das Fixações, ANOVA de medidas repetidas mostrou efeito de interação entre lexicalidade-extensão (F[1,20] = 16,00; p = <0,001, η2 p = 0,444). A Tabela 2 mostra os resultados da análise post-hoc (Tukey) que revelou diferenças entre as variáveis psicolinguísticas, onde a DTF em palavras curtas foi menor que em palavras longas, que por sua vez, foi menor que em pseudopalavras curtas e pseudopalavras longas, respectivamente. ANOVA de medidas repetidas também revelou efeito de interação tripla marginalmente significativo entre frequência-extensão-regularidade, com F(1,20) = 4,57; p = 0,045, η2 p = 0,186, onde embora o p-valor obtido tenha sido próximo ao nível de significância de 0,05, encontramos um tamanho de efeito grande que poderia justificar a interação desses três fatores psicolinguísticos na Duração Total das Fixações. O teste post-hoc (Tukey) que analisou todas as interações possíveis revelou que a DTF em palavras curtas-frequentes-regulares foi significativamente menor (mediana 333,33 ms) que nas palavras longas-infrequentes-regulares (mediana 466,66 ms), mostrando que extensão e frequência são determinantes para a diferença no tempo envolvido na decodificação, e que palavras longas-frequentes-regulares (mediana 333,33 ms) são lidas significativamente mais rápido que palavras longas-infrequentes-regulares (mediana 466,66 ms), mostrando que a frequência mais uma vez pode ser fator determinante para o processamento da leitura.

Tabela 2. Valores de mediana e desvio-padrão para a Duração Total das Fixações em milissegundos em função do efeito de interação entre lexicalidade-extensão.

Palavras Curtas Palavras Longas Pseudopalavras Curtas Pseudopalavras Longas F(1,20) p η2 p
DTF 366,66 (409,37) 366,66 (427,31) 566,66 (647,08) 816,66 (792,05) 16,00 <0,001 0,444

Legenda: DTF = Duração Total das Fixações; F = estatística F do Teste ANOVA; p = nível de significância; η2 p = eta-quadrado parcial - tamanho do efeito

Para avaliar a taxa de refixações, fizemos análises de modelos lineares generalizados mistos nas quais verificamos a probabilidade de refixações acontecerem dentro de uma palavra antes do olhar do participante deixar o estímulo. Essa categoria de modelos lineares estende o modelo linear geral, que contempla variáveis independentes contínuas e discretas, fixas ou randômicas sobre indivíduos, mas agora com uma variável dependente contínua para variáveis dependentes binárias, entre outras. Neste estudo, o ato de refixar pelo menos uma vez, ou não, foi a variável binária. Na prática, como acontece em regressão logística, cada resposta foi vista como a realização de uma tentativa-Bernoulli com uma certa probabilidade de refixação relacionada às variáveis independentes pela função-link, o logit, ou log(θ)-log(1-θ). A função-link é uma função linear das variáveis preditoras com coeficientes a serem estimados por um método de máxima verossimilhança. Estas análises foram implementadas no software Jamovi - 2021(17,18) com o módulo Linear Models (19) e uma função-link logística, o que equivale à regressão logística mista mas, neste caso, com preditores discretos. As características de lexicalidade, extensão, frequência e regularidade foram transformadas através de codificação de contraste e representadas por um preditor dummy com valor numérico -0,5 ou 0,5. O modelo é misto porque enquanto os valores de efeito para estas variáveis foram considerados fixos sobre a população de indivíduos, foi acrescentado um termo variável por indivíduo, como um fator aleatório com distribuição normal estipulada sobre a população. No contexto atual, este termo pode ser interpretado como representando a variação interindividual na taxa-base da refixação de estímulos linguísticos em geral. Buscamos, assim, analisar as características psicolinguísticas conforme a sua combinação e verificar como uma variável pode influenciar a outra na probabilidade de refixar palavras durante o processamento da leitura. Foram realizadas as análises para comparar palavras com pseudopalavras, incluindo o efeito de extensão e para verificar os papeis da extensão, frequência e regularidade das palavras. Foi adotado o teste de Wald, com estatística Χ2, para aferir significância estatística, usando uma distribuição qui-quadrado e sempre com um grau de liberdade. Todas as análises foram de intercepto randômico sobre os voluntários, mas de efeitos fixos para as manipulações experimentais. Os efeitos serão apresentados através da contribuição linear ao logit da probabilidade de refixar, com os odds correspondentes como tamanho de efeito. O fator odds indica com qual constante multiplicativa a razão da probabilidade de refixar versus a de não refixar, já considerando as outras variáveis, é modulada pela diferença em níveis da variável independente em questão. Um coeficiente para o logit positivo corresponde a uma maior probabilidade de refixação e corresponderá a um fator-odds maior que 1.

Em uma primeira análise, foram determinados os efeitos principais e a interação entre lexicalidade e extensão. Pseudopalavras curtas foram refixadas 38,49% das vezes, enquanto pseudopalavras longas foram refixadas 57,14% das vezes. Palavras foram refixadas 20,95% das vezes quando curtas e 31,91% das vezes quando longas. O aparente padrão de maior número de refixações nas pseudopalavras do que nas palavras, bem como nos estímulos longos independente da lexicalidade, foi confirmado na regressão logística com lexicalidade e extensão como fatores. Os efeitos principais de extensão (longas-curtas) e lexicalidade (pseudopalavras-palavras) foram fortemente significativos, com estimativa linear ± erro padrão de 0,7308±0,1175 e 1,0512±0,1181, Χ2 de 38,67 e 79,19, respectivamente e, p < 0,0001 para ambos. O tamanho de efeito foi grande, com odds de 2,077 e 2,861, respectivamente, enquanto a interação não alcançou significância estatística (0,2104±0,2340, Χ2 = 0,8081, p = 0,37). O fator odds foi calculado como parte do modelo logístico misto, levando em conta a variação interindividual na tendência de realizar as refixações(20,21).

Uma segunda análise de regressão logística mista foi realizada somente com as palavras para investigar os efeitos de extensão, regularidade e frequência dentro deste grupo de estímulos. Entre as palavras regulares, as que eram longas e infrequentes foram refixadas 42,18% das vezes, as curtas e infrequentes 21,43%, as longas e frequentes 20,83% e as curtas e frequentes 18,37% das vezes. Entre as palavras irregulares, as taxas foram de 31,55%, 21,77%, 34,69%, e 22,02% respectivamente. O ajuste do modelo com intercepto randômico para os voluntários indicou significância estatística, conforme o teste chi-quadrado de Wald, para frequência (infrequentes-frequentes, estimativa linear ± erro padrão 0,2896±0,1371, Χ2 = 4,4634, p = 0,035, odds 1,336), para extensão (longas-curtas, 0,6256±0,1375, Χ2 = 20,7091, p < 0,0001, odds 1,869), para a interação entre regularidade (irregular-regular) e frequência (-0,7527±0,2743, Χ2 = 7,5305, p = 0,006, odds 0,4711) e significância marginal para a interação tripla entre extensão, frequência e regularidade (-1,0561±0,5482, Χ2 = 3,7114, p = 0,054, odds 0,3478). Valores positivos para as estimativas lineares e odds acima de 1 indicam maior número de refixações para palavras mais longas e menos frequentes. O efeito principal de regularidade não foi significativo, bem como para as outras interações duplas (todos com p > 0,15), no entanto um valor positivo para regularidade significaria maior número de refixações para palavras regulares em comparação com irregulares. Também foi ajustado um modelo com intercepto randômico indivíduo e item cruzado, com resultados parecidos em termos de tamanho de efeito, mas no qual todos os p-valores subiram, perdendo a significância no nível de 5% para a frequência e para a interação tripla (mas não para a interação frequência e regularidade). Pelo fato que os mesmos tamanhos de efeito produziram p > 0,05, deve-se levar em conta a perda do poder estatístico. Uma comparação de condições por pares com correção de Holm mostra que a principal causa da interação frequência x regularidade é a diferença entre palavras regulares frequentes e raras (p < 0,005; mas após correção, p > 0,5 entre palavras irregulares para a mesma diferença) e também, em menor grau, a diferença entre palavras irregulares e regulares em palavras frequentes (p < 0,10). A primeira interação modula o efeito principal de frequência, portanto, o efeito de frequência parece ser maior para palavras regulares. De forma complementar, a diferença marginalmente significativa entre palavras frequentes irregulares e regulares indica que as regulares provocam menos refixações do que seria esperado. Apesar de não significativa após correção de Holm, a tendência de diferença entre palavras regulares frequentes e palavra irregulares infrequentes está no mesmo sentido que as diferenças entre palavras regulares frequentes e as outras combinações de frequência e regularidade. O padrão que surge é que palavras ao mesmo tempo frequentes e regulares são refixadas menos vezes que outras palavras.

Análises post-hoc da interação tripla, isto é, entre todos os 28 pares de combinações dos níveis das três variáveis linguísticas independentes, mostraram que o grupo de palavras longas-infrequentes-regulares é refixado significativamente mais que todas as condições com palavras curtas e também mais que palavras longas-frequentes-regulares. Palavras longas-frequentes-irregulares são refixadas mais vezes que curtas-frequentes-regulares e com significância marginal (p < 0,10), mais do que palavras longas-frequentes-regulares. Chama a atenção que a taxa de refixação deste último grupo é no nível das palavras curtas, onde todos os p-valores para a comparação pareada com cada uma das condições de palavras curtas ficaram acima de 0,5 mesmo antes da correção, apesar do efeito principal particularmente robusto de extensão.

O conjunto de efeitos (Figura 1) mostrou que, em média, as palavras curtas são menos refixadas que as palavras longas, com a exceção de palavras longas-frequentes-regulares. Regularidade e frequência não cumprem papel significativo dentro do grupo de palavras curtas. As palavras mais refixadas são as longas-infrequentes-regulares, em nível aproximadamente equivalente a palavras longas-irregulares. Entre palavras longas-irregulares, a frequência não parece importar. Entre palavras longas-regulares, no entanto, a frequência é determinante em reduzir a probabilidade de refixação da maior taxa (42,28% para infrequentes) para a segunda menor entre as oito condições com palavras (20,83% para frequentes).

Figura 1. Taxa de refixações para a interação tripla entre extensão, frequência e regularidade.

Figura 1

Legenda: SE = Standard Error

Um modelo com efeitos randômicos cruzados também foi usado e produziu tamanhos de efeito compatíveis com os calculados anteriormente, mas novamente com valores maiores para todos os p-valores, resultando a perda de significância, em nível de 5%, para frequência e para a interação tripla. Extensão e interação entre frequência e regularidade foram mantidas como efeitos estatisticamente significativos, destacando a importância destas variáveis. A interação frequência x regularidade foi novamente motivada, em primeiro lugar, pelo fato que palavras regulares frequentes provocam menos refixações que palavras regulares infrequentes, com p corrigido < 0,10. As análises post-hoc da interação tripla também mostraram, neste caso, que a diferença mais importante está entre palavras longas-infrequentes-regulares, e palavras curtas, especialmente aquelas que adicionalmente são regulares e frequentes. Considerando o grande número de testes simultâneos (28) envolvidos na correção e o menor poder estatístico ao introduzir item como variável aleatória, a diferença entre palavras longas, regulares frequentes e infrequentes deve ser considerada estatisticamente significativa (p corrigido = 0,073).

Por fim, em relação aos testes neuropsicológicos, o desempenho médio da amostra de participantes no teste de fluência verbal por categoria semântica foi de 21,52 palavras por minuto, com desvio-padrão de 3,47. Para o teste de fluência verbal por categoria fonêmica, a média das três letras foi de 16,23 palavras por minuto, com desvio-padrão de 3,23. Para estudar a interação entre as variáveis dependentes dos padrões oculares e o perfil neuropsicológico, ANOVA split-plot e análise post-hoc mostraram que os indivíduos com melhor fluência Verbal Semântica apresentaram menor duração da primeira fixação (DFT) em palavras longas, com mediana de 266,66 ms, em relação aos indivíduos com desempenho pior nesse teste, com mediana de 328,20 ms: F(3,21) = 3,69; p = 0,027. Não foram encontradas interações significativas entre os padrões oculomotores e o desempenho dos participantes nas provas de memória operacional fonológica.

DISCUSSÃO

As análises na Tabela 1 mostraram que a Duração da Primeira Fixação e a Duração Total das Fixações foram menores para palavras do que para as pseudopalavras, uma vez que estas últimas requerem conversão grafema-fonema e uso exclusivo da rota fonológica, além de não fornecerem nenhuma informação semântica aos sistemas visual e cognitivo. Em bons leitores, como é o caso da população estudada neste trabalho, as sacadas percorrem alguns caracteres entre as fixações que extraem a informação linguística dos estímulos(7,22) e frequentemente, nestas fixações, acontece o processamento de letras vizinhas que já foram ou que serão ainda percorridas pelas sacadas enquanto apenas uma letra é fixada na palavra(23), havendo portanto, uma janela perceptual de mais de uma letra em uma única fixação(24). A primeira fixação na palavra corresponde ao acesso lexical, já a duração total de todas fixações na palavra descreve a integração desse acesso com o sistema semântico(5,25). Conforme descrito na Tabela 1, encontramos que palavras curtas apresentaram Duração Total das Fixações menor que palavras longas, pois necessitaram de um menor número de fixações para serem processadas, como confirmado pela análise da probabilidade de refixações, realizada através da regressão logística mista. Mas encontramos que as palavras curtas apresentaram durações de Primeira Fixação maiores que palavras longas, o que pode ser explicado pelo fato de que nas palavras curtas a janela perceptual de uma única fixação pode dar conta de fazer o acesso ao léxico ortográfico e sua integração semântica, levando mais tempo para o seu reconhecimento completo. Já nas palavras longas, a primeira fixação não seria suficiente para o acesso ao léxico, fazendo o leitor diminuir o tempo desta primeira fixação e precisar de mais fixações dentro da palavra para completar o seu acesso lexical e reconhecimento(26), confirmando os achados de outro estudo brasileiro(5).

Em relação à frequência, encontramos neste estudo que palavras frequentes apresentaram menor Duração da Primeira Fixação e do Total das Fixações, pois estímulos mais frequentes ao leitor e mais previsíveis na língua tendem a ter representações ortográficas mais familiares e podem ter seu reconhecimento mais fácil e rápido(27). Sendo assim, recebem menor número de fixações e em menor duração até seu completo reconhecimento, confirmando os achados também de outros estudos realizados em Português e em outras línguas(5,7,8). Os resultados relacionados às durações da primeira e do total das fixações nos fatores de extensão e frequência também foram confirmados pelos resultados encontrados no modelo de regressão logística mista, onde buscamos verificar a probabilidade dos estímulos linguísticos serem ou não refixados. Nesta análise, encontramos que valores positivos para as estimativas lineares e odds acima de 1 indicaram maior número de refixações para palavras mais longas e para palavras menos frequentes, confirmando que palavras mais frequentes (e possivelmente mais familiares) e menos extensas tendem a apresentar menor número de fixações(7,8).

Considerando o fator de regularidade, o estudo brasileiro realizado anteriormente com leitura de palavras isoladas(5) em adultos encontrou diferenças significativas entre palavras regulares e irregulares, tendo sido as últimas mais demoradas que as primeiras tanto nos parâmetros de primeira fixação como no total das fixações, sugerindo envolvimento de maior carga cognitiva e linguística na decodificação de palavras irregulares. Tomando como base o modelo teórico de dupla-rota, as palavras irregulares, que não seguem regras de conversão grafofonêmica, poderiam ser ativadas diretamente pela rota lexical através do input visual, podendo assim levar menos tempo para o seu reconhecimento completo por não demandarem exclusivamente da rota fonológica, que é mais lenta na decodificação. Deste modo, buscamos investigar a influência da regularidade nas palavras nos processos de leitura, porém isoladamente não encontramos neste estudo nenhuma diferença significativa nos parâmetros oculomotores na comparação de palavras regulares com irregulares. Então, ao analisarmos a regularidade interagindo com os outros fatores psicolinguísticos, encontramos diferenças a serem consideradas, porém as análises post-hoc mostraram que as diferenças altamente significativas estavam entre as palavras curtas-frequentes-regulares, que tiveram sua Duração Total de Fixações e taxa de refixação menores que palavras longas-infrequentes-regulares, mostrando mais uma vez que extensão e frequência cumprem papel importante no processamento da leitura. Outro achado relevante foi encontrado em palavras longas-frequentes-regulares, que tiveram seus tempos totais de fixação e taxa de refixação também significativamente menores que palavras longas-infrequentes-regulares, confirmando que a frequência de fato pode ser fator determinante na decodificação.

Na Figura 1, pode-se observar que, de forma geral, palavras curtas são menos refixadas que palavras longas, mas na análise dos três fatores psicolinguísticos juntos, verificamos que a regularidade e a frequência não cumprem papel significativo dentro do grupo de palavras curtas, sendo estas pouco refixadas de qualquer maneira, possivelmente pela extensão curta ser fator suficiente para que as palavras sejam já processadas com poucas fixações ou, por vezes, apenas uma fixação. Pensando, então, no grupo de palavras longas, observamos que as mais refixadas foram as longas-infrequentes-regulares, em nível aproximadamente equivalente a palavras longas-irregulares, onde nestas últimas a frequência mostrou não fazer diferença. Entre palavras longas-regulares, no entanto, a frequência foi determinante em reduzir a probabilidade de refixação de 42,28% nas infrequentes para 20,83% nas frequentes. A explicação para esse achado pode estar na natureza do acesso de palavras irregulares, realizado necessariamente pela rota lexical, a via de acesso direto pelo input visual. Em bons leitores, como é o caso da amostra deste estudo, não são esperadas dificuldades ou falhas na representação/memória ortográfica e o processamento desse grupo de palavras irregulares aconteceria de forma direta. Sendo a mostra composta por bons leitores, também era esperado que esses participantes lessem as palavras regulares pela via lexical, considerando sua eficiência e fluência na decodificação e no reconhecimento de palavras, porém mesmo nesta população não podemos descartar a participação paralela e simultânea da rota fonológica na leitura de palavras regulares. A via fonológica é mais lenta e, neste tempo adicional de processamento, a frequência mostra-se, então, determinante em reduzir a duração da decodificação. Também não se pode desconsiderar o fato dos estímulos terem sido apresentados em listas, sem nenhum contexto linguístico, e os participantes terem feito uso da via fonológica para reler e confirmar o que já haviam lido anteriormente.

Em relação ao comportamento oculomotor e sua interação com fatores neuropsicológicos, um estudo realizado na língua inglesa(12) usando rastreamento ocular para investigar a leitura de sentenças com e sem ambiguidades semânticas mostrou que adultos saudáveis, tanto jovens como idosos, com maior fluência verbal apresentaram maiores durações das fixações na primeira passagem do olhar pelas frases e que adultos com pior fluência verbal apresentaram o inverso, isto é, menor duração neste parâmetro. Os autores explicam que a alta fluência verbal pode justificar as fixações da primeira leitura da oração serem mais demoradas e sendo compensadas pela menor necessidade de reler e refixar segmentos da sentença, ao passo que leitores com fluência verbal pior apresentariam medidas de primeira passagem mais rápidas pois gastariam mais tempo lendo e relendo toda a sentença posteriormente a fim de resolver ambiguidades, já que recrutariam e organizariam menos estratégias para o resgate de palavras. No presente estudo, encontramos que os participantes com melhor fluência verbal semântica apresentaram menor Duração da Primeira Fixação em palavras longas. Pensando na interação com o fator de extensão, esse dado pode sugerir que a alta fluência verbal possa também estar associada à redução da necessidade de reler, porém aqui, diversamente do estudo citado, a leitura foi realizada através de palavras isoladas, sem nenhum contexto linguístico que ajudasse o leitor na previsibilidade das palavras ou na integração com o significado, algo que deve ser considerado para a limitação da interpretação deste resultado e deve ser melhor investigado em estudos futuros.

Não encontramos interações entre os padrões oculomotores e o desempenho nas provas de memória operacional fonológica. O tipo de estímulo linguístico usado neste estudo, que foi de palavras isoladas apresentadas em listas, pode ter influenciado neste resultado e o uso de protocolos de leitura com frases ou textos pode fornecer mais possibilidades para a investigação de correlações entre a leitura e a função da memória operacional.

Por fim, tendo em vista a produção nacional neste tema, estudos brasileiros(5,8) já buscaram investigar a correlação dos parâmetros oculares com variáveis psicolinguísticas através do uso de listas de palavras e pseudopalavras, encontrando efeitos isolados de lexicalidade, frequência, extensão e regularidade que contribuem para a discussão de alguns aspectos linguísticos e cognitivos que podem estar envolvidos no processamento da leitura. Neste estudo, buscamos investigar mais detalhadamente a relação existente na interação entre as variáveis psicolinguísticas e dos parâmetros oculares com algumas funções cognitivas, como a memória operacional fonológica e a fluência verbal, aspectos ainda pouco abordados nos estudos de rastreamento ocular e leitura no Português Brasileiro. As medidas que avaliamos (latência para a primeira fixação, duração total das fixações e probabilidade de retornos ao estímulo) trouxeram informações complementares à aplicação tradicional da tarefa de leitura de palavras e pseudopalavras e que podem ser relevantes para um diagnóstico clínico mais preciso, bem como para desenhar intervenções para pacientes com dislexia. Também é importante ressaltar que as dislexias podem ter manifestações leves, moderadas e graves. Quando a dificuldade é muito leve, por exemplo, em uma fase muito inicial de quadros neurodegenerativos, instrumentos que possam detectar comportamentos que sugerem uma disfunção incipiente podem ser relevantes para a prática clínica. Como perspectiva futura, são necessários trabalhos com amostras maiores e mais representativas da população, ou seja, com mais variabilidade em termos de escolaridade, idade, nível socioeconômico e região. A partir disso, também será necessário criar ferramentas que facilitem a obtenção, análise e interpretação das informações que os dados obtidos por rastreamento ocular podem trazer, para que os profissionais que atuam no diagnóstico e intervenção em pacientes com dislexia possam se beneficiar dessa ferramenta em seu dia-a-dia e em nível individual. Há um caminho longo a percorrer nesse sentido e este trabalho visa inspirar a ampliação de estudos nesta área.

CONCLUSÃO

Testes de leitura de palavras e pseudopalavras são frequentemente empregados para investigar quadros de dislexia do desenvolvimento e adquiridas, avaliando a preservação e funcionamento das rotas de leitura. O rastreador ocular é um instrumento que analisa o desempenho na leitura de forma objetiva, podendo ser uma ferramenta adicional para investigar esses aspectos, porém ainda não é utilizado na prática clínica no Brasil. O objetivo do presente estudo, de investigar os padrões oculomotores durante a leitura em Português em uma população cognitivamente saudável, foi contribuir para a caracterização do perfil típico em leitores do português- brasileiro, mostrando sobretudo os efeitos de lexicalidade, de frequência e extensão. Este trabalho é uma prova de conceito de como o rastreador ocular pode auxiliar na obtenção de dados e valores de referência para fins de pesquisa e aplicabilidade clínica na investigação diagnóstica, onde déficits sutis podem vir a ser detectados e algumas características do comportamento oculomotor podem estar mais associadas com bom desempenho na leitura. Para isso, outros estudos são sugeridos em língua portuguesa considerando amostras maiores, diferentes populações, outros estímulos linguísticos, como frases e textos, e investigação da correlação do comportamento oculomotor com funções cognitivas superiores, sobretudo com a memória operacional fonológica e a fluência verbal.

AGRADECIMENTOS

FM recebeu bolsa de estudos institucional da Universidade Federal do ABC (UFABC).

MTCG participa de projeto relacionado financiado pela Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP, bolsa número 2019/25795-2). É afiliada ao Instituto Nacional de Ciência e Tecnologia sobre Comportamento, Cognição e Ensino (INCT-ECCE), São Carlos (SP), Brasil, com apoio do Conselho Nacional de Pesquisa (CNPq, bolsa número 465686/2014-1), Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES, bolsa número 88887.136407/2017-00) e Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP Bolsa número 2014/50909-8).

O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior – Brasil (CAPES) – Código de Financiamento 001.

Footnotes

Trabalho realizado na Universidade Federal do ABC – UFABC – São Bernardo do Campo (SP), Brasil.

Fonte de financiamento: nada a declarar.


Articles from CoDAS are provided here courtesy of Sociedade Brasileira de Fonoaudiologia

RESOURCES