Abstract
Objectives: To assess the potential uses of computer-assisted record linkage in the surveillance of infectious diseases, using the Nova Scotia blood recipient notification program as the example.
Methods: We developed a computer-assisted, multiple-pass, probabilistic record linkage to link records for blood recipients identified by the Nova Scotia notification program (Nova Scotia Phase I Blood Bank File information) with corresponding Nova Scotia Health Card Registration File records to obtain current mailing addresses to contact potentially living recipients. We used variables available from both files (e.g., name, date of birth, gender, and health care registration number) to link records, after eliminating duplicates/deceased cases.
Results: Among 23,925 eligible records in the Nova Scotia Phase I Blood Bank File (1984–1990), there were 1,818 (7.8%) duplications and 8,675 deceased cases, leaving 13,432 cases for linkage. 8,713 (65%) cases were successfully linked to the 1998 Health Card Registration Data File for current mailing addresses.
Interpretation: Multiple-pass linkage seems acceptable for maximizing detection of correctly matched records for lookback projects. To overcome quality/lack of information obstacles, future lookback linkages should explore the use of supplementary data files (tax files, voter lists, license files, other provincial databases) to obtain most current addresses.
Résumé
Objectifs: Évaluer les possibilités d’utilisation de la liaison de dossiers assistée par ordinateur pour la surveillance des maladies infectieuses, en utilisant comme exemple le programme de notification des personnes ayant reçu du sang mis en oeuvre par la Nouvelle-Écosse.
Méthodes: Le système informatique élaboré pour le maillage des dossiers probabilistes de personnes ayant reçu du sang cernées par le programme de notification de la Nouvelle-Écosse (N.-É.) a utilisé les renseignements du fichier de la banque de sang de la phase I de la N.-É. et des dossiers correspondants du fichier d’enregistrement des cartes santé de la N.-É. afin d’obtenir les adresses postales actuelles de ces personnes qui vivent peut-être encore. On s’est servi des variables disponibles dans les deux fichiers pour mailler les dossiers, après avoir éliminé les cas en double/ de décès.
Résultats: Parmi les 23 925 dossiers admissibles dans le fichier de la banque de sang de la phase I (1984–1990), on a compté 1 818 (7,8%) de doubles et 8 675 cas de décès, ce qui laisse 13 432 cas de maillage. 8 713 (65%) cas ont été maillés avec succès au fichier des données d’inscription de la carte santé de 1998, obtenant ainsi les adresses postales actuelles.
Interprétation: Le maillage multipasse semble acceptable pour maximiser la détection des dossiers assortis correctement pour les projets futurs de recherche de dons antérieurs. Afin d’éliminer les obstacles relatifs à la qualité ou au manque d’information, les maillages futurs relatifs à la recherche de dons antérieurs pourraient explorer l’utilisation de fichiers de données supplémentaires (fichiers fiscaux, listes électorales, fichiers de permis, autres bases de données provinciales) afin d’obtenir l’adresse actuelle la plus récente.
References
- 1.Newcombe HB, Kennedy JM, Axford SJ. Automatic linkage of vital records. Science. 1959;130:954–59. doi: 10.1126/science.130.3381.954. [DOI] [PubMed] [Google Scholar]
- 2.Howe GR, Lindsay J. A generalized Iterative Record Linkage Computer System for use in medical follow-up studies. Computers and Biomedical Research. 1981;14:327–40. doi: 10.1016/0010-4809(81)90004-5. [DOI] [PubMed] [Google Scholar]
- 3.Smith ME, Silins J. Generalized Iterative Record Linkage System. 1981. pp. 128–37. [Google Scholar]
- 4.Newcombe HB. Handbook of Record Linkage: Methods for Health and Statistical Studies, Administration, and Business. Oxford, England: Oxford University Press; 1988. [Google Scholar]
- 5.Kusiak RA, Springer J, Ritchie AC, Muller J. Carcinoma of the lung in Ontario gold miners: Possible etiological factors. Br J Industr Med. 1991;48:808–17. doi: 10.1136/oem.48.12.808. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 6.Goldberg MS, Carpenter M, Theriault G, Fair ME. The accuracy of ascertaining vital status in a historical cohort study of synthetic textile workers using computerized record linkage to the Canadian Mortality Data Base. Can J Public Health. 1993;84:201–4. [PubMed] [Google Scholar]
- 7.Howe GR. Use of computerized record linkage in cohort studies. Epidemiol Rev. 1998;20:112–21. doi: 10.1093/oxfordjournals.epirev.a017966. [DOI] [PubMed] [Google Scholar]
- 8.Fair M, Cyr M, Allen AC, Wen SW, Guyon G, MacDonald RCthe Fetal-Infant Mortality Study Group of the Canadian Perinatal Surveillance System An assessment of the validity of a computer system for probabilistic record linkage of birth and infant death records in Canada. Chron Dis Can. 2000;21:8–13. [PubMed] [Google Scholar]
- 9.Interim Report. Commission of Inquiry on Blood System in Canada. Ottawa: Commission of Inquiry on Blood System in Canada; 1995. [Google Scholar]
- 10.MatchWare Technologies, Inc. Burtonsville, Maryland. E-mail: info@matchware.com.
- 11.Lynch BT, Arends WL. Selection of surname coding procedure for the SRS record linkage system. Washington, DC: U.S. Department of Agriculture; 1977. [Google Scholar]
- 12.British Columbia Blood Recipients Record Linkage System. Report on the Blood Recipient Notification Project. British Columbia Ministry of Health and Ministry Responsible for Seniors. 1998. pp. 5–7. [Google Scholar]