Abstract
Die Verwendung von einheitlichen Datenformaten (Datenstandards) im Gesundheitswesen dient vier Hauptzwecken: 1) dem Datenaustausch, 2) der Integration von Computersystemen und -instrumenten, 3) der Datenspeicherung und -archivierung und 4) der Unterstützung föderierter Datenbanken. Sie sind besonders wichtig für die Erforschung und die klinische Versorgung Seltener Erkrankungen (SE).
In dieser Übersicht stellen wir Standards im Gesundheitswesen vor und präsentieren eine Auswahl von Standards, die im Bereich der seltenen Krankheiten häufig verwendet werden. Die „Human Phenotype Ontology“ (HPO) ist der am häufigsten verwendete Standard zur Annotation phänotypischer Anomalien und zur Unterstützung der phänotypgesteuerten Analyse der diagnostischen Exom- und Genomsequenzierung. Es gibt zahlreiche Standards für Krankheiten, die unterschiedlichen Anforderungen entsprechen. Das „Online Mendelian Inheritance in Man“ (OMIM) und die „Orphanet Rare Disease Ontology“ (ORDO) sind die wichtigsten Standards, die speziell für seltene Krankheiten entwickelt wurden. Die „Mondo Disease Ontology“ (Mondo) ist eine neue Krankheitsontologie, die darauf abzielt, auf umfassende Weise Daten aus aktuellen Nosologien zu integrieren. Neue Standards und Schemata wie die „Medical Action Ontology“ (MAxO) und das „Phenopacket“ der Global Alliance for Genomics and Health (GA4GH) werden gegenwärtig eingeführt, um die Palette der verfügbaren Standards zur Unterstützung der Forschung an seltenen Krankheiten zu erweitern.
Um eine optimale Versorgung von Patienten mit SE in verschiedenen Bereichen des Gesundheitswesens zu ermöglichen, müssen die Standards für seltene Krankheiten besser in die elektronischen Ressourcen des Gesundheitswesens integriert werden, z. B. über den Standard „FHIR“ (Fast Healthcare Interoperability Resources).
Schlüsselwörter: Gesundheitsdatenstandard, Nosologie, Ontologie, Seltene Erkrankungen, Terminologie
Abstract
The use of standardized data formats (data standards) in healthcare supports four main goals: (1) exchange of data, (2) integration of computer systems and tools, (3) data storage and archiving, and (4) support of federated databases. Standards are especially important for rare-disease research and clinical care.
In this review, we introduce healthcare standards and present a selection of standards that are commonly used in the field of rare diseases. The Human Phenotype Ontology (HPO) is the most commonly used standard for annotating phenotypic abnormalities and supporting phenotype-driven analysis of diagnostic exome and genome sequencing. Numerous standards for diseases are available that support a range of needs. Online Mendelian Inheritance in Man (OMIM) and the Orphanet Rare Disease Ontology (ORDO) are the most important standards developed specifically for rare diseases. The Mondo Disease Ontology (Mondo) is a new disease ontology that aims to integrate data from a comprehensive range of current nosologies. New standards and schemas such as the Medical Action Ontology (MAxO) and the Global Alliance for Genomics and Health (GA4GH) phenopacket are being introduced to extend the scope of standards that support rare disease research.
In order to provide optimal care for patients with SE in different healthcare settings, it will be necessary to better integrate standards for rare disease with electronic healthcare resources such as the Fast Healthcare Interoperability Resources (FHIR) standard for healthcare data exchange.
Keywords: Standards for healthcare data, Terminology, Ontology, Rare diseases, Nosology
Hintergrund
Eine optimale Patientenversorgung, die alle beteiligten Gesundheitsdienstleister in einem zeitlichen Kontinuum und auf interdisziplinäre Art und Weise einbindet, setzt eine Zusammenarbeit der Akteure voraus. Der reibungslose Austausch von Gesundheitsdaten ist hierfür eine wichtige Voraussetzung. Er wird durch die Kommunikation verschiedener IT-Systeme ermöglicht.
Einheitliche Datenformate (Datenstandards) von Gesundheitsdaten sind dabei essentiell, um Patientendaten für eine genaue Diagnose oder einen genauen Behandlungsplan verfügbar zu machen, um Daten gemeinsam nutzen zu können, Prozesse zuverlässig wiederholen zu können, Vergleiche anzustellen und um Innovationen wie künstliche Intelligenz (KI) vorantreiben zu können. Digitale Systeme und Werkzeuge benötigen Standards und Normen, um beispielsweise die Qualität von Daten zu prüfen, aber auch um die Syntax und Semantik von Daten aus Quellen wie elektronischen Patientenakten und anderen digitalen Quellen prozessieren zu können. Aktuell verwendete allgemeine Gesundheitsdatenstandards sind in Tab. 1 aufgeführt.
Standard | Medizinischer Bereich | Einsatzbereich des Standards (syntaktischer oder semantischer Standard) |
---|---|---|
DICOM (Digital Imaging and Communications in Medicine) |
Bildgebung | Speicherung und Austausch von medizinischen Bilddaten und Metadaten (syntaktischer Standard) |
FHIR (Fast Healthcare Interoperability Resources) |
Patientenakten | Kommunikation der Systeme verschiedener Anbieter (syntaktischer Standard) |
ICD (International Classification of Diseases) |
Kodierung | Internationale statistische Klassifikation/Kodierung von Krankheiten und verwandten Gesundheitsproblemen (semantischer Standard) |
LOINC (Logical Observation Identifiers Names and Codes) |
Labormedizin | Verzeichnis allgemeingültiger Namen und Identifikatoren zur Bezeichnung und zum Austausch von Untersuchungsergebnissen aus dem Labor- und Vitaldatenumfeld (semantischer Standard) |
SNOMED CT (Systematized Nomenclature of Medicine – Clinical Terms) |
Medizinische Sachverhalte | Ontologiebasierter Terminologiestandard für die Medizin (semantischer Standard) |
In Hinsicht auf die Bewertung der Notwendigkeit und der Wirkung von Gesundheitsdatenstandards ist DICOM1, der internationale Standard für die digitale Bildgebung und Kommunikation in der Medizin, ein sehr gutes Beispiel. Als einer der ersten überhaupt eingeführten Gesundheitsdatenstandards war und ist DICOM bei Bildarchivierung und Kommunikation sowie der Integration von medizinischen Bildgebungsgeräten verschiedener Hersteller äußerst erfolgreich. Die bereits mit der DICOM-Entwicklung verfolgten Ziele können als exemplarisch für die Zwecke aller Gesundheitsdatenstandards gelten [1].
Die 4 Hauptzwecke von Gesundheitsdatenstandards sind:
Datenaustausch,
Integration von Computersystemen und -instrumenten,
Datenspeicherung und Archivierung,
Unterstützung föderierter Datenbanken.
Das Ziel des Beitrags ist es, die wichtigsten Standards für die Erforschung Seltener Erkrankungen (SE)2 und für die klinische Versorgung betroffener Menschen vorzustellen. Im Folgenden werden zunächst die wichtigsten Gesundheitsdatenstandards für SE und deren Einsatzbereiche beschrieben. Anschließend werden speziell für die Humangenetik bzw. für die Versorgung von Menschen mit genetischen und anderen SEs entwickelte Standards vorgestellt, die von den „allgemeinen“ Standards lückenhaft abgedeckte Inhalte spezifizieren oder spezielle Algorithmen für die translationale Forschung oder zur Unterstützung der Differentialdiagnostik ermöglichen. Der Beitrag schließt mit einer Diskussion über Perspektiven einer verbesserten Integration von SE-Standards in die klinische Versorgung bzw. einer verstärkten Anbindung an die elektronische Patientenakte (ePA) ab.
Datenstandards für Seltene Erkrankungen
Aufgrund der überwiegend genetischen Verursachung, der großen phänotypischen Heterogenität sowie der Seltenheit und geografischen Verteilung der SE-Patienten und -Experten sind Datenstandards insbesondere für die klinische Versorgung und die translationale Erforschung von SEs unerlässlich. Die Verwendungszwecke dieser Datenstandards korrespondieren dabei mit den oben genannten Hauptzwecken von Gesundheitsdatenstandards. Zu den spezifisch für SE wichtigen Standards gehören Standards für genetische und genomische Daten, ohne die der bemerkenswerte Erfolg der wissenschaftlichen Gemeinschaft bei der Aufklärung der molekularen Ursachen von Tausenden von monogenen Erkrankungen (Mendelian Disorders) in den letzten Jahrzehnten kaum möglich gewesen wäre. Standards wie der von der „Human Genome Variation Society“ (HGVS) für die Benennung von genetischen Varianten sowie das „Variant Call Format“ (VCF) zur Erfassung von in Exom- oder Genomsequenzierung identifizierten Varianten ermöglichen die effiziente und akkurate informatische Analyse von Varianten im diagnostischen sowie im Forschungsfeld als auch den Austausch von Daten über Varianten in Datenbanken wie „ClinVar“ [2]. In diesem Artikel werden wir uns jedoch weitgehend auf Standards für klinische Daten beschränken und verweisen den interessierten Leser auf die Übersicht in Tab. 2 und weitere Informationsquellen [3].
Standard | Spezifischer Bereich | Einsatzbereich des Standards |
---|---|---|
American College of Medical Genetics (Variant Interpretation Guidelines) |
Einschätzung der Pathogenität von genetischen Varianten | Regeln zur Einteilung von Sequenzvarianten in die 5 Klassen: 1) Normvariante („benign“), 2) wahrscheinliche Normvariante („likely benign“), 3) Variante unklarer klinischer Relevanz („variant of unknown significance“, VUS), 4) VUS, wahrscheinlich pathogen („likely pathogenic“) und 5) VUS pathogen („pathogenic“; [7]) |
GA4GH Phenopacket Schema (Global Alliance for Genomics and Health) |
Schema zur Erfassung klinischer Informationen | Ein Datenschema der GA4GH, welches Informationen über phänotypische Abnormitäten, klinische Messwerte, Behandlungen, Biopsien und genetisch/genomische Befunde erfasst [13, 14] |
HGVS (Human Genome Variation Society) |
Benennung von genetischen Varianten | Syntax zur Beschreibung von verschiedenen Varianten auf DNA-, RNA- und Proteinebene [5] |
HPO (Human Phenotype Ontology) |
Beschreibung phänotypischer Abnormitäten | Ontologie zur Benennung von abnormalen klinischen Merkmalen (s. Text; [8, 9]) |
MAxO (Medical Action Ontology) |
Klinisches Management | Die neue Medical Action Ontology beschreibt Behandlungen und andere medizinische Handlungen, welche dem klinischen Management dienen |
Mondo (Mondo Disease Ontology) |
Nosologie aller Erkrankungen | Eine Nosologie, die zahlreiche andere Nosologien miteinander verbindet und vereinheitlicht [12] |
OMIM (Online Mendelian Inheritance in Man) |
Monogene Erkrankungen | Zusammenfassung relevanter Informationen zu monogenen und ausgewählten anderen Erkrankungen bzw. zu Genen und deren Funktionen [4] |
ORDO (Orphanet Rare Disease Ontology) |
Nosologie Seltener Erkrankungen | Eine Nosologie (Krankheitsontologie) mit Informationen zu Erkrankungen und deren Prävalenzen, Genassoziationen und HPO-basierten Symptombeschreibungen aus der Orphanet-Ressource [10] |
ORPHAcodes | ORPHAcodes | International geltendes Klassifizierungssystem für Diagnosen im Bereich der seltenen Krankheiten [11] |
VCF (Variant Call Format) |
Beschreibung von genetischen Varianten, die durch Next-Generation-Sequenzierung (NGS) nachgewiesen wurden | Schema zur Spezifizierung von genetischen Varianten, die durch NGS-Methoden wie Exom- oder Genomsequenzierung identifiziert werden; das VCF-Schema enthält verschiedene Felder mit Informationen über die Sequenzqualität und -tiefe und die Allelverteilung usw. [6] |
Datenstandards für klinische Daten Seltener Erkrankungen
Die 4 genannten Hauptzwecke von Gesundheitsdatenstandards sind auch für klinische Datenstandards relevant. Häufig verwendete klinische Standards beziehen sich auf phänotypische Merkmale und Erkrankungen sowie andere Themenfelder wie klinisches Management. In den folgenden Abschnitten werden die für klinische SE-Daten wichtigsten standardisierten Ontologien (Wissensdarstellungen), Nosologien (Krankheitsklassifikationen) und Schemata vorgestellt. Ontologien und Datenstandards spielen insbesondere bei den Seltenen Erkrankungen eine große Rolle, weil es auch Spezialisten schwerfällt, ohne informatische Werkzeuge alle für die optimale Patientenbetreuung erforderlichen Informationen zu finden.
Human Phenotype Ontology (HPO)
Die HPO ermöglicht eine umfängliche Erfassung von abnormen phänotypischen Merkmalen, die sich bei seltenen und nicht seltenen Erkrankungen manifestieren. Die sogenannten „Terms“ (Begriffe) der HPO entsprechen Symptomen, Befunden, auffälligen Ergebnissen von bildgebenden und anderen diagnostischen Verfahren und dergleichen mehr. Die Terms der HPO sind hierarchisch strukturiert, wobei die „Kinder“ eines Terms den spezifischen Formen eines übergeordneten „Eltern“-Terms entsprechen (Abb. 1).
Das HPO-Projekt umfasst nicht nur die Ontologie, sondern auch eine Bibliothek von Annotationen für über 8400 Seltene Erkrankungen. Die Ontologie bildet mit den Annotationen die informatische Grundlage für die Anwendung verschiedener Algorithmen, die zur Entscheidungsunterstützung oder bioinformatischen Analyse von genomischen Daten benutzt werden können. Zu den Anwendungsbereichen gehören Differentialdiagnostik, Forschung nach bislang unbekannten Krankheitsgenen, Systembiologie und Kohortenanalyse in elektronischen Krankenakten (EHR). Die HPO wurde 2008 an der Charité Berlin entwickelt [9] und ist seitdem zum De-facto-Standard in der internationalen humangenetischen Gemeinschaft geworden. Die HPO ist eine „anerkannte Ressource“ des International Rare Disease Research Consortium (IRDiRC; [15]) und wird von zahlreichen Projekten der Global Alliance for Genomics and Health (GA4GH) eingesetzt [14]. Die HPO ist in vielen nationalen Initiativen für genomische Medizin Standard, wie dem „100,000 Genomes Project“ von Genomics England, dem „National Institutes of Health (NIH) Undiagnosed Diseases Program and Network“, der „Deciphering Developmental Disorders Study“, und dem europäischen Projekt „Solve-RD – solving the unsolved rare diseases“ [15–18].
Ontologien wie die HPO können als Grundlage für Algorithmen zur informatischen Entscheidungsunterstützung dienen. Ontologien sind systematische Wissensrepräsentationen, die Informationen aus vielen heterogenen Quellen zu einem kohärenten Modell einer Domäne verbinden (Abb. 2; [19]). Die HPO ist die Grundlage für verschiedene Software-Tools wie „Exomiser“, welche zur Verbesserung der diagnostischen Ausbeute bei Initiativen wie dem „NIH Undiagnosed Diseases Program“ und dem „100,000 Genomes Project“ beigetragen haben [16, 20].
Nosologien für Seltene Erkrankungen
Verfügbare Krankheitsklassifikationen (Nosologien) unterscheiden sich in Strukturen, Formaten, Umfang und beabsichtigten Anwendungsbereichen. Die zwei am weitesten verbreiteten, für die Seltenen Erkrankungen spezialisierten Ressourcen, das „Online Mendelian Inheritance in Man“ (OMIM) und die „Orphanet Rare Disease Ontology“ (ORDO), haben unterschiedliche Schwerpunkte. ORDO ist eine Ontologie der seltenen monogenen und nicht-monogenen Erkrankungen mit Informationen zu Therapien, klinischen Merkmalen, ggf. Krankheitsgenen sowie Forschungsprojekten und Versorgungszentren. ORDO wurde 2014 veröffentlicht [10]. OMIM bietet keine Ontologie, sondern eine Terminologie (kontrollierte Liste) von Erkrankungen mit textuellen Informationen über Gene, Varianten, klinische Merkmale und ggf. Behandlungen. Traditionell werden monogene Erkrankungen vom OMIM-Team benannt, obwohl auch andere Benennungsregeln vorgeschlagen worden sind [21, 22].
Weitere Terminologien und Ontologien mit Krankheitsklassifikationen sind: „National Cancer Institute Thesaurus“ (NCIt), „SNOMED CT“, „Human Disease Ontology“, „ICD-10“, „MedGen“, spezialisierte Nosologien wie die „Sickle Cell Disease Ontology“ und dergleichen mehr [23–26]. Jede Ressource dient einem bestimmten Zweck und weist unterschiedliche Schwerpunkte sowie Stärken und Schwächen auf. Die „Mondo Disease Ontology“ wurde entwickelt, um diese Ressourcen so miteinander zu verbinden, dass mit unterschiedlichen Terminologien oder Ontologien annotierte klinische Daten interoperabel (austauschbar) sind [12].
Medical Action Ontology (MAxO)
MAxO ist eine Ontologie für medizinische Eingriffe, Therapien und andere dem klinischen Management dienliche Maßnahmen. Bei der Entwicklung von MAxO wurde der Schwerpunkt auf die Seltenen Erkrankungen gelegt, aber MAxO umfasst auch Terms für andere Erkrankungen. MAxO ist erhältlich über den „Ontology Lookup Service“ (OLS)3 des European Bioinformatics Institute (EMBL-EBI), eine erste Publikation wird derzeit vorbereitet. Vorgesehen ist, dass SEs auf der HPO-Webseite mit HPO-Terms sowie auch mit MAxO-Terms annotiert werden, um Artikel über Behandlungen für Seltene Erkrankungen leichter auffindbar zu machen. Künftig sollen auch Informationen des „Treatabolome-Projektes“ integriert werden. Das Treatabolome ist eine neue, vom europäischen Projekt „Solve-RD“ ausgehende Initiative zur Erstellung von systematischen Übersichten zum klinischen Management von Seltenen Erkrankungen [27, 28].
Das Phenopacket-Schema der GA4GH
Die 2013 gegründete Global Alliance for Genomics and Health (GA4GH) entwickelt eine Sammlung von aufeinander abgestimmten Standards für den Austausch von genomischen und klinischen Informationen [14]. Das Phenopacket-Schema ist ein Standard der GA4GH für klinische Informationen, wobei Informationen über eine Person und die bei ihr beobachteten phänotypischen Abnormitäten strukturiert erfasst werden, inklusive klinischer Messwerte, Krankheitsdiagnosen, ggf. Behandlungen und genetischer oder genomischer Untersuchungsbefunde. Ein Phenopacket beschreibt eine Person oder biologische Probe und ist gleichsam eine informatische Kasuistik. Es ermöglicht den informatischen Vergleich von phänotypischen Abnormitäten bei unterschiedlichen Patienten, was der Differentialdiagnose oder Kohortenbildung dienen kann [13]. Die Zertifizierung durch die „International Standards Organization“ (ISO 4454:2022) ist vor Kurzem erfolgt.
Diskussion
Datenstandards sind für SEs von großer Wichtigkeit aufgrund der großen Anzahl der SEs, der Notwendigkeit der informatisch unterstützten Zusammenarbeit im Forschungs- und klinischen Versorgungskontext sowie aufgrund der dezentralen Erzeugung und Speicherung von SE-Daten. Aufgrund der sinkenden Kosten verschiedener Sequenzierungstechnologien ist zu erwarten, dass in den nächsten Jahren mehrere Millionen Patienten durch Genomsequenzierung untersucht werden. Damit verknüpft ist sowohl eine große Herausforderung für die Medizininformatik und Bioinformatik als auch die Möglichkeit, durch die geeignete Analyse großer Mengen an klinischen und genomischen Daten die molekularen Grundlagen monogener und komplexer Erkrankungen besser zu verstehen. Voraussetzung dafür ist, dass die Daten mit logisch aufeinander abgestimmten Standards kodiert werden.
Die ethischen und datenschutzrechtlichen Aspekte von Datenstandards und dem damit ermöglichten Datenaustausch sind nicht Gegenstand dieses Artikels. Wir möchten jedoch auf die Stellungnahme der GA4GH zum verantwortungsvollen Umgang mit klinischen Forschungsdaten verweisen [29].
Die Festlegung eines einheitlichen Datensatzes für die Erfassung von Daten über seltene Krankheiten in Europa ist ein sehr gutes Beispiel für die Anwendung und Sinnhaftigkeit der SE-Datenstandards. Primäres Ziel eines einheitlichen Datensatzes ist es, zu erreichen, dass die von den europäischen Registern erfassten Daten vergleichbar und die Datenregister interoperabel sind. Zugleich werden mit der Einführung des einheitlichen Datensatzes, der seinen Fokus auf Forschungsregister hat, auch Anforderungen für die Dokumentation von klinischen Primärdaten gemäß den SE-Datenstandards definiert. Damit werden die Voraussetzungen für epidemiologische, klinische oder pharmakologische Studien für SE geschaffen, die Primär- und Sekundärdaten aus ganz Europa gemäß einem einheitlichen und akzeptierten Standard sammeln und organisieren bzw. analysierbar machen können.
Der „Satz gemeinsamer Datenelemente für die Registrierung seltener Krankheiten“4 ist dabei das erste praktische Instrument, das von der „EU-Plattform für seltene Krankheiten“5 herausgegeben wurde, um die Interoperabilität der SE-Datenregister zu verbessern. Er definiert die Datenelemente, die von allen Registern für seltene Krankheiten in ganz Europa registriert werden müssen, und gibt Anweisungen, wie und in welchem Format jedes Datenelement registriert werden sollte. Die 16 definierten Datenelemente beziehen sich auf die persönlichen Daten der Patienten, die Diagnose, die Krankheitsgeschichte und den Behandlungsverlauf sowie auf Informationen, die zu Forschungszwecken bereitgestellt werden müssen. Für das Format der Mindestdatenelemente wird eine Reihe der oben aufgeführten Datenstandards verwendet, u. a. ORPHA-Codes, die HGVS-Nomenklatur, OMIM und ICF (Internationale Klassifikation der Funktionsfähigkeit und Behinderung).
Dieser Datensatz wird gegenwärtig durch den „Use Case CORD“ (Collaboration on Rare Diseases) der Medizininformatik-Initiative (MI-I) in der klinischen Dokumentation der Zentren für Seltene Erkrankungen implementiert, mit dem Ziel, diese Daten per Schnittstelle diversen Forschungsregistern zur Verfügung zu stellen.
Datenstandards, die für SE entwickelt worden sind, werden mehr und mehr auch für Erkrankungen verwendet, die nicht selten sind. Zum Beispiel werden HPO-Codes von mehreren Datenbanken für die „genomweite Assoziationsstudie“ (GWAS) verwendet [30, 31]. Die Präzisionsmedizin zielt auf Stratifizierung von Erkrankungen, um personalisierte Therapien zu ermöglichen. Die systematische Kodierung klinischer und genomischer Daten von Patienten mit komplexen Erkrankungen mit ggf. erweiterten Versionen der hier vorgestellten Standards könnte wesentlich dazu beitragen, verfügbare Daten optimal zu verwenden, um Präzisionsmedizin in der Zukunft für die Patientenversorgung am Point of Care informatisch anwendbar zu machen.
Die hier vorgestellten SE-Datenstandards wurden zunächst im Forschungskontext entwickelt, finden mit dem Eingang der Forschungsergebnisse in die klinische Versorgung der SE-Patienten aber auch Anwendung im klinischen Kontext. Vielleicht das wichtigste Beispiel ist die HPO, die, aus der humangenetisch-diagnostischen Forschung kommend, im aktuellen klinisch-genetischen Versorgungskontext ihren festen Platz gefunden hat. Der Folgeschritt, nämlich eine systematische Kodierung relevanter klinischer Daten in ePA, würde die Anwendung der informatischen Entscheidungshilfen in mehr klinischen Anwendungsfeldern erlauben, als heute möglich ist, was für die optimale Anwendung und Nutzung der genomischen Diagnostik in der klinischen Versorgung wesentlich ist. Deutschland hat für die Einführung der ePA erste Schritte getan. Arztbriefe, Befunde sowie Mutter- und Impfpass können damit am gleichen Ort gespeichert werden. Inwieweit klinische Datenstandards in der Zukunft in die ePA integriert werden, ist vor allem abhängig von den geltenden regulatorischen Bedingungen, die optimalerweise in einer begleitenden gesellschaftlichen Diskussion konsentiert werden sollten.
Fazit und Ausblick
In dieser Übersicht haben wir einige der wichtigsten SE-Datenstandards vorgestellt. Diese Standards sind schon heute aus dem klinischen Alltag insbesondere des Humangenetikers nicht mehr wegzudenken und werden mit der wachsenden Bedeutung der genomischen Medizin an Bedeutung gewinnen. In der Zukunft sollten die verbesserte Integration von SE-Standards in die ePA und damit verbundene Standards wie FHIR (Fast Healthcare Interoperability Resources, ausgesprochen wie das englische Wort „fire“) im Fokus stehen, um Informationen und Wissen über SEs sowie entsprechende informatische Werkzeuge einem breiteren medizinischen Anwendungskreis zugänglich zu machen.
Acknowledgments
Danksagung
Die Autoren danken Frau Julie McMurry für die Erstellung von Abb. 2.
Förderung
P. N. Robinson wurde unterstützt und Open Access wurde finanziert von den National Institutes of Health (NIH), USA [NHGRI 1U24HG011449-01A1].
Einhaltung ethischer Richtlinien
Interessenkonflikt
P.N. Robinson und H. Graessner geben an, dass kein Interessenkonflikt besteht.
Für diesen Beitrag wurden von den Autor/-innen keine Studien an Menschen oder Tieren durchgeführt. Für die aufgeführten Studien gelten die jeweils dort angegebenen ethischen Richtlinien.
Footnotes
Als „Seltene Erkrankungen“ (SE) gelten in der Europäischen Union (EU) Krankheiten, von denen nicht mehr als 5 von 10.000 Menschen betroffen sind.
Literatur
- 1.Mantri M, Taran S, Sunder G. DICOM integration libraries for medical image interoperability: a technical review. IEEE Rev Biomed Eng. 2022;15:247–259. doi: 10.1109/RBME.2020.3042642. [DOI] [PubMed] [Google Scholar]
- 2.Landrum MJ, Chitipiralla S, Brown GR, Chen C, Gu B, Hart J, et al. ClinVar: improvements to accessing data. Nucleic Acids Res. 2020;48(D1):D835–D844. doi: 10.1093/nar/gkz972. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 3.Brookes AJ, Robinson PN. Human genotype-phenotype databases: aims, challenges and opportunities. Nat Rev Genet. 2015;16(12):702–715. doi: 10.1038/nrg3932. [DOI] [PubMed] [Google Scholar]
- 4.Amberger JS, Bocchini CA, Scott AF, Hamosh A. OMIM.org: leveraging knowledge across phenotype-gene relationships. Nucleic Acids Res. 2019;47(D1):D1038–D1043. doi: 10.1093/nar/gky1151. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 5.den Dunnen JT, Dalgleish R, Maglott DR, Hart RK, Greenblatt MS, McGowan-Jordan J, et al. HGVS recommendations for the description of sequence variants: 2016 update. Hum Mutat. 2016;37(6):564–569. doi: 10.1002/humu.22981. [DOI] [PubMed] [Google Scholar]
- 6.Danecek P, Auton A, Abecasis G, Albers CA, Banks E, DePristo MA, et al. The variant call format and VCFtools. Bioinformatics. 2011;27(15):2156–2158. doi: 10.1093/bioinformatics/btr330. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 7.Richards S, Aziz N, Bale S, Bick D, Das S, Gastier-Foster J, et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American college of medical genetics and genomics and the association for molecular pathology. Genet Med. 2015;17(5):405–424. doi: 10.1038/gim.2015.30. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 8.Köhler S, Carmody L, Vasilevsky N, Jacobsen JOB, Danis D, Gourdine J-P, et al. Expansion of the human phenotype ontology (HPO) knowledge base and resources. Nucleic Acids Res. 2019;47(D1):D1018–D1027. doi: 10.1093/nar/gky1105. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 9.Robinson PN, Köhler S, Bauer S, Seelow D, Horn D, Mundlos S. The human phenotype ontology: a tool for annotating and analyzing human hereditary disease. Am J Hum Genet. 2008;83(5):610–615. doi: 10.1016/j.ajhg.2008.09.017. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 10.Maiella S, Olry A, Hanauer M, Lanneau V, Lourghi H, Donadille B, et al. Harmonising phenomics information for a better interoperability in the rare disease field. Eur J Med Genet. 2018;61(11):706–714. doi: 10.1016/j.ejmg.2018.01.013. [DOI] [PubMed] [Google Scholar]
- 11.Aymé S, Bellet B, Rath A. Rare diseases in ICD11: making rare diseases visible in health information systems through appropriate coding. Orphanet J Rare Dis. 2015;10:35. doi: 10.1186/s13023-015-0251-8. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 12.Shefchek KA, Harris NL, Gargano M, Matentzoglu N, Unni D, Brush M, et al. The monarch initiative in 2019: an integrative data and analytic platform connecting phenotypes to genotypes across species. Nucleic Acids Res. 2020;48(D1):D704–D715. doi: 10.1093/nar/gkz997. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 13.Jacobsen JOB, Baudis M, Baynam GS, Beckmann JS, Beltran S, Buske OJ, et al. The GA4GH phenopacket schema defines a computable representation of clinical data. Nat Biotechnol. 2022;40(6):817–820. doi: 10.1038/s41587-022-01357-4. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 14.Rehm HL, Page AJH, Smith L, Adams JB, Alterovitz G, Babb LJ, et al. GA4GH: international policies and standards for data sharing across genomic research and healthcare. Cell Genom. 2021;1(2):100029. doi: 10.1016/j.xgen.2021.100029. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 15.Lochmüller H, Torrent I Farnell J, Le Cam Y, Jonker AH, Lau LP, Baynam G, et al. The international rare diseases research consortium: policies and guidelines to maximize impact. Eur J Hum Genet. 2017;25(12):1293–1302. doi: 10.1038/s41431-017-0008-z. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 16.100,000 Genomes Project Pilot Investigators. Smedley D, Smith KR, Martin A, Thomas EA, McDonagh EM, et al. 100,000 genomes pilot on rare-disease diagnosis in health care—preliminary report. N Engl J Med. 2021;385(20):1868–1880. doi: 10.1056/NEJMoa2035790. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 17.Köhler S, Gargano M, Matentzoglu N, Carmody LC, Lewis-Smith D, Vasilevsky NA, et al. The human phenotype ontology in 2021. Nucleic Acids Res. 2021;49(D1):D1207–D1217. doi: 10.1093/nar/gkaa1043. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 18.Zurek B, Ellwanger K, Vissers LELM, Schüle R, Synofzik M, Töpf A, et al. Solve-RD: systematic pan-European data sharing and collaborative analysis to solve rare diseases. Eur J Hum Genet. 2021;29(9):1325–1331. doi: 10.1038/s41431-021-00859-0. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 19.Haendel MA, Chute CG, Robinson PN. Classification, ontology, and precision medicine. N Engl J Med. 2018;379(15):1452–1462. doi: 10.1056/NEJMra1615014. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 20.Gall T, Valkanas E, Bello C, Markello T, Adams C, Bone WP, et al. Defining disease, diagnosis, and translational medicine within a homeostatic perturbation paradigm: the national institutes of health undiagnosed diseases program experience. Front Med. 2017;4:62. doi: 10.3389/fmed.2017.00062. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 21.Hamosh A, Amberger JS, Bocchini CA, Bodurtha J, Bult CJ, Chute CG, et al. Response to Biesecker et al. Am J Hum Genet. 2021;108(9):1807–1808. doi: 10.1016/j.ajhg.2021.07.004. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 22.Biesecker LG, Adam MP, Alkuraya FS, Amemiya AR, Bamshad MJ, Beck AE, et al. A dyadic approach to the delineation of diagnostic entities in clinical genomics. Am J Hum Genet. 2021;108(1):8–15. doi: 10.1016/j.ajhg.2020.11.013. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 23.Bodenreider O, Cornet R, Vreeman DJ. Recent developments in clinical terminologies—SNOMED CT, LOINC, and RxNorm. Yearb Med Inform. 2018;27(1):129–139. doi: 10.1055/s-0038-1667077. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 24.de Coronado S, Wright LW, Fragoso G, Haber MW, Hahn-Dantona EA, Hartel FW, et al. The NCI thesaurus quality assurance life cycle. J Biomed Inform. 2009;42(3):530–539. doi: 10.1016/j.jbi.2009.01.003. [DOI] [PubMed] [Google Scholar]
- 25.Mazandu GK, Hotchkiss J, Nembaware V, Wonkam A, Mulder N. The sickle cell disease ontology: recent development and expansion of the universal sickle cell knowledge representation. Database. 2022;2022:baac014. doi: 10.1093/database/baac014. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 26.Schriml LM, Munro JB, Schor M, Olley D, McCracken C, Felix V, et al. The human disease ontology 2022 update. Nucleic Acids Res. 2022;50(D1):D1255–D1261. doi: 10.1093/nar/gkab1063. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 27.Atalaia A, Thompson R, Corvo A, Carmody L, Piscia D, Matalonga L, et al. A guide to writing systematic reviews of rare disease treatments to generate FAIR-compliant datasets: building a treatabolome. Orphanet J Rare Dis. 2020;15(1):206. doi: 10.1186/s13023-020-01493-7. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 28.Bonne G. The Treatabolome, an emerging concept. J Neuromuscul Dis. 2021;8(3):337–339. doi: 10.3233/JND-219003. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 29.Knoppers BM. Framework for responsible sharing of genomic and health-related data. HUGO J. 2014;8(1):3. doi: 10.1186/s11568-014-0003-1. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 30.Beck T, Hastings RK, Gollapudi S, Free RC, Brookes AJ. GWAS central: a comprehensive resource for the comparison and interrogation of genome-wide association studies. Eur J Hum Genet. 2014;22(7):949–952. doi: 10.1038/ejhg.2013.274. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 31.Li MJ, Liu Z, Wang P, Wong MP, Nelson MR, Kocher J-PA, et al. GWASdb v2: an update database for human genetic variants identified by genome-wide association studies. Nucleic Acids Res. 2016;44(D1):D869–76. doi: 10.1093/nar/gkv1317. [DOI] [PMC free article] [PubMed] [Google Scholar]