Skip to main content
Thieme Open Access logoLink to Thieme Open Access
. 2023 Feb 27;85(6):578–594. [Article in German] doi: 10.1055/a-1937-9516

Der diagnostische Test: Güte, Kennwerte und Interpretation Unter dem Eindruck der Corona-Pandemie und unterschiedlicher SARS-CoV-2-Tests

The Diagnostic Test: Goodness, Characteristics, and Interpretation: Under the Impact of the Corona Pandemic and Different SARS-CoV-2 Tests

Bernd Röhrig
PMCID: PMC11248145  PMID: 36848945

Abstract

Introduction Many diagnostic tests are currently being performed around the world to detect SARS-CoV-2 infection. Positive and negative test results are not one hundred percent accurate, but have far-reaching consequences. There are false positives (test positive, uninfected) and false negatives (test negative, infected). A positive/negative result does not necessarily mean that the test subject is actually infected/non-infected. This article has two objectives: 1. to explain the most important characteristics of diagnostic tests with binary outcome 2. to point out problems and phenomena of interpretation of diagnostic tests, on the basis of different scenarios.

Method Presentation of the basic concepts of the quality of a diagnostic test (sensitivity, specificity) and pre-test probability (prevalence of test group). Calculation (including formulas) of further important quantities.

Results In the basic scenario, sensitivity is 100%, specificity 98.8%, and pre-test probability of 1.0% (10 infected persons per 1,000 tested). For 1,000 diagnostic tests, the statistical mean is 22 positive cases, 10 of which are true-positive. The positive predictive probability is 45.7%. The prevalence calculated from this (22/1,000 tests) overestimates the actual prevalence (10/1,000 tests) by a factor of 2.2. All cases with a negative test outcome are true negative. The prevalence has a strong influence on the positive and negative predictive value. This phenomenon occurs even with otherwise very good test values of sensitivity and specificity. At a prevalence of only 5 infected persons per 10,000 (0.05%), the positive predictive probability drops to 4.0%. Lower specificity amplifies this effect, especially with small numbers of infected persons.

Conclusion If the sensitivity or specificity is below 100%, diagnostic tests are always error-prone. If the prevalence of infected persons is low, a large number of false positive results are to be expected – even if the test is of good quality with a high sensitivity and especially a high specificity. This is accompanied by low positive predictive values, i. e. positive tested persons are not infected. A false positive test result in the first test can be clarified by carrying out a second test.

Key words: diagnostic test, prevalence, sensitivity, specificity, predictive value, SARS-CoV-2 test

Einleitung

Im Rahmen der Covid-19-Pandemie wird weltweit eine Vielzahl diagnostischer Tests durchgeführt. In der Bundesrepublik Deutschland setzt der bevölkerungsbezogene Infektionsschutz – neben dem Impfen – auf eine Strategie des Testens und der Kontaktnachverfolgung. Zur Diagnose des Virus SARS-CoV-2 bzw. von Antikörpern existieren 3 verschiedene Testarten, mit jeweils deutlich unterschiedlichen Zielen und Prinzipien 1 2 .

  • PCR-Test (Polymerase-Chain-Reaction-Test) Abstrich und Analyse von Spuren des Virus SARS-CoV-2 (Virus-Genmaterial mittels Amplifikationsverfahren) im Speichel mittels Reverse-Transkriptase-Polymerase-Kettenreaktion (RT-PCR) 3 . Das Erbmaterial des Virus kann in einem Labor nachgewiesen werden (PCR-Test). Ergänzend hierzu existiert der PoC-NAT-Test . PoC-NAT-Tests sind laboratoriumsmedizinische Untersuchungen, die wie der PCR-Test auf der Nukleinsäureamplifikationstechnik (NAT) basieren, d. h. dem Nachweis viraler Gene. PoC-NAT-Tests werden ohne Probenvorbereitung unmittelbar vor Ort (Point of Care, PoC) ausgewertet, also patientennah und kurzfristig am Ort der Testung 4 .

  • Antikörpertest Nachweis von Antikörpern gegen das Virus SARS-CoV-2 nach durchgemachter Infizierung und Immunisierung. Ziel ist die Bestimmung des Immunitätsstatus 5 .

  • Antigen-Test Nachweis von Eiweißmaterial des Virus SARS-CoV-2 durch einen Nasen- oder Rachenabstrich. Wird der Test durch geschultes Personal durchgeführt, spricht man von einem Antigen-Schnelltest (Point-of-Care-Tests, PoC-Antigen-Test, „Schnelltest“), bei selbstständiger Durchführung durch Privatpersonen von einem Antigen-Selbsttest („Selbsttest“) 6 7 8 .

Während Gen-Amplifikationsverfahren und Antigen-Tests eine aktuelle Infektion nachweisen, geht es bei Antikörpertests um den Nachweis einer abgelaufenen Infektion. Jeder diagnostische Test hat Vor- und Nachteile. Allen sogenannten „diagnostischen Tests“ ist gemeinsam, dass das Ergebnis 2 verschiedene Testausgänge hat, nämlich entweder ein positives oder ein negatives Ergebnis (binäres Testergebnis). Grundlegendes Problem fast aller diagnostischen Tests ist, dass die Tests weder erkrankte noch gesunde Testpersonen eindeutig und stets richtig diagnostizieren. Durch die Fehleranfälligkeit und Ungenauigkeit diagnostischer Tests bedeutet ein positives (oder negatives) Ergebnis nicht in jedem Fall, d. h. zu 100%, dass die Person tatsächlich erkrankt (nicht erkrankt) ist. Ein positives oder negatives Ergebnis eines diagnostischen Tests entspricht lediglich einer Wahrscheinlichkeit, mit der der Getestete tatsächlich erkrankt oder gesund ist, bzw. im Fall von SARS-CoV-2 mit dem Virus infiziert/nicht infiziert ist.

Um Ergebnisse eines Diagnosetests richtig verstehen zu können, ist die Kenntnis der Güte des Tests – als Sensitivität und Spezifität – und die Prävalenz in der Testgruppe (Vortestwahrscheinlichkeit) nötig. Insbesondere die Vortestwahrscheinlichkeit hat einen starken Einfluss auf die Interpretation des Testergebnisses 9 10 11 . Berechnung und Interpretation des Ergebnisses eines diagnostischen Tests hängen ausschließlich und eindeutig von den 3 Kennwerten Sensitivität, Spezifität und Prävalenz ab. Die Deutung diagnostischer Tests gilt als schwierig, da bedingte Wahrscheinlichkeiten eine zentrale Rolle spielen (Bayesches Theorem); mathematisch ausgedrückt P(A/B): Wahrscheinlichkeit des Eintretens von Ereignis A unter der Bedingung, dass Ereignis B eingetreten ist. Die bedingte Wahrscheinlichkeit eines „positiven Testergebnisses bei vorliegender Erkrankung“ ist nicht (!) das Gleiche wie „eine tatsächliche Erkrankung nach positivem Testausgang“.

Ziel

Ziel des Artikels ist, wichtige Grundbegriffe und Kennwerte von Diagnosetests zu erläutern. Der Leser soll nach der Lektüre allgemeine Grundlagen diagnostischer Tests verstehen, wichtige Testgrößen berechnen und Testergebnisse richtig interpretieren können; siehe Abschnitt „ Interpretation diagnostischer Tests in Abhängigkeit von Sensitivität, Spezifität und Prävalenz “.

Darüber hinaus wird auf wichtige Probleme, Phänomene und Fallstricke bei der Interpretation diagnostischer Tests hingewiesen. Dies geschieht anhand verschiedener Szenarien durch Variation der 3 Kennwerte Sensitivität, Spezifität und Vortestwahrscheinlichkeit (Prävalenz der Stichprobe) sowie die Anzahl durchgeführter Tests; siehe Abschnitt „ Ergebnisse “. Für die Berechnungen werden aus aktuellem Anlass gängige Kennzahlen im Rahmen der Corona-Pandemie verwendet. Die Ergebnisse gelten jedoch unabhängig vom verwendeten diagnostischen Test und unabhängig von dessem konkreten Einsatzbereich.

Der Diskussionsteil stellt Interpretation und Folgen der Testergebnisse im Kontext der aktuellen Covid-19-Pandemie dar und geht insbesondere auf mögliche Konsequenzen falsch-positiver und falsch-negativer Testergebnisse ein, in Abhängigkeit vom eingesetzten SARS-CoV-2-Test. Der starke Einfluss der Häufigkeit infizierter Personen in der Testgruppe auf die Interpretation des Testergebnisses wird verdeutlicht. Sind in einer zu testenden Stichprobe wenige Personen erkrankt, dann ist mit einer hohen Anzahl falsch-positiver Fälle zu rechnen, die in dieser Konstellation maßgeblich von der Spezifität bestimmt wird.

Eine Teststrategie zur Abklärung positiver Befunde stellt das Konzept der Doppeltestung dar. Nach einem positiven Testresultat im Antigen-Schnelltest als Ersttest wird das Ergebnis in einem PCR-Test als Zweittest weiter abgeklärt. Ob diese Strategie erfolgversprechend ist, wird anhand verschiedener Szenarien berechnet und vorgestellt; siehe Abschnitt „ Diskussion “.

Interpretation diagnostischer Tests in Abhängigkeit von Sensitivität, Spezifität und Prävalenz

Allgemeine Beschreibung diagnostischer Tests

Um das Ergebnis eines diagnostischen Tests verstehen zu können, ist die Kenntnis der 3 Kenngrößen Sensitivität (engl.: Sensitivity), Spezifität (engl.: Specificity) und Vortestwahrscheinlichkeit (engl. Pre-test Propability) notwendig 12 13 . Die Parameter Sensitivität und Spezifität legen die Güte des Tests (Testgüte) fest. Die Vortestwahrscheinlichkeit ist unabhängig von der Testgüte und definiert als die Häufigkeit erkrankter bzw. infizierter Personen in der zu testenden Population (Berechnung: Anzahl Erkrankter/Gesamtzahl in der Stichprobe). Die Vortestwahrscheinlichkeit ist in den meisten Fällen nicht gleich der Prävalenz (engl. Prevalence). Die Prävalenz ist ein epidemiologisches Maß und beschreibt die Anzahl der Erkrankten bzw. Infizierten in der (Gesamt-)Bevölkerung oder in einer Region. Für die Interpretation eines diagnostischen Tests ist die Vortestwahrscheinlichkeit entscheidend. Ein binärer diagnostischer Test hat 2 mögliche Ausgänge, ein „positives Ergebnis“ oder ein „negatives Ergebnis“. Das Ergebnis eines diagnostischen Tests ist in aller Regel fehlerbehaftet, es kann nicht mit 100%iger Sicherheit angegeben werden, ob die getestete Person tatsächlich krank oder gesund ist. Bemerkung: Bei SARS-CoV-2-Tests geht es darum, ob die getestete Person mit dem Virus infiziert bzw. nicht infiziert ist.

4 verschiedene Möglichkeiten werden unterschieden ( Abb. 1 ):

Abb 1.

Abb 1

Qualitätskriterien eines diagnostischen Tests und Aussagekraft eines Testergebnisses

  • Richtig-Positiv: Testergebnis ist positiv und das Ergebnis ist richtig: Die Testperson ist krank/infiziert und der Test zeigt dies richtig an (Test positiv):

    • Der positive Test stellt richtigerweise eine Erkrankung („krank“) fest!

  • Falsch-Positiv: Testergebnis ist positiv und das Ergebnis ist falsch: Die Testperson ist gesund/nicht infiziert und der Test zeigt dies falsch an (Test positiv):

    • Der positive Test stellt irrtümlicherweise eine Erkrankung („krank“) fest, obwohl der Getestete gesund/infiziert ist!

  • Richtig-Negativ: Testergebnis ist negativ und das Ergebnis ist richtig: Die Testperson ist gesund/nicht infiziert und der Test zeigt dies richtig an (Test negativ):

    • Der negative Test stellt richtigerweise eine Nicht-Erkrankung („gesund“) fest!

  • Falsch-Negativ: Testergebnis ist negativ und das Ergebnis ist falsch: Die Testperson ist krank/infiziert und der Test zeigt dies falsch an (Test negativ):

    • Der negative Test stellt irrtümlicherweise eine Nicht-Erkrankung („gesund“) fest, obwohl der Getestete krank/infiziert ist!

Testgüte: Sensitivität und Spezifität

Die Güte eines diagnostischen Tests wird durch die beiden statistischen Kenngrößen Sensitivität und Spezifität bestimmt. Sensitivität und Spezifität sind A-priori-Wahrscheinlichkeiten und die zentralen Qualitätsmerkmale eines Diagnosetests. Beide Kenngrößen werden vor dem (routinemäßigen) Einsatz des Tests anhand einer gesunden und kranken Testgruppe bestimmt.

Es wird zwischen diagnostischer Güte und analytischer Güte (ermittelt im Analyselabor) unterscheiden:

  • Die diagnostische Güte, auch als effektive Güte bezeichnet, berücksichtigt die tatsächliche Testsituation mit Probennahme (beispielsweise Nasopharynx- bzw. Oropharynxabstrich) und Verarbeitung unter realen Bedingungen.

  • Demgegenüber wird die analytische Güte (lediglich) unter einer idealisierten Testsituation anhand von Testproben im Labor ermittelt 14 15 .

Bei der Bestimmung der Sensitivität und Spezifität ist für jede Testperson bzw. Testprobe bekannt, ob sie krank oder gesund ist, und das entsprechende Testergebnis. Die klinische Abklärung geschieht durch Symptomermittlung, medizinische Diagnose oder alternativ durch einen anderen diagnostischen Test im Sinne eines Goldstandards (s. Abb. 1 ).

  • Sensitivität (Sens): relativer Anteil Erkrankter/Infizierter, die der Test richtig als positiv erkennt; also die richtig-positiven Fälle bezogen auf alle erkrankten Fälle. Eine Sensitivität von beispielsweise 90% bedeutet, dass von 100 erkrankten Personen 90 richtig (positives Testergebnis, richtig-positiv) und 10 nicht richtig (negatives Testergebnis, falsch-negativ) diagnostiziert werden.

  • Spezifität (Spez): relativer Anteil Gesunder/Nicht-Infizierter, die der Test richtig als negativ erkennt; also die richtig-negativen Fälle bezogen auf alle gesunden Fälle. Eine Spezifität von beispielsweise 95% bedeutet, dass von 100 gesunden Personen 95 richtig (negatives Testergebnis, richtig-negativ) und 5 nicht richtig (positives Testergebnis, falsch-positiv) diagnostiziert werden.

Neben den beiden Kennwerten der Güte eines diagnostischen Tests, Sensitivität und Spezifität, hat die Vortestwahrscheinlichkeit (Basisrate) – d. h. die Prävalenz der Erkrankung bzw. Infektion in der Testgruppe – einen sehr starken Einfluss auf die Interpretation eines positiven und negativen Testergebnisses.

Interpretation des Testergebnisses

Wenn Sensitivität oder Spezifität unter 100% liegen, dann ist die Interpretation des Testergebnisses unsicher. Ein positives bzw. negatives Testergebnis bedeuten in diesem Fall nicht zwangsläufig, dass die Testperson tatsächlich erkrankt bzw. nicht erkrankt ist. Ob eine Erkrankung bei positivem Testergebnis tatsächlich vorliegt, hängt – neben der Sensitivität und Spezifität – sehr stark von der Vortestwahrscheinlichkeit als A-priori-Wahrscheinlichkeit der Erkrankung ab. Obwohl dies (leicht) mathematisch gezeigt werden kann, kommt es selbst bei Fachleuten zu Fehleinschätzungen und Fehlurteilen 13 16 17 18 19 . Die richtige Interpretation eines diagnostischen Tests wird häufig dadurch erschwert, dass die Prävalenz der zu testenden Gruppe nicht oder zumindest nicht genau bekannt ist 11 16 17 20 .

Positiver Vorhersagewert und negativer Vorhersagewert sind bedingte Wahrscheinlichkeiten und zentrale Parameter zur Interpretation des Ergebnisses eines diagnostischen Tests. Die Vorhersagewahrscheinlichkeit gibt die Wahrscheinlichkeit an, ob nach Kenntnis des Testresultats (positiv oder negativ) die getestete Person tatsächlich krank oder gesund ist. Beide Kennwerte sind Post-Test-Wahrscheinlichkeiten (engl.: Post-test Propability) und lassen sich für eine Testgruppe eindeutig und deterministisch aus den 3 Kenngrößen Spezifität, Sensitivität und Vortestwahrscheinlichkeit berechnen. Besonders die Vortestwahrscheinlichkeit beeinflusst positive und negative Vorhersagewerte stark:

  • Der positive Vorhersagewert (positive Vorhersagewahrscheinlichkeit, positiv prädiktiver Wert) wird berechnet aus der Häufigkeit richtig-positiver Fälle (erkrankt und Test positiv) dividiert durch die Gesamtanzahl positiver Testausgänge, also richtig-positive und falsch-positive Fälle. Der positive Vorhersagewert gibt die Wahrscheinlichkeit an, bei positivem Testergebnis tatsächlich erkrankt zu sein. Demgegenüber gibt die Wahrscheinlichkeit „1-positiver Vorhersagewert“ an, bei positivem Testergebnis nicht erkrankt zu sein (s. Abb. 1 ).

  • Der negative Vorhersagewert (negative Vorhersagewahrscheinlichkeit, negativ prädiktiver Wert) wird berechnet aus der Häufigkeit richtig-negativer Fälle (nicht erkrankt und Test negativ) dividiert durch die Gesamtanzahl negativer Testausgänge, also richtig-negative und falsch-negative Fälle. Der negative Vorhersagewert gibt die Wahrscheinlichkeit an, bei negativem Testergebnis tatsächlich nicht erkrankt zu sein. Demgegenüber gibt die Wahrscheinlichkeit „1-negativer Vorhersagewert“ an, bei negativem Testergebnis erkrankt zu sein (s. Abb. 1 ).

Methode

Für die Parameter Sensitivität, Spezifität und Vortestwahrscheinlichkeit sowie Anzahl durchgeführter Tests werden – anhand allgemeingültiger Formeln – folgende Kennwerte berechnet:

  • Anzahl richtig-positiver, falsch-positiver Fälle sowie positive Vorhersagewahrscheinlichkeit,

  • Anzahl richtig-negativer, falsch-negativer Fälle sowie negative Vorhersagewahrscheinlichkeit.

Die Darstellung der Fallzahlen und Wahrscheinlichkeiten erfolgt tabellarisch. Ausgehend von einem Grundszenario wird jeweils ein Parameter variiert; dadurch kann der Leser Art und Quantität des Einflusses der veränderten Größe erkennen. Für die vielfältigen Berechnungen wird ein vom Autor erstelltes Excel-Programm verwendet (Programm ist bei Interesse erhältlich). Weitere Informationen zur Berechnung der Zielgrößen und zur Bedeutung der Kennwerte findet der geneigte Leser in Lehrbüchern 13 , Publikationen 10 11 12 oder online 21 22 23 24 25 . Ein sehr gutes, kostenfreies Tool zur Berechnung diverser Szenarien stellen Lenhard u. Lenhard zur Verfügung 21 . Ein interaktives, grafisch ansprechendes Tool bietet das British Medical Journal an 26 .

Ergebnisse

Zur Interpretation diagnostischer Tests mit binärem Ausgang (positiv/negativ) ist die Kenntnis der 3 Parameter Sensitivität, Spezifität und Vortestwahrscheinlichkeit sowie die Anzahl durchgeführter Tests (Umfang der Testpopulation) notwendig und hinreichend für die Berechnung folgender Größen: Anzahl positiver und negativer Testausgänge sowie die positive und negative Vorhersagewahrscheinlichkeit. Anhand verschiedener Szenarien werden die Auswirkungen der Veränderung von Sensitivität, Spezifität und Vortestwahrscheinlichkeit sowie Anzahl durchgeführter Tests dargestellt, ausgehend von dem im Folgenden beschriebenen Grundszenario.

Grundszenario

In einer Gemeinde mit 100000 Einwohnern werden Tests auf das SARS-CoV-2-Virus durchgeführt. Sensitivität und Spezifität (Testgüte) sowie die Vortestwahrscheinlichkeit als Prävalenz an Infizierten in der Testpopulation sind bekannt. Als Prävalenz der Stichprobe kann die positive Testrate verwendet werden, beispielsweise bei SARS-CoV-2-Tests. Die positive Testrate ist die erwartete Häufigkeit positiver Testergebnisse aufgrund einer Virusinfektion in der potenziellen Testgruppe dividiert durch die Anzahl durchgeführter (Corona-)Tests.

Für die Durchführung von 1000 diagnostischen Tests (N) sowie einer Sensitivität (Sens) von 100,0%, einer Spezifität (Spez) von 98,8% und einer Prävalenz in der Testgruppe (Präv) von 1,0% werden die Anzahl richtig-positiver, falsch-positiver, richtig-negativer, falsch-negativer Fälle sowie die positive und negative Vorhersagewahrscheinlichkeit berechnet. Die dargestellten Kennwerte entsprechen ungefähr den Angaben aus einer Publikation über statistische Hintergründe von Antikörpertests gegen SARS-CoV-2 20 , können jedoch auch für die Interpretation anderer Corona-Tests verwendet werden. Führt man 1000 Antikörpertests bei einer Prävalenz von 1,0% (1 infizierte Person von 100 Getesteten) durch, dann ist damit zu rechnen, dass 10 Personen (tatsächlich) infiziert waren und als Immunschutz Antikörper gebildet haben. Im statistischen Mittel wird folgendes Ergebnis erwartet:

N=22 positive Testausgänge (Testergebnis ist positiv),

  • davon 10 richtig-positive Fälle (RP) : infiziert und Test positiv

    • Berechnung: Anzahl Tests (N)*Prävalenz*Sensitivität=1000*0,01*1,0= 10 Fälle

  • und 12 falsch-positive Fälle (FP) : nicht-infiziert und Test positiv

    • Berechnung: Anzahl Tests (N)*(1-Prävalenz)*(1-Spezifität)=1000*(1–0,01)*(1–0,988)=11,9 ≈ 12 Fälle

  • Positive Vorhersagewahrscheinlichkeit: RP/(RP+FP): 10/(10+12)*100 [%]=10/22*100 [%]= 45,5%. Die positive Vorhersagewahrscheinlichkeit von 45,5% bedeutet, dass bei 100 positiven Testausgängen 46 Personen infiziert (und Antikörper gebildet haben) und 54 Personen nicht infiziert (keine Bildung von Antikörper) waren. Mehr als jede 2. positiv getestete Person ist bzw. war somit nicht infiziert. Die aus den Testergebnissen berechnete Prävalenz (22 positive Ergebnisse/1000 Tests=2,2%) überschätzt die tatsächliche Prävalenz (10/1000 Tests=1,0%) um den Faktor 2,2, d. h. um mehr als das Doppelte. Ein positives Testergebnis bei einem Antikörpertest impliziert die Annahme, dass Immunschutz gegen das Virus vorhanden ist. Dies trifft in mehr als der Hälfte der Fälle (54,5%) nicht zu.

N=978 negative Testausgänge (Testergebnis ist negativ),

  • davon 978 richtig-negative Fälle (RN) : nicht-infiziert und Test negativ

    • Berechnung: Anzahl Tests (N)*(1-Prävalenz)*Spezifität=1000*(1–0,01)*0,988= 978 Fälle

  • und 0 falsch-negative Fälle (FN): infiziert und Test negativ

    • Berechnung: Anzahl Tests (N)* Prävalenz*(1-Sensitivität)=1000*(1–0,01)*(1–1,0)= 0 Fälle

  • Negative Vorhersagewahrscheinlichkeit: RN/(RN+FN): 978/(978+0) *100 [%]=978/978*100 [%]= 100,0% . Die negative Vorhersagewahrscheinlichkeit von 100,0% bedeutet, dass bei 100 negativen Testausgängen alle 100 Personen nicht infiziert und keine Person infiziert ist bzw. war. Aufgrund der perfekten Sensitivität von 100,0% treten keine falsch-negativen Fälle auf. Ein negatives Testergebnis beim Antikörpertest impliziert die Annahme, dass kein Immunschutz gegen das Virus vorhanden ist. Dies trifft bei allen Fällen mit negativem Testausgang zu.

Veränderung der Prävalenz (Anzahl der Infizierten)

Die Häufigkeit Infizierter in der getesteten Population, also die Prävalenz in der Stichprobe, beeinflusst die positive und negative Vorhersagewahrscheinlichkeit deutlich. Mit zunehmender Prävalenz in der Stichprobe erhöht sich die positive Vorhersagewahrscheinlichkeit und erniedrigt sich bei geringerer Prävalenz, gleiche Sensitivität und gleiche Spezifität vorausgesetzt ( Tab. 1 ). Eine steigende Prävalenz in der getesteten Gruppe entspricht im Kontext von SARS-CoV-2 – in aller Regel – einer zunehmenden Infizierung der Bevölkerung. Sind in einer Gruppe beispielsweise 1000 von 10000 Personen infiziert (Prävalenz: 10%), dann beträgt der positive Vorhersagewert 90,3%, bei einer Infektionsrate von lediglich 5 von 10000 (Prävalenz: 0,05%) nur 4,0% ( Tab. 1 ).

Tab. 1 Veränderung der Prävalenz: Bei konstanter Sensitivität (100,0%) und Spezifität (98,8%): Anzahl Tests: 1000.*

Sens Spez Präv Infiziert Tpos: RP Nicht infiziert Tpos: FP Anzahl positive Tests Nicht infiziert Tneg: RN Infiziert Tneg: FN Anzahl negative Tests Positiver Vorhersagewert Negativer Vorhersagewert
1,000 0,988 0,0005 0,5 12 12,5 987,5 0 987,5 4,0% 100,0%
1,000 0,988 0,001 1 12 13 987 0 987 7,7% 100,0%
1,000 0,988 0,005 5 12 17 983 0 983 29,5% 100,0%
1,000 0,988 0,010 10 12 22 978 0 978 45,7% 100,0%
1,000 0,988 0,020 20 12 32 968 0 968 63,0% 100,0%
1,000 0,988 0,050 50 11 61 939 0 939 81,4% 100,0%
1,000 0,988 0,100 100 11 111 889 0 889 90,3% 100,0%
1,000 0,988 0,200 200 10 210 790 0 790 95,4% 100,0%

* Bemerkung: Ergebnisse teilweise gerundet, Grundszenario: Vortestwahrscheinlichkeit/Prävalenz der Stichprobe: 0,010=1,0%; Sens: Sensitivität, Spez: Spezifität, Präv: Prävalenz, RP: richtig-positive Fälle, FP: falsch-positive Fälle, RN: richtig-negative Fälle, FN: falsch-negative Fälle

Werden 10000 Personen getestet, dann ergeben sich – bei einer Prävalenz von 0,05% – im Mittel 125 positive Testausgänge. Davon sind 5 Fälle richtig-positiv (N*Prävalenz*Sensitivität=10000*0,0005*1,000) und 120 Fälle falsch-positiv (N*(1-Prävalenz)*(1-Spezifität)=10000*0,9995*0,012) (vgl. Tab. 1 , 1. Zeile; Anzahl der Tests um Faktor 10 erhöht). Die berechnete Prävalenz beträgt 125 von 10000 (1,25%) und ist um den Faktor 25 (=125/5) höher als die tatsächliche Prävalenz der Testgruppe (5 von 10000=0,05%).

Bei einer perfekten Sensitivität von 100,0% werden alle infizierten Fälle richtig erkannt, es gibt keine falsch-negativen Fälle und die negative Vorhersagewahrscheinlichkeit liegt bei 100%.

Merke.

Bei niedrigerer Vortestwahrscheinlichkeit ist mit weniger richtig-positiven und mehr falsch-positiven Fällen zu rechnen. Dadurch wird der positive Vorhersagewert niedriger, auch bei ansonsten guten Werten der Sensitivität und Spezifität.

Merke.

Der positive Vorhersagewert reagiert sehr sensibel auf Änderungen der Prävalenz, etwa im Bereich unter 5%.

Veränderung der Sensitivität

Bei niedrigerer Sensitivität nimmt die Anzahl richtig erkannter Infizierter (richtig-positive Fälle) ab. Da sich – bei konstanter Spezifität – die Anzahl falsch-positiver Fälle nicht ändert, reduziert sich die positive Vorhersagewahrscheinlichkeit, und zwar von 45,7% bei einer Sensitivität von 100,0% auf 14,4% bei einer von 20,0% ( Tab. 2 ). Der negative Vorhersagewert nimmt nur geringfügig ab, von 100,0% auf 99,2% ( Tab. 2 ).

Tab. 2 Abhängigkeit des positiven und negativen Vorhersagewerts von der Sensitivität: Bei konstanter Spezifität (98,8 %) und Prävalenz (1%): Anzahl Tests: 1000.*

Sens Spez Präv Infiziert Tpos: RP Nicht infiziert Tpos: FP Anzahl positive Tests Nicht infiziert Tneg: RN Infiziert Tneg:FN Anzahl negative Tests Positiver Vorhersagewert Negativer Vorhersagewert
1,000 0,988 0,010 10 12 22 978 0 978 45,7% 100,0%
0,900 0,988 0,010 9 12 21 978 1 979 43,1% 99,9%
0,800 0,988 0,010 8 12 20 978 2 980 40,2% 99,8%
0,700 0,988 0,010 7 12 19 978 3 981 37,1% 99,7%
0,500 0,988 0,010 5 12 17 978 5 983 29,6% 99,5%
0,300 0,988 0,010 3 12 15 978 7 985 20,2% 99,3%
0,200 0,988 0,010 2 12 14 978 8 986 14,4% 99,2%

* Bemerkung: Ergebnisse teilweise gerundet, Grundszenario: Vortestwahrscheinlichkeit/Prävalenz der Stichprobe: 0,010=1,0%; Sens: Sensitivität, Spez: Spezifität, Präv: Prävalenz, RP: richtig-positive Fälle, FP: falsch-positive Fälle, RN: richtig-negative Fälle, FN: falsch-negative Fälle

Merke.

Eine niedrigere Sensitivität führt zu weniger richtig-positiven Testergebnissen. Bei konstanter Anzahl falsch-positiver Fällen verringert sich der positive Vorhersagewert. Der Einfluss einer geringeren Sensitivität auf den positiven Vorhersagewert fällt insbesondere bei Prävalenzen unter 10% deutlich aus.

Merke.

Aufgrund der geringen Zahl an Infizierten und damit einhergehend hohen Anzahl richtig-negativer Fälle bleibt der negative Vorhersagewert nahezu konstant.

Veränderung der Spezifität

Bei einem Test auf SARS-CoV-2 oder einem Antikörpertest ist die Bandbreite der Spezifität deutlich geringer als die der Sensitivität. Geringfügige Veränderungen der Spezifität wirken sich jedoch drastisch auf die Anzahl falsch-positiver Fälle und damit auf den positiven Vorhersagewert aus. Dieser Effekt lässt sich mit der hohen Anzahl nicht infizierter Personen erklären (geringe Vortestwahrscheinlichkeit!), was insbesondere beim Einsatz in Personengruppen ohne direkte Krankheitssymptome vorkommt 27 .

Bei kleiner Prävalenz in der Testgruppe von≤1% führt eine (geringfügig) abnehmende Spezifität zu einem (starken) Anstieg falsch-positiver Fälle. Dadurch bedingt verringert sich der positive Vorhersagewert deutlich. Bei einer (geringen) Verringerung der Spezifität von 100% auf 95% sinkt der positive Vorhersagewert von 100,0% auf lediglich 16,8% (Bemerkung: Sensitivität=1,0; Tab. 3 ). Bei einer geringeren Sensitivität fällt dieser Effekt noch deutlicher aus: Der positive Vorhersagewert fällt beispielsweise bei einer Sensitivität 100,0% von 100,0% auf 5,7% bei einer Sensitivität von 30% ( Tab. 3 ). Ein niedriger positiver Vorhersagewert bei SARS-CoV-2-Tests bedeutet, dass viele der positiv Getesteten nicht infiziert sind. Bei einem Antikörpertest bedeutet ein niedriger positiver Vorhersagewert, dass bei vielen positiv Getesteten kein Immunschutz vorliegt.

Tab. 3 Abhängigkeit des positiven und negativen Vorhersagewerts von der Spezifität für verschiedene Sensitivitäten (100%, 80% und 30%) und einer Prävalenz von 1%, Anzahl Tests: 1000.*

Sens Spez Präv Infiziert Tpos: RP Nicht infiziert Tpos: FP Anzahl positive Tests Nicht infiziert Tneg: RN Infiziert Tneg: FN Anzahl negative Tests Positiver Vorhersagewert Negativer Vorhersagewert
1,000 1,000 0,010 10 0 10 990 0 990 100,0% 100,0%
1,000 0,999 0,010 10 1 11 989 0 989 91,0% 100,0%
1,000 0,995 0,010 10 5 15 985 0 985 66,9% 100,0%
1,000 0,990 0,010 10 10 20 980 0 980 50,3% 100,0%
1,000 0,988 0,010 10 12 22 978 0 978 45,7% 100,0%
1,000 0,970 0,010 10 30 40 960 0 960 25,2% 100,0%
1,000 0,960 0,010 10 40 50 950 0 950 20,2% 100,0%
1,000 0,950 0,010 10 50 60 941 0 941 16,8% 100,0%
0,800 1,000 0,010 8 0 8 990 2 992 100,0% 99,8%
0,800 0,999 0,010 8 1 9 989 2 991 89,0% 99,8%
0,800 0,995 0,010 8 5 13 985 2 987 61,8% 99,8%
0,800 0,990 0,010 8 10 18 980 2 982 44,7% 99,8%
0,800 0,988 0,010 8 12 20 978 2 980 40,2% 99,8%
0,800 0,970 0,010 8 30 38 960 2 962 21,2% 99,8%
0,800 0,960 0,010 8 40 48 950 2 952 16,8% 99,8%
0,800 0,950 0,010 8 50 58 941 2 943 13,9% 99,8%
0,300 1,000 0,010 3 0 3 990 7 997 100,0% 99,3%
0,300 0,999 0,010 3 1 4 989 7 996 75,2% 99,3%
0,300 0,995 0,010 3 5 8 985 7 992 37,7% 99,3%
0,300 0,990 0,010 3 10 13 980 7 987 23,3% 99,3%
0,300 0,988 0,010 3 12 15 978 7 985 20,2% 99,3%
0,300 0,970 0,010 3 30 33 960 7 967 9,2% 99,3%
0,300 0,960 0,010 3 40 43 950 7 957 7,0% 99,3%
0,300 0,950 0,010 3 50 53 941 7 948 5,7% 99,3%

* Bemerkung: Ergebnisse teilweise gerundet, Grundszenario: Vortestwahrscheinlichkeit/Prävalenz der Stichprobe: 0,010=1,0%; Sens: Sensitivität, Spez: Spezifität, Präv: Prävalenz, RP: richtig-positive Fälle, FP: falsch-positive Fälle, RN: richtig-negative Fälle, FN: falsch-negative Fälle

Der negative Vorhersagewert verändert sich demgegenüber in allen Szenarien nur geringfügig und liegt stets über 99,0% (Prävalenz=1,0%; Tab. 3 ).

Die aus den Testergebnissen berechnete Prävalenz überschätzt die real vorliegende Prävalenz , insbesondere bei niedriger Spezifität. Bei einer Infektionsrate von 1 von 100 Fällen (1%) und einer Sensitivität von 100,0 gilt: Bei einer Spezifität von 99,5% liegt die berechnete Prävalenz um den Faktor 1,5 (Anzahl positiver Fälle/Anzahl infizierter Fälle=15/10), bei einer Spezifität von 98,8% um den Faktor 2,2 (=22/10) und bei einer Spezifität von 96,0% um den Faktor 5,0 (=50/10) höher als die tatsächliche Prävalenz der Testgruppe.

Merke.

Verringert sich die Spezifität, dann steigt die Anzahl falsch-positiver Testergebnisse und damit erniedrigt sich der positive Vorhersagewert. Aufgrund der hohen Anzahl Nicht-Infizierter gilt dies insbesondere bei einer niedrigen Prävalenz der Testgruppe.

Merke.

Der positive Vorhersagewert reagiert sehr sensibel auf eine Änderung der Spezifität, etwa im Bereich zwischen 95 und 100%. Die geringe Vorhersagekraft positiver Testergebnisse bei niedrigen Spezifitäten wird durch eine geringe Sensitivität verstärkt.

Veränderung der Sensitivität und Prävalenz

Mit steigender Prävalenz der Erkrankung nimmt die Anzahl richtig-positiver und falsch-negativer Fälle zu. Dadurch steigt die Vorhersagekraft positiver Testergebnisse und die Vorhersagekraft negativer Testergebnisse fällt. Der positive Vorhersagewert ist bei höherer Sensitivität größer ( Tab. 4 ).

Tab. 4 Abhängigkeit des positiven und negativen Vorhersagewerts von der Prävalenz, bei einer Sensitivität von 80,0% und 30,0% und einer Spezifität von 98,8 %, Anzahl Tests: 1000.*

Sens Spez Präv Krank Tpos: RP Gesund Tpos: FP Anzahl positive Tests Gesund Tneg: RN Krank Tneg: FN Anzahl negative Tests Positiver Vorhersagewert Negativer Vorhersagewert
0,800 0,988 0,0005 0,4 12 12 988 0,1 988 3,2% 100,0%
0,800 0,988 0,005 4 14 18 983 1 984 25,1% 99,9%
0,800 0,988 0,010 8 12 20 978 2 980 40,2% 99,8%
0,800 0,988 0,050 40 11 51 939 10 949 77,8% 98,9%
0,800 0,988 0,100 80 11 91 889 20 909 88,1% 97,8%
0,800 0,988 0,200 160 10 170 790 40 830 94,3% 95,2%
0,300 0,988 0,0005 0 12 12 988 0 988 1,2% 100,0%
0,300 0,988 0,005 2 12 13 983 4 987 11,2% 99,6%
0,300 0,988 0,010 3 12 15 978 7 985 20,2% 99,3%
0,300 0,988 0,050 15 11 26 939 35 974 56,8% 96,4%
0,300 0,988 0,100 30 11 41 889 70 959 73,5% 92,7%
0,300 0,988 0,200 60 10 70 790 140 930 86,2% 85,0%

* Bemerkung: Ergebnisse teilweise gerundet; Sens: Sensitivität, Spez: Spezifität, Präv: Prävalenz, RP: richtig-positive Fälle, FP: falsch-positive Fälle, RN: richtig-negative Fälle, FN: falsch-negative Fälle

Bei einer Sensitivität von 80,0% steigt beispielsweise der positive Vorhersagewert von 3,2% (Prävalenz: 0,05%) auf 94,3% (Prävalenz: 20,0%). Die negative Vorhersagewahrscheinlichkeit verringert sich demgegenüber geringfügig mit steigender Prävalenz, von 100,0% (Prävalenz=0,05%) auf 95,2% (Prävalenz=20,0%).

Merke.

Bei zunehmender Prävalenz von 0,05% auf 20% steigt die Anzahl richtig-positiver und ebenso falsch-negativer Fälle. Erkrankte lassen sich sicherer vorhersagen, die positive Vorhersagewahrscheinlichkeit steigt. Nicht-Erkrankte lassen sich jedoch unsicherer vorhersagen, die negative Vorhersagewahrscheinlichkeit fällt, wenngleich dieser Effekt nicht so deutlich ausfällt.

Variation der Spezifität und Prävalenz

Bei einer Prävalenz von 1% und einer sehr guten Testgüte mit Sensitivität=100% und Spezifität=99,9% ist von 10 positiven Testergebnissen ziemlich genau 1 Person nicht infiziert (falsch-positiv, positiver Vorhersagewert=91,0%, Tab. 5 : hellgrau gemarktete Zeile). Bei einer geringeren Infektionsrate von 0,05% liegt der positive Vorhersagewert bei lediglich einem Drittel (33,3%, Tab. 5 : dunkelblau gemarktete Zeile). Ein positiver Vorhersagewert von 33,3% bedeutet, dass 2 von 3 positiv getesteten Fälle nicht infiziert sind. Die berechnete Prävalenz mit 15 positiven Fällen bei 10000 Tests überschätzt die tatsächliche Prävalenz (5 bei 10000 Tests) um das Dreifache (Faktor 3). Erst mit zunehmender Prävalenz Infizierter in der Testgruppe steigt der positive Vorhersagewert deutlich an.

Tab. 5 Abhängigkeit des positiven und negativen Vorhersagewerts von der Spezifität, bei einer Sensitivität von 100,0%, Anzahl Tests: 1000.*

Sens Spez Präv Kran Tpos: RP Gesund Tpos: FP Anzahl positive Tests Gesund Tneg: RN Krank Tneg: FN Anzahl negative Tests Positiver Vorhersagewert Negativer Vorhersagewert
1,000 1,000 0,0005 1 0 1 1000 0 1000 100,0% 100,0%
1,000 1,000 0,001 1 0 1 999 0 999 100,0% 100,0%
1,000 1,000 0,005 5 0 5 995 0 995 100,0% 100,0%
1,000 1,000 0,010 10 0 10 990 0 990 100,0% 100,0%
1,000 1,000 0,020 20 0 20 980 0 980 100,0% 100,0%
1,000 0,999 0,0005 0,5 1,0 1,5 999 0 999 33,3% 100,0%
1,000 0,999 0,001 1 1 2 998 0 998 50,0% 100,0%
1,000 0,999 0,005 5 1 6 994 0 994 83,4% 100,0%
1,000 0,999 0,010 10 1 11 989 0 989 91,0% 100,0%
1,000 0,999 0,020 20 1 21 979 0 979 95,3% 100,0%
1,000 0,995 0,0005 0,5 5,0 5,5 995 0 995 9,1% 100,0%
1,000 0,995 0,001 1 5 6 994 0 994 16,7% 100,0%
1,000 0,995 0,005 5 5 10 990 0 990 50,1% 100,0%
1,000 0,995 0,010 10 5 15 985 0 985 66,9% 100,0%
1,000 0,995 0,020 20 5 25 975 0 975 80,3% 100,0%

* Bemerkung: Ergebnisse teilweise gerundet, Grundszenario: Vortestwahrscheinlichkeit/Prävalenz der Stichprobe: 0,0005=0,05%; Sens: Sensitivität, Spez: Spezifität, Präv: Prävalenz, RP: richtig-positive Fälle, FP: falsch-positive Fälle, RN: richtig-negative Fälle, FN: falsch-negative Fälle

Absolute Sicherheit und somit positive und negative Vorhersagewerte von 100,0% ergeben sich nur bei einem perfekten Test mit Sensitivität und Spezifität von 100,0%; in diesem Fall auch unabhängig von der Prävalenz der Testgruppe ( Tab. 5 : Zeilen 1–5).

Merke.

Bei niedrigen Prävalenzen nimmt der positive Vorhersagewert deutlich ab. Dies gilt selbst bei einer sehr guten Spezifität des Diagnosetests von über 99,0%. Bei zudem geringerer Spezifität nimmt der positive Vorhersagewert noch niedrigere Werte an.

Zusammenhang zwischen Anzahl durchgeführter Tests und Anzahl positiver Testausgänge

Die Anzahl positiver Testresultate steigt linear mit der Anzahl durchgeführter Tests. Es gilt der kausale Zusammenhang: „Wer viel testet, erhält viele positive Testergebnisse!“

Angenommen, in einen Ort mit 10000 Einwohnern sind 100 von 10000 Personen infiziert, d. h. die Prävalenz liegt bei 1%. Die Sensitivität sei 1,0 und die Spezifität 0,988. Mit zunehmender Anzahl durchgeführter Tests steigt die Häufigkeit positiver Testergebnisse ( Tab. 6 ). Bei Durchführung von 1000 diagnostischen Tests ergeben sich 22 positive Testresultate, bei 2000 Tests mit 44 positiven Fällen die doppelte Anzahl usw. Der positive Vorhersagewert ist unabhängig von der Anzahl durchgeführter Tests und liegt konstant bei 45,7%.

Tab. 6 Abhängigkeit der positiven Testausgänge von der Anzahl durchgeführter Tests, für unterschiedliche Prävalenzen (Sensitivität=100,0 % und Spezifität=98,8 %).*

Sens Spez Präv Anzahl Tests Krank Tpositiv: RP Gesund Tpositiv: FP Anzahl Tpositiv Positiver Vorhersagewert Positiv-Test-Rate
1,000 0,988 0,01 500 5 6 11 45,7% 2,2%
1,000 0,988 0,01 1000 10 12 22 45,7% 2,2%
1,000 0,988 0,01 2000 20 24 44 45,7% 2,2%
1,000 0,988 0,01 2500 25 30 55 45,7% 2,2%
1,000 0,988 0,01 5000 50 59 109 45,7% 2,2%
1,000 0,988 0,01 10000 100 119 219 45,7% 2,2%
1,000 0,988 0,001 1000 1 12 13 7,7% 1,3%
1,000 0,988 0,010 1000 10 12 22 45,7% 2,2%
1,000 0,988 0,020 1000 20 12 32 63,0% 3,2%
1,000 0,988 0,050 1000 50 11 61 81,4% 6,1%
1,000 0,988 0,100 1000 100 11 111 90,3% 11,2%
1,000 0,988 0,200 1000 200 10 210 95,4% 21,0%
1,000 0,988 0,200 2000 400 19 419 95,4% 21,0%
1,000 0,988 0,200 4000 800 38 838 95,4% 21,0%

* Bemerkung: Ergebnisse teilweise gerundet; Sens: Sensitivität, Spez: Spezifität, Präv: Prävalenz, Tpositiv: Test-positiv, RP: richtig-positive Fälle, FP: falsch-positive Fälle

Die Positiv-Testrate wird berechnet aus der Anzahl positiver Tests (Neuinfektionen) geteilt durch die Anzahl durchgeführter Tests. Die Positiv-Testrate ist unabhängig von der Anzahl durchgeführter Tests und liegt im Beispiel konstant bei 2,2% (22/1000 Tests=44/2000 Tests=0,022). Die Verwendung der Positiv-Testrate wird – neben der 7-Tage-Inzidenz – zur Beschreibung des Infektionsgeschehens in der Corona-Pandemie empfohlen 28 .

Der Rückgang falsch-positiver und die Zunahme richtig-positiver Fälle bei steigender Prävalenz wird in diesem Szenario ebenfalls deutlich. Der positive Vorhersagewert nimmt von 7,7% auf 95,4% zu, bei zunehmender Prävalenz von 0,10% auf 20%. Die Positiv-Testrate nimmt mit höherer Prävalenz in der Testgruppe ebenfalls zu, von 1,3% auf 21,0%.

Diskussion

Interpretation diagnostischer Tests

Die Interpretation diagnostischer Tests mit binärem Ausgang (positiv/negativ) ist schwierig und führt leicht zu falschen Schlussfolgerungen 13 16 29 . Durch Angabe absoluter Häufigkeiten – anstelle von Wahrscheinlichkeiten bzw. relativen Häufigkeiten – werden Ergebnisse diagnostischer Tests besser verstanden 29 , dies zeigten Studien 30 31 . Um Fehlinterpretationen vorzubeugen, empfiehlt sich die Ergebnisdarstellung diagnostischer Tests durch absolute Häufigkeiten sowie mittels Entscheidungsbäumen und Flächendiagrammen 16 18 . Die Häufigkeit erkrankter bzw. infizierter Personen in der Testgruppe (Vortestwahrscheinlichkeit) hat einen sehr starken, teils unerwarteten und oft deutlichen Einfluss auf das Vorkommen falsch-positiver und falsch-negativer Ergebnisse. Der starke Effekt niedriger Prävalenzen der Untersuchungsgruppe (unter 5%) bleibt auch bei ansonsten guten Qualitätsmerkmalen des diagnostischen Tests – ausgedrückt durch Sensitivität und Spezifität – bestehen. Diese Effekte werden in den berechneten Szenarien deutlich, wobei gängige Kennwerte (Sensitivität, Spezifität und Prävalenz) aus der Literatur zur Beschreibung der Testsituation in der Corona-Pandemie verwendet wurden ( Tab. 1 2 3 4 5 6 ).

Das Ergebnis diagnostischer Tests kann eindeutig berechnet und richtig gedeutet werden, wenn die beiden Kennwerte der Testgüte, Sensitivität und Spezifität, sowie die Häufigkeit der Erkrankten/Infizierten in der Testpopulation bekannt sind 18 . Sensitivität und Spezifität sind Zufallsvariablen und müssen vor dem Einsatz eines Tests anhand einer Stichprobe gesunder und erkrankter Personen geschätzt werden. Die Unsicherheit bei der Bestimmung von Sensitivität und Spezifität zeigt sich daran, dass Hersteller eines Tests neben dem Punktschätzer zusätzlich die Vertrauensbereiche bzw. Konfidenzintervalle angeben. Nur bei A-priori-Kenntnis der Sensitivität und Spezifität kann das Ergebnis eines diagnostischen Tests korrekt beurteilt werden.

Die Güte eines Tests unterscheidet zwischen diagnostischer Güte (effektive Güte) und analytischer Güte:

  • Die diagnostische Güte wird beim tatsächlichen Einsatz des Tests unter realen Bedingungen „im praktischen Alltag“ bestimmt. Fehler können auftreten bei der Probenahme, durch Kontamination der Probe, Kreuzreaktionen mit anderen Viren oder genetischem Material, Weiterverarbeitung, Probenversand und datentechnischer Erfassung sowie bei der Analyse der Probe 15 .

  • Die analytische Güte umfasst hingegen ausschließlich die Qualität der Analyse unter idealisierten Bedingungen im Analyselabor 14 .

Deshalb ist die analytische Güte stets gleich oder besser im Vergleich zur diagnostischen Güte. Vor dem Einsatz eines diagnostischen Tests muss der Hersteller die (analytische) Sensitivität und (analytische) Spezifität anhand einer Stichprobe von Proben von Erkrankten und Gesunden bestimmen (s. Abb. 1 ). Beim Einsatz des Tests müssen qualifizierte Analyselabore Auskunft über die im Labor erreichte Sensitivität und Spezifität geben und diese Parameter im Rahmen des internen und externen Qualitätsmanagements kontinuierlich überprüfen. Eine hohe Sensitivität und Spezifität sind eine notwendige, jedoch keine hinreichende Voraussetzung für den sinnvollen Einsatz eines diagnostischen Tests. Die geforderte Güte des Tests ist abhängig vom Einsatzgebiet und den mit dem Ergebnis verbundenen Konsequenzen, etwa zur Diagnose einer Erkrankung oder beim Einsatz als Screeninginstrument 18 .

Die Vortestwahrscheinlichkeit (Pre-test Probability) als Prävalenz in der zu testenden Population bestimmt als A-priori-Wahrscheinlichkeit – neben der Sensitivität und Spezifität – entscheidend das Testergebnis sowie dessen Interpretation 13 18 32 . Nur wenn die Sensitivität exakt 100% beträgt, gibt es keine falsch-negativen Ergebnisse, und nur wenn die Spezifität exakt 100% beträgt, gibt es keine falsch-positiven Ergebnisse. Unglücklicherweise ist die Häufigkeit infizierter Personen in der getesteten Population in den meisten Fällen nicht exakt bekannt und dadurch eine korrekte Interpretation diagnostischer Testergebnisse nicht möglich. Die exakte Angabe der im Mittel zu erwartenden Anzahl richtig-positiver, falsch-positiver, richtig-negativer und falsch-negativer Fälle sowie der daraus abgeleiteten Größen positive und negative Vorhersagewahrscheinlichkeit ist nicht möglich, wenn die Vortestwahrscheinlichkeit unbekannt ist 10 11 13 33 . Dies gilt insbesondere auch beim Einsatz eines diagnostischen Tests in speziellen Subgruppen, wie beispielsweise ältere oder jüngere Personengruppen, Pflegeheimbewohner, Reiserückkehrer, Sportler, Schulklassen, usw. Der Anteil von akut mit SARS-CoV-2 infizierten Personen in der Gesamtbevölkerung wird je nach Ausbruchsgeschehen mit 0,05–5%, also 5–500 von 10000 Menschen angenommen. Demgegenüber ist der Anteil Infizierter in einer Gruppe von Menschen mit COVID-19-Symptomen ungleich höher und liegt beispielsweise bei 10%, also 1000 von 10000 Menschen 27 .

Ist die Anzahl Erkrankter in der Testpopulation niedrig (Bemerkung: und damit die Anzahl Nicht-Erkrankter hoch!), dann ist die Anzahl falsch-positiver Fälle hoch; dies gilt auch bei guter Spezifität des Tests. Obwohl die individuelle Wahrscheinlichkeit für ein falsch-positives Ergebnis für einen Gesunden bei guter Spezifität niedrig ist, nimmt aufgrund der hohen Anzahl gesunder Personen die Gesamtzahl falsch-positiver Testausgänge dennoch stark zu (s. Tab. 1 ). Die Anzahl falsch-positiver Fälle berechnet sich als Produkt aus der „Anzahl durchgeführter Tests“‚ „1-Spezifität“ und Gesamtzahl gesunder Fälle (s. o. Grundszenario). Demgegenüber ist die Anzahl richtig-positiver Fälle niedrig, da bei einer geringen Prävalenz in der Testpopulation wenige Personen erkrankt sind. Bei niedriger Prävalenz kann es vorkommen, dass die Anzahl falsch-positiv Getesteter höher als die Anzahl richtig-positiv Getesteter ist; die positive Vorhersagewahrscheinlichkeit liegt in diesem Fall unter 50%.

Durch eine hohe Anzahl falsch-positiver Fälle wird die tatsächliche Prävalenz in der Testgruppe überschätzt, insbesondere bei guter Sensitivität. Das Phänomen vieler falsch-positiver Testergebnisse bei niedrigen Erkrankungsraten ist hinlänglich bekannt 16 17 18 34 und sollte beim Testen gesunder Personen ohne Symptome berücksichtigt werden, beispielsweise im Rahmen umfänglicher COVID-Tests in gesunden Testpopulationen oder bei Screeningmaßnahmen 10 15 33 35 . Das Robert Koch-Institut konstatiert, dass ungezieltes Testen, bei niedriger Prävalenz und auch nur geringfügig eingeschränkter Spezifität, eine relevante Zahl falsch-positiver Befunde ergibt 2 . Folgendes Zahlenbeispiel zeigt dies deutlich: Bei einer perfekten Sensitivität von 100,0% und einer nahezu perfekten Spezifität von 99,9% beträgt bei einer Infektionsrate von 50 je 100000 Personen (=0,05%) die positive Vorhersagewahrscheinlichkeit lediglich ein Drittel (33,3%); anders gesagt: bei 10000 durchgeführten Tests haben N=15 ein positives Ergebnis, 10 davon sind falsch-positive Fälle (s. Tab. 5 , dunkelgraue Markierung). Ebenfalls lediglich ein Drittel beträgt die positive Vorhersagewahrscheinlichkeit bei einer Sensitivität von 100,0%, einer Spezifität von 99,0% und einer Vortestwahrscheinlichkeit von 0,50%.

Unsicherheit diagnostischer Tests: Auswirkungen von falsch-positiven und falsch-negativen Fällen

Falsche Ergebnisse – in Form falsch-positiver und falsch-negativer Fälle – entstehen bei diagnostischen Tests durch eine unzureichende Testgüte (Sensitivität, Spezifität), aber auch durch Fehler und statistische Unsicherheiten bei der Probenahme 7 , Probenverarbeitung und -analyse. Falsche Testergebnis können problematisch sein, deshalb sollte der eingesetzte diagnostische Test eine möglichst hohe analytische und diagnostische Testgüte haben. Um Anzahl falscher Testergebnisse möglichst gering zu halten, sollte die zu testende Population eine ausreichend hohe Prävalenz an Erkrankten bzw. Infizierten vorweisen. Der eingesetzte Virustest bestimmt die Auswirkungen falscher Testergebnisse.

Falsch-positive Fälle

Im Corona-Test sind falsch-positiv getestete Personen – trotz positivem Testresultat – nicht infiziert und stellen somit keine Infektionsgefahr für Mitmenschen dar. Personen mit einem falsch-positiven Testergebnis und möglicherweise ihre Kontaktpersonen müssen zu Unrecht in Isolation bzw. Quarantäne und sich gegebenenfalls erneut testen lassen. Dies wirkt sich auf den persönlichen Lebensbereich der Betroffenen negativ aus, beispielsweise durch Isolation/Quarantäne, Angst vor der Erkrankung, Kontaktvermeidung, finanzielle Einschränkungen, Einschränkungen im täglichen Leben, Depression, häusliche Gewalt usw. Negative Auswirkungen auf den gesellschaftlichen Lebensbereich der Betroffenen sind gleichfalls denkbar, etwa durch Fernbleiben von der Arbeit oder nicht zu erledigende, familiäre und gemeinschaftliche Verpflichtungen 15 . Falsch-positiv Getestete (ohne Symptome!) können als asymptomatisch betrachtet und in der Statistik irrtümlicherweise als Infektionsfall gezählt werden 14 . Insbesondere dann, wenn keine Abklärung durch einen zweiten Test erfolgt (Doppeltestung).

Für das gesamte Gesundheitssystem aus Behörden, Gesundheitsämter, Testzentren, Kliniken, Rehabilitationseinrichtungen, niedergelassene Ärzte, Pflegeheime und andere Institutionen entsteht durch fehlerhaft positiv Getestete ein hoher bürokratischer, finanzieller und medizinischer Aufwand; etwa beim Management der Quarantäneanordnung, Isolierung, Behandlung, Durchführung weiterer Tests sowie Kontaktnachverfolgung der nicht infizierten Personen 15 . Durch die Bindung (falscher) Kapazitäten im Gesundheitssystem fehlen diese bei anderen wichtigen Aufgaben zur Eindämmung der Pandemie 9 32 34 35 . Wichtige Bereiche zur Eindämmung der Pandemie sind beispielsweise:

  • umfassende Impfmaßnahmen,

  • gezielte Testungen für Risikogruppen,

  • Einbindung der Testergebnisse in ein übergreifendes Dokumentationssystem inklusive statistischer Auswertung und Evaluation,

  • Gewinnung fundierter Kenntnisse zur Verbreitung des SARS-CoV-2-Virus und zu Risikofaktoren für schwere Verläufe,

  • Anwendung wirkungsvoller Hygienemaßnahmen für die Bevölkerung 9 35 36 .

Falsch-negative Fälle

Falsch-negative Tests wirken sich anders aus als falsch-positive Testergebnisse. Falsch-negative Testergebnisse können erheblich zur Ausbreitung des SARS-CoV-2-Virus beitragen 32 . Bei Antikörpertests gilt dies für falsch-positive Fälle, da ein falsches, positives Testergebnis einen nicht vorhandenen Immunschutz und somit eine niedrige Infektiosität unterstellt 20 . Aus diesem Grund ist die korrekte Durchführung der Abstriche zur Identifizierung einer Infektion sehr wichtig 7 37 . Bei einem falsch-negativen Testergebnis müssen tatsächlich infizierte Personen zu Unrecht nicht in Quarantäne. Sie wiegen sich möglicherweise in falscher Sicherheit und infizieren durch weiteren Kontakt und unterlassene Hygienemaßnahmen andere Personen 38 . Besonders problematisch ist diese Fehleinschätzung bei Mitarbeitern im Gesundheits- bzw. Sozialwesen 18 , Besuchern von Pflegeheimen, Geschäften oder Veranstaltungen sowie Reiserückkehrern 15 39 . Obwohl bei einer niedrigen Sensitivität des Tests viele Personen falsch-negativ getestet werden, bleibt bei einer niedrigen Prävalenz der Infektion mit SARS-CoV-2 die absolute Häufigkeit falsch-negativer Fälle ebenfalls niedrig. Dies gilt selbst bei einer relativ niedrigen Sensitivität des diagnostischen Tests (s. Tab. 2 ). Die kontinuierliche Beobachtung sowie regelmäßige Testung von Personen, die in sensiblen Bereichen – beispielsweise im Gesundheits- und Sozialwesen – arbeiten, wird empfohlen 18 .

Vermeidung falsch-positiver und falsch-negativer Fälle durch Doppeltestung

Eine hohe Validität des Testverfahrens wird durch eine fachgerechte, sorgfältige Probenahme, idealerweise durch geschultes Personal 7 14 , sowie eine hohe Qualität, eine einfache Handhabbarkeit des diagnostischen Tests und gegebenenfalls qualitätsgesicherte Probeanalyse in einem qualifizierten Analyselabor erreicht 34 . Die Abklärung eines positiven Resultats im ersten Test durch einen zweiten Test wird empfohlen, da dies die Sicherheit und Aussagekraft eines Tests steigert 15 40 .

Antigen-Schnelltests und PCR-Tests

Im Rahmen der Nationalen Teststrategie und der 3G- bzw. 2G-Plus-Regel (genesen, geimpft, getestet) werden Antigen-Schnelltests zur Eindämmung der Corona-Pandemie eingesetzt. Die Durchführung eines Antigen-Schnelltests liefert sehr schnell und unmittelbar am Testort eine Entscheidung über eine mögliche Infektion mit SARS-CoV-2, etwa vor dem Kontakt mit Risikogruppen (z. B. in Altersheimen und Krankenhäusern), Feierlichkeiten, Restaurant- und Kneipenbesuchen, Urlaubsreisen oder Events wie Sportveranstaltungen, Museums- und Konzertbesuchen. Die analytische Güte von Antigen-Schnelltests variiert stark 41 42 . Im Praxiseinsatz liegt die Testgüte deutlich unter den Angaben der Hersteller 38 43 44 . In einer aktuellen, von Eurosurveillance durchgeführten Studie erreichen 26 von 122 untersuchten Antigen-Tests (21%) nicht die vom Paul-Ehrlich-Institut (PEI) geforderte Sensitivität von mindestens 75% 44 . Mit sinkender Viruslast der Proben verringert sich insbesondere die Sensitivität der Tests. Sensitivität und Spezifität von Antigen-Tests (Schnell- und Selbsttest) sind generell niedriger im Vergleich zu PCR-Tests 1 2 6 38 40 . Aufgrund falsch-positiver Ergebnisse – insbesondere bei geringer Vortestwahrscheinlichkeit – sollte ein positives Ergebnis beim Antigen-Test durch einen zweiten Test bestätigt werden 15 38 40 . Durch einen zweiten, genaueren PCR-Test lassen sich mögliche falsch-positive Ergebnisse abklären. Das Robert Koch-Institut (RKI) und das Bundesministerium für Gesundheit (BMG) empfehlen, ein positives Ergebnis im Antigen-Test grundsätzlich mittels PCR-Test abzuklären 6 40 . Das RKI empfiehlt, vor dem Einsatz von Antigen-Schnelltests die Möglichkeit falsch-positiver Fälle zu berücksichtigen, insbesondere bei geringer Vortestwahrscheinlichkeit 40 . Von einer massenhaften Testung von asymptomatischen Personen (mit häufig geringer Viruslast) rät das RKI aufgrund der niedrigen Testsensitivität und der dadurch unklaren Aussagekraft eines negativen Ergebnisses in der Regel ab 45 . Die Berechnungen in diesem Artikel unterstützen dieses Vorgehen, da eine geringe Prävalenz in der Testgruppe zu einer hohen Anzahl falsch-positiver Fälle führt.

Obwohl PCR-Tests generell eine bessere Testgüte als Antigen-Schnelltests haben, sind sie ebenfalls nicht 100% zuverlässig, vielfältige Fehler bei der Probenahme und -analyse sind möglich 14 46 . Die Richtigkeit des Testergebnisses ist abhängig vom eingesetzten PCR-Test (Firma), einer qualifizierten Probenahme, einer akkuraten Probenverarbeitung und qualitätsgestützter Analyse und insbesondere vom Testzeitpunkt, d. h. der Zeitspanne von der Infektion bis zur Testdurchführung 2 47 . Der zweite Test sollte eine hohe Sensitivität aufweisen, so können Infizierte richtig erkannt und falsch-negative Ergebnisse vermieden werden. Zur Vermeidung falsch-positiver Fälle ist eine hohe Spezifität ebenfalls empfehlenswert. PCR-Tests können durch die Analyse mehrerer Gen-Sequenzen („Dual-Target“-Methode 48 ) eine analytische Spezifität von 99,9% realisieren 39 . Eine analytische Sensitivität des PCR-Tests von 98,9–99,7% (getestet an verschieden konzentrierten SARS-CoV-2-Proben) und eine analytische Spezifität von 97,8–98,6% (getestet an Proben mit anderen humanen Corona-Viren und mit nicht infizierten Kontrollzellen [MRC-5-Zellen]) wurde in einem großen Ringversuch nachgewiesen 2 48 . Variationen der Testgüte in Abhängigkeit vom Labor und Testkit sind denkbar, diese bleiben möglicherweise unbekannt.

Auch bei PCR-Tests (wie im Antigen-Schnelltest!) kann sich die diagnostische Sensitivität deutlich von der analytischen Sensitivität unterscheiden. In Abhängigkeit vom Testzeitpunkt nach einer Infektion bzw. der Viruslast ermittelten Kucirka u. Mitarb. für die Sensitivität Werte zwischen 0% (95%-CI 0–0%) am 1. Tag, 33% am 4. Tag (95%-CI 6–73%) und 80% am 8. Tag (95%-CI 70–88%) der Ansteckung 47 . Ab dem 9. Tag sinkt die Sensitivität auf 34% am 21. Tag. Dies zeigt den starken Einfluss der Viruslast und des Zeitpunkts der Probennahme. In den ersten 7 Tagen nach Infektion (cave: Der genaue Infektionszeitpunkt ist häufig unbekannt!) ändert sich die Viruslast in den oberen Atemwegen sehr rasch, entsprechend auch die diagnostische Güte des Tests 40 .

Folgender Abschnitt berechnet verschiedene Szenarien mit einem Erst- und einem Zweittest, in Abhängigkeit von der Vortestwahrscheinlichkeit an SARS-CoV-2-Infektionen. Als Ersttest wird ein Antigen-Schnelltest und bei positivem Ergebnis (!) zur Abklärung ein PCR-Test als Zweittest eingesetzt.

Für den Antigen-Test (Ersttest) wird eine analytische Sensitivität von 91,4% und eine analytische Spezifität von 99,8% angenommen (Firma Abbot Rapid Diagnostics Jena GmbH, AT116/21 41 ). Bei Prävalenzen der zu testenden Gruppe von 0,05%/0,5%/1,0%/5,0% Infizierte ergeben sich bei N=100000 durchgeführten Tests 246, 656, 1112 und 4760 positive Fälle. Die Anzahl richtig-positiver Fälle nimmt mit zunehmender Prävalenz deutlich zu und beträgt N=46, 457, 914 und 4570 ( Tab. 7 ).

Tab. 7 Anzahl positiver und negativer Testergebnisse in Abhängigkeit von der Prävalenz, Anzahl Tests=100000.*

Sens Spez Präv Infiziert Tpos: RP Nicht infiziert Tpos: FP Anzahl positive Tests Nicht infiziert Tneg: RN Infiziert Tneg: FN Anzahl negative Tests Positiver Vorhersagewert Negativer Vorhersagewert
0,914 0,998 0,0005 46 200 246 99750 4,3 99754 18,6% 100,0%
0,914 0,998 0,005 457 199 656 99301 43 99344 69,7% 100,0%
0,914 0,998 0,010 914 198 1112 98802 86 98888 82,2% 99,9%
0,914 0,998 0,050 4570 190 4760 94810 430 95240 96,0% 99,5%

* Bemerkung: Sensitivität=91,4%, Spezifität=99,8%; N=100000 Tests; Ergebnisse teilweise gerundet; Sens: Sensitivität, Spez: Spezifität, Präv: Prävalenz, RP: richtig-positive Fälle, FP: falsch-positive Fälle, RN: richtig-negative Fälle, FN: falsch-negative Fälle

Die positive Vorhersagewahrscheinlichkeit steigt mit zunehmender Infektionsrate in der Testgruppe von 18,6% – d. h. weniger als jede 5. positiv getestete Person ist tatsächlich infiziert – auf 96,0% an ( Tab. 7 ). Die relativ hohe Fehlerquote im ersten Test mit zwischen 190 und 200 falsch-positiv getesteten Personen legt eine weitere Abklärung der positiven Ergebnisse durch einen zweiten Test nahe.

Die negative Vorhersagewahrscheinlichkeit bleibt nahezu konstant bei relativ hohen Werten zwischen 99,5% (Prävalenz 5,0%) und 100,0% (Prävalenz<0,5%). Mit zunehmender Häufigkeit an Infizierten steigt die Zahl der Fälle mit falsch-negativem Testergebnis und liegt bei einer Prävalenz von 5% und 100000 Tests bei 430 falsch-negativen Fällen, dies entspricht 4,3 ‰ ( Tab. 7 ). Da bei falsch-negativen Fällen – trotz negativen Testergebnisses – eine Infektion vorliegt, sollte bei einer hohen Infektionsrate in der Testgruppe die Sensitivität des Tests hoch sein.

Alle positiv getesteten Personen (richtig-positive und falsch-positive Fälle) werden im zweiten Durchgang zur Abklärung erneut getestet, mit einem PCR-Test. Die Anzahl durchzuführender Zweittests ist abhängig von der Prävalenz und beträgt 246, 656, 1112 und 4760. Die A-priori-Prävalenz vor Durchführung des zweiten Tests ergibt sich als Quotient aus richtig-positiven Fällen und der Gesamtzahl positiver Fälle im ersten Test, sie entspricht der positiven Vorhersagewahrscheinlichkeit 46/246=18,6%, 457/656=69,7%, 82,2% und 96,0%. Durch die gestiegene Vortestwahrscheinlichkeit im zweiten Test und die höhere Testgüte des PCR-Tests verbessert sich der positive Vorhersagewert ( Tab. 8 ).

Tab. 8 Abklärung positiver Testergebnisse mittels PCR-Test als Zweittest.*

Sens Spez Präv Anzahl Tests N Infiziert Tpos: RP Nicht infiziert Tpos: FP Anzahl positive Tests Tneg+nicht infiziert: RN Infiziert+Tneg: FN Anzahl negative Tests Positiver Vorhersagewert Negativer Vorhersagewert
0,990 0,999 0,186 246 45 0,2 45 200 0,5 200 99,6% 99,8%
0,990 0,999 0,697 656 452 0,2 453 199 4,6 203 100,0% 97,8%
0,990 0,999 0,822 1.112 905 0,2 905 198 9 207 100,0% 95,6%
0,990 0,999 0,960 4.760 4524 0,2 4524 190 46 236 100,0% 80,6%

* Bemerkung: Sensitivität=99,0%, Spezifität=99,9%; Ergebnisse teilweise gerundet; Sens: Sensitivität, Spez: Spezifität, Präv: Prävalenz, RP: richtig-positive Fälle, FP: falsch-positive Fälle, RN: richtig-negative Fälle, FN: falsch-negative Fälle

Fällt der Zweittest positiv aus , ist die Person sehr wahrscheinlich tatsächlich infiziert. Die positiven Vorhersagewerte liegen über 99% mit einer Spanne von 99,6–100,0%, in Abhängigkeit von der Prävalenz. Dieses begrüßenswerte Ergebnis kommt durch die relativ hohe Prävalenz an Infizierten beim zweiten Test zustande; mit einer Spanne zwischen 18,6 und 96,0% Infizierte.

Fällt der Zweittest negativ aus , ist die Wahrscheinlichkeit, nicht infiziert zu sein, ebenfalls hoch. Die negative Vorhersagewahrscheinlichkeit sinkt jedoch mit zunehmender Infektionsprävalenz von 99,8% (Prävalenz im Ersttest 0,05%) auf 80,6% (Prävalenz im Ersttest 5%). Die negative Vorhersagewahrscheinlichkeit liegt somit niedriger als im ersten Test, insbesondere bei hohen Infektionsraten. Zwischen 0,5 und 46 Fälle werden im zweiten Test negativ getestet, obwohl eine Infektion vorliegt. Nicht infizierte Personen mit falsch-positivem Ergebnis im ersten Test werden im zweiten Test zu fast 100% richtig-negativ getestet, dies aufgrund sehr hoher Spezifität des PCR-Tests. Die Abklärung falsch-positiver Fälle (im ersten Test) mit dem PCR-Test funktioniert also, Nicht-Infizierte bleiben vor weiteren Zwangsmaßnahmen verschont.

Bei zunehmender Prävalenz steigt jedoch die Anzahl falsch-negativer Fälle und die negative Vorhersagewahrscheinlichkeit sinkt, d. h. Quarantänemaßnahmen werden zu Unrecht aufgehoben. Deshalb sollten im zweiten Test negativ Getestete weiterhin vorsichtig sein und gängige Hygiene- und Schutzmaßnahmen beachten: Abstand halten, Hygiene beachten, im Alltag Maske tragen und regelmäßig Lüften (AHA+L-Regel). Gegebenenfalls kann ein dritter Test zur weiteren Abklärung durchgeführt werden, insbesondere bei einer hohen Infektionsrate in der Bevölkerung oder Risikogruppen.

Die Ergebnisse zeigen, dass die Genauigkeit bei Durchführung zweier diagnostischer Tests (1. Antigen-Schnelltest, 2. PCR-Test) deutlich verbessert wird. Fallen beide Tests positiv aus, dann ist die Person mit sehr hoher Wahrscheinlichkeit infiziert, nämlich über 99% auch bei einer ursprünglichen Prävalenz von 0,05%. Fallen hingegen der erste Test oder der zweite Test (nach positivem erstem Test) negativ aus, dann ist mit falsch-negativen Ergebnissen zu rechnen. Die Anzahl falsch-negativer Fälle steigt mit zunehmender Häufigkeit an Infizierten. Auch bei der Doppelteststrategie sind die 3 Grundkennwerte eines diagnostischen Tests Sensitivität, Spezifität und Prävalenz in der Praxis a-priori nicht exakt bekannt und müssen geschätzt werden.

Kernaussagen.

  • Für die richtige Interpretation der Ergebnisse diagnostischer Tests sind statistische Kenntnisse zu diesem komplexen Thema nötig.

  • Berechnung und Interpretation des Ergebnisses eines diagnostischen Tests mit binärem Testausgang (positiv oder negativ) ist von 3 Kennwerten abhängig: Sensitivität, Spezifität und Vortestwahrscheinlichkeit.

  • Bei Kenntnis der 3 Kennwerte kann die Anzahl richtig-positiver, falsch-positiver, richtig-negativer und falsch-negativer Fälle mit mathematischen Formeln exakt berechnet werden. Aus diesen 4 Parametern wird die positive und negative Vorhersagewahrscheinlichkeit berechnet.

  • Bei der Angabe der Testgüte wird zwischen analytischer und diagnostischer Testqualität unterscheiden.

  • Liegen die diagnostische Sensitivität oder diagnostische Spezifität unter 100%, dann treten Fehler bei der Interpretation diagnostischer Tests auf. Die Fehlerhaftigkeit diagnostischer Tests führt zu falsch-positiven und falsch-negativen Fällen und ist Grund für eine positive bzw. negative Vorhersagewahrscheinlichkeit ungleich 100 %.

  • Die Vortestwahrscheinlichkeit hat einen sehr starken Einfluss auf die Interpretation eines positiven oder negativen Testergebnisses.

  • Die 3 bekannten SARS-COV-2-Tests (PCR-Test, Antikörpertest und Antigen-Schnelltest) haben unterschiedliche Einsatzbereiche und diagnostische Kennwerte.

  • Die Richtigkeit des Testergebnisses ist von vielen Parametern abhängig, z. B. vom Wirkungsprinzip, der analytischen Güte der Tests, dem Zeitpunkt der Testung, der Viruslast, der Probennahme, der Probenweitergabe und der Qualität der Analyse.

  • Die Abklärung positiver Testergebnisse bei einem Antigen-Schnelltest als ersten Test durch einen PCR-Schnelltest als zweiten Test erhöht die Testgenauigkeit.

  • Die Strategie der Doppeltestung ist aus biometrischer und medizinischer Sicht sinnvoll und kann empfohlen werden.

Danksagung

Der Autor bedankt sich bei Frau Beate Feeser und Herr Dr. Klaus Freidel für die kollegiale Unterstützung, insbesondere beim Korrekturlesen des Manuskripts sowie für viele wertvolle Tipps und Anregungen.

Autorinnen/Autoren

Dr. rer. nat. Bernd Röhrig.

Dr. rer. nat. Bernd Röhrig

Dr. Bernd Röhrig ist Diplom-Physiker und arbeitet seit über 25 Jahren im Bereich medizinische Statistik/Biometrie. Er betreute mehrere medizinische und epidemiologische Studien. Aktuell arbeitet er beim Medizinischen Dienst Rheinland-Pfalz. Unter anderem erstellt er Qualitätsberichte für Einrichtungen und Krankenversicherungen. Dr. Röhrig engagiert sich für die Vermittlung statistischer Kenntnisse sowie die Förderung der Evidenz-basierten Medizin.

Footnotes

Interessenkonflikt Erklärung zu finanziellen Interessen Forschungsförderung erhalten: nein; Honorar/geldwerten. Vorteil für Referententätigkeit erhalten: nein; Bezahlter. Berater/interner Schulungsreferent/Gehaltsempfänger: nein; Patent/Geschäftsanteile/Aktien (Autor/Partner, Ehepartner, Kinder) an Firma (Nicht-Sponsor der Veranstaltung): nein; Patent/Geschäftsanteile/Aktien (Autor/Partner, Ehepartner, Kinder) an Firma (Sponsor der Veranstaltung): nein. Erklärung zu nicht finanziellen Interessen Die Autorinnen/Autoren geben an, dass kein Interessenkonflikt besteht.

Abkürzungen.

BMG Bundesministerium für Gesundheit

NAT Nukleinsäureamplifikationstechnik

PCR polymerase chain reaction

PEI Paul-Ehrlich-Institut

PoC Point of Care

RKI Robert Koch-Institut

RT-PCR

Reverse-Transkriptase-Polymerase-Kettenreaktion

Zusatzinfo.

Für die Sensitivität und Spezifität gilt:

  • Je höher die Sensitivität , desto höher die Anzahl richtig-positiver und desto niedriger die Anzahl falsch-negativer Testergebnisse.

  • Je höher die Spezifität , desto höher die Anzahl richtig-negativer und desto niedriger die Anzahl falsch-positiver Testergebnisse.

Brauchbare Diagnosetests haben möglichst hohe Werte für die Sensitivität und Spezifität; maximal sind 1,0 bzw. 100,0%.

Fazit.

Bei der Durchführung und Interpretation eines diagnostischen Tests gibt es Fehler, es treten falsch-positive und falsch-negative Ergebnisse auf. Absolute Sicherheit – also Gewissheit – gibt es nur bei einer Sensitivität und Spezifität von jeweils 100,0%. Positiv getestete Personen sind deshalb nicht automatisch infiziert (positiver Vorhersagewert) und negativ Getestete nicht automatisch nicht infiziert (negativer Vorhersagewert). Die beiden Wahrscheinlichkeiten positiver und negativer Vorhersagewert lassen sich bei Kenntnis der 3 Kennwerte Sensitivität und Spezifität als Güte eines diagnostischen Tests und Vortestwahrscheinlichkeit als A-priori-Wahrscheinlichkeit genau berechnen. Bei niedrigen Prävalenzen, also beim Testen von überwiegend nicht infizierten Personen, ist mit einer hohen Anzahl falscher positiver Ergebnisse zu rechnen, und zwar selbst bei einer hohen Spezifität des Tests. Die Durchführung eines zweiten Tests hilft, ein falsch-positives Testergebnis im ersten Test abzuklären.

Literatur


Articles from Gesundheitswesen (Bundesverband Der Arzte Des Offentlichen Gesundheitsdienstes (Germany) are provided here courtesy of Thieme Medical Publishers

RESOURCES