Skip to main content
Thieme Open Access logoLink to Thieme Open Access
. 2022 Nov 17;85(11):1047–1053. [Article in German] doi: 10.1055/a-1955-9986

Das Entscheidungsverhalten in Arztbewertungsportalen. Ergebnisse einer Vignettenstudie in den neuen Bundesländern

Decision-Making Behaviour in Physician-Rating Portals: Results of a Vignette Study in the New Federal States of Germany

Christine Schmidt 1, Melissa Suhr 1, Peter Kriwy 1,
PMCID: PMC11248190  PMID: 36395821

Abstract

Background The extent to which relevant information is taken into consideration in the decision process for or against the choice of certain physicians when searching for physicians via physician-rating portals is largely unknown. In particular, the question of whether longer travel distances to a doctor’s office are accepted in favour of a good rating is investigated in this study.

Methods In a vignette study, 192 respondents from new German states were shown ten hits each from a fictitious search for a primary care physician. A total of 1881 choice probabilities were evaluated with cluster-corrected regressions.

Results A good rating and a short distance to the doctor’s office were the most important determinants of a positive probability of choice. Longer distances were not accepted in favour of a good rating. Arabic-sounding names strongly reduced the probability of choice, although the respondents only assigned subordinate importance to the doctors’ names as a basis for decision-making.

Conclusion The area served by physicians in private practice does not increase if they receive good grades on rating portals. Service quality is important, but not the most important factor in the rating score.

Key words: physician rating portal, decision behaviour, factorial survey, physician searchonline publiziert 2022

Einleitung

In Europa suchen im Jahr 2020 in einem Zeitraum von drei Monaten 55% der Bevölkerung Gesundheitsinformationen online. Das sind 31% mehr als im Jahr 2010. In Deutschland liegt der Anteil der gesundheitsbezogenen Onlinesuche über dem europäischen Durchschnitt bei 70%. 1 . Bei der Arztauswahl spielen Suchdienste wie Google und Dienste der Ärztekammern für 45% der Bevölkerung in Deutschland eine wichtige Rolle; etwa 40% nutzen beispielsweise das Online-Portal Jameda 2 . Ebenfalls ca. 40% kennen keine Arztbewertungsportale 3 . Emmert et al. haben 29 Arztbewertungsportale identifiziert und näher analysiert 4 , wobei sich das Feld aktuell auf fünf bekannte Portale reduziert, u. a. Jameda, Die Arzt-Auskunft und Sanego 5 .

Im Zusammenhang mit der Frage wie Personen Ärztinnen und Ärzte suchen, können verschiedene Forschungsstränge unterschieden werden. Zur Analyse des Arztsuchverhaltens werden beispielsweise Logdaten der internetbasierten Recherchen zum Finden geeigneter Ärztinnen und Ärzte ausgewertet und häufige Suchwörter (z. B. Krebs, Schwangerschaft) analysiert 8 oder das Suchverhalten von Probanden wird im Labor beobachtet 9 . Über die Arztsuche allgemein ist bekannt, dass die Erreichbarkeit der Praxis, die fachliche Kompetenz der Ärztin oder des Arztes und die Terminverfügbarkeit zu den wichtigsten Informationen der Arztwahl gehören 3 . Zum spezifischen Entscheidungsverhalten auf Arztbewertungsportalen liegt bereits ein überschaubarer Stand der Forschung vor. Die Suche nach einem Zahnarzt nach einem Umzug wurde beispielsweise mit simulierten Ergebnissen einer Arztsuche via Bewertungsportal sowohl in 2014 10 als auch von einem anderen Team in 2017 11 untersucht. In beiden Studien wurden als zentrales Element die Note und die Anzahl an Bewertungen variiert.

Unser Forschungsprojekt erweitert die bisherigen Ansätze zu den Effekten von Durchschnittsnote und Anzahl an Bewertungen. Neben diesen Signalen 12 , die Vertrauen in anonymen Märkten stiften sollen 13 , erweitern wir die Bewertungsdimensionen um realitätsnähere Entscheidungssituationen zu untersuchen. Zunächst nehmen wir die Entfernung zum Arzt als Kostenfaktor mit auf, der die Nachfrage 14 beeinflussen soll. In der Literatur zu Online-Märkten wird auch diskutiert, ob Nachteile auf der einen Dimension durch besondere Vorteile auf einer anderen Dimension kompensiert werden können 15 . Übertragen auf die Arztsuche via Arztbewertungsportal untersuchen wir dementsprechend, ob zugunsten einer guten Note von den Probanden längere Anfahrtswege in Kauf genommen werden würden. Zudem variieren wir die Herkunft der Ärzte, um „tastes for discrimination“ 16 im Zusammenhang mit ethnischer Diskriminierung von Ärzten 17 18 zu untersuchen. Hierfür werden häufige deutsche und arabische Namen in den Suchtreffern verwendet. Zudem werden Zusatzinformationen (z. B. „kurzfristige Termine möglich“, „nimmt sich viel Zeit und hört gut zu“), Geschlecht und Doktortitel variiert, um den Probanden eine umfangreiche Entscheidungsgrundlage zu bieten.

Im Rahmen einer Vignettenstudie wurden konkrete Treffer einer hypothetischen Suche nach Hausärztinnen und Hausärzten simuliert, die randomisierte Zusammenstellungen von Informationen zu den jeweiligen Ärztinnen und Ärzten enthalten. Die Treffer der hypothetischen Suche wurden bezogen auf das Layout und Design am optischen Erscheinungsbild real existierender Arztbewertungsportale aufbereitet, ohne eine bestimmte Plattform explizit zu kopieren.

Zu einem Treffer der simulierten Arztsuche haben die Befragten auf einer elfstufigen Skala von 0 bis 100% angegeben, ob sie die Ärztin oder den Arzt besuchen möchten oder nicht. Methodik und Ergebnisse dieser Vignettenstudie werden im Folgenden berichtet.

Methodik

Peter Rossi gilt als Erfinder der Vignettenanalyse 17 , die oftmals auch als Faktorieller Survey bezeichnet wird. In den Sozialwissenschaften hat sich das Verfahren mittlerweile gut etabliert 20 . Bei Vignettenstudien werden den Befragten multidimensionale Situationsbeschreibungen vorgelegt, die als Ganzes von den Befragten beurteilt werden. Die Variation der Ausprägungen der Dimensionen erfolgt dabei zufällig, sodass auf diese Weise die experimentelle Logik in die konventionelle Umfrageforschung integriert wird 21 . Methodische Grundlagenforschung nimmt dabei die Anzahl von Vignetten pro befragte Person, die Anzahl von Dimensionen pro Vignette und die Vorgehensweise bei der Erstellung von Vignetten in den Fokus 21 22 . Auch in den Gesundheitswissenschaften kommt das Verfahren zunehmend zum Einsatz 23 , beispielsweise werden Präferenzen von Männern bei bewegungsfördernden Interventionen 24 , das Vertrauen in Ärztinnen und Ärzte nach Nationalität, Geschlecht und Alter 25 und die Nutzung von Handdesinfektionsmitteln beim Pflegepersonal 26 mit diesem Forschungsansatz untersucht. Eine wesentliche Stärke der Vignettenanalyse ist das reduzierte Antwortverhalten im Sinne sozialer Erwünschtheit. Da mehrere Stimuli gleichzeitig präsentiert werden, ist es den Befragten oftmals nicht bewusst, dass sie entlang einer bestimmten Dimension diskriminieren und auf diese Weise kommen i. d. R. ehrlichere Antworten zustande, als es bei der isolierten Abfrage einzelner Items der Fall wäre. Da das Zufallselement bereits im Fragebogen enthalten ist, kann überwiegend auf eine Zufallsauswahl der Befragten verzichtet werden 22 , was die Erhebungssituation bei Vignettenanalysen meist deutlich erleichtert.

Im folgenden Schritt werden die Operationalisierungen der Konzepte und die Erstellung des Erhebungsinstruments erläutert. Für die Vignetten wurden sieben Dimensionen ausgewählt (siehe Tab. 1 ). Geschlecht, akademischer Titel und Migrationshintergrund haben dabei je zwei Ausprägungen. Der Migrationshintergrund wurde durch die Verwendung offensichtlich deutsch klingender Namen (z. B. Susanne Schulz, Jörg Müller, Stefan Fischer) und arabisch klingender Namen (z. B. Hasan Zorgani, Raifa Gomaa, Hossain Alsaad) signalisiert. Die Vornamen der fiktiven Ärzte basieren auf je fünf der häufigsten deutschen weiblichen und männlichen Vornamen jener Generation, die derzeit der arbeitsfähigen Altersgruppe angehört, sowie den jeweils fünf häufigsten weiblichen und männlichen arabischen Vornamen 27 . Bei den deutschen Nachnamen handelt es sich um die zehn häufigsten deutschen Nachnamen 28 . Zur Ermittlung der arabischen Nachnamen sind die im Frühling 2018 an Universität XY (Name für die Begutachtung anonymisiert) immatrikulierten arabischen Studierenden ermittelt und die zehn am häufigsten vorkommenden Nachnamen ausgewählt worden. (Das Prüfungsamt hat dies im Jahr 2018 durchgeführt und ausschließlich die Nachnamen ohne weitere personenbezogene Informationen übermittelt.) Da bei den nicht deutsch klingenden Namen zuweilen das Geschlecht nicht offensichtlich ist, enthält eine visualisierte Vignette zusätzlich die Information „Ärztin“ oder „Arzt“ (siehe Abb. 1 ).

Tab. 1 Dimensionen und Ausprägungen.

Dimensionen Ausprägungen
Geschlecht Frau
Mann
Akademischer Titel Dr. med.
Dipl.-Med.
Entfernung 2 km
4 km
8 km
Note 1,1
1,6
2,2
Anzahl der Bewertungen 8
16
35
Zusatzinformationen Gute Parkplatzsituation und Erreichbarkeit mit öffentlichen Verkehrsmitteln
Nimmt sich viel Zeit und hört gut zu
Gute telefonische Erreichbarkeit
Kurzfristige Termine möglich
Migrationshintergrund keiner
arabisch

Quelle: Eigene Darstellung.

Abb. 1.

Abb. 1

Zwei Beispielvignetten (Quelle: eigener Fragebogen).

Die Dimensionen Entfernung in Kilometer, Note der durchschnittlichen Bewertung und Anzahl der Bewertungen hat jeweils drei Ausprägungen. Nur die Dimension der Zusatzinformation hat vier Ausprägungen: (1) Gute Parkplatzsituation und Erreichbarkeit mit öffentlichen Verkehrsmitteln, (2) Nimmt sich viel Zeit und hört gut zu, (3) Gute telefonische Erreichbarkeit, (4) Kurzfristige Termine möglich. Bei der Auswahl der Zusatzinformationen war eine Studie zu Arztbewertungen wegweisend 29 . Aus der Multiplikation der Ausprägungen der Dimensionen ergibt sich ein Vignettenuniversum von 2×2 x 3×3 x 3×4 x 2=864 maximal möglichen Variationen von Vignetten.

Da nicht alle theoretisch möglichen Kombinationen im Erhebungsinstrument berücksichtigt werden können, wurde eine Zufallsauswahl von 140 Vignetten gezogen und auf 14 Fragebogensets verteilt. Lediglich Auffälligkeiten in der Reihenfolge der Vignetten innerhalb eines Sets wurden manuell korrigiert (z. B. wenn drei Vignetten zu einer Ärztin hintereinander platziert wurden). Da sich durch die Anpassung der Reihenfolge der Vignetten innerhalb eines Sets die Zusammenstellung der Ausprägungen innerhalb der Vignetten und die Auswahl der Vignetten eines Sets an sich nicht ändern, ist dieser Eingriff problemlos möglich. Auf Vignettenebene liegt keine Multikollinearität vor (Mean VIF=1,02).

Die Datenerhebung erfolgte via selbst administriertem Fragebogen auf Papier. Die Personenrekrutierung erfolgte dabei in einem zweistufigen Verfahren. In der ersten Stufe konnten innerhalb von vier Monaten im Jahr 2018 durch das Chain-Referral-Sampling 148 Fragebögen (Responsequote 86%) in die Datenanalyse eingebracht werden. Dafür hatten fünf Personen des Projektteams insgesamt 172 Fragebögen in ihrem privaten Umfeld verteilt. Eine Kontaktperson hat bis zu 3 Fragebögen erhalten (einen für sich selbst und zwei für weitere Personen des eigenen Netzwerkes). Bei der Auswahl der Kontaktpersonen wurde auf maximale Heterogenität geachtet, z. B. dass aus einer Sportgruppe nur maximal zwei unterschiedliche Personen ausgewählt wurden, z. B. ein jüngerer Mann und eine ältere Frau und nicht die ganze Gruppe. So wurde sichergestellt, dass ca. 57 heterogene Kontaktpersonen Fragebögen erhalten haben. Ob das weitere Verteilen der Kontaktpersonen ebenfalls nach Heterogenitätsaspekten durchgeführt wurde, so wie es ihnen von den Mitarbeiterinnen oder Mitarbeitern des Projekts erklärt wurde, kann nicht überprüft werden. Selbst wenn sich hier eine „Mini-Clusterung“ aufgrund von Ähnlichkeit z. B. unter Freunden oder Ehepartnerinnen und Ehepartnern ergeben haben sollte, dann scheint dies dennoch weitgehend unbedenklich, da selbstverständlich unterschiedliche Fragebogensets je Kontaktperson verteilt wurden. Auf diese Weise haben Befragte aus den Bundesländern Sachsen, Berlin und Brandenburg an der Befragung teilgenommen. Auffällig selten vertreten waren nach diesem ersten Erhebungsschritt Personen mit einem schlechten Gesundheitszustand und Personen mit Migrationshintergrund. In einem zweiten Schritt wurde deshalb nachrekrutiert. In Chemnitz wurde über eine zentral gelegene Apotheke, eine Allgemeinärztin und über eine Sprachmittler-Plattform weitere Fragebögen verteilt, die via frankiertem Rückumschlag retourniert wurden. Auf diese Weise konnten weitere 23 Personen mit schlechtem Gesundheitszustand und 21 Personen mit Migrationshintergrund bzw. Migranten befragt werden. Insgesamt wurden für die Vignettenstudie 192 Personen befragt. Sets wurden im geringsten Fall 12-mal (Set 6, 7, 10, 12, 13, 14) und im höchsten Fall 17-mal ausgefüllt (Set 2 und 11). Die anderen Sets liegen mit je 13 bis 15-mal dazwischen. Damit sind alle Sets in etwa ähnlich häufig von Befragten ausgefüllt worden.

Aufgrund der Strategie der heterogenen Verteilung der Fragebögen konnte ein hochgebildetes Convenience-Sample vermieden werden. 44% der Befragten haben einen Hauptschulabschluss, einen Abschluss der polytechnischen Oberschule oder einen Realschulabschluss. Wenn Schul- und Ausbildungsjahre (incl. universitäre Ausbildung) addiert werden, so liegen bei den Befragten durchschnittlich 13,8 Bildungsjahre vor (bei einer Standardabweichung von 2,5). Auch die Verteilung nach Geschlecht ist mit 46% Männeranteil relativ ausgeglichen (siehe Tab. 2 ). Drei befragte Personen haben die dritte Geschlechtskategorie außerhalb von Mann und Frau gewählt. Damit diese drei Fälle nicht als Missing fungieren, wurden sie mit dem Wert 0,5 codiert. Das ist selbstverständlich eine gewagte Kodierung, da damit unterstellt wird, dass die Nichtzuordnung zu Frau und Mann etwas Dazwischenliegendes bedeutet. Da es sich jedoch statistisch gesehen um ein in den vorliegenden Daten auf Befragtenebene seltenes Ereignis handelt, ist diese vermeintliche Unschärfe vermutlich dennoch besser für die Analysequalität, als auf 30 beantwortete Vignetten in den Berechnungen zu verzichten.

Tab. 2 Beschreibung des Befragten-Samples.

Variable N Mean Std. Dev. Min Max
Alter 192 43,33 15,13 19 85
Bildungsjahre 192 13,79  2,52  9 16,5
Geschlecht (Mann=1, divers=0,5) 192  0,46  0,49  0  1
Technik-Affinität 192  0,45  0,20  0  1
Pos. Erfahrung mit Portalen (=1) 192  0,30  0,46  0  1
Eigener Umzug (50 km+=1) 192  0,15  0,36  0  1

Hinweis: Technik-Affinität ist eine additiv verknüpfte Messung mit vielen Ausprägungen von 0 bis 1 Quelle: Eigene Daten, eigene Berechnung.

Jede Vignette wurde im Fragebogen mit einer 11-stufigen Ratingskala beantwortet, mit der die Befragten die Wahrscheinlichkeit angaben, mit der die dargestellte Ärztin bzw. der Arzt gewählt werden würde. Die Ausprägungen 1 bis 11 wurden anschließend auf die Werte 0 bis 100 recodiert, damit die Koeffizienten der Regressionen als Prozenteffekte interpretiert werden können. Diese Recodierung entspricht einer linearen Transformation, die beim vorliegenden Skalenniveau problemlos möglich ist, da die 11 Ausprägungen im Fragebogen als gleicherscheinende Intervalle präsentiert und entsprechend beschriftet waren (siehe Abb. 1 ). Die resultierende Verteilung der durchschnittlichen Wahlwahrscheinlichkeit aller Ärztinnen und Ärzte weist ein arithmetisches Mittel von 65,1% auf. Die Verteilung ist dabei nur sehr geringfügig linksschief (Skewness −0,77) und die Wölbung entspricht voll der einer Normalverteilung, da die Kurtosis mit 2,94 quasi nicht vom Normwert 3 abweicht. Somit sind lineare Regressionen zulässig 30 . Da aufgrund des Vignettendesigns die Unabhängigkeitsannahme der Elemente auf Vignettenebene verletzt ist (eine befragte Person beantwortet 10 Vignetten), wird eine clusterkorrigierte Regression durchgeführt, wobei eine befragte Person einen Cluster bildet 20 . Damit die Konstante der Regressionen einen sinnvollen Wert annimmt, werden alle metrischen und dichotomen unabhängigen Variablen zentriert. Damit auch die eingangs aufgeworfene Teil-Fragestellung, ob zugunsten einer guten Note auch längere Anfahrtswege in Kauf genommen werden, analysiert werden kann, wird ein Interaktionsterm aus guter Note und Entfernung zur Arztpraxis in km gebildet.

Nach der Beantwortung der Vignetten wurden die Befragten noch gebeten anzugeben, welche Arztinformationen für Einstellungsbildung besonders wichtig waren. Die sieben variierten Dimensionen (Geschlecht, akademischer Titel etc.) der Arztbeschreibungen wurden aufgeführt und maximal drei davon konnten gewählt werden.

Ergebnisse

Die Ergebnisse werden in zwei Schritten präsentiert. Der erste Schritt sind die Ergebnisse der Regressionsanalysen, die über drei Modelle aufbereitet werden. Modell 1 enthält nur die Vignettenvariablen. In Modell 2 werden zusätzlich Befragten-Variablen kontrolliert und in Modell 3 wird der Vignetten-Interaktionsterm aus guter Note und Anfahrtsweg integriert. Anschließend wird in einem zweiten Schritt die subjektiv eingeschätzte Wichtigkeit der Bewertungsdimensionen mit den Regressionsergebnissen verglichen.

In Tab. 3 sind die Regressionsergebnisse dargestellt. Bezogen auf die Personenmerkmale der Ärztinnen und Ärzte zeigt sich, dass weder das Geschlecht noch der akademische Titel einen statistisch signifikanten Effekt auf die Wahlwahrscheinlichkeit ausüben. Die Entfernung spielt eine statistisch signifikante Rolle. Pro Kilometer längerer Anfahrt sinkt die Wahlwahrscheinlichkeit um 2% (T-Werte −6,45 bis −7,40). Einen ähnlich starken Effekt hat die gezeigte Note der Ärztinnen und Ärzte. Wenn sich die Note um eine Einheit erhöht (z. B. von 1 auf 2), dann sinkt die Wahlwahrscheinlichkeit um ca. 12% (T-Werte −5,97 bis −8,79). Einen etwas schwächeren, aber dennoch auf dem 5%-Niveau statistisch signifikanten Effekt hat die Anzahl der Bewertungen. Zehn Bewertungen mehr bewirken eine Steigerung der Wahlwahrscheinlichkeit um ca. 1% (T-Werte 2,35 bis 2,51). Bei den Zusatzinformationen zur Arztpraxis wurde die Parkplatzsituation als Referenzkategorie gewählt. Im Vergleich zu dieser Referenzkategorie hat die Information, dass die Ärztin oder der Arzt sich viel Zeit für Patientinnen oder Patienten nimmt, einen höchst signifikanten Effekt (T-Wert 4,37 bis 4,45) und erhöht die Wahlwahrscheinlichkeit um ca. 6%. Die Angabe, dass die Praxis auch kurzfristige Termine vergibt, erhöht die Wahlwahrscheinlichkeit im Vergleich etwas schwächer, aber dennoch signifikant auf dem 5%-Niveau um ca. 3%. Gute telefonische Erreichbarkeit hat keinen Einfluss auf die Wahlwahrscheinlichkeit der Ärztinnen und Ärzte.

Tab. 3 OLS Regression (AV: Wahlwahrscheinlichkeit der Ärztin/des Arztes in Prozent, clusterkorrigiert).

Modell 1 Vignetten Modell 2 Vignetten+Befragte Modell 3 Vignetten incl. Interaktion+Befragte
Reg.-Koeff. T-Wert Reg.-Koeff. T-Wert Reg.-Koeff. T-Wert
Vignetten-Variablen:
Ärztin 1,65 1,51 1,65 1,52 1,73 1,58
Dr. Med. a) -1,53 -1,44 -1,56 -1,46 -1,56 -1,46
Entfernung in km -2,04*** -7,40 -2,04*** -7,38 -2,30*** -6,45
Note -12,51*** -8,64 -12,61*** -8,79 -11,20*** -5,97
Gute Note * Entfernung 1,14* 2,35 2,46 1,00
Anzahl Bewertungen/10 6,37*** 4,45 1,20* 4,40 0,34 2,51
nimmt sich viel Zeit b) -1,34 -0,97 6,30*** -1,01 1,23* 4,37
Gute telef. Erreichbarkeit b) 3,24* 2,44 -1,41 2,35 6,25*** -1,04
-9,80*** -7,11 3,09* -7,09 -1,45 2,23
Kurzfristige Termine a) -9,84*** 2,97* -6,96
Arabisch klingender Name -9,72***
Befragten-Variablen:
Alter (10 Jahre) -2,54** -3,34 -2,54** -3,34
Mann -4,98 -1,86 -4,98 -1,85
Bildungsjahre 0,14 0,28 0,14 0,28
Technikaffinität 2,94 0,44 3,01 0,45
Pos. Portalerfahrung -0,95 -0,36 -0,95 -0,34
Umzug (50 km+) 1,38 0,47 1,42 0,48
Konstante 63,07*** 43,02 63,10*** 44,71 63,15*** 44,50
R2 0,15 0,18 0,18
p 0,00*** 0,00*** 0,00***
N (Vignetten) 1881 1881 1881
N (Personen) 192 192 192

*p<.05; **p<.01; ***p<.001; Hinweis: Referenz zu a) Dipl-Med., b) gute Parkplatzsituation; Quelle: Eigene Daten, eigene Berechnung.

Die Interaktion aus guter Note und Entfernung hat keinen signifikanten Effekt auf die Wahlwahrscheinlichkeit der Ärztinnen und Ärzte. Demnach wird zugunsten einer guten Note kein längerer Anfahrtsweg in Kauf genommen.

Wenn Ärztinnen oder Ärzte mit einem arabisch klingenden Namen in den Vignetten präsentiert wurden, dann verringert sich die Wahlwahrscheinlichkeit um fast 10% (T-Werte 6,96 bis −7,11).

Befragtenmerkmale spielen bei der Entscheidung für eine bestimmte Wahlwahrscheinlichkeit kaum eine Rolle. Lediglich das Alter der Befragten ist statistisch hoch signifikant dahingehend, dass um zehn Jahre ältere Befragte, eine um fast 3% geringere allgemeine Wahlwahrscheinlichkeit aufzeigen. Das bedeutet ältere Befragte geben allgemein geringere Wahrscheinlichkeiten an, völlig unabhängig von den Merkmalen der Ärztinnen und Ärzte oder den Besonderheiten der Arztpraxen. Alle weiteren berücksichtigten Kontrollvariablen: Geschlecht, Bildung, Technikaffinität, eigene positive Portalerfahrung und ein eigener Umzug über eine längere Strecke (mehr als 50 km) haben keinen Einfluss auf die Wahlwahrscheinlichkeit der in den Vignetten beschriebenen Ärztinnen und Ärzte.

Im zweiten Analyseschritt wird die subjektive Wichtigkeit der variierten Vignettendimensionen ausgewertet. Hierzu konnten die Befragten im Anschluss an die Beantwortung der Vignetten aus der Liste der sieben Dimensionen bis zu drei auswählen, die für ihre Einstellungsfindung am wichtigsten waren. Zu 75% bzw. 70% werden hierbei die Note und die Entfernung in Kilometern angegeben. Zu etwa 50% nennen die Befragten die Zusatzinformationen und die Anzahl an Bewertungen. Der arabisch oder deutsch klingende Name wird zu 18% genannt. Der akademische Titel sowie das Geschlecht der Ärztinnen und Ärzte werden zu ca. 10% genannt (siehe Tab. 4 ).

Tab. 4 Ergebnisse: Subjektive Wichtigkeit der einzelnen Vignettendimensionen.

Variable N Mean Std. Dev. Min Max
Note 190 0,75 0,42 0 1
Entfernung 190 0,70 0,45 0 1
Zusatzinformationen 190 0,53 0,49 0 1
Anzahl der Bewertungen 190 0,49 0,50 0 1
Arabischer oder deutscher Name 190 0,18 0,38 0 1
Akademischer Titel 190 0,10 0,30 0 1
Geschlecht 190 0,08 0,28 0 1

Hinweis: Befragte Personen konnten bis zu drei Aspekte wählen; Quelle: Eigene Daten, eigene Berechnung.

Zusammenfassung und Diskussion

Für die vorliegende Vignettenstudie wurde die Arztsuche über ein Arztbewertungsportal simuliert und dabei das Erscheinungsbild der fiktiven Suchergebnisse mit optischer Ähnlichkeit zu real existierenden Plattformen umgesetzt. Insgesamt haben 192 befragte Personen 1881 Vignetten beurteilt und entsprechende Wahlwahrscheinlichkeiten zu fiktiven Ärztinnen und Ärzten angegeben. Eine gute Note und eine geringe Entfernung zur Praxis haben den stärksten Effekt auf eine positive Wahlwahrscheinlichkeit. Die Interaktion aus guter Note und Entfernung ist jedoch statistisch nicht signifikant. Zugunsten einer guten Note nehmen die Befragten demnach keine längeren Anfahrtswege zu Ärztinnen und Ärzten in Kauf. Die Anzahl der Bewertungen ist zwar statistisch signifikant, der Einfluss fällt jedoch im Vergleich zu Note und Entfernung deutlich schwächer aus. Ein nicht deutsch klingender Name verringert die Wahlwahrscheinlichkeit von Ärztinnen und Ärzten in etwa genauso stark wie die Verschlechterung einer Note um eine Einheit (z. B. von Note 1,2 auf Note 2,2). Merkmale der Befragten selbst spielen eine untergeordnete Rolle. Lediglich steigendes Alter der Befragten geht mit einer verringerten Wahlwahrscheinlichkeit einher. Bildung, Technikaffinität und eigene Umzugserfahrungen haben keinen Einfluss auf die Einschätzung der simulierten Treffer einer Arztsuche.

Vignettenanalysen können das Antwortverhalten im Sinne sozialer Erwünschtheit abfedern. Indizien sprechen dafür, dass dies hier speziell beim Effekt des nicht deutsch klingenden Namens vorliegt. Der Effekt des arabisch klingenden Namens gehört einerseits zu den drei stärksten Vignetteneffekten, andererseits wird in der anschließenden Abfrage der subjektiven Wichtigkeit der Entscheidungsdimensionen der Name der Ärztinnen und Ärzte „nur“ zu 18% von den befragten Personen genannt. Zusatzinformationen (wie z. B. kurzfristige Termine) und die Anzahl der Bewertungen werden dagegen bei der Angabe ihrer subjektiven Wichtigkeit zu ca. 50% von den Befragten genannt, obwohl ihre Effekte in den Vignettenergebnissen im Vergleich zu dem Einfluss des nicht deutsch klingenden Namens offensichtlich schwächer ausfallen.

Abweichungen der vorliegenden Resultate zur internationalen Forschung sind bezüglich der Anzahl der Bewertungen pro Ärztin oder Arzt festzustellen. In einer NRC-Health Studie wurde für den US-amerikanischen Raum festgestellt, dass es einen deutlichen Schwellenwert von mindestens sieben Bewertungen gibt, ab dem eine Vertrauensvergabe erfolgt 31 . Mit den vorliegenden Resultaten der Vignettenstudie kann ein möglicher Schwellenwert der Anzahl von Bewertungen zwar nicht untersucht werden, jedoch fällt der durchschnittliche Effekt der Anzahl von Bewertungen vergleichsweise schwach aus.

Die interne Validität der Befragungsergebnisse scheint in Anbetracht der diskriminierenden Effekte der Vignettendimensionen hoch zu sein. Aus Expertensicht könnte jedoch die Kombination „Dipl.-Med.“ und „arabischer Name“ unrealistisch wirken, da der Abschluss „Dipl.-Med.“ nach der Wende nicht mehr vergeben wurde. Die Befragten haben sich davon jedoch entweder nicht beeindrucken lassen, oder es ist ihnen schlichtweg als wenig plausible Kombination nicht aufgefallen. Dafür spricht die Verteilung der befragtenspezifischen Residuen, die für die Kombinationen „Dr. med. mit arabischem Namen“ und „Dipl.-Med. mit arabischem Namen“ vergleichbar ausfällt. Die Qualität der externen Validität wird ebenfalls diskutiert. Einerseits spricht die optische Aufbereitung der hypothetischen Treffer einer Arztsuche für eine relativ realitätsnahe Entscheidungssituation. Die Realitätsnähe stößt jedoch an ihre Grenzen, wenn der Medienbruch der Befragungssituation betrachtet wird. Obwohl ein maximal realitätsnahes Layout angestrebt wurde (siehe Abb. 1 ), ist dennoch mit Künstlichkeit der Situation zu rechnen, da eine reale Online-Arztsuche nicht auf Papier beurteilt wird. Im Fragebogen werden randomisierte Treffer präsentiert und jeder Treffer wurde von den Befragten sequentiell beurteilt. In realen Suchsituationen erhalten die Suchenden eine Liste an Treffern, die vermutlich zuerst nach der subjektiv wichtigsten Dimension sortiert wird, z. B. nach der Note oder der Anzahl der Bewertungen. Wenn alle gefundenen Ärztinnen und Ärzte der gewünschten Fachrichtung nach dem bevorzugten Kriterium sortiert auf dem Bildschirm sichtbar sind, ist davon auszugehen, dass auch weitere Entscheidungsdimensionen ins Kalkül gezogen werden. Dabei ist zu vermuten, dass in realen Entscheidungssituationen nicht die gesamte Liste an Treffern von suchenden Personen eingeschätzt werden würde, sondern nur die obersten Treffer. Wie viele das in der Realität dann sein könnten, kann derzeit aufgrund des Forschungsstandes nicht eingeschätzt werden. Ein weiterer Aspekt in der Diskussion um die externe Validität ist die Dringlichkeit des Bedarfs eine neue Ärztin oder einen neuen Arzt zu besuchen. In der vorliegenden Studie haben wir eine Hausarztsuche ohne akuten Bedarf simuliert. Angenommen man würde mit derzeit starken Schmerzen schnell einen bestimmten Arzt benötigen, so könnten Aspekte wie die Note oder die Anzahl der Bewertungen in den Hintergrund treten und ausschließlich eine schnelle Terminvergabe dominieren. Wir haben diese Dringlichkeit versucht mit unseren Daten ex post zu generieren, indem wir zusätzlich Suchstrategien von kranken mit gesunden Personen verglichen haben: Es zeigen sich jedoch keine Unterschiede in den Strategien bei der Hausarztsuche. Wobei eine schlechte subjektive Gesundheit auch nicht mit akuten Schmerzen gleichzusetzen ist. Diesbezüglich könnten weitere (Vignetten-) Studien akute Schmerzen und die Nutzung von Arztbewertungsportalen aufgreifen. Zukünftige Forschung könnte zudem gefälschte Bewertungen 6 und Selbstselektion zum Verfassen von Bewertungen thematisieren. Auch könnte die Künstlichkeit der Situation durch vorgegebene unsortierte Listen zu beurteilender Treffer mit Laborexperimenten abgefedert werden. Wenn Probanden am PC im Labor Arztbewertungsportale nutzen, so unterscheidet es sich vermutlich nur wenig zu einer realen Arztsuche am Rechner in den eigenen vier Wänden. Es bestünde zudem die Möglichkeit, im Labor auch mit Eye-Tracking-Verfahren zu arbeiten, um den Prozess der Informationssammlung und die resultierende Herausbildung von Präferenzen für bestimmte Ärztinnen und Ärzte noch differenzierter zu untersuchen. Eventuell können in diesem Zusammenhang auch Schwellenwert-Effekte der Anzahl von Bewertungen für den deutschsprachigen Raum nachgewiesen werden.

Einhaltung ethischer Richtlinien

Die Vorgehensweise der Datenerhebung erfolgte im Einklang mit den Ethikvorgaben der Deutschen Gesellschaft für Soziologie.

Footnotes

Interessenkonflikt Die Autorinnen und der Autor geben an, dass kein Interessenkonflikt besteht.

Literatur

  • 1.Eurostat . One in two EU citizens look for health information online. Online: https://ec.europa.eu/eurostat/en/web/products-eurostat-news/-/edn-20210406-1;letzter Zugriff: 17.05.2022
  • 2.Urbanek M. Worauf es für Praxen online ankommt. Uro-News. 2021;25:49. [Google Scholar]
  • 3.Albrecht M, Heiden I an der, Bock H. Transparenz in der vertragsärztlichen Versorgung. Online:https://www.iges.com/sites/igesgroup/iges.de/myzms/content/e6/e1621/e10211/e26312/e26734/e26735/e26737/attr_objs26740/IGES_Studie_Transparenz_ambulante_Versorgung_2021_ger.pdf;letzter Zugriff: 17.05.2022
  • 4.Emmert M, Meszmer N. Eine Dekade Arztbewertungsportale in Deutschland. Eine Zwischenbilanz zum aktuellen Entwicklungsstand. Gesundheitswesen. 2018;80:851–858. doi: 10.1055/s-0043-114002. [DOI] [PubMed] [Google Scholar]
  • 5.Löw O Welche Arzt-Bewertungsportale sollten Ärzte im Blick behalten? Online: https://www.docrelations.de/arzt-bewertungsportale-im-vergleich/; letzter Zugriff: 17.05.2022o
  • 6.Grundhöfer H, Dreuw C, Quint N 2017.
  • 7.Patel S, Cain R, Neailey K et al. Public awareness, usage, and predictors for the use of doctor rating websites. Cross-sectional study in England. J Med Internet Res. 2018;20:e9523. doi: 10.2196/jmir.9523. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 8.Choudhury M de, Ringel Morris M, White RHrsg. Seeking and sharing health information online. Comparing search engines and social media 2014
  • 9.Sander U, Emmert M, Grobe T G. Effektivität und Effizienz der Arztsuche mit Arztsuch- und Bewertungsportalen und Google. Gesundheitswesen. 2013;75:397–399. doi: 10.1055/s-0032-1321762. [DOI] [PubMed] [Google Scholar]
  • 10.Grabner-Kräuter S, Waiguny MK J. Insights into the impact of online physician reviews on patients’ decision making: randomized experiment. J Med Internet Res. 2015;17:e3991. doi: 10.2196/jmir.3991. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 11.Link E, Schmotz E, Baumann E.Durch Online-Portale ins Wartezimmer? Wie Arztbewertungsportale die Arztwahl beeinflussen. In: Kalch A, Wagner A, Hrsg. Gesundheitskommunikation und Digitalisierung Nomos Verlagsgesellschaft mbH & Co; KG202073–88. [Google Scholar]
  • 12.Spence M. Competitive and optimal responses to signals: An analysis of efficiency and distribution. Journal of Economic theory. 1974;7:296–332. [Google Scholar]
  • 13.Diekmann A, Jann B, Przepiorka W et al. Reputation formation and the evolution of cooperation in anonymous online markets. American sociological review. 2014;79:65–85. [Google Scholar]
  • 14.Phaneuf D J, Smith V K. Recreation demand models. Handbook of environmental economics. 2005;2:671–761. [Google Scholar]
  • 15.Kacen J J, Hess J D, Chiang W K. Bricks or clicks? Consumer attitudes toward traditional stores and online stores. Global Economics and Management Review. 2013;18:12–21. [Google Scholar]
  • 16.Becker G S. University of Chicago press; 2010. The economics of discrimination. [Google Scholar]
  • 17.Chen F M, Fryer G E, Phillips R L et al. Patients’ beliefs about racism, preferences for physician race, and satisfaction with care. The Annals of Family Medicine. 2005;3:138–143. doi: 10.1370/afm.282. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 18.Greene J, Hibbard J H, Sacks R M. Does the race/ethnicity or gender of a Physician’s name impact patient selection of the physician? Journal of the National Medical Association. 2018;110:206–211. doi: 10.1016/j.jnma.2017.05.010. [DOI] [PubMed] [Google Scholar]
  • 19.Rossi P H. Vignette analysis. Uncovering the normative structure of complex judgments. Qualitative and quantitative social research: Papers in honor of Paul F. Lazarsfeld. 1979:176–186. [Google Scholar]
  • 20.Wallander L. 25 years of factorial surveys in sociology. A review. Social science research. 2009;38:505–520. [Google Scholar]
  • 21.Atzmüller C, Steiner P M. Experimental vignette studies in survey research. Methodology. 2010.
  • 22.Auspurg K, Hinz T. California: Thousand Oaks; 2015. Factorial survey experiments. [Google Scholar]
  • 23.Lehmann J, Kriwy P. Wiesbaden: Springer; 2021. Vignettenanalysen. In: Niederberger M, Finne E, Hrsg. Forschungsmethoden in der Gesundheitsförderung und Prävention; pp. 329–350. [Google Scholar]
  • 24.Chatfield S L, Gamble A, Hallam J S. Men’s preferences for physical activity interventions. An exploratory study using a factorial survey design created with R software. American journal of men’s health. 2018;12:347–358. doi: 10.1177/1557988316643316. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 25.Wiltshire J, Allison J J, Brown R et al. African American women perceptions of physician trustworthiness. A factorial survey analysis of physician race, gender and age. AIMS public health. 2018;5:122. doi: 10.3934/publichealth.2018.2.122. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 26.Chatfield S L, Nolan R, Crawford H et al. Acute care nurses’ responses and recommendations for improvement of hand hygiene compliance. A cross-sectional factorial survey research study. American journal of infection control. 2017;45:620–625. doi: 10.1016/j.ajic.2016.12.024. [DOI] [PubMed] [Google Scholar]
  • 27.Walther K. Länderspezifische Vornamen. Universitätsklinikum Erlangen. 2018.
  • 28.Kohlheim R, Kohlheim V. 2008. Duden, Familiennamen: Herkunft und Bedeutung. 2. Aufl. [Google Scholar]
  • 29.Grabner-Kräuter S, Waiguny MK J. Insights into the impact of online physician reviews on patients’ decision making. Randomized experiment. J Med Internet Res. 2015;17:e93. doi: 10.2196/jmir.3991. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 30.Atzmüller C, Steiner P M. Springer; 2017. Was ist ein faktorieller Survey? Ärztliche Werthaltungen gegenüber nichteinwilligungsfähigen Patienten; pp. 29–52. [Google Scholar]
  • 31.Ibbotson A.Patients Trust Online Reviews As Much As Doctor Recommendations. Online:https://www.healthitoutcomes.com/doc/patients-trust-online-reviews-as-much-as-doctor-recommendations-0001;letzter Zugriff: 17.05.2022

Articles from Gesundheitswesen (Bundesverband Der Arzte Des Offentlichen Gesundheitsdienstes (Germany) are provided here courtesy of Thieme Medical Publishers

RESOURCES