Nur Daten bringen Licht ins Dunkel - Wir wissen weniger über die Pandemie, als wir könnten

Gastbeitrag von Prof. Dr. Jan Paul Heisig

Die Pandemie hat in vielen Gesellschaftsbereichen strukturelle Probleme offengelegt. Dabei wird unter anderem eine Frage diskutiert: Werden die vorhandenen Datenquellen und die Möglichkeiten digitaler Kontaktverfolgung in Deutschland konsequent genutzt, um das Infektionsgeschehen zu verstehen und zielgenau zu intervenieren? Hohe Anforderungen an den Datenschutz bedeuten für Prof. Dr. Jan Paul Heisig nicht, dass die Nutzung sensibler Datenquellen grundsätzlich unmöglich sein sollte. Das Recht auf Privatsphäre ist ein hohes Gut. Aber das Gleiche gelte auch für andere Grundrechte wie das Recht auf Gesundheit, die Versammlungsfreiheit und das Recht auf die freie Berufsausübung. Hierüber sollte eine breite und offene gesellschaftliche Debatte in Gang gesetzt werden. Am Beispiel der Corona-Warn-App zeigt der Soziologe auf, wie dezentrale Ansätze der Datenerfassung an ihre Grenzen stoßen können.

Jan Paul Heisig ist Professor für Soziologie an der Freien Universität Berlin und Forschungsgruppenleiter am Wissenschaftszentrum Berlin für Sozialfor?schung (WZB). In laufenden Projekten beschäftigt er sich unter anderem mit Diskriminierung und Ungleichbehandlung im Gesundheitswesen, mit sozialen Ungleichheiten im Gesundheitsverhalten und mit sozialräumlichen und ökologischen Ursachen gesundheitlicher Ungleichheiten. Im Jahr 2020 war er sachverständiges Mitglied der Enquete-Kommission „Corona-Pandemie“ des rheinland-pfälzischen Landtags.

Foto: David Ausserhofer

Nichts hat unser aller Leben in den letzten Monaten so stark geprägt wie die Corona-Pandemie. Dank schneller Erfolge bei der Impfstoffentwicklung zeichnet sich inzwischen ein Ausweg aus der Krise ab – auch wenn noch viele Ungewissheiten bleiben und die Virusmutationen der letzten Monate deutlich gemacht haben, dass uns die Pandemie mit etwas Pech doch noch länger beschäftigen könnte. Klar ist inzwischen, dass Deutschland auf die Pandemie längst nicht so gut vorbereitet war, wie es nach der ersten Welle im Frühjahr 2020 vielleicht den Anschein hatte. Die zweite Welle im Winter 2020/21 entlarvte diese Wahrnehmung schnell als Trugschluss.

Die vergangenen Monate haben nicht nur Defizite bei der Pandemiebekämpfung im engeren Sinne aufgezeigt, sondern auch strukturelle Probleme in den verschiedensten gesellschaftlichen Teilbereichen offengelegt. Die Liste ist lang. Sie beginnt bei der Vorbereitung auf zukünftige Pandemien und der Digitalisierung des öffentlichen Gesundheitsdienstes. Ohne Anspruch auf Vollständigkeit setzt sie sich fort bei der ungleichen Verteilung von Sorgearbeit zwischen den Geschlechtern und bei häuslicher Gewalt, den prekären und menschenunwürdigen Arbeitsbedingungen in einigen Wirtschaftszweigen wie z. B. der fleischverarbeitenden Industrie und bei der verschlafenen Digitalisierung der Schulen. Im Idealfall könnte der „Corona-Schock“ zum Auslöser für umfangreiche gesellschaftliche Modernisierungsanstrengungen werden. Diskutieren sollten wir in diesem Zusammenhang auch zwei verwandte Fragen, die ich im Folgenden aus der langen Liste möglicher Themen herausgreifen möchte: ob Deutschland über eine angemessene Dateninfrastruktur zur Beobachtung und Bekämpfung von Pandemien und grundlegenden sozial-gesundheitlichen Ungleichheiten verfügt und ob wir die Möglichkeiten digitaler Kontaktverfolgung konsequent genug zur Kontrolle des Infektionsgeschehens nutzen.

Viele wichtige Fragen und zu wenig gesichertes Wissen

Welche Bevölkerungsgruppen infizieren sich vermehrt mit dem Coronavirus und welche versterben besonders häufig an Covid-19? Wo kommt es sehr oft zu Ansteckungen? Inwiefern sind bestimmte Aktivitäten wie der Besuch eines Friseursalons oder die Nutzung des öffentlichen Nahverkehrs mit einer höheren Ansteckungswahrscheinlichkeit verbunden?

Leider gibt es auf diese Fragen auch ein Jahr nach Beginn der Pandemie nur unzureichende Antworten, auch weil die dafür nötige Dateninfrastruktur in Deutschland kaum existiert. Zwar gibt es eine Reihe von regelmäßigen Bevölkerungsbefragungen, die Fallzahlen dieser Umfragen sind jedoch zu gering und die Erhebung der Daten ist zu aufwendig, um im Falle einer Pandemie schnell belastbare Informationen zu liefern. Letztlich führt deshalb kein Weg an der amtlichen Statistik, an sogenannten Routine- oder Prozessdaten von Sozial- und Krankenversicherung und an der gezielten Rekrutierung positiv Getesteter für Spezialbefragungen vorbei. In Deutschland werden die Potenziale all dieser Datenquellen bisher nicht ansatzweise ausgeschöpft.

Ungenutzte Datenpotenziale und sinnvolle Ergänzungen

Die Todes- und Todesursachenstatistik ist ein gutes Beispiel. Die Erfassung von Todesfällen erfolgt in Deutschland noch weitgehend analog auf Grundlage von Todesbescheinigungen, die in der Regel handschriftlich ausgefüllt werden und von Bundesland zu Bundesland variieren. Die Folge sind Probleme mit Vergleichbarkeit und Datenqualität sowie ein langsamer Informationsfluss. Anders als in vielen anderen Ländern werden in Deutschland über die unmittelbaren Umstände des Todes hinaus auch nur wenige Merkmale der Verstorbenen erfasst. Informationen zur sozioökonomischen Lage, zum Beruf oder zum Migrationshintergrund liegen nicht vor, so dass keine Aussagen über Sterblichkeitsunterschiede entlang dieser Merkmale möglich sind. Die Abrechnungsdaten der gesetzlichen Krankenkassen könnten einen wichtigen Beitrag zur Beobachtung und Erforschung der Pandemie leisten. Die Hürden für die Nutzung dieser Daten sind allerdings sehr hoch, so dass sie vergleichsweise selten für wissenschaftliche Analysen genutzt werden. Durch die Fragmentierung des Systems in die private und die gesetzliche Krankenversicherung mit über 100 gesetzlichen Krankenkassen kann zudem in der Regel nur ein kleiner und gegebenenfalls selektiver Teil aller Versicherten untersucht werden. Durch die Zusammenführung der Daten von verschiedenen Krankenkassen, eine mögliche Verknüpfung mit anderen Datensätzen und den Abbau von Zugangsbarrieren könnten hier nicht nur große Potenziale für die Bewältigung pandemischer Krisen realisiert werden; auch für die Erforschung nicht ansteckender Krankheiten und gesundheitlich-sozialer Ungleichheiten wären diese Daten von unschätzbarem Wert.

Schließlich wäre im Hinblick auf die laufende, aber auch auf mögliche zukünftige Pandemien der Aufbau einer digitalen Infrastruktur zur gezielten Befragung von Verdachts- und Positivfällen zu erwägen. Informationen zu den Alltagsaktivitäten und zum Schutzverhalten von Positivfällen könnten durch den Vergleich mit Negativfällen aus einer Bevölkerungsstichprobe wichtige Hinweise auf Risikofaktoren für eine Infektion liefern. So entstünde im Idealfall ein vollständigeres Bild davon, welche Aktivitäten und Verhaltensweisen mit erhöhten Infektionsrisiken verbunden sind, als im Rahmen der Kontaktnachverfolgung durch die Gesundheitsämter: Für die Mehrzahl der Infektionen kann der Infektionsweg von den Gesundheitsämtern nicht identifiziert werden – und bei den erfassten Übertragungsereignissen sind systematische Verzerrungen wahrscheinlich. Insbesondere sporadische Übertragungen, z.B. im öffentlichen Nahverkehr, dürften dabei systematisch untererfasst werden.

Digitale Kontaktverfolgung im Spannungsfeld zwischen Privatsphäre und anderen Grundrechten

Die Nutzung von personenbezogenen Daten berührt Fragen des Datenschutzes, der informationellen Selbstbestimmung und des Rechts auf Privatsphäre. In einigen der genannten Fälle, etwa bei der Nutzung von Krankenversicherungsdaten, erfolgt diese Nutzung in der Regel ohne explizite Zustimmung der betroffenen Personen; zudem berühren die verarbeiteten Informationen zum Teil sehr sensible Themen. Deshalb unterliegt die Nutzung dieser Daten zu Recht besonders hohen Anforderungen im Hinblick auf den Zweck der Datennutzung und die Gewährleistung von Datensicherheit.

Dass hier hohe Anforderungen gelten sollten, heißt aber nicht, dass die Nutzung dieser und anderer ähnlich sensibler Datenquellen grundsätzlich unmöglich sein sollte. Das Recht auf Privatsphäre ist ein hohes Gut, aber das Gleiche gilt für das Recht auf Gesundheit, echt auf Bildung, das Versammlungsrecht und das Recht auf die freie Berufsausübung – allesamt Rechte, die durch die Corona-Pandemie direkt betroffen waren und sind oder durch verschiedene Maßnahmen u ihrer Bekämpfung eingeschränkt wurden und weiterhin werden. Immer wieder wird deshalb gefordert, den Datenschutz in der Pandemie stärker einzuschränken und z. B. eine Auswertung handybasierter Bewegungs- und Kontaktdaten von Infizierten zu ermöglichen. In der Tat spricht einiges dafür, dass die Nutzung solcher Daten einen wichtigen Beitrag zu den Erfolgen vieler asiatischer Länder bei der Pandemiebekämpfung geleistet hat – darunter neben Autokratien wie China und Singapur auch demokratisch verfasste Länder wie Japan und Südkorea. Der Soziologe Jürgen Gerhards und der Politikwissenschaftler Michael Zürn sprachen sich vor diesem Hintergrund im Januar 2021 dafür aus, in den westlichen Ländern offener über vorübergehende Eingriffe in die Privatsphäre nachzudenken – mit dem wichtigen Zusatz: „Für jeden Euro, der für den Aufbau staatlicher Digitalkompetenz ausgegeben wird, muss ein Euro in die Missbrauchskontrolle fließen.“ ("China gewinnt Systemvergleich", Frankfurter Allgemeine Zeitung, 11.01.21)

„Die vergangenen Monate haben nicht nur Defizite bei der Pandemiebekämpfung im engeren Sinne aufgezeigt, sondern auch strukturelle Probleme in den verschiedensten gesellschaftlichen Teilbereichen offengelegt.“

Prof. Dr. Jan Paul Heisig

Der dezentrale Ansatz der Corona-Warn-App stößt an seine Grenzen

Eine breite und offene gesellschaftliche Diskussion über diese Fragen wäre in der Tat zu begrüßen. Dabei sollte aber nicht übersehen werden, dass die Potenziale des dezentralen Ansatzes zur Kontaktverfolgung, wie er in der Corona-Warn-App implementiert ist, bei weitem noch nicht ausgeschöpft sind. So hängt die Effektivität einer derartigen App entscheidend von der Zahl der Nutzer*innen ab. Eine aktuelle Studie zeigte hier kürzlich, dass sich die Bereitschaft zur Installation der App durch begrenzte finanzielle Anreize in Höhe von maximal fünf Euro deutlich erhöhen lässt. (Simon Munzert et al. 2021. “Tracking and promoting the usage of a COVID-19 contact tracing app”. Nature Human Behaviour, 5, 247–255.)

Auch über einen Opt-out-Ansatz, bei dem die App etwa im Zuge eines Updates automatisch installiert und von den Nutzer*innen deaktiviert bzw. deinstalliert werden muss, könnte ihr Verbreitungsgrad gegebenenfalls gesteigert werden. Ein weiteres Problem der App ist die unvollständige und oftmals späte Erfassung positiver Testergebnisse. Idealerweise werden diese Ergebnisse direkt von den Laboren an die App und damit auch an die getestete Person gemeldet. Dies ist zwar grundsätzlich möglich, bedarf aber der ausdrücklichen Zustimmung der Patient*innen, die in der Praxis oft nicht erfolgt. Auch hier könnte auf ein Opt-out-Verfahren gesetzt werden, bei dem die Zustimmung zur laborseitigen Weitergabe des Testergebnisses ausdrücklich widerrufen werden muss.

Schließlich stößt der dezentrale Ansatz der Corona-Warn-App an seine Grenzen, wenn es um die Ermittlung von Ausbruchsclustern geht. Die Ergänzung durch ein inzwischen in die App integriertes Kontakttagebuch kann hier teilweise Abhilfe schaffen, bringt aber erheblichen Aufwand für die Nutzer*innen mit sich. Die Verbesserung der Clustererkennung, z. B. durch das Scannen eines QR-Codes beim Besuch von öffentlichen Orten wie Restaurants und Museen, ist weniger aufwendig, setzt aber immer noch ein Tätigwerden der jeweiligen Nutzerin voraus. Zudem ist dieser Ansatz wohl nur bedingt geeignet, Infektionscluster im privaten Bereich zu erfassen. An dieser Stelle hätte eine befristete zentrale Speicherung von Kontaktinformationen entscheidende Vorteile – und verweist damit wiederum auf die grundlegende Frage nach dem richtigen Verhältnis von Datenschutz und anderen Grundrechten im Kontext einer Pandemie.