Die Auswirkungen bestimmter im Nutzenbewertungsverfahren evaluierter Faktoren auf die Preisverhandlungen wurden in anderen Studien untersucht (Theidel & Graf von der Schulenburg, 2016). Der größte Einflussfaktor bei Preisverhandlungen ist der Zusatznutzen. In dieser Hinsicht sind G-BA-Entscheidungen strenger als die Entscheidungen anderer Länder in Bezug auf dieselben Medikamente und Indikationen (Fischer, Heisser, & Stargardt, 2016). Für die Vorhersage von G-BA-Entscheidungen hinsichtlich des Zusatznutzens von Arzneimitteln wurde ein Messsystem vorgeschlagen (Schwandera, Banz, Kaier, & Walzer, 2014). Da klinische Daten als Grundlage für die Entscheidung über den Mehrwert von Arzneimitteln in Nutzendossiers dienen, konzentriert sich diese Studie auf den zweiten wichtigen Faktor, der die Preisverhandlungen beeinflussen kann: die Anzahl der Patienten in den Zielpopulationen mit einem therapeutisch bedeutsamen Zusatznutzen. Insbesondere in Fällen, in denen es mehrere Patientensubgruppen gibt und die Verhandlungen auf einem Mischpreismodell basieren, ist der Einfluss der eingereichten Patientenpopulationen pro Zielgruppe stärker ausgeprägt.
>> Im Jahr 2017 wurde anhand von fünf Indikatoren eine systematische Analyse von 88 Nutzendossiers aus abgeschlossenen Verfahren vorgenommen. Auf Grundlage der Ergebnisse dieser Analyse wurde ein prognostisches Scoring-System mit einer gewissen prädiktiven Aussagekraft vorgeschlagen. Die Studie legte jedoch nahe, dass andere, in der Studie nicht analysierte Indikatoren, bei 19% der Dossierbewertungen eine Rolle spielen könnten. Diese konnten mit dem prognostischen Modell nicht korrekt vorhergesagt werden, was die Notwendigkeit weiterer Studien unterstreicht, die diese zusätzlichen Faktoren identifizieren können (Metin, Grabein, Lux, Kerkemeyer, & Bardenheuer, 2017). Die aktuelle Arbeit zielte darauf ab, den vollständigen Satz von Dossiers zu analysieren und eine Reihe von signifikanten Faktoren zu identifizieren, die sich auf die Akzeptanzrate auswirken, um dann eine Leitlinie zu erstellen, die pharmazeutischen Unternehmern dabei hilft, Dossiers mit besseren Erfolgsaussichten zu erstellen.
Methoden
Auswahl der Dossiers und Erfolgsdefinition
Seit dem 1. Januar 2011 werden neue Arzneimittel gemäß AMNOG einer Nutzenbewertung unterzogen. Für die Zwecke dieser Analyse wurden nur Dossiers mit einem Verfahrensbeginn vor dem 1. Januar 2018 betrachtet, da zum Zeitpunkt des Abschlusses der Datenabfrage am 15. Juni 2018 keines der Verfahren, die 2018 aufgenommen wurden, als abgeschlossen markiert worden war. Im Gegensatz dazu waren alle 327 Verfahren, die vor dem 31. Dezember 2017 begannen, beendet, meist mit dem Status „Verfahren abgeschlossen“. Die Wahl des Datenabfragezeitraums ermöglichte eine Kategorisierung der Dossiers, basierend auf dem Startdatum des Verfahrens, in sieben vollständige Kalenderjahre, beginnend mit dem 1. Januar 2011 und endend mit dem 31. Dezember 2017.
In der Analyse wurden nur Dossiers mit dem Status „Verfahren abgeschlossen“ berücksichtigt. Zum 15. Juni 2018 hatten 309 von 327 Dossiers diesen Status. Neun Dossiers waren von der Nutzenbewertung ausgenommen und für weitere neun war das Verfahren eingestellt worden. Nur vollständige Dossiers mit dem Status „Verfahren abgeschlossen“ wurden berücksichtigt, da unvollständige/fehlende Dossiers dazu führen, dass der G-BA keine Dokumente veröffentlicht, aus denen Informationen über Patientenzahlen abgeleitet werden können. Zum 15. Juni 2018 waren für 292 von 309 Dossiers mit dem Status „Verfahren abgeschlossen“ vollständige Dossiers beim G-BA eingereicht worden, während die Dossiers für 17 weitere Verfahrensnummern unvollständig und nicht veröffentlicht waren. Diese 292 Dossiers bildeten die Grundlage für die Studie.
Die Akzeptanz der Patientenzahlen durch das IQWiG erwies sich als wesentlicher Erfolgsfaktor. Selbst für Arzneimittel zur Behandlung eines seltenen Leidens (Orphan Drugs), bei denen die Nutzenbewertung durch den G-BA erfolgt, werden die Patientenzahlen und Therapiekosten vom IQWiG gesondert bewertet, was eine zuverlässige Analyse aller vollständigen Dossiers mit abgeschlossenem Bewertungsverfahren ermöglicht. Die IQWiG-Stellungnahme hinsichtlich der Patientenzahlen folgt jedoch nicht unbedingt einem standardisierten Ansatz. IQWiG kann die Zahlen für plausibel oder nicht plausibel halten, die Berechnung nachvollziehbar finden oder nicht, aber auch jede klare Aussage zur Plausibilität und Verständlichkeit der Ergebnisse unterlassen und lediglich die Unsicherheit der Zahlen kommentieren. Das Institut kann sich auch allgemein zur Unter- oder Überschätzung der Patientenzahlen äußern oder die Unter- und Obergrenze einzeln bewerten.
Eine weitere Komplikation ergibt sich, wenn das IQWiG die Verteilung der Patienten auf einzelne Subpopulationen oder Subgruppen innerhalb von Subpopulationen durch den Antragsteller nicht akzeptiert und eine andere Aufteilung empfiehlt. Das IQWiG kann auch eigene Patientenzahlen berechnen, ohne dabei unter Umständen Aussagen zur Plausibilität und Verständlichkeit der Zahlen zu machen.
Die Informationen zu Patienten, für die ein therapeutisch relevanter Nutzen besteht, werden in Modul 3, Kapitel 3.2 je therapeutischer Indikation beschrieben und in Modul 1, Kapitel 1.6 des Nutzendossiers zusammengefasst. Für die Zwecke dieser Analyse diente die Nachvollziehbarkeit/Plausibilität als primäre Zielvariable und die Bewertung der Patientenzahlen wurde als Erfolg angesehen, wenn die Verständlichkeit oder Plausibilität entweder vom IQWiG explizit bestätigt wurde oder eindeutig aus den anderen Aussagen abgeleitet werden konnte.
Definition der Variablen
Es wird erwartet, dass die Schätzungen der Patientenpopulationen durch empirische Daten untermauert werden (Altevers, Borchert, Mittendorf, & Braun, 2015). Darüber hinaus wird erwartet, dass die Qualität der vom Antragsteller verwendeten Datenquellen, die Verständlichkeit der Methoden zur Unterteilung der Patienten in Zielgruppen sowie der Ansatz zum Ausschluss bestimmter Patienten aus der Zielgruppe anhand bestimmter Kriterien die Akzeptanz der berechneten Patientenpopulationen durch das IQWiG stark beeinträchtigen.
Weitere Faktoren, die die Akzeptanz der Patientenzahlen durch das IQWiG beeinflussen dürften, waren die Größe der Zielpopulation und die Höhe der Jahrestherapiekosten für die GKV, der Ausmaß des angegebenen Zusatznutzens, der Orphan-Status, der Detaillierungsgrad des Dossiers und die Erfahrung des Antragstellers bezüglich der Dossiererstellung. Auch das Höhe des Wettbewerbs auf dem Markt, das in dieser Arbeit anhand der Reihenfolge der Antragstellung im Therapiegebiet, dem Therapiefeld oder dem ATC4-Code definiert wird, wird voraussichtlich Auswirkungen haben. Abschließend wurden das Antragsjahr, die Inanspruchnahme einer G-BA-Beratung durch den Antragsteller und die fachärztliche Beratung durch das IQWiG während der Bewertungsphase als mögliche Faktoren bei der Akzeptanz der Patientenzahlen identifiziert.
Eine multivariate Regressionsanalyse wurde durchgeführt, um eine Reihe von Faktoren zu identifizieren, die einen signifikanten Einfluss auf die Akzeptanz von Patientenzahlen durch das IQWiG haben.
Die für die Definition von Variablen erforderlichen Informationen wurden auf Grundlage einer Kombination von automatisierten und manuellen Ansätzen gesammelt. Die meisten Variablen wurden durch die Erstellung von Abfragen unter Verwendung einer von IQVIA erstellten AMNOG-Datenbank gesammelt. Für einige Variablen wurden die Informationen manuell mit Hilfe von gezielten Stichwortsuchen in Dokumenten gesammelt, die im Rahmen des Nutzenbewertungsverfahren auf der G-BA-Webseite veröffentlicht wurden (Tab. 1).
Multivariate Analyse
Nach der Identifizierung der Variablen, die potenziell einen Einfluss haben könnten, wurden multivariate logistische Regressionsmodelle angewendet, um den Zusammenhang zwischen diesen Variablen und dem Erfolg des Nutzendossiers zu schätzen (Hammerschmidt, 2017). Der Erfolg des Nutzendossiers wurde als Zielvariable mit den Werten 1 für erfolgreich (Akzeptanz der Patientenzahlen durch das IQWiG) und 0 für erfolglos verwendet.
Odds-Ratios (OR) wurden anhand der logistischen Regression berechnet. Die univariaten OR können mit Hilfe der einfachen 2x2-Tabelle berechnet werden. In der Regel sind jedoch mehrere Faktoren für den Erfolg von Nutzendossiers verantwortlich. Ein nicht bereinigtes OR lässt keine endgültigen Schlussfolgerungen zu, sodass in dieser Studie nur bereinigte ORs verwendet wurden. Aus dem gleichen Grund betrachtete die Analyse mehrere Faktoren (Variablen) und die Bewertungen wurden auf Grundlage multivariater Modelle durchgeführt, die mehrere Variablen berücksichtigen.
Ein p-Wert von <0,05 wurde als statistisch signifikant angesehen. ORs >1 mit p <0,5 bedeuten, dass die Variable einen signifikant positiven Einfluss auf den Erfolg des Nutzendossiers hat (größerer Erfolg); ORs<1 mit p<0,05 bedeuten, dass die Variable einen signifikant negativen Einfluss auf den Erfolg des Nutzendossiers hat (geringerer Erfolg). Je weiter der OR von 1 abweicht, desto größer der Effekt. Beispielsweise haben Nutzendossiers mit OR = 3 eine dreimal höhere Erfolgswahrscheinlichkeit.
Mit der multivariaten Regressionsanalyse wurde der Einfluss von Variablen auf andere Variablen berücksichtigt, um eine gegenseitige Störwirkung der Variablen zu verhindern. Alle Analysen wurden mit Hilfe von SAS 9.4 (SAS Institute, Cary, USA) durchgeführt.
Ergebnisse
Zusammenfassend lässt sich sagen, dass die vom Antragsteller angegebenen Patientenzahlen in 169 von 292 Dossiers vom IQWiG in mindestens einer Subgruppe akzeptiert wurden, was einer Akzeptanzquote von 57,9 % entspricht.
Die multivariate Regressionsanalyse ergab, dass 10 Variablen einen signifikanten Einfluss auf die Akzeptanz der Patientenzahlen durch das IQWiG hatten. Der Schwellenwert wurde als p < 0,05 definiert, wobei zwei Variablen mit p-Werten zwischen 0,05 und 0,1 aufgrund der geringen absoluten Anzahl von Dossiers ebenfalls als signifikant identifiziert wurden (Tabelle 2).
Der positive Effekt der G-BA-Beratung, des Dossier-Beitrags von IQVIA und der Verwendung von Publikationen, Registern und Daten staatlicher Institutionen als Datenquellen wurde nachgewiesen. Ein erhöhter Detaillierungsgrad der öffentlich zugänglichen Dossiers wirkte sich positiv aus und Anträge in den Therapiefeldern Diabetes, Nierenzellkarzinom und Hepatitis C konnten mit höheren Akzeptanzraten in Verbindung gebracht werden.
Es wurde festgestellt, dass die Reihenfolge der Anträge in der ATC4-Klasse einen wesentlichen Einfluss auf die Akzeptanzrate hatte, wenn das Dossier als drittes bis fünftes in einer ATC4-Klasse eingereicht wurde.
Die Akzeptanzraten stiegen bei einer Patientenanzahl unter 100.000 und über einer Jahrestherapiekostengrenze von 200 Millionen Euro.
Die Publikation eigener Zahlen des IQWiG reduzierte die Akzeptanzrate der vom Antragsteller angegebenen Patientenzahlen signifikant.
Diskussion
Die Ergebnisse der in dieser Studie vorgestellten Analyse untermauern die Forschungshypothese, dass die Akzeptanz der Patientenzahlen durch das IQWiG in unterschiedlichem Maße von zusätzlichen Faktoren beeinflusst wird. Die Studie zeigt, dass die Akzeptanzraten tendenziell höher sind in Therapiebereichen mit geringeren Patientenzahlen und zahlreichen Dossiers, wenn andere Datenquellen als GKV-Routinedaten und kommerzielle Datenbanken verwendet werden und wenn es eine Beratung durch den G-BA gab. Die Ergebnisse können Auswirkungen auf die nach der Entscheidung des G-BA stattfindenden Preisverhandlungen haben. Hier ist zu beachten, dass strategische oder politische Überlegungen eine Rolle hinsichtlich der Patientenzahlen spielen könnten, dies jedoch im Rahmen dieser Studie nicht untersucht werden konnte.
Die Zunahme der Akzeptanzraten von niedrigeren Patientenzahlen war ein zu erwartendes Phänomen und erklärt sich aus der Bereitschaft des IQWiG, vom Patienten berechnete Zahlen zu akzeptieren, wenn die Zahl der Patienten gering ist. Interessanterweise war die Akzeptanzrate zwischen den Schwellenwerten von 10.000 bis 100.000 Patienten in einer Subpopulation deutlich höher und sank bei sehr kleinen Patientenpopulationen von unter 10.000 Patienten ab, obwohl sie auch hier immer noch deutlich höher war als die Akzeptanzrate in der Gruppe mit Populationen von über 100.000 Patienten. Der Hauptgrund dafür könnte sein, dass bei einer geringen Anzahl von Patienten in einer Subpopulation oder Subgruppe die Datensituation in Deutschland nicht ausreicht, um die Patientenzahlen genau zu identifizieren, was die Antragsteller in einigen Fällen zwingt, Schätzungen anhand weltweiter Zahlen vorzunehmen.
Ein weiteres unerwartetes Phänomen war die Zunahme der Akzeptanzraten der Patientenzahlen bei Dossiers mit berechneten jährlichen Gesamtkosten von über 200 Millionen Euro. Arzneimittel mit der größten Auswirkung auf das Budget der GKV verteilten sich gleichmäßig auf die Gruppen der teuren Medikamente mit kleinen Populationen, der günstigen Medikamente mit großen Populationen und der Medikamente im mittleren Preissegment mit durchschnittlich großen Populationen, sodass eine klare Unterscheidung nicht möglich war. Es wurde jedoch festgestellt, dass die jährlichen Gesamttherapiekosten stärker von der Anzahl der Patienten abhängen als die Therapiekosten pro Patient, und es kann argumentiert werden, dass der Antragsteller aufgrund der höheren Anzahl der betroffenen Patienten auf bessere Daten zurückgreifen kann. Daher scheint dieser Befund mit der Abnahme der Akzeptanzrate bei Populationen mit unter 10.000 Patienten vereinbar.
Auch wenn die Beratungsunternehmen große Anstrengungen unternehmen, um die Validität und Repräsentativität der Daten in kommerziellen Datenbanken nachzuweisen, könnten mehrere Faktoren erklären, warum Daten aus Patientenregistern, wissenschaftlichen Publikationen und staatlichen Quellen für die IQWiG-Bewertung höher ins Gewicht fallen könnten als kommerzielle Datenbanken. Das IQWiG mag Zweifel an der Qualität der Daten aus diesen Quellen haben und deren allgemeingültige Eigenschaften kritisieren: spezielle Informationen, die für die Bestimmung der Patientenzahlen bei besonderen Indikationen (z. B. TNM-Klassifikation in der Onkologie) benötigt werden, sind möglicherweise in kommerziellen Datenbanken nicht verfügbar und eine Überprüfung der Repräsentativität in diesen Fällen ist unter Umständen nicht möglich (Becher, Kostev, & Schröder-Bernhardi, 2009).
Der Zusammenhang zwischen dem Umfang des Dossiers und dem geltend gemachten zusätzlichen Nutzen wurde untersucht und es wurde eine Korrelation zwischen der Anzahl der Seiten und dem geltend gemachten zusätzlichen Nutzen von Nicht-Orphan Drugs, nicht aber von Orphan Drugs gefunden (Kulp & Reinartz, 2017). Es ist zu erwarten, dass der Antragsteller mit zunehmendem Detaillierungsgrad des Dossiers mehr Datenquellen nutzt und mehr Einblick in den Prozess der Berechnung der Patientenzahlen gibt. Es wird daher weiterhin erwartet, dass die Methode des Antragstellers zur Beurteilung der Patientenzahl besser verständlich für das IQWiG ist. Der Detaillierungsgrad innerhalb von Modul 3, und insbesondere von Modul 3.2, schien jedoch weitaus erfolgsrelevanter zu sein als der des gesamten Dossiers, da die übrigen Teile des Dossiers nicht unbedingt zur in diesem Kapitel dargestellten Berechnung der Patientenzahlen beitragen. Es kann argumentiert werden, dass die Signifikanz dieser Variablen aufgrund ihrer starken Korrelation untereinander und mit der Gesamtlänge des Dossiers verschleiert wurde.
Die Korrelation zwischen der Inanspruchnahme einer G-BA-Beratung und der Akzeptanz der Patientenzahlen durch das IQWiG ist auf die Annahme zurückzuführen, dass der Antragsteller vom G-BA Informationen darüber erhält, wie er die Patientenpopulation am besten in einzelne Subpopulationen und Subgruppen aufteilen kann, sodass diese mit der von den Gutachtern erwarteten Aufteilung übereinstimmen. Auch wenn der Hauptzweck der G-BA-Beratung darin besteht, den Antragstellern zu helfen, die Anforderungen für klinische Vergleiche mit der zweckmäßigen Vergleichstherapie (zVT) zu verstehen, ist es möglich, dass diese Beratung den Antragstellern auch einen Einblick in den Denkprozess der Gutachter gibt.
First-in-class Arzneimittel, die neuen ATC4-Klassen zugeordnet wurden, erwiesen sich als weniger erfolgreich in Bezug auf die Akzeptanz der Patientenzahlen. Dies mag auf den „first-to-file effect“ zurückzuführen sein, der den Antragsteller zwingt, aufgrund des Fehlens realer empirischer Daten Annahmen über die Anzahl der Patienten mit einer bestimmten Indikation zu treffen (Ruof, Staab, Dintsios, Schröter, & Schwartz, 2016). Bei Dossiers, die in einem bereits etablierten Markt mit noch wenig Wettbewerb eingereicht werden, kann die zunehmende Zahl von Erkenntnissen aus der Praxis zu der beobachteten Erhöhung der Akzeptanz führen, da die Antragsteller mit der zunehmenden Zahl vorangegangener Dossiers die Erwartungen der Gutachter besser kennen und die bereits eingereichten Daten als Richtgröße verwenden können.
Für Nachzügler in einer ATC4-Klasse kann das Ausmaß des Wettbewerbs dazu führen, dass Antragsteller nach Nischenpopulationen suchen, bei denen der reduzierende Effekt darauf beruhen kann, dass die Patientenpopulationen zu klein sind und die Menge an brauchbaren Daten für die Bestimmung von Patientenzahlen zu gering ist.
Zwei Indikationen mit der höchsten Anzahl von Dossiers ergaben signifikant höhere Odds-Ratios für die Akzeptanz im Vergleich zu anderen. Im Falle von Diabetes war der zeitliche Aspekt der Akzeptanzraten der Patientenzahlen besonders auffällig, da die Akzeptanzrate im Laufe der Jahre allmählich abnahm. Dies könnte an der Sättigung des Diabetesmarktes und an der Tendenz des IQWiG liegen, die Nutzendossiers in späteren Jahren strenger zu bewerten. Die Unsicherheit der Patientenzahlenschätzungen aufgrund der Verwendung von Sekundärdaten und fehlender Standardisierung wurde vom IQWiG kritisiert (ten Thoren, Mostardt, Schwalm, Zhou, & Gerber-Grote, 2017) und könnte der Hauptgrund für den Rückgang der Akzeptanzrate sein.
Seit der Zulassung der ersten interferonfreien Therapien für Hepatitis C im Jahr 2014 haben hochwirksame Kombinationstherapien die Behandlungslandschaft verändert (Hüppe et al., 2016). Nur zwei der beim G-BA eingereichten Dossiers in diesem Therapiebereich stammten aus der Interferon-Ära, während 7 der restlichen 12 Dossiers sich auf Kombinationstherapien bezogen. Der Erfolg könnte auf den zufriedenstellenden Stand der in der Interferon-Ära gesammelten Praxiserkenntnisse zurückzuführen sein, die es im Falle der nach 2014 eingereichten Dossiers ermöglicht haben könnten, realistischere Definitionen von Patientenpopulationen einzubeziehen.
Zusätzliche Studien können denselben Satz unabhängiger Variablen verwenden und die Auswirkungen dieser Variablen auf die IQWiG-Bewertung der jährlichen Therapiekosten sowie die G-BA-Entscheidung hinsichtlich der Patientenzahlen, jährlichen Therapiekosten und den Zusatznutzen analysieren.
Preisverhandlungen und die aus diesen Verhandlungen resultierenden Preisvereinbarungen lagen außerhalb des Umfangs dieser Analyse. Andere als die hier analysierten Faktoren – z. B. strategische Überlegungen und politische Beweggründe – könnten bei den Entscheidungen des G-BA und den anschließenden Preisverhandlungen eine Rolle spielen.
Der Einfluss der identifizierten Einflussfaktoren auf die Preisverhandlungen kann untersucht und in weiteren Analysen mit den bereits vorhandenen Untersuchungen verglichen werden. Für diese Analysen kann der vom Antragsteller für das erste Jahr nach der Marktzulassung gewählte Preis des pharmazeutischen Unternehmers (PpU) mit der vereinbarten Erstattungssumme verglichen werden. Ein wesentliches Hindernis im Falle dieser Analyse sind die Einwände der meisten Pharmaunternehmen gegen die Veröffentlichung der mit dem GKV-SV vereinbarten Erstattungsbeträge.
Bisher wurde lediglich die Anzahl der IQWiG-Mitarbeiter als Faktor betrachtet (Metin, Grabein, Lux, Kerkemeyer, & Bardenheuer, 2017), aber die Berücksichtigung von deidentifizierten IQWiG-Mitarbeitern als unabhängige Variablen könnte zur Identifizierung zusätzlicher Korrelationen führen. Es ist zu erwarten, dass die Einbeziehung zusätzlicher Variablen in das Regressionsmodell zusätzliche Störfaktoren aufdeckt und dazu führt, dass weitere Variablen, deren Effekte als nicht signifikant eingestuft wurden, signifikant werden.
Abschließend ist anzumerken, dass – auch wenn in dieser Studie alle vor Ende 2017 eingereichten Dossiers analysiert wurden – die Anzahl trotz starker Effekte in der univariaten Analyse zu gering sein mag, um für einige Variablen eine Signifikanz zu ergeben. Basierend auf der laufenden Summe der Einreichungen pro Jahr könnte die Zahl der eingereichten Dossiers bis 2019 auf 500 ansteigen. Eine größere Anzahl von Dossiers würde tiefergehende Analysen ermöglichen und zusätzliche signifikante Effekte aufzeigen. <<