Identificatie van 5 HF-subtypen met behulp van machinelearning
Met hun eigen machinelearning-framework identificeerden de auteurs 5 HF-subtypen (vroeg beginnend, laat beginnend, AF-gerelateerd, metabool en cardiometabool), die een goede voorspellende nauwkeurigheid voor 1-jaarssterfte hadden.
Identifying subtypes of heart failure from three electronic health record sources with machine learning: an external, prognostic, and genetic validation studyLiteratuur - Banerjee A, Dashtban A, Chen S, et al. - Lancet Digit Health. 2023 Jun;5(6):e370-e379. doi: 10.1016/S2589-7500(23)00065-1
Introductie en methoden
Achtergrond
De huidige HF-subtypeclassificaties hebben niet geleid tot precisiegeneeskunde, gepersonaliseerde zorg of gerichte therapieën [1-6]. Bovendien zijn door onvolledige kennis van HF-subtypen over het brede spectrum van oorzakelijke factoren en populaties de primaire preventie en screeningsrichtlijnen voor deze ziekte beperkt [7,8].
Doel van de studie
In een grote populatie van patiënten gediagnosticeerd met HF gebruikten de auteurs machinelearning om (1) subtypen te identificeren met klinische relevantie gedurende het gehele ziekteverloop van HF en met een laag risico op bias voor patiëntselectie en algoritmen, (2) interne, externe, prognostische en genetische validiteit aan te tonen en (3) potentiële klinische paden te ontwikkelen om de impact te verbeteren.
Methoden
In deze externe, prognostische en genetische validatiestudie gebruikten de auteurs hun framework voor praktische machinelearning-implementatie uit 2021, dat bestaat uit 6 stappen: klinische relevantie, patiënten, algoritme, interne validatie (binnen dataset en tussen methoden), externe validatie (tussen methoden), klinische bruikbaarheid en effectiviteit) [9]. De gegevens van patiënten gediagnosticeerd met HF in de leeftijd van ≥30 jaar werden geëxtraheerd uit 2 populatiegebaseerde databases met elektronische patiëntendossiers in het VK, Clinical Practice Research Datalink (CPRD; n=188.800) en The Health Improvement Network (THIN; n=124.262), van 1998 tot 2018.
De CPRD- en THIN-datasets leverden 645 factoren op voor en na de HF-diagnose, waaronder demografische informatie, comorbiditeiten en medicatiegebruik en persistentie. Voor het algoritme werden 87 van deze 645 factoren geselecteerd. Om het risico op algoritmische bias te verminderen, werden de volgende 4 machinelearning-methoden (zonder toezicht) vergeleken: K-means, hiërarchisch, K-medoids en mixture modeling.
Subtypen werden geïdentificeerd en beoordeeld op: (1) externe validiteit, (2) prognostische validiteit (voorspellende nauwkeurigheid voor totale sterfte na 1 jaar) en (3) genetische validiteit (associatie met single nucleotide-polymorfismen (SNP’s) en met polygene risicoscores (PRS’s ) voor HF-gerelateerde kenmerken, met behulp van UK Biobank-gegevens (n=9573)).
Om de klinische bruikbaarheid te beoordelen, werd 5 HF-artsen gevraagd naar klinische relevantie, rechtvaardiging en interpreteerbaarheid van de resultaten. Op basis van hun input werd een model ontwikkeld dat cluster en overleving voorspelde, evenals een HF-clusterapp voor routinematig klinisch gebruik.
Belangrijkste resultaten
Interne en externe validatie en subtype-identificatie
- In de interne validatie was het optimale aantal clusters 5. Op basis van demografie, belasting met HVZ-risicofactoren, AF, HVZ, medicatie en laboratoriumwaarden werden 5 clusters geïdentificeerd, die werden gelabeld als de volgende 5 HF-subtypen: (1) vroeg beginnend, (2) laat beginnend, (3) AF-gerelateerd, (4) metabool en (5) cardiometabool.
- In de externe validatie waren de subtypen vergelijkbaar tussen de datasets (voor THIN-model in CPRD varieerde de c-statistiek van 0,79 (subtype 3) tot 0,94 (subtype 1) en voor CPRD-model in THIN van 0,79 (subtype 1) tot 0,92 (subtypen 2 en 5)).
- De verdeling van de 5 subtypen was vergelijkbaar in de CPRD- en THIN-datasets, waarbij laat beginnend (~33%) en cardiometabool (~29%) de meest voorkomende subtypen waren en AF-gerelateerd (~9%) het minst voorkomende subtype.
Prognostische validatie
- In de prognostische validatie in CPRD met behulp van het THIN-model was de 1-jaarssterfte door alle oorzaken na de HF-diagnose 0,20 (95%BI: 0,14-0,25) voor subtype 1, 0,46 (95%BI: 0,43-0,49) voor subtype 2, 0,61 (95%BI: 0,57-0,64) voor subtype 3, 0,11 (95%BI: 0,07-0,16) voor subtype 4 en 0,37 (95%BI: 0,32-0,41) voor subtype 5. Tussen THIN en CPRD werden verschillen in sterfte gezien voor clusters 1 en 5, maar niet voor de andere clusters.
- Ook het risico op niet-fatale HVZ of ziekenhuisopname verschilde per HF-subtype.
Genetische validatie
- In de genetische validatie waren de PRS’s voor atriale ritmestoornissen, DM, hypertensie, MI, obesitas, stabiele angina en instabiele angina allemaal geassocieerd met ≥1 HF-subtype na correctie voor meervoudig testen (P<0,0009). De subtypen laat beginnend en cardiometabool waren in grote lijnen geassocieerd met vergelijkbare PRS’s.
- Acht SNP’s waren nominaal geassocieerd met de voorspelde HF-subtypen (P=0,049), waarvan 4 SNP’s beperkt waren tot het AF-gerelateerde subtype.
Klinische bruikbaarheid en effectiviteit
- De 5 HF-artsen rapporteerden dat de geïncludeerde factoren en geïdentificeerde clusters klinische relevantie hadden volgens het raamwerk van de auteurs uit 2021.
- De artsen waren ook van mening dat de ontwikkelde app de geïdentificeerde HF-subtypen weerspiegelde en het testen van de effectiviteit en kosteneffectiviteit in goed ontworpen, prospectieve studies mogelijk zou kunnen maken.
Conclusie
Met behulp van hun 6-stapsframework voor machinelearning-implementatie identificeerden de auteurs 5 HF-subtypen (vroeg beginnend, laat beginnend, AF-gerelateerd, metabool en cardiometabool) en valideerden ze deze subtypen op basis van gegevens die representatief zijn voor de populatie. De 5 subtypen vertoonden een goede voorspellende nauwkeurigheid voor 1-jaarssterfte door alle oorzaken. Om de effectiviteit van hun benadering te beoordelen, ontwikkelden de auteurs ook een open-acces HF-clusterapp die artsen kunnen gebruiken om het cluster dat past bij een bepaalde patiënt en diens voorspelde overleving te bepalen.
Referenties
1. Ponikowski P, Voors AA, Anker SD, et al. 2016 ESC Guidelines for the diagnosis and treatment of acute and chronic heart failure: The Task Force for the diagnosis and treatment of acute and chronic heart failure of the European Society of Cardiology (ESC)developed with the special contribution of the Heart Failure Association (HFA) of the ESC. Eur Heart J 2016; 37: 2129–200.
2. Mordi IR, Pearson ER, Palmer CNA, Doney ASF, Lang CC. Differential association of genetic risk of coronary artery disease with development of heart failure with reduced versus preserved ejection fraction. Circulation 2019; 139: 986–88.
3. Solomon SD, Pfeffer MA. The future of clinical trials in cardiovascular medicine. Circulation 2016; 133: 2662–70.
4. Seidelmann SB, Feofanova E, Yu B, et al. Genetic variants in SGLT1, glucose tolerance, and cardiometabolic risk. J Am Coll Cardiol 2018; 72: 1763–73.
5. Yancy CW, Jessup M, Bozkurt B, et al. 2017 ACC/AHA/HFSA focused update of the 2013 ACCF/AHA guideline for the management of heart failure: a report of the American College of Cardiology/American Heart Association Task Force on Clinical Practice Guidelines and the Heart Failure Society of America. J Am Coll Cardiol 2017; 70: 776–803.
6. Chawla LS, Herzog CA, Costanzo MR, et al. Proposal for a functional classification system of heart failure in patients with end-stage renal disease: proceedings of the acute dialysis quality initiative (ADQI) XI workgroup. J Am Coll Cardiol 2014; 63: 1246–52.
7. Arnett DK, Blumenthal RS, Albert MA, et al. ACC/AHA guideline on the primary prevention of cardiovascular disease. Circulation 2019; 2019: CIR0000000000000678.
8. Banerjee A, Pasea L, Chung SC, et al. A population-based study of 92 clinically recognized risk factors for heart failure: co-occurrence, prognosis and preventive potential. Eur J Heart Fail 2022; 24: 466–80.
9. Banerjee A, Chen S, Fatemifar G, et al. Machine learning for subtype definition and risk prediction in heart failure, acute coronary syndromes and atrial fibrillation: systematic review of validity and clinical utility. BMC Med 2021; 19: 85.
Vind dit artikel online op Lancet Digit Health.Vind hier de hartfalencluster-app