Identificatie van 5 HF-subtypen met behulp van machinelearning
Identifying subtypes of heart failure from three electronic health record sources with machine learning: an external, prognostic, and genetic validation study
Literatuur - Banerjee A, Dashtban A, Chen S, et al. - Lancet Digit Health. 2023 Jun;5(6):e370-e379. doi: 10.1016/S2589-7500(23)00065-1Introductie en methoden
Achtergrond
De huidige HF-subtypeclassificaties hebben niet geleid tot precisiegeneeskunde, gepersonaliseerde zorg of gerichte therapieën [1-6]. Bovendien zijn door onvolledige kennis van HF-subtypen over het brede spectrum van oorzakelijke factoren en populaties de primaire preventie en screeningsrichtlijnen voor deze ziekte beperkt [7,8].
Doel van de studie
In een grote populatie van patiënten gediagnosticeerd met HF gebruikten de auteurs machinelearning om (1) subtypen te identificeren met klinische relevantie gedurende het gehele ziekteverloop van HF en met een laag risico op bias voor patiëntselectie en algoritmen, (2) interne, externe, prognostische en genetische validiteit aan te tonen en (3) potentiële klinische paden te ontwikkelen om de impact te verbeteren.
Methoden
In deze externe, prognostische en genetische validatiestudie gebruikten de auteurs hun framework voor praktische machinelearning-implementatie uit 2021, dat bestaat uit 6 stappen: klinische relevantie, patiënten, algoritme, interne validatie (binnen dataset en tussen methoden), externe validatie (tussen methoden), klinische bruikbaarheid en effectiviteit) [9]. De gegevens van patiënten gediagnosticeerd met HF in de leeftijd van ≥30 jaar werden geëxtraheerd uit 2 populatiegebaseerde databases met elektronische patiëntendossiers in het VK, Clinical Practice Research Datalink (CPRD; n=188.800) en The Health Improvement Network (THIN; n=124.262), van 1998 tot 2018.
De CPRD- en THIN-datasets leverden 645 factoren op voor en na de HF-diagnose, waaronder demografische informatie, comorbiditeiten en medicatiegebruik en persistentie. Voor het algoritme werden 87 van deze 645 factoren geselecteerd. Om het risico op algoritmische bias te verminderen, werden de volgende 4 machinelearning-methoden (zonder toezicht) vergeleken: K-means, hiërarchisch, K-medoids en mixture modeling.
Subtypen werden geïdentificeerd en beoordeeld op: (1) externe validiteit, (2) prognostische validiteit (voorspellende nauwkeurigheid voor totale sterfte na 1 jaar) en (3) genetische validiteit (associatie met single nucleotide-polymorfismen (SNP’s) en met polygene risicoscores (PRS’s ) voor HF-gerelateerde kenmerken, met behulp van UK Biobank-gegevens (n=9573)).
Om de klinische bruikbaarheid te beoordelen, werd 5 HF-artsen gevraagd naar klinische relevantie, rechtvaardiging en interpreteerbaarheid van de resultaten. Op basis van hun input werd een model ontwikkeld dat cluster en overleving voorspelde, evenals een HF-clusterapp voor routinematig klinisch gebruik.
Belangrijkste resultaten
Interne en externe validatie en subtype-identificatie
- In de interne validatie was het optimale aantal clusters 5. Op basis van demografie, belasting met HVZ-risicofactoren, AF, HVZ, medicatie en laboratoriumwaarden werden 5 clusters geïdentificeerd, die werden gelabeld als de volgende 5 HF-subtypen: (1) vroeg beginnend, (2) laat beginnend, (3) AF-gerelateerd, (4) metabool en (5) cardiometabool.
- In de externe validatie waren de subtypen vergelijkbaar tussen de datasets (voor THIN-model in CPRD varieerde de c-statistiek van 0,79 (subtype 3) tot 0,94 (subtype 1) en voor CPRD-model in THIN van 0,79 (subtype 1) tot 0,92 (subtypen 2 en 5)).
- De verdeling van de 5 subtypen was vergelijkbaar in de CPRD- en THIN-datasets, waarbij laat beginnend (~33%) en cardiometabool (~29%) de meest voorkomende subtypen waren en AF-gerelateerd (~9%) het minst voorkomende subtype.
Prognostische validatie
- In de prognostische validatie in CPRD met behulp van het THIN-model was de 1-jaarssterfte door alle oorzaken na de HF-diagnose 0,20 (95%BI: 0,14-0,25) voor subtype 1, 0,46 (95%BI: 0,43-0,49) voor subtype 2, 0,61 (95%BI: 0,57-0,64) voor subtype 3, 0,11 (95%BI: 0,07-0,16) voor subtype 4 en 0,37 (95%BI: 0,32-0,41) voor subtype 5. Tussen THIN en CPRD werden verschillen in sterfte gezien voor clusters 1 en 5, maar niet voor de andere clusters.
- Ook het risico op niet-fatale HVZ of ziekenhuisopname verschilde per HF-subtype.
Genetische validatie
- In de genetische validatie waren de PRS’s voor atriale ritmestoornissen, DM, hypertensie, MI, obesitas, stabiele angina en instabiele angina allemaal geassocieerd met ≥1 HF-subtype na correctie voor meervoudig testen (P<0,0009). De subtypen laat beginnend en cardiometabool waren in grote lijnen geassocieerd met vergelijkbare PRS’s.
- Acht SNP’s waren nominaal geassocieerd met de voorspelde HF-subtypen (P=0,049), waarvan 4 SNP’s beperkt waren tot het AF-gerelateerde subtype.
Klinische bruikbaarheid en effectiviteit
- De 5 HF-artsen rapporteerden dat de geïncludeerde factoren en geïdentificeerde clusters klinische relevantie hadden volgens het raamwerk van de auteurs uit 2021.
- De artsen waren ook van mening dat de ontwikkelde app de geïdentificeerde HF-subtypen weerspiegelde en het testen van de effectiviteit en kosteneffectiviteit in goed ontworpen, prospectieve studies mogelijk zou kunnen maken.
Conclusie
Met behulp van hun 6-stapsframework voor machinelearning-implementatie identificeerden de auteurs 5 HF-subtypen (vroeg beginnend, laat beginnend, AF-gerelateerd, metabool en cardiometabool) en valideerden ze deze subtypen op basis van gegevens die representatief zijn voor de populatie. De 5 subtypen vertoonden een goede voorspellende nauwkeurigheid voor 1-jaarssterfte door alle oorzaken. Om de effectiviteit van hun benadering te beoordelen, ontwikkelden de auteurs ook een open-acces HF-clusterapp die artsen kunnen gebruiken om het cluster dat past bij een bepaalde patiënt en diens voorspelde overleving te bepalen.
Referenties
Vind dit artikel online op Lancet Digit Health. Vind hier de hartfalencluster-app
Deel deze pagina met collega's en vrienden: