Cardiovasculaire Geneeskunde.nl

Identificatie van 5 HF-subtypen met behulp van machinelearning

Identifying subtypes of heart failure from three electronic health record sources with machine learning: an external, prognostic, and genetic validation study

Literatuur - Banerjee A, Dashtban A, Chen S, et al. - Lancet Digit Health. 2023 Jun;5(6):e370-e379. doi: 10.1016/S2589-7500(23)00065-1

Introductie en methoden

Achtergrond

De huidige HF-subtypeclassificaties hebben niet geleid tot precisiegeneeskunde, gepersonaliseerde zorg of gerichte therapieën [1-6]. Bovendien zijn door onvolledige kennis van HF-subtypen over het brede spectrum van oorzakelijke factoren en populaties de primaire preventie en screeningsrichtlijnen voor deze ziekte beperkt [7,8].

Doel van de studie

In een grote populatie van patiënten gediagnosticeerd met HF gebruikten de auteurs machinelearning om (1) subtypen te identificeren met klinische relevantie gedurende het gehele ziekteverloop van HF en met een laag risico op bias voor patiëntselectie en algoritmen, (2) interne, externe, prognostische en genetische validiteit aan te tonen en (3) potentiële klinische paden te ontwikkelen om de impact te verbeteren.

Methoden

In deze externe, prognostische en genetische validatiestudie gebruikten de auteurs hun framework voor praktische machinelearning-implementatie uit 2021, dat bestaat uit 6 stappen: klinische relevantie, patiënten, algoritme, interne validatie (binnen dataset en tussen methoden), externe validatie (tussen methoden), klinische bruikbaarheid en effectiviteit) [9]. De gegevens van patiënten gediagnosticeerd met HF in de leeftijd van ≥30 jaar werden geëxtraheerd uit 2 populatiegebaseerde databases met elektronische patiëntendossiers in het VK, Clinical Practice Research Datalink (CPRD; n=188.800) en The Health Improvement Network (THIN; n=124.262), van 1998 tot 2018.

De CPRD- en THIN-datasets leverden 645 factoren op voor en na de HF-diagnose, waaronder demografische informatie, comorbiditeiten en medicatiegebruik en persistentie. Voor het algoritme werden 87 van deze 645 factoren geselecteerd. Om het risico op algoritmische bias te verminderen, werden de volgende 4 machinelearning-methoden (zonder toezicht) vergeleken: K-means, hiërarchisch, K-medoids en mixture modeling.

Subtypen werden geïdentificeerd en beoordeeld op: (1) externe validiteit, (2) prognostische validiteit (voorspellende nauwkeurigheid voor totale sterfte na 1 jaar) en (3) genetische validiteit (associatie met single nucleotide-polymorfismen (SNP’s) en met polygene risicoscores (PRS’s ) voor HF-gerelateerde kenmerken, met behulp van UK Biobank-gegevens (n=9573)).

Om de klinische bruikbaarheid te beoordelen, werd 5 HF-artsen gevraagd naar klinische relevantie, rechtvaardiging en interpreteerbaarheid van de resultaten. Op basis van hun input werd een model ontwikkeld dat cluster en overleving voorspelde, evenals een HF-clusterapp voor routinematig klinisch gebruik.

Belangrijkste resultaten

Interne en externe validatie en subtype-identificatie

Prognostische validatie

Genetische validatie

Klinische bruikbaarheid en effectiviteit

Conclusie

Met behulp van hun 6-stapsframework voor machinelearning-implementatie identificeerden de auteurs 5 HF-subtypen (vroeg beginnend, laat beginnend, AF-gerelateerd, metabool en cardiometabool) en valideerden ze deze subtypen op basis van gegevens die representatief zijn voor de populatie. De 5 subtypen vertoonden een goede voorspellende nauwkeurigheid voor 1-jaarssterfte door alle oorzaken. Om de effectiviteit van hun benadering te beoordelen, ontwikkelden de auteurs ook een open-acces HF-clusterapp die artsen kunnen gebruiken om het cluster dat past bij een bepaalde patiënt en diens voorspelde overleving te bepalen.

Referenties

Toon referenties

Vind dit artikel online op Lancet Digit Health. Vind hier de hartfalencluster-app

Deel deze pagina met collega's en vrienden: