Forskare inom fysik och medicin från Göteborgs universitet, och från Nova Medical School i Lissabon, har samarbetat för att hitta ett sätt att använda maskininlärning för att diagnostisera patienter med förhöjda kolesterolnivåer.
Testat på vanlig sjukdom
Familial hypercholesterolemia (FH) är en vanlig genetisk sjukdom som drabbar en av 250 personer. Sjukdomen påverkar ämnesomsättningen och orsakar förhöjda kolesterolnivåer. För att få en helt säker diagnos krävs ett genetiskt test.
Dessa tester är emellertid bara tillgängliga på ett begränsat antal universitetssjukhus.
Alla andra sjukhus använder en metod som kallas Dutch lipid score, som baseras på en patients kliniska egenskaper och familjehistoria. Metoden uppskattar sannolikheten för att en patient lider av FH, snarare än att diagnostisera, och den är ett mer lättillgängligt, men mindre exakt, verktyg än ett genetiskt test.
Uppfunnit ny och mer tillförlitlig diagnosmetod
Nu har en tvärvetenskaplig grupp forskare från institutionen för fysik och avdelningen för molekylär och klinisk medicin vid Göteborgs universitet uppfunnit en alternativ metod.
– Vi bestämde oss för att försöka använda maskininlärning för att förutsäga om en patient har den ärftliga genetiska sjukdomen, eller om deras symptom uppstått av orsaker relaterade till livsstil. För att göra detta använde vi tre olika typer av algoritmer: ett klassificeringsträd, en gradient boosting machine och ett neuralt nätverk. Vi fann att alla tre varianter gav bättre resultat än den traditionella Dutch lipid score, säger Saga Helgadottir, doktorand vid institutionen för fysik.
Använde data från patienter
Forskarna använde data från patienter i Göteborg för att träna algoritmerna. Hälften av datasetet användes för information, den andra hälften för att testa och se hur exakt algoritmerna kunde förutsäga om en patient led av FH eller inte.
För varje patient matades det in ett par grundläggande variabler, som alla sjukhus enkelt kunde få fram, som ålder och resultat från blodprov. Forskarna testade dessutom algoritmerna som tränats med Göteborgs-data på en annan uppsättning data från en liknande patientgrupp från Milano.
Resultaten visade att algoritmerna presterade mer exakt när de tränats med "lokalt data", men algoritmernas resultat överträffade fortfarande Dutch lipid score när de testade extern Milano-data.
– Beroende på hur väl du tränar algoritmen blir testresultatet mer eller mindre exakt. Sjukhus runt om i världen skulle kunna välja mellan att träna algoritmen med egen patientdata och få ett mer exakt resultat, eller att använda en redan tränad algoritm och fortfarande få ett bättre resultat än i dagsläget, förklarar Saga Helgadottir.
Jämföra data en väg framåt
Framöver kan en potentiell väg att utforska vara att träna algoritmen med hjälp av en stor mängd data från patientgrupper i olika länder, och jämföra exaktheten i resultaten med den för en version som tränats med endast lokala data.
– Möjligheten att testa den idén hänger på tillgången till sådana datamängder, säger Saga Helgadottir.
Resultaten av studien har publicerats i European Journal of Preventive Cardiology.
Samarbetande forskare i studien inkluderar Stefano Romeo, professor i molekylär och klinisk medicin vid Göteborgs universitet och specialistläkare i kardiologi vid Sahlgrenska Universitetssjukhuset, Ana Pina, specialiserad läkare, datavetare och forskare vid Medir, Chronic Diseases Research Center, NovaMedical School och Giovanni Volpe, universitetslektor vid institutionen för fysik, Göteborgs universitet.
Text: Carolina Svensson
Artikelns namn: Virtual genetic diagnosis for familial hypercholesterolemia powered by machine learning
Länk till artikeln>>
Kontakt:
Saga Helgadottir, doktorand vid institutionen för fysik
031-786 9157 ,0766-229157, saga.helgadottir@physics.gu.se
Foto:
Överst: illustration AI, foto kentoh, Mostphotos.
Porträtt Saga Helgadottir (GU)