Glykaner, eller strukturer av sockermolekyler i våra celler kan mätas med masspektrometri. En viktig användning är att strukturerna kan indikera för olika former av cancer i cellerna.
Datan från masspektrometer-mätningen måste dock analyseras noggrant av människor för att utifrån glykanets fragmentering räkna ut vilken struktur det rör sig om. Denna process kan ta allt från timmar till dagar för varje prov och kan bara utföras med hög säkerhet av ett fåtal experter i världen, eftersom det i grunden är ett detektivarbete som man lär sig under många år.
Automatisera detektivarbetet
Processen är därmed en flaskhals i användandet av glykananalyser, till exempel för att upptäcka cancer, när det finns många prover som ska analyseras.
Forskare vid Göteborgs universitet har utvecklat en AI-modell för att automatisera detektivarbetet. AI-modellen, som fått namnet Candycrunch, löser uppgiften på bara tar några sekunder per prov. Resultaten redovisas i en vetenskaplig artikel i tidskriften Nature Methods.
I tränandet av AI-modellen användes en databas med över 500 000 exempel på olika fragmenteringar och tillhörande strukturer av sockermolekyler.
– Träningen har gjort att Candycrunch kan räkna ut den exakta sockerstrukturen i ett prov i 90 procent av fallen, säger Daniel Bojar, biträdande universitetslektor i bioinformatik vid Göteborgs universitet.
Kan hitta nya biomarkörer
Detta innebär att AI-modellen snart kan nå samma nivåer av noggrannhet som sekvenseringen av andra biologiska sekvenser, som DNA, RNA eller proteiner.
Eftersom AI-modellen är så snabb och exakt i sina svar så kan den påskynda upptäckten av glykanbaserade biomarkörer för både diagnos och prognos för cancerformen.
– Vi tror att glykananalyser kommer bli en större del av biologisk och klinisk forskning när vi nu har automatiserat den största flaskhalsen, säger Daniel Bojar.
AI-modellen Candycrunch klarar också av att identifiera strukturer som ofta missas av mänskliga analyser på grund av för låga koncentrationer. Modellen kan därför hjälpa forskarna att hitta nya glykanbaserade biomarkörer.
Vetenskaplig artikel i Nature Methods: Predicting glycan structure from tandem mass spectrometry via deep learning
Kontakt: Daniel Bojar, biträdande universitetslektor i bioinformatik på Institutionen för kemi och molekylärbiologi vid Göteborgs universitet och vid Wallenbergcentrum för molekylär och translationell medicin, telefon: (talar engelska) 072-209 98 22, e-post: daniel.bojar@gu.se