Iskalnik za natančnejše, hitrejše prepoznavanje metabolitov | 2020

Vsebina:

Anonim

Raziskovalci z univerze Aalto in Univerze v Jeni v Nemčiji so razvili iskalnik z imenom CSI: FingerID, ki identificira metabolite iz tandemskih meritev masne spektrometrije s točnostjo več kot 150 odstotkov večjo od njenih tekmecev, zaradi česar lahko delo raziskovalcev v življenju in medicinskih znanosti. Študija je bila pred kratkim objavljena v PNAS časopis.

Metaboliti so majhne molekule, kot so sladkorji, maščobne kisline in aminokisline, ki med drugim služijo kot viri energije v celicah in kot gradbeni materiali za celične stene. Za raziskovalce so ti sledi delovanja in statusa celic.

„Obstaja veliko presnovkov, od več sto tisoč do milijonov, in vsi so videti podobni. V naši študiji smo izdelali model, ki temelji na strojnem učenju. Molekularne strukture, ki jih predvideva, se lahko uporabljajo na enak način kot rezultati iskanja v Googlovem iskalniku, «pojasnjuje profesor Juho Rousu z univerze Aalto.

Prstni odtisi molekul

Tandem masni spektrometer, uporabljen v študiji, je instrument, ki deli molekule na fragmente, da izmeri njihove mase in relativne abundance ali njihov masni spekter. V metodi, ki so jo razvili raziskovalci iz Aalta in Jene, je iz vsakega spektra, vključenega v podatke o usposabljanju, najprej izračunano razdrobljeno drevo, ki opisuje za vsak fragment njegov starš, večji fragment, iz katerega izvira. Nato raziskovalci trenirajo model strojnega učenja z uporabo velikega števila dreves fragmentacije in molekularnih lastnosti ali prstnih odtisov, ki ustrezajo vsakemu drevesu. Ko za model dobimo spekter nove molekule, napovedujemo njene verjetne prstne odtise, na podlagi katerih se iz baze podatkov molekule poišče niz najbolj primernih molekul.

Odvisno od vrste molekul, kar 95 odstotkov iskanj trenutno vrne pravilen rezultat iskanja med prvih 10 tekem. S povečanjem obsega podatkov se izboljša natančnost identifikacije. Za izdelavo modela je trenutno uporabljenih približno 6.000 masnih spektrov.V idealnem primeru bi iskalnik, ki temelji na strojnem učenju, vedno predlagal pravilno molekulo kot prvo tekmo, vendar to zahteva znatno povečanje obsega podatkov in nadaljnji razvoj metod.

Študija bi lahko koristila zlasti raziskovalcem v življenju in medicini. Možna prihodnja področja uporabe vključujejo delo proti dopingu, nadzor nad drogami s strani carine in preiskavo na kraju zločina.

Študija je bila izvedena v sodelovanju z raziskovalno skupino pod vodstvom profesorja Sebastiana Böckerja z Univerze v Jeni in služi kot dober primer raziskav Aaltove univerze, ki združuje informacijsko tehnologijo z digitalnim zdravjem.