Seminar iz veštačke inteligencije, 29. jun 2022.

Naredni sastanak Seminara biće održan onlajn u sredu, 29. juna 2022, od 19-20 časova.

Predavač: Biljana Stojanović, Matematički institut SANU

Naslov predavanja: ANALIZA KODIRAJUĆIH I AMINOKISELINSKIH SEKVENCI PROTEINA VIRUSA SARS-COV-2 METODOM KLASTEROVANjA

Apstrakt:
U predavanju će biti izloženi rezultati dobijeni klasterovanjem proteina virusa SARS-CoV-2 na osnovu: 1) upotrebe kodona (engl. Codon Usage, CU) u kodirajućim (nukleotidnim) sekvencama proteina i 2) edit-rastojanja aminokiselinskih sekvenci proteina, radi karakterizacije specifičnih proteinskih grupa (tipova) i sojeva virusa SARS-CoV-2 kojima pripadaju posmatrani proteini. Pojam upotrebe kodona se odnosi na razlike u učestalosti pojavljivanja sinonimnih kodona aminokiselina tokom translacije proteina. Upotreba kodona je izračunata primenom dve standardne mere (indeksa): 1) relativne upotrebe sinonimnih kodona (eng. Relative Synonimous Codon Usage, RSCU) i efektivnog  broja kodona (engl. Effective Number of Codons, ENC) pojedinačnih aminokiselina. Edit-rastojanja sekvenci aminokiselina izračunata su za svaki par proteina. Skup podataka od 423.425 nukleotidnih sekvenci izolata preuzet je sa https://www.ncbi.nlm.nih.gov/sars-cov-2 25. avgusta 2021. Nakon procesa čišćenja ostalo je 347.962 izolata sa 225.934 jedinstvenih (2.366.031 ukupno) kodirajućih sekvenci proteina. Provera konzistentnosti je izvršena između nukleotidnih sekvenci i aminokiselinskih kodova odgovarajućih proteina na osnovu standardne tablice genetskog koda (transl_table 1). Klasteovanje proteina je izvršeno sa više različitih metoda  uz variranje parametara algoritama klasterovanja. Klasterovanjem skupa kodirajućih sekvenci dobijaju se jasno razdvojeni proteini odgovarajućeg tipa (ORF1a, ORF1ab, S-protein, N-protein, ...) što pokazuje da svaki tip proteina ima svoj specifičan „potpis“ zavisan od upotrebe kodona. Ukoliko se posmatraju oznake proteina prema WHO (World Health Organization) anotaciji, dobijaju se klasteri u kojima pojedini sojevi proteina izrazito dominiraju ili u kojima je zastupljen samo jedan soj. Ovi rezultati mogu da posluže za određivanje sojeva izolata koji su prikupljani u prvom periodu dok još nije vršena WHO anotacija.

Napomena: Registraciona forma za učešće je dostupna na linku:
https://miteam.mi.sanu.ac.rs/asset/CW5nJWDSEZDj7p32p

Ukoliko želite samo da pratite predavanje bez mogućnosti aktivnog učešća, prenos je dostupan na linku:
https://miteam.mi.sanu.ac.rs/asset/4LNW8WtML7rLKojozNažalost nije moguće ostaviti komentar.