BIOINFORMATIKA

 

Kontrolinis darbas Nr.2

 

Tema: Homologų paieškos BLAST metodu optimizavimas

 

Darbo užduotis: keičiant BLAST įvesties parametrus atlikti homologų paiešką pasirinktam baltymui ir išanalizavus gautus rezulatus rekomenduoti optimalius parametrų rinkinius įvairiems tiriamos sekos analizės atvejams: kai atliekami evoliuciniai tyrimai ar funkcinė baltymo sekos analizė, vertinant didelio, vidutinio ar žemo panašumo homologus, siekiant rezultatų gausos ar kokybės.

 

Darbo etapai:

1. 

Keičiant “word size” ir “Matrix” parametrus surinkti homologų paieškos duomenis (dešimt rezultatų rinkinių)

2. 

Aptarti homologų paieškos rezultatus kai optimizavimas vykdomas pagal rezultatų gausą. Įvardinti optimalius parametrų rinkinius (matrix + word size) evoliuciniams tyrimams bei funkcinei baltymų sekų analizei.()

3. 

Aptarti homologų paieškos rezultatus kai optimizavimas vykdomas siekiant gaunamų rezultatų kokybės. Įvardinti optimalius parametrų rinkinius (matrix + word size) evoliuciniams tyrimams bei funkcinei baltymų sekų analizei. Išskirti atvejus kai analizė atliekama didelių, vidutinių ir mažų homologijų srityje()

4p 

Aptarti homologų suradimo stabilumą (kokių homologų identifikavimas nepriklauso nuo parametrų kaitos, kiek yra “nestabilių” homologų, ką galėtumėte pasakyti apie jų stabilumą?)

4p nėra privalomas, papildomiems vertinimo taškams sukaupti (bus panaudoti užpildant tobulumo spragas pagrindinėje dalyje (1-3))

 

Rekomendacijos, komentarai:

1. 

Pirmiausia surinkite homologų paieškos rezultatus visiems parametrų deriniams (2 variantai "word size" kart 5 variantai "matrix" = 10 rezultatų rinkinių). Kiekvienu atveju rezultatus surašykite atskiruose MS Excel (ar Open Office) lakštuose (žemiau pateiktame pavyzdyje rezultatai buvo sukeliami į B stulpelius A stulpelį rezervuojant homologų vardams)

2. 

Pasirenkamas atvejis kai homologų buvo surasta mažiausiai ir šiame rinkinyje atrenkami 3 kontroliniai baltymai, kurie atstovaus baltymus didelių, vidutinių ir silpnų homologijų srityse. Tuo tikslu homologų sąrašas padalinamas į 3 dalis - viršutinę (t.y. didelių homologijų), vidurinę (t.y. vidutinių homologijų) ir žemutinę (t.y. silpniausių homologijų). Kiekvienos dalies apie vidurį pasirenkamas baltymas su žinoma funkcija (nesirenkame "hypothetical", "putative", "unknown" ar "-like" baltymų)

3. 

Kiekvieno rezultatų rinkinio atveju į atskirus rezultatų eilutės stulpelius "išekstrahuojami" homologų vardai (naudojant LEFT funkciją) bei jų panašumo į tiriamąjį baltymą įverčiai (E-value reikšmės; naudojant MID funkciją). Vardo ilgis LEFT funkcijai pateikiamas pasinaudojus SEARCH funkcija, ieškant rezultatų eilutėje pirmojo tarpelio simbolio (jis gi bus homologo vardo pabaigoje). E-value reikšmėms paimti yra nuskaitoma rezultatų eilutės 7 simboliai pradedant 75-uoju. Gautasis naujas stulpelis nukopijuojamas į gretimą, perkeliant tik reikšmes (Paste special -> values) ir visame stulpelyje vykdant tarpelio simbolio pakeitimą į tuštumą (t.y. "replace with" laukelyje neįrašant nieko) tekstas automatiškai bus pakeistas į skaičius.

4. 

Atskirame lakšte sudaroma lentelė, kurioje bus pateikiami gauti rezultatai: kiekvienam parametrų rinkiniui - surastų homologų skaičius (panaudojant COUNT funkciją suskaičiuojant E-value reikšmių skaičių atitinkamų lakštų atitinkamuose stulpeliuose) bei kontrolinių baltymų panašumo į tiriamąjį baltymą įverčiai (panaudojama VLOOKUP funkcija).

5. 

Išrinkus optimalius parametrų rinkinius įvairiems atvejams (kaip buvo suformuluota užduotyje), toliau aptariant gautus rezultatus prisiminkite ką reiškia skaičiai PAM ir BLOSUM lentelių pavadinimuose ir žvelgiant į rezultatus gautus kontroliniams baltymams pakomentuokite ar tyrimams pasirinkto baltymo homologai atitinka bendrąsias baltymų panašumo tendencijas (o būtent ar dideliems panašumams vertinti geriausiai tinka BLOSUMxx ir PAMyy lentelės, vidutiniams ..., silpniems ...). Ši aptarimo dalis būtina siekiantiems aukščiausio įvertinimo už kontrolinį darbą (dešimtuko). Įvertinimui pasigerinti skirta ir 4p užduotis.

 

    Naudingos nuorodos: BLAST

 

    Pavyzdys: MS Excel 2007 , MS Excel 97-2003 , MS Excel 97-2003 (LT regionals) , Open Office , Open Office (LT regionals)

    This page was last updated on 10/19/09.