Zápočet z molekulární fylogenetiky. - 23.5.2007
Dnes jsem kromě zápočtu z „úplně nejmenší botaniky“ v podobě poznávačky kytek (snad jsem to zvládnul, bylo to dost lehké – Dactylis glomerata, Poaceae; Geum urbanum, Rosaceae; Lychnis flos-cuculi; hvozdíkovité – tady jsem si nevzpomněl na latinský název čeledi; heřmánek pravý, Asteraceae; Rannunculus, Ranunculaceae; Tilia cordata, Tiliaceae; Vicia cracca, Fabaceae apod.; něco jsem nevěděl, něco jenom česky, snad to bude stačit) dělal také zápočet z molekulární fylogenetiky, tj. z vyrábění stromečků na základě pořadí nukleotidů v nukleových kyselinách. Vylosoval jsem si úkol „dokaž, že sinice a riketsie jsou bakterie“. Nebyl to asi nejzábavnější úkol z nabídky (spolužáci měli např. „dokaž, že ploutve vznikly u obratlovců opakovaně“ nebo „na ostrově byly nalezeny nové druhy klokanů - kolonizovaly ostrov nezávisle, nebo jsou výsledkem radiace přímo na ostrově“ nebo „jsou jazyčnatky opravdu korýši?“), ale zvládnul jsem ho dobře. Teď zde zhruba načtrtnu svůj postup. Na anglické Wikipedii, na stránkách fakultních fykologů Sinicearasy.cz a tak vůbec na netu a ve své paměti jsem si našel několik sinic. Vybíral jsem ty, které jsem si matně pamatoval z doby před rokem, kdy jsem se učil na zkoušku z fykologie (Nostoc, Anabaena, Arthrospira, Oscillatoria, Synechococcus). Potom jsem vybral několik různých druhů riketsií a několik známých bakterií (Escherichia coli, Yersinia) a jako outgroup (tj. něco, co nepatří do bakterií a podle čeho se pak ten výsledný strom zarovnává) jsem si vybral jednu archeobakterii a jeden eukaryotní organismus ze skupiny Apicomplexa. V této fázi je výhodou hrubá znalost fylogeneze organismů, na netu se ale dá najít vše. Nebyli jsme nijak tlačeni časem, takže i ten, kdo např. nevěděl, kteří obratlovci mají ploutve, si to mohl zjistit. Zároveň s vybíráním vhodných druhů do mého stromečku jsem si z databáze GenBank, která není volně přístupná, stahoval geny daných zvířat pro 16S rRNA (typický gen používaný pro fylogenetiku). Gen např. oscillatorie vypadal takto:
A G A G G A A G A T C C T G G C T C A G G A T G A A C G C T G G C G G T C T G C T T A A C A C A T G C T A G T C G A A C G A A G T C T T C G G A C T T A G T G G C G G A C G G G T G A G T A A C G C G T G A G A A T C T G C C T T C A G G T C G G G G A T A A C A G T T G G A A A C G A C T G C T A A T A C C G G A T G T G C C C A A G G G T G A A A G A T T T A T T G C C A G A A G A G G A G C T C G C G T C T G A T T A G C T A G T T G G T A G G G T A A A A G C C T A C C A A G G C G T C G A T C A G T A G C T G G T C T G A G A G G A T T A G C A G C C A C A C T G G G A C T G A G A C A C G G C C C A G A C T C C T A C G G G A G G C A G C A G T G G G G A A T T T T C C G C A A T G G G C G C A A G C C T G A C G G A G C A A G A C C G C G T G G G G G A G G A A A G C C T T T G G G T C G T A A A C C C C T T T T G T C A G G G A A G A A A C C C T T G A C G G T A C C T G A C G A A T C A G C C T C G G C T A A C T C C G T G C C A G C A G C C G C G G T A A T A C G G A G G A G G C A A G C G T T A T C C G G A A T T T T T G G G C G T A A G C G T C C G C A G G T G C C A A G T A A G T C T G C T G T T A A A G A A C A C G G C T C A A C T G T G G G C A G G C A G T G G A A A C T G C G G G G C T A G A G T G C G G T A G G G G T A G A G G G A A T T C C C G G T G T A G C G G T G A A A T G C G T A G A G A T C G G G A A G A A C A C C G G T G G C G A A G G C G C T C T A C T G G G C C G C A A C T G A C A C T C A C A G G A C G A A A G C T A G G G G A G C G A A A G G G A T T A G A T A C C C C T G T A G T C C T A G C T G T A A A C G A T G G A G A C T A G G T G T A G C A C G T A T C G A C C C G T G C T G T A T C G G A T C C A A C G C G T T A A G T C T C C C G C C T G G G G A G T A C G C G C G C A A G C G T G A A A C T C A A A G G A A T T G A C G G G G G C C C G C A C A A G C G G T G G A G T A T G T G G T T T A A T T C G A T G C A A C G C G A A C A A C C T T A C C A G G G C T T G A C A T G T C G C G A A T C T C T G G G A A A A C C G G A G A G T G C C T A A G G G A G C G C G A A C C C A G G T G G T G C A T G G C T G T C G T C A G C T C G T G T C G T G A G A T G T T T G G T T A A G T C C C G C A A C G A G C G C A A C C C C T C G T C T T T A G T T G C C A G C A G T A A G A T G G G C A C T C T A G A G A G A C T G C C G G T G A C A A A C C C G G A G G A A G G T G G G G A T G A C G T C A A G T C A G C A T G C C C C T T A C G T C C T G G G C G A C A C A C G T A C T A C A A T G G A G G G G A C A G A G G G C A G C C A A C C C G C G A G G G C G A G C T A A T C C C G T A A A C C C C G C C T C A G T T C A G A T C G C A G G C T G C A A C T C G C C T G C G T G A A G G C G G A A T C G C T A G T A A T C G C C G G T C A G C A T A C G G C G G T G A A T C C G T T C C C G G G C C T T G T A C A C A C C G C C C G T C A C A C C A T G G G A G C T G G C C A C G C C C G A A G T C G T T A C T C C A A C C C G T T A G G G A G G A G G A C G C C G A A G G C A G G G C T G G T G A C T G G G G T G A A G T C G T A A C A A G G T A G C C G T A C C G G A A G G T G T G G C T G G A T C A C C T C C T T T
Pěkné, že? Když jsem měl všechny geny stažené, uložil jsem si je do jednoho textového souboru, určitým způsobem označil, který gen patří ke kterému organismu, a zapnul program Clustal X. Tento program mi sekvence tzv. "zelajnoval" (alignment), tj. dal pod sebe sobě si odpovídající části genů u různých organismů.