Darwiniana

Seznam diskusních fór - Masožravky - ostatní témata : 
Molekulární taxonomie MR
Autor: Mirek Srba (IP zapsáno)
Datum: 13.01.2005 12:23

Vážení kolegové,


problematiku molekulární taxonomie MR jsme již nakousli. Na úvod a pro ilustaraci jsem vytáhl z jedné placené databáze pár sekvencí špirlic:

S. alata:
attgtgtcgc tattcccaat tgccccactt aagagtcggt gagcaatggg taaggcgtat attggccctc cgtgcgcact cgtcaacggt tggcctaaaa atgagttctt gacgacacac gtcacgataa gtggtggtta acaaacgttg catcctgtcg tgcgtgccca tgttgccacg agttggctca tatgattaac ctaaagtgtt gtgactacaa tgcaccgatt

S. flava:
tctgcctggc gtcagccatt gtgtcgctat tcccaattgc cccacctaag agtcggtgag caatgggaaa ggcgtatatt ggccctccgt gcgtactcgt caacggttgg nnnaaaaatg
agttcttgac gacacacgtc acgataagtg gtggttaaca aacgttgcat cctatcgtgc
gtgcccatgt tgccacgagt tggctcatat gattaacctg aagtgttgtg actacaatgc
accgattgcg accccaggtc aga


S. leucophylla:
tctgcctggc gtcaggcatt gtgtccgtat tcccaattgc cccacctaag agtcggtgag
caatgggcaa ggcggatatt ggccctccgt gcgcactcgt caacggttgg cctaaaaatg
agttcttgac gacacacgtc acgataagtg gtggttaaca aacgttgcat cctgtcgtgc
gtgcccatgt tgccacgagt tggctcatat gattaaccta aagtgttgtg actacaatgc
accgattgcg accccaggtc aga

S. minor:
tctgcctggc gtcagccatt gtgtcgctat tcccaattgc cccacctaag agtcggtgag
caatgggaaa ggcgtatatt ggccctccgt gcgaactcgt caacggttgg cctaaaaatg
agttcttgac gacacacgtc acgataagtg gtggttaaca aatgttgaat cctatcgtgc
gtgcccatgt tgccacgagt tggctnatat ggttaacctg aagtgttgtg actacaatac
actgattgcg accccaggtc aga

S. oreophila:
tctgcctggc gtcagccatt gtgtcgctat tcccaattgc cccacttaag agtcgtgagc
aatgggcaag gcgtatattg gccctccgtg cgcactcgtc aacggttggc ctaaaaatga
gttcttgacg acacacgtca cgataagtgg tggttaacaa acgttgcatc ctgtcgtgcg
tgcccatgtt gccacgagtt ggctcatatg attaacctaa agtgttgtga ctacaatgca
ccgattgcga ccccaggtca ga

S. psittacina:
tctgcctggc gtcagccatt gtgtcgctat tcccaattgc cccacctaag agtcggtgag
caatgggaaa ggcgtatatt ggccctccgt gcgtactcgt caacggttgg cccaaaaatg
agttcttgac gacacacgtc acgataagtg gtggttaaca aacgttgcat cctatcgtgc
gtgcccatgt tgccacgagt tggctcataa atgattaacc tgaagtgttg tgactacaat
gcaccgattg cgaccccagg tcaga

S. purpurea:
tctgcctggc gtcaggcatt gtgtccgtat tcccaattac cccacctaat agtcggtgag
taatgtgtaa ggcgtatatt ggccctccgt gcgcactcgt caacggttgg cctaaaaatg
agttcttgac gacacacgtc acgataagtg gtggttaaca aacgttgcat cctatcgtgc
gtgcctatgt tgccatgagt tggctcatat gattaaccca aagtgttgtg actacaatgc
accgattgcg accccaggtc aga

S. rubra:
tctgcctggc gtcagccatt gtgtcgctat tcccaattgc cccacttaag agtcgtgagc
aatgggcaag gcgtatattg gccctccgtg cgcactcgtc aacggttggc ctaaaaatga
gttcttgacg acacacgtca cgataagtgg tggttaacaa acgttgcatc ctgtcgtgcg
tgcccatgtt gccacgagtt ggctcatatg attaacctaa agtgttgtga ctacaatgca
ccgattgcga ccccaggtca ga

Jedná se o sekvenci ITS2 z chloroplastů. Data byla původně publikována v práci:

Bayer,R.J., Hufford,L. and Soltis,D.E.: Phylogenetic relationships in Sarraceniaceae based on rbcL and ITS sequences. Syst. Bot. 21 (2), 121-134 (1996)

Každý se může podívat jak moc se jednotlivé druhy od sebe liší a které jsou si příbuznější a které méně.

Re: Molekulární taxonomie MR
Autor: Miloš Šula (IP zapsáno)
Datum: 13.01.2005 12:45

Takže konkrétně si vezmu 5 rostlin o kterých "skutečně" vím, že jsou to D. aliciae z různých lokalit/kontinentů ( tady ale spoléhám na odborníky, že ta D.aliciae z toho či onoho území je skutečně ještě D.aliciae ač vypadá trochu jinak díky přirozeným mutacím v jiném prostředí ), ale co když to "odborníci" popletli a označili za D.aliciae rosnatku, která je D.aliciae pouze podobná-příbuzná, čímž se přípustná odchylka uvnitř tohoto druhu zvýší a pak při srovnávání s D. esterhuyseniae vyjde, že to je vlastně zmutovaná D. aliciae ? Aha už mě to trklo proto ten širší záběr na dalších 5 druhů z čeledi rosnatkovitých, aby se zjistila mezidruhová odchylka a podle ní se pak určila zhruba variabilita toho genu, aby nedocházelo k těmto záměnám ....


Už to sázím do programu na analýzu , pak sem dám nějakej graf nebo tabulku , sem zvědavej a taky línej to dělat očima smiling smiley

Re: Molekulární taxonomie MR
Autor: Miloš Šula (IP zapsáno)
Datum: 13.01.2005 15:31

Mirku nespletl ses u S. alata ?
Já si dla tu práci a nacpal do programu a tohle mi vylezlo u jednoho druhu sestavy:


TREE-PUZZLE 5.1-generic

Input file name: infile
Type of analysis: tree reconstruction
Parameter estimation: approximate (faster)
Parameter estimation uses: neighbor-joining tree (for substitution process and rate variation)

Standard errors (S.E.) are obtained by the curvature method.
The upper and lower bounds of an approximate 95% confidence interval
for parameter or branch length x are x-1.96*S.E. and x+1.96*S.E.


SEQUENCE ALIGNMENT

Input data: 6 sequences with 265 nucleotide sites
Number of constant sites: 87 (= 32.8% of all sites)
Number of site patterns: 66
Number of constant site patterns: 4 (= 6.1% of all site patterns)


SUBSTITUTION PROCESS

Model of substitution: HKY (Hasegawa et al. 1985)
Transition/transversion parameter (estimated from data set): 6.64 (S.E. 0.15)
Nucleotide frequencies (estimated from data set):

pi(A) = 23.4%
pi(C) = 25.6%
pi(G) = 25.4%
pi(T) = 25.6%

Expected transition/transversion ratio: 6.64
Expected pyrimidine transition/purine transition ratio: 1.10


AMBIGUOUS CHARACTERS IN THE SEQUENCE (SEQUENCES IN INPUT ORDER)

gaps wildcards sum % sequence
S.flava 2 3 5 1.89%
S.leucop 2 0 2 0.75%
S.minor 2 1 3 1.13%
S.psitta 0 0 0 0.00%
S.purpur 2 0 2 0.75%
S.rubra 3 0 3 1.13%
-------------------------------------------------------
Sum 11 4 15 0.94%


The table above shows the amount of gaps ('-') and other 'wildcard'
characters ('X', '?', etc.) and their percentage of the 265 columns
in the alignment.
Sequences with more than 50% ambiguous characters are marked with a '!' and
should be checked, whether they have sufficient overlap to other sequences.
Sequences with 100% ambiguous characters do not hold any phylogenetic
information and had to be discarded from the analysis.



SEQUENCE COMPOSITION (SEQUENCES IN INPUT ORDER)

5% chi-square test p-value
S.flava passed 99.91%
S.leucop passed 97.15%
S.minor passed 97.80%
S.psitta passed 99.37%
S.purpur passed 95.07%
S.rubra passed 99.27%

The chi-square tests compares the nucleotide composition of each sequence
to the frequency distribution assumed in the maximum likelihood model.


IDENTICAL SEQUENCES

The sequences in each of the following groups are all identical. To speed
up computation please remove all but one of each group from the data set.

All sequences are unique.


MAXIMUM LIKELIHOOD DISTANCES

Maximum likelihood distances are computed using the selected model of
substitution and rate heterogeneity.

6
S.flava 0.00000 0.03208 0.02376 0.22904 0.05312 8.99895
S.leucop 0.03208 0.00000 0.05292 0.28479 0.03957 8.99831
S.minor 0.02376 0.05292 0.00000 0.24810 0.07470 8.98357
S.psitta 0.22904 0.28479 0.24810 0.00000 0.30751 8.99854
S.purpur 0.05312 0.03957 0.07470 0.30751 0.00000 8.99846
S.rubra 8.99895 8.99831 8.98357 8.99854 8.99846 0.00000

Average distance (over all possible pairs of sequences): 3.08823


RATE HETEROGENEITY

Model of rate heterogeneity: uniform rate


TREE SEARCH

No tree search performed (maximum likelihood distances only).


Z čehož je nejdůležitější asi tabulka MAXIMUM LIKELIHOOD DISTANCES, kde třeba nejblíže S.flava je S.minor, nejvíce odlišná od všech Sarracenií zde uvedených je S. rubra. Chápu to dobře ? Program je to velice chytrej, dovede si v internetové genové databázi BLAST najít podle vložené sekvence i typ rostliny/genu smiling smiley


Re: Molekulární taxonomie MR
Autor: Miloš Šula (IP zapsáno)
Datum: 13.01.2005 15:38

Jo ještě jsme narazil na zajímavou stránku s různejma databázema (genetický kódy, taxonomie atd.)

[www.ncbi.nlm.nih.gov]

Re: Molekulární taxonomie MR
Autor: Miloš Šula (IP zapsáno)
Datum: 13.01.2005 15:52

Tak ta S.alata byla přece jen dobře, koukal jsem se do té databáze smiling smiley

jinak kompletní tabulka teda je
S.flava 0.00000 0.03145 0.02350 0.19423 0.05169 1.35124 0.24718 8.99839
S.leucop 0.03145 0.00000 0.05135 0.23266 0.03892 1.43497 0.23331 8.99851
S.minor 0.02350 0.05135 0.00000 0.20769 0.07193 1.29151 0.26737 8.99860
S.psitta 0.19423 0.23266 0.20769 0.00000 0.24831 1.32232 0.31354 8.99829
S.purpur 0.05169 0.03892 0.07193 0.24831 0.00000 1.52789 0.27782 8.99841
S.rubra 1.35124 1.43497 1.29151 1.32232 1.52789 0.00000 1.69414 3.73667
H.minor 0.24718 0.23331 0.26737 0.31354 0.27782 1.69414 0.00000 8.99830
S.alata 8.99839 8.99851 8.99860 8.99829 8.99841 3.73667 8.99830 0.00000

Re: Molekulární taxonomie MR
Autor: Mirek Srba (IP zapsáno)
Datum: 13.01.2005 17:02

No, udělal jsi to dobře. K podobným závěrům došli i autoři původní práce.

Re: Molekulární taxonomie MR
Autor: Miloš Šula (IP zapsáno)
Datum: 13.01.2005 19:55

Dobře podle toho se pozná, jak moc je velká příbuznost určitých druhů, ale jak se pozná z jaké rostliny se vyvinula tj. jak poznám jejího předka ?

příbuznost může být taková ( předek mutoval na dvě větve):

S.flava
předek
S.minor

nebo:

S.flava S.minor (tj. S.minor že by byla mutací předka S.flava)


Re: Molekulární taxonomie MR
Autor: Miloš Šula (IP zapsáno)
Datum: 31.01.2005 16:57

Chybicka se vloudila do predchoziho zpracovani, stacilo sekvence spravne zarovnat a uz je tu "rozumejsi" vysledek:
http://www.pocketpc.cz/carnivora/taxonomie.gif

Re: Molekulární taxonomie MR
Autor: Mirek Srba (IP zapsáno)
Datum: 01.02.2005 12:22

No, to je dobrý. Škoda, že jsem ztratil plnou verzi toho originálního článku. Zkoušel jsi to i s jinou sekvencí?

Re: Molekulární taxonomie MR
Autor: Miloš Šula (IP zapsáno)
Datum: 01.02.2005 14:25

Ještě ne, ale až bude chvilička tak to zkusím, zatím mám v práci fofry sad smiley Ještě sháním mapky vývoje pohoří-posuny a teplot kontinentů v Americe za posledních x tisíců let. Docela by mě zajímalo proč migrovali špirlice a darlingtonie zrovna na sever a ne na jih pokud se vyvinuli z heliamphor případně jestli to nebylo obráceně (jak tomu nasvědčují poslední poznatky - tvrdí že saracenie a heliamphory vznikly z darlingtonie, což by znamenalo, že darlingtonie musela migrovat částečně na východ - Sarracenie a částečně na jih - Heliamphory).

Re: Molekulární taxonomie MR
Autor: Miloš Šula (IP zapsáno)
Datum: 07.02.2005 15:48

Takže jsem výsledky umístil sem:

[www.pocketpc.cz]

Výsledky jsou docela rozporuplný, u té druhé sekvence genů to vychází docela jinak. Netuším jak si to vyložit. Je to guláš sad smiley

Re: Molekulární taxonomie MR
Autor: Miloš Šula (IP zapsáno)
Datum: 08.02.2005 08:30

Trochu jsem se na to včera koukal a mě by vyhovavala asi nejvěrohodnější analýza genu kódujícího ITS1 CHLOROPLASTU. Tam je vidět, že S.purpurea je geneticky nejblíže Heliamphorám, což potvrzuje fakt , že mají podobný typ pastí (víčko nepřekrývá láčku - tekutina se při dešti ředí). Taky objev zkameněliny pravděpodobně předchůdce sarracenií Anaeamphora longicervia v Číně, která je něco mezi S.purpurea a Heliamphorou do toho zapadá. Na nějakou podrobnější analýzu si jednotlivých druhů si netroufám, na to tu jsou jiní odborníci. Nejblíže k sobě si jsou S.alata S.leucophylla, což mě nejdříve trošku překvapilo, ale jak jsem se dočetl v článku od K. Páska - Za sárami do Ameriky, kde píše - "S.alata ovšem vypadá méně alatově než v Mississippi, místy lze vidět jakýsi náznak fenestrace v horních částech láček, jako by tu byly vtroušeně přítomny znaky S.leucophylla"....Nevím z kolika různých rostlin a z jakých lokalit byli sekvenovány ty geny. To bohužel v GenBank nepíšou.

Re: Molekulární taxonomie MR
Autor: Mirek Srba (IP zapsáno)
Datum: 09.02.2005 12:15

Když srovnáváš jeden gen, tak v podstatě sleduješ akorát evoluci toho genu. Různé populace různě mutují. Ale ty koukáš jen na jeden gen. Nějaký jedinec zůstane beze změny. Další zmutuje v nějakém písmenku. Pak zmutuje znovu, ale třeba zpátky. Jeden je v původním stavu, druhý má jednu evoluční událost a ten třetí dokonce dvě. Ale při jednoduché analýze Ti vyjdou první a třetí jako nejpříbuznější. Proto je vhodné srovnávat více genů, aby se takovéto omyly omezily.

A navíc je tu ta věc s křížením. U špirlic dochází často k přenosům genů a tudíž se může stát, že sekvenuješ leucophyllu, ale zrovna si vybereš gen, který ta kytka zíkskala v desátém koleni od alaty. Pak Ti vyjde příbuzná alatě. Kdyby jsi si vzal jiný gen, který je skutečně vlastní leucophylle, tak Ti vyjde blízko k S. purpurea. Toto se eliminuje stejným způsobem + sekvenování většího počtu jedinců.




Toto fórum je dočasně otevřeno pouze ke čtení. Prosím, zajděte sem zase později.

This forum powered by Phorum.
rss