The following six mitochondrial sequences are for an evolutionary computation assignment.

>A:
ATAGAGACAGTTGTTATTTCATCAATTCATTCATTCAATTCTTCAATTAAAAGACAATTTATTATGCTACCTTTGTAC
AGTCAATATACTGCAGCTATTTAAATTTATTTCATGGAGCAGATCGACCTAAAATTATATTCAATAGGCCATGTTTT
TGTTAAACAGGTGAATAATCAATTTTGCCGAGTTCCTTTAAATTATATATATATAAATAATTTATATATTATTAAATA
TACTTTTATTACTAATTTAATCATTATCACTATATTTCAAAAATTAAAATATATATTTTTATAGAATAAATAAAATTT
AAAATTTAAATTTTTTAAATTAATAACTAAATTATTAAATTTTTTATATTAATAAAAAATATTAACTTCATAATATTA
TAAATAAAATCAAAAATTTTTATAAATAAATTTATAGTTTATCCCATAAATTTTTAATATAAAAATTAATACTATAAA
TAAATTTTAATGTATTAAAAATTTTATATCTAAATTAAATTTATTTCTAAAAAAACTAGATATCAATAACTTCGAATG
ACATTTAATCTCTAAATTTATATTTATAATTTTTATGCAACAAAAAAAATATTATAAACTTAGCTCACTTATTTTCGA
GATATTTAAATTTATTAAATAAATTTTAAT

>B:
ATAGAGACAGTTGTTATTTCATCAATTCATTCATTCAATTCTTCAATTAAAAGACAATTTATTATGCTACCTTTGTACA
GTCAATATACTGCAGCTATTTAAATTTATTTCATGGAGCAGATCGACCTAAAATTATATTCAATAGGCCATGTTTTTG
TTAAACAGGTGAATAATCAATTTTGCCGAGTTCCTTTAAATTATATATATATAAATAATTTATATATTATTAAATATAC
TTTTATTACTAATTTAATCATTATCACTATATTTTAAAAATTAAAATATATATTTTTATAGAATAAATAAAATTTAAAA
TTTAAATTTTTTAAATTAATAACTAAATTATTAAATTTTTTATATTAATAAAAAATATTAACTTCATAATATTATAAATA
AAATCAAAAATTTTTATAAATAAATTTATAGTTTATCCCATAAATTTTTAATATAAAAATTAATACTATAAATAAATTTT
AATGTATTAAAAATTTTATATCTAAATTAAATTTATTTCTAAAAAAACTAGATATCAATAACTTCGAATGACATTTAATC
TCTAAATTTATATTTATAATTTTTATGCAACAAAAAAAATATTATAAACTTAGCTCACTTATTTTCGAGATATTTAAATT
TATTAAATAAATTTTAAT

>C:
ATAGAGACAGTTGTTATTTCATCAATTCATTCATTCAATTCTTCAATTAAAAGACAATTTATTATGCTACCTTTGTACAG
TCAATATACTGCAGCTATTTAAATTTATTTCATGGAGCAGATCGACCTAAAATTATACTCAATAGGCCATGTTTTTGTT
AAACAGGTGAATAATCAATTTTGCCGAGTTCCTTTAAATTATATATATATAAATAATTTATATATTATTAAATATACTTT
TATTACTAATTTAATCATTATCACTATATCTTAAAAATTAAAATATATGTTTTTATAGAATAAATAAAATTCAAAATTTA
AATTTTTAAAAATTAATAACTAAATTATTAAATTTTTTATATTAATAAAAAATATTAACTTCATAATATTATAAATAAAA
TCAAAAATTTTTATAAATAAATTTATAGTTTATCCCATAAATTTTTAATATAAAAATTAATACTATAAATAAATTTTAAG
GTATTAAAAATTTTATATCTAAATTAAATTTATTTCTAAAAAAACTAGATATCAATAACTTCGAATGACATTTAATCTCT
AAATTTATATTTATAATTTTATTGCAACAAAAAAAATATTACAAATTTAGCTCACTTATTTTCGAGATATTTAAATTTATT
AAATAAATTTTAAT

>D:
ATAGAGACAGTTGTTATTTCATCAATTCATTCATTCAATTCTTCAATTAAAAGACAATTTATTATGCTACCTTTGTACAGT
CAATATACTGCAGCTATTTAAATTTATTTCATGGAGCAGATCGACCTAAAATTATACTCAATAGGCCATGTTTTTGTTAA
ACAGGTGAATAATCAATTTTGCCGAGTTCCTTTAAATTATATATATATAAATAATTTATATATTATTAAATATACTTTTATT
ACTAATTTAATCATTATCACTATATCTTAAAAATTAAAATATATGTTTTTATAGAATAAATAAAATTCAAAATTTAAATTTTT
AAAAATTAATAACTAAATTATTAAATTTTTTATATTAATAAAAAATATTAACTTCATAATATTATAAATAAAATCAAAAATT
TTTATAAATAAATTTATAGTTTATCCCATAAATTTTTAATATAAAAATTAATACTATAAATAAATTTTAAAGTATTAAAAATT
TTATATCTAAATTAAATTTATTTCTAAAAAAACTAGATATCAATAACTTCGAATGACATTTAATCTCTAAATTTATATTTATA
ATTTTATTGCAACAAAAAAAATATTACAAATTTAGCTCACTTATTTTCGAGATATTTAAATTTATTAAATAAATTTTAAT

>E:
TTAGAGACAGTTATTATTTCATTAATTCTTTCATACAATTCTTCAATTAAAAGACAATTTATTATGCTACCTTTGTACAGT
CAACATACTGCAGCTATTTAAAATAATTCATTGAGCAGATCGACCTAAAATTATAATCAACAGGACATGTTTTTGATAA
ACAGGTGAATAATATATTTGCCGAATTCCTTTAAATTATATAATACAAAATATCATTATAAAATATAACTTTATTACTAA
TCTAATCACTATTTCTATATTTTATTAATTAAAATATAAATTTTTATAGAAAAATAAAATATAAATTTAAATCATTATTAA
TTTATAAATATTAAATTATTAAATTATTAAAATTAAAGAAAAATATTATCTCTATAACATTAAAAATTAAAATTAAATTTT
TATCTTAAATTTATAGATTATCCCATAAATTTTTAATATAAAAATTAATAAATTAAAATAAAATTTAATTTACTAAAATAAT
TATATCTAAATTAAATTTATTTCTAAAAAAACTAGATATTAATAAGTTCGTTTAACATTTAATTTCTAAATCTATATTTATA
ATTTTATTGCTACAAAAAAAATAATATAAATTTAGCTCCCTTATTTTCGAGATATTTAAAATCATTAAATAAATTTTAAT

>Dyakuba:
AATGAAACAGTTAATATTTCGTCCAACCATTCATTCCAGCCTTCAATTAAAAGACTAATGATTATGCTACCTTTGCACA
GTCAAAATACTGCGGCCATTTAAAATTTTCAGTGGGCAGGTTAGACTTTATATATAATTCAAAAAGACATGTTTTTGTT
AAACAGGCGAACATTATTTTTGCCGAATTCTTTATTTAAACTTTTCATAAAAATTTATTTTAACAATATTATATACTAATT
CTATCATTATTACTTAATTTTAAATATTAAAATTAATATTTTAATAAATAATTAAAATTTAATAAATAATTTAATTTATAAA
ATAAATTATAACACATTTTTTAATAATTGCTAATTCTAAGCATATATTTATTAAATTTATTTATTATTTTTAAAAATTTATT
TTATAGCTTATCCCATAAAATATTAAAATTATAAATTATTTAATTAAATAAATAATTAAATAAATTTATAATTTCTAAATT
AAATTTATTTCTTAAAAAACTAGATACCTTTAAAAACGAATAACATTTCATTTCTAATATAATATTATAAATAATTTTGTC
ACATTAACTTAAATATTATATTAACTCTTTTAAAATCGAGAAAAATAAATATTTATTTTTTATTTAAT

1.1 Align the six mitochondrial sequences using Clustal W or Clustal X (Select an output file format after multiple alignment to be the PHYLIP format).
 

C_

D_

A_

B_

E_

Dyakuba_ 

662

ATAGAGACAG TTGTTATTTC ATCAATTCAT TCATTCAATT CTTCAATTAA 

ATAGAGACAG TTGTTATTTC ATCAATTCAT TCATTCAATT CTTCAATTAA 

ATAGAGACAG TTGTTATTTC ATCAATTCAT TCATTCAATT CTTCAATTAA

ATAGAGACAG TTGTTATTTC ATCAATTCAT TCATTCAATT CTTCAATTAA

TTAGAGACAG TTATTATTTC ATTAATTCTT TCATACAATT CTTCAATTAA 

AATGAAACAG TTAATATTTC GTCCAACCAT TCATTCCAGC CTTCAATTAA

AAGACAATTT ATTATGCTAC CTTTGTACAG TCAATATACT GCAGCTATTT 

AAGACAATTT ATTATGCTAC CTTTGTACAG TCAATATACT GCAGCTATTT 

AAGACAATTT ATTATGCTAC CTTTGTACAG TCAATATACT GCAGCTATTT 

AAGACAATTT ATTATGCTAC CTTTGTACAG TCAATATACT GCAGCTATTT 

AAGACAATTT ATTATGCTAC CTTTGTACAG TCAACATACT GCAGCTATTT 

AAGACTAATG ATTATGCTAC CTTTGCACAG TCAAAATACT GCGGCCATTT 

AAATTTATTT CATGGAGCAG ATC-GACCTA AAATTATACT CAATAGGCCA 

AAATTTATTT CATGGAGCAG ATC-GACCTA AAATTATACT CAATAGGCCA 

AAATTTATTT CATGGAGCAG ATC-GACCTA AAATTATATT CAATAGGCCA 

AAATTTATTT CATGGAGCAG ATC-GACCTA AAATTATATT CAATAGGCCA 

AAAAT-AATT CATTGAGCAG ATC-GACCTA AAATTATAAT CAACAGGACA 

AAAAT--TTT CAGTGGGCAG GTTAGACTTT ATATATAATT CAAAAAGACA 

TGTTTTTGTT AAACAGGTGA ATAATCAATT TTGCCGAGTT CCTTTAAATT 

TGTTTTTGTT AAACAGGTGA ATAATCAATT TTGCCGAGTT CCTTTAAATT 

TGTTTTTGTT AAACAGGTGA ATAATCAATT TTGCCGAGTT CCTTTAAATT 

TGTTTTTGTT AAACAGGTGA ATAATCAATT TTGCCGAGTT CCTTTAAATT 

TGTTTTTGAT AAACAGGTGA ATAATATATT T-GCCGAATT CCTTTAAATT 

TGTTTTTGTT AAACAGGCGA ACATTATTTT T-GCCGAATT C-TTTATTTA 

ATATATATAT AAATAATTTA TATATTATTA AATATACTTT TATTACTAAT 

ATATATATAT AAATAATTTA TATATTATTA AATATACTTT TATTACTAAT 

ATATATATAT AAATAATTTA TATATTATTA AATATACTTT TATTACTAAT 

ATATATATAT AAATAATTTA TATATTATTA AATATACTTT TATTACTAAT 

ATATA-ATAC AAAATATC-- ---ATTATAA AATATAACTT TATTACTAAT 

AACTTTTCAT AAAAATTT-- ---ATT-TTA ACAATA-TTA TAT-ACTAAT 

TTAATCATTA TCACTATATC TTAAAAATTA AAATATATGT TTTTATAGAA 

TTAATCATTA TCACTATATC TTAAAAATTA AAATATATGT TTTTATAGAA 

TTAATCATTA TCACTATATT TCAAAAATTA AAATATATAT TTTTATAGAA 

TTAATCATTA TCACTATATT TTAAAAATTA AAATATATAT TTTTATAGAA 

CTAATCACTA TTTCTATATT TTATTAATTA AAATATAAAT TTTTATAGAA 

TCTATCATTA TTACTTAATT TTAAATATTA AAATTAATAT TTTAATA-AA 

TAAATAAAAT TCAAAATTTA AATTTTTAAA AATTAATAA- --CTAAATTA 

TAAATAAAAT TCAAAATTTA AATTTTTAAA AATTAATAA- --CTAAATTA 

TAAATAAAAT TTAAAATTTA AATTTTTTAA A-TTAATAA- --CTAAATTA 

TAAATAAAAT TTAAAATTTA AATTTTTTAA A-TTAATAA- --CTAAATTA 

-AAATAAAAT ATAAA-TTTA AATCATTATT AATTTATAAA TATTAAATTA 

TAATTAAAAT TTAA----TA AATAATT--T AATTTATAAA --ATAAATTA 

TTAAATTTTT TATATTAATA AAAAATATTA ACTTCATAAT ATTATAAATA 

TTAAATTTTT TATATTAATA AAAAATATTA ACTTCATAAT ATTATAAATA 

TTAAATTTTT TATATTAATA AAAAATATTA ACTTCATAAT ATTATAAATA 

TTAAATTTTT TATATTAATA AAAAATATTA ACTTCATAAT ATTATAAATA 

TTAAATTATT AAAATTAAAG AAAAATATTA TCTCTATAAC ATTAAAAATT 

TAACACATTT TTTAATAATT GCTAATTCTA AGCATATA-T TTATTAAATT 

AAATCAAAAA TTTTTATAAA TAAATTTATA GTTTATCCCA TAAATTTTTA 

AAATCAAAAA TTTTTATAAA TAAATTTATA GTTTATCCCA TAAATTTTTA 

AAATCAAAAA TTTTTATAAA TAAATTTATA GTTTATCCCA TAAATTTTTA 

AAATCAAAAA TTTTTATAAA TAAATTTATA GTTTATCCCA TAAATTTTTA 

AAAATTAAA- TTTTTATCT- TAAATTTATA GATTATCCCA TAAATTTTTA 

TATTTATTAT TTTTAAAAAT TTATTTTATA GCTTATCCCA TAAAATATTA 

ATATAAAAAT TAATACTATA AA-TAAATTT TAAGGTATTA AAAATTTTAT 

ATATAAAAAT TAATACTATA AA-TAAATTT TAAAGTATTA AAAATTTTAT 

ATATAAAAAT TAATACTATA AA-TAAATTT TAATGTATTA AAAATTTTAT 

ATATAAAAAT TAATACTATA AA-TAAATTT TAATGTATTA AAAATTTTAT 

ATATAAAAAT TAATAAATTA AAATAAAATT TAATTTACTA AAATAATTAT 

AAATTATAAA TTATTTAATT AAATAAA--T -AATTAAATA AATTTATAAT 

ATCTAAATTA AATTTATTTC TAAAAAAACT AGATATCAAT AACTTCGAAT 

ATCTAAATTA AATTTATTTC TAAAAAAACT AGATATCAAT AACTTCGAAT 

ATCTAAATTA AATTTATTTC TAAAAAAACT AGATATCAAT AACTTCGAAT 

ATCTAAATTA AATTTATTTC TAAAAAAACT AGATATCAAT AACTTCGAAT 

ATCTAAATTA AATTTATTTC TAAAAAAACT AGATATTAAT AAGTTCGTTT 

TTCTAAATTA AATTTATTTC TTAAAAAACT AGATACCTTT AAAAACGAAT 

GACATTTAAT CTCTAAATTT ATATTT---A TAATTTTATT GCAACAAAAA 

GACATTTAAT CTCTAAATTT ATATTT---A TAATTTTATT GCAACAAAAA 

GACATTTAAT CTCTAAATTT ATATTT---A TAATTTTTAT GCAACAAAAA 

GACATTTAAT CTCTAAATTT ATATTT---A TAATTTTTAT GCAACAAAAA 

AACATTTAAT TTCTAAATCT ATATTT---A TAATTTTATT GCTACAAAAA 

AACATTTCAT TTCTAATATA ATATTATAAA TAATTTTGTC ACATTAACTT 

AAATATTACA AATTTAGCTC ACTTATTTTC GAGATATTTA AATTTATTAA 

AAATATTACA AATTTAGCTC ACTTATTTTC GAGATATTTA AATTTATTAA 

AAATATTATA AACTTAGCTC ACTTATTTTC GAGATATTTA AATTTATTAA 

AAATATTATA AACTTAGCTC ACTTATTTTC GAGATATTTA AATTTATTAA 

AAATAATATA AATTTAGCTC CCTTATTTTC GAGATATTTA AAATCATTAA 

AAATATTATA ---TTAACTC TTTTAAAATC GAGAAAAATA AATAT-TTAT 

ATAAATTTTA AT

ATAAATTTTA AT

ATAAATTTTA AT

ATAAATTTTA AT

ATAAATTTTA AT

TTTTTATTTA AT

1.2 Calculate the distance matrix for these sequences using Kimura’s two parameter method (Use programme Dnadist in PHYLIP). The output file from Clustal are in an interleaved format but the species names are more than ten characters which are essentially required by PHYLIP. Accordingly, the output file from Clustal needs to be slightly adjusted and eventually, saved as a textfile.

6
mitA          
mitB 0.0015         
mitC 0.0171  0.0155      
mitD 0.0171  0.0155  0.0015    
mitE 0.1488  0.1468  0.1503  0.1503  
Dyakuba 0.3868  0.3840 0.3981 0.3981 0.4321

1.3 Use the distance matrix obtained from 1.2 to construct a phylogenetic tree based on the neighbor-joining method (Use the programme Neighbor and select D. yakuba as an outgroup. After that, draw a phylogenetic tree using Drawtree).
 
 

6 Populations

Neighbor-Joining/UPGMA method version 3.573c

Neighbor-joining method

Negative branch lengths allowed
 
+mitA 

+--3 

! +mitB 

+--4 

! ! +mitC 

! +--2 

! +mitD 

--1-----mitE 

+-------------------Dyakuba 

remember: (although rooted by outgroup) this is an unrooted tree!

Between And Length
 
1

3

3

2

2

1

4

mitA

mitB

2

mitC

mitD

mitE

Dyakuba

0.04620

0.00360

0.00175

-0.00025

0.01120

0.00075

0.00075

0.09470

0.33740