Difference between revisions of "Reference tree for APSES domains"

From "A B C"
Jump to navigation Jump to search
Line 1: Line 1:
 
;How this tree was computed:
 
;How this tree was computed:
  
The input sequence alignment was derived from the [[APSES_domains_probcons|Probcons MSA of 74 fungal APSES domains]] (from Assignment 3). The PHYLIP input file appears below. Columns that represented regions of uncertain alignment were deleted, as well as large gapped sections. Using the PHYLIP suite and the program '''promlk''' (an ML tree building program that constructs a tree under the assumption of a "molecular clock") with default parameters plus global optimization, the following tree was constructed (running time > 4h on my workstation).  
+
The input sequence alignment was derived from the [[APSES_domains_MUSCLE_revised| APSES domains - MUSCLE aligned and sequence names revised]] file based on the MSA from Assignment 3. The PHYLIP input file is given in the [[Assignment_5_fallback_data|Fallback data page]]. Columns that represented regions of uncertain alignment were deleted, as well as large gapped sections. Using the PHYLIP suite online, at the Institut Pasteur, as described in the instructions, the following tree was constructedas a UPGMA NJ tree .  
  
The program '''retree'' was used on the output treefile to rotate particular clades around their branchpoint. This was done to arrange the species within a clade as nearly as possible in the sequence in which they appear in in the reference cladogram. While this is a "cosmetic" change (rotations around branch points do not change the topology of a tree), it facilitates analysis, especially to evaluate how many species are present in each clade and which species may be missing.
+
The program '''retree'' was used on the output treefile to rotate particular subclades around their branchpoint. This was done to arrange the species within a clade as nearly as possible to correspondto in the reference cladogram. While this is a "cosmetic" change (rotations around branch points do not change the topology of a tree), it facilitates analysis, especially to evaluate how many species are present in each clade and which species may be missing.
  
 
__TOC__
 
__TOC__
Line 9: Line 9:
 
==The APSES Reference Tree==
 
==The APSES Reference Tree==
  
                                                  +------11:9301 MAGGR
 
                                                +-88 
 
                                            +-87  +------12:9978 GIBZE
 
                                            |  | 
 
                                          +-86  +---------10:2599 ASPTE
 
                                          |  | 
 
                    +-------------------85  +---------13:3009 ASPNI
 
                    |                    | 
 
                    |                    +----------9:1244 ASPFU
 
      +-------------77 
 
      |              |          +--------------------8:6482 CANGL
 
      |              |          | 
 
      |              |          |                  +----6:XBP1 SACCE
 
      |              +---------78            +----84 
 
      |                        |        +-83    +----5:3869 EREGO
 
      |                        |        |  | 
 
      |                        |        |  +----------7:9773 DEBHA
 
      |                        +--------79 
 
      |                                  |  +----------4:5262 KLULA
 
      |                                  +-80 
 
      |                                      |  +---------3:0918 CANAL
 
      |                                      +-81 
 
      |                                        |  +--------2:5499 YARLI
 
      |                                        +-82 
 
      |                                            +--------1:0925 USTMA
 
      | 
 
      |                                                        +-19:0837 NEUCR
 
      |                                                  +----98 
 
      |                                                  |    +-18:8552 MAGGR
 
      |                                              +-97 
 
      |                                              |  |  +----21:PHD1 SACCE
 
  +-76                                              |  +-99 
 
  |  |                                          +--96    +----20:9680 CANGL
 
  |  |                                          |  | 
 
  |  |                                          |  |    +-23:0305 GIBZE
 
  |  |                                        +-95  +--100 
 
  |  |                                        |  |        +-22:3440 ASPNI
 
  |  |                                        |  | 
 
  |  |                                        |  |      +-25:8847 CANGL
 
  |  |                                        |  +-----101 
 
  |  |                                    +-91          +-24:5299 KLULA
 
  |  |                                    |  | 
 
  |  |                                    |  |          +-16:3001 EREGO
 
  |  |                                    |  |      +-94 
 
  |  |                                    |  |    +-93  +-15:SOK2 SACCE
 
  |  |                                  +-90  |    |  | 
 
  |  |                                  |  |  +---92  +-14:9785 DEBHA
 
  |  |                                  |  |      | 
 
  |  |                                  |  |      +----17:1102 YARLI
 
  |  |                                  |  | 
 
  |  |                                  |  +---------26:2292 YARLI
 
  |  |                                  | 
 
  |  +---------------------------------89                +-31:8256 ASPTE
 
  |                                    |        +----106 
 
  |                                    |        |      +-30:5125 ASPFU
 
  |                                    |    +-104 
 
  |                                    |    |  |    +-29:0447 DEBHA
 
  |                                    |  +103  +---105 
 
  |                                    |  |  |        +-28:1513 CANAL
 
  |                                    +102  | 
 
  |                                        |  +----------32:4197 CANAL
 
  |                                        | 
 
  |                                        +----------27:4237 CANAL
 
  | 
 
  |                                                +----53:5548 ASPTE
 
  |                                            +130 
 
  |                                            |  +----54:1770 YARLI
 
  |                                            | 
 
  |                                    +-----129      +-55:MBP1 MAGGR
 
  |                                    |      |  +-132 
 
  |                                    |      |  |  +-56:MBP1 GIBZE
 
  |                                    |      +131 
 
  |                                    |          |  +-----59:MBP1 NEUCR
 
  |                                    |          +133 
 
  |                                    |            |    +-58:4319 ASPNI
 
  |                                    |            +---134 
 
  |                                    |                  +-57:MBP1 ASPFU
 
  |                                    | 
 
  |                                    |                    +-64:MBP1 ASPNI
 
  |                                    |              +----140 
 
  |                            +-----128              |      |  +-63:MBP1 ASPTE
 
  |                            |      |          +139      +141 
 
-75                            |      |          |  |        +-62:4232 ASPFU
 
  |                            |      |          |  | 
 
  |                            |      |    +---137  +-------65:5821 NEUCR
 
  |                            |      |    |    | 
 
  |                            |      |    |    |  +---61:2974 MAGGR
 
  |                            |      |    |    +-138 
 
  |                            |      |  +136        +---60:0560 GIBZE
 
  |                            |      |  |  | 
 
  |                            |      |  |  |  +----------69:9090 CRYNE
 
  |                            |      |  |  |  | 
 
  |                            |      |  |  +142    +------67:1485 USTMA
 
  |                            |      +135    |  +144 
 
  |                            |          |    +143  +------66:5496 SCHPO
 
  |                            |          |        | 
 
  |                          +116          |        +--------68:MBP1 USTMA
 
  |                          |  |          | 
 
  |                          |  |          |    +-------71:MBP1 YARLI
 
  |                          |  |          +---145 
 
  |                          |  |                +-------70:MBP1 CRYNE
 
  |                          |  | 
 
  |                          |  |                  +---52:MBP1 SACCE
 
  |                          |  |                +126 
 
  |                          |  |                |  |  +-50:MBP1 EREGO
 
  |                          |  |                |  +127 
 
  |                          |  |  +-----------123    +-51:MBP1 KLULA
 
  |                          |  |  |            | 
 
  |                          |  |  |            |  +-----49:MBP1 CANGL
 
  |                          |  |  |            +124 
 
  |                          |  |  |                |    +-47:MBP1 DEBHA
 
  |          +------------115  +117                +--125 
 
  |          |              |    |                    +-48:MBP1 CANAL
 
  |          |              |    | 
 
  |          |              |    |        +---------41:6370 EREGO
 
  |          |              |    +-------118 
 
  |          |              |              |  +---------46:4890 KLULA
 
  |          |              |              +119 
 
  |          |              |                  |  +--------45:4966 CANGL
 
  |          |              |                  +120 
 
  |          |              |                    |  +--------44:SWI4 SACCE
 
  |        +108              |                    +121 
 
  |        |  |              |                        |      +-42:7246 DEBHA
 
  |        |  |              |                        +-----122 
 
  |        |  |              |                                +-43:2876 CANAL
 
  |        |  |              | 
 
  |        |  |              +---------------------40:MBP1 SCHPO
 
  |        |  | 
 
  |        |  |                          +--------39:2267 NEUCR
 
  |        |  |                          | 
 
  |        |  |                          |          +--35:3762 MAGGR
 
  |        |  |                          |    +---113 
 
  |        |  +-------------------------109    |    +--36:5459 GIBZE
 
  +------107                              |  +112 
 
            |                              |  |  |  +--------38:7766 ASPNI
 
            |                              |  |  +114 
 
            |                              +110    +--------37:6132 SCHPO
 
            |                                | 
 
            |                                |    +--33:6355 ASPTE
 
            |                                +---111 
 
            |                                      +--34:3510 ASPFU
 
            | 
 
            |                            +--------73:9901 DEBHA
 
            |  +------------------------147 
 
            +146                          +--------72:3412 CANAL
 
              | 
 
              +-----------------------------------74:6166 SCHPO
 
  
 +
                                                  ,---13:Mbp1 NEUCR
 +
                                                  ! 
 +
                                            ,---85    ,-12:Mbp1 MAGGR
 +
                                            !    !  ,-89 
 +
                                            !    !  !  `-11:Mbp1 GIBZE
 +
                                            !    `-86 
 +
                                            !      !  ,-10:Mbp1 ASPNI
 +
                                            !      `-87 
 +
                                            !          !  ,--9:Mbp1 ASPTE
 +
                                          ,-84          `-88 
 +
                                          !  !            `--8:Mbp1 ASPFU
 +
                                          !  ! 
 +
                                          !  !        ,-14:Mbp1 COPCI
 +
                                          !  !    ,--92 
 +
                                          !  !  ,-91  `-15:MbpA CRYNE
 +
                                      ,-83  !  !  ! 
 +
                                      !  !  `-90  `-----16:Mbp1 SCHPO
 +
                                      !  !    ! 
 +
                                      !  !    `------17:Mbp1 USTMA
 +
                                      !  ! 
 +
                                      !  !  ,------19:Mbp1 YARLI
 +
                                      !  `-93 
 +
                                    ,-76    `------18:Mbp1 CRYNE
 +
                                    !  ! 
 +
                                    !  !          ,--2:Mbp1 CANGL
 +
                                    !  !      ,-79 
 +
                                    !  !      !  `--1:Mbp1 SACCE
 +
                                    !  !  ,---78 
 +
                                    !  !  !    !  ,--3:Mbp1 ASHGO
 +
                                    !  !  !    `-80 
 +
                                    !  `-77      `--4:Mbp1 KLULA
 +
                                    !    ! 
 +
                                    !    !          ,--7:Mbp1 PICST
 +
                                    !    !      ,-82 
 +
                                    !    `------81  `--6:Mbp1 DEBHA
 +
                                ,-75            ! 
 +
                                !  !            `--5:Mbp1 CANAL
 +
                                !  ! 
 +
                                !  !        ,----28:MbpA NEUCR
 +
                                !  !      ,100 
 +
                                !  !      !  !  ,-27:MbpA MAGGR
 +
                                !  !      !  `101 
 +
                                !  !      !    `-26:MbpA GIBZE
 +
                                !  !  ,--96 
 +
                                !  !  !  !        ,-24:MbpA ASPTE
 +
                                !  !  !  !  ,-----98 
 +
                                !  !  !  !  !      !  ,-23:MbpA ASPNI
 +
                                !  !  !  `-97      `-99 
 +
                                !  `-94      !        `-22:MbpA ASPFU
 +
              ,-----------------74    !      ! 
 +
              !                  !    !      `-----25:MbpA YARLI
 +
              !                  !    ! 
 +
              !                  !    !  ,---------21:MbpB USTMA
 +
              !                  !    `-95 
 +
              !                  !        `---------20:MbpA SCHPO
 +
              !                  ! 
 +
              !                  !          ,-----31:Swi4 CANGL
 +
              !                  !      ,104 
 +
              !                  !      !  !  ,---30:Swi4 SACCE
 +
              !                  !  ,-103  `105 
 +
              !                  !  !  !    `---29:Swi4 ASHGO
 +
              !                  !  !  ! 
 +
              !                  !  !  `--------32:Swi4 KLULA
 +
              !                  `-102 
 +
              !                      !            ,-35:MbpA PICST
 +
              !                      !          ,107 
 +
              !                      `--------106  `-34:MbpA DEBHA
 +
              !                                ! 
 +
              !                                `-33:MbpA CANAL
 +
              ! 
 +
              !                                        ,-50:Sok2 MAGGR
 +
              !                                    ,123 
 +
        ,---73                                    !  `-49:Sok2 GIBZE
 +
        !    !                                    ! 
 +
        !    !                                  ,119        ,-46:Sok2 ASPNI
 +
        !    !                                  !  !    ,122 
 +
        !    !                                  !  !  ,121  `-45:Sok2 ASPFU
 +
        !    !                                  !  !  !  ! 
 +
        !    !                              ,118  `120  `-47:Sok2 ASPTE
 +
        !    !                              !  !    ! 
 +
        !    !                              !  !    `-48:SokA ASPNI
 +
        !    !                              !  ! 
 +
        !    !                              !  `-51:SokA YARLI
 +
        !    !                              ! 
 +
        !    !                              !        ,--42:Sok2 CANGL
 +
        !    !                              !        ! 
 +
        !    !                              !        !        ,-37:Sok2 SACCE
 +
        !    !                          ,-109    ,112    ,115 
 +
        !    !                          !  !    !  !  ,114  `-36:Sok2 ASHGO
 +
        !    !                          !  !    !  !  !  ! 
 +
        !    !                          !  !    !  !  !  `-38:Sok2 KLULA
 +
        !    !                          !  !    !  `113 
 +
  ,-----72    !                          !  !  ,111    !    ,-41:Sok2 PICST
 +
  !      !    !                          !  !  !  !    !  ,117 
 +
  !      !    !                          !  !  !  !    `116  `-40:Sok2 DEBHA
 +
  !      !    `-------------------------108  !  !  !        ! 
 +
  !      !                                !  `110  !        `-39:Phd1 CANAL
 +
  !      !                                !      !  ! 
 +
  !      !                                !      !  `--43:Phd1 SACCE
 +
  !      !                                !      ! 
 +
  !      !                                !      `--44:Sok2 YARLI
 +
  !      !                                ! 
 +
  !      !                                !  ,------55:SokA CANGL
 +
  !      !                                `124 
 +
  !      !                                  !    ,-54:SokA DEBHA
 +
  !      !                                  `--125 
 +
  !      !                                        !  ,-53:SokA PICST
 +
  !      !                                        `126 
 +
  !      !                                          `-52:Sok2 CANAL
 +
-71      ! 
 +
  !      !                            ,-----------56:MbpC CANAL
 +
  !      !        ,-----------------128 
 +
  !      `------127                  `-----------57:MbpB DEBHA
 +
  !              ! 
 +
  !              `-------------------------------58:MbpB SCHPO
 +
  ! 
 +
  !                                          ,----64:Xbp1 MAGGR
 +
  !                                  ,----134 
 +
  !                                  !      `----63:Xbp1 GIBZE
 +
  !            ,--------------------130 
 +
  !            !                      !  ,-------62:XbpA ASPNI
 +
  !            !                      `-131 
 +
  !            !                          !  ,----61:Xbp1 ASPTE
 +
  !            !                          `132 
 +
  !            !                            !    ,-60:Xbp1 ASPNI
 +
  !            !                            `--133 
 +
  `----------129                                  `-59:Xbp1 ASPFU
 +
              ! 
 +
              !          ,-----------------------69:Xbp1 SACCE
 +
              !          ! 
 +
              !      ,136                  ,---66:Xbp1 DEBHA
 +
              !      !  !        ,-------138 
 +
              !      !  !        !        `---65:Xbp1 CANAL
 +
              !      !  `-------137 
 +
              `-----135            !  ,----------68:Xbp1 YARLI
 +
                      !            `139 
 +
                      !              `----------67:Xbp1 COPCI
 +
                      ! 
 +
                      `--------------------------70:Xbp1 USTMA
  
==PHYLIP Input File==  
+
==PHYLIP Tree File==  
  
 
+
  (((((((((Mbp1_NEUCR:0.12887,((Mbp1_MAGGR:0.08575,Mbp1_GIBZE:0.08575):0.01322,
  74  72
+
  (Mbp1_ASPNI:0.04245,(Mbp1_ASPTE:0.01625,Mbp1_ASPFU:0.01625):0.0262):0.05652):0.0299):0.10027,
MBP1_SACCEIMKRKKDDW-VNATHILKAANF-AKA--KRTREKVQGGFGKYQGTWVPLNIAKQLAEKF--SVYDQLK-PLF
+
  (((Mbp1_COPCI:0.08125,MbpA_CRYNE:0.08125):0.08562,Mbp1_SCHPO:0.16687):0.01938,
MBP1_YARLIVMRRKSDGW-VNATHILKVAGF-DKP--QRTREKVQGGYGKYQGTWVPLERAREIATLY--DVDSHLA-PIF
+
  Mbp1_USTMA:0.18625):0.04289):0.02119,(Mbp1_YARLI:0.19385,Mbp1_CRYNE:0.19385):0.05649):0.0563,
5821_NEUCRVMRRRHDDW-VNATHILKAAGF-DKP--ARTREKIQGGYGRYQGTWIPLEQAEALARRN--NIYERLK-PIF
+
  (((Mbp1_CANGL:0.06605,Mbp1_SACCE:0.06605):0.04984,(Mbp1_ASHGO:0.08655,
9090_CRYNEVMRRRSDAY-LNATQILKVAGF-DKP--QRTREKVQGGYGKYQGTWIPIERGLALAKQY--GVEDILR-PII
+
  Mbp1_KLULA:0.08655):0.02934):0.10725,((Mbp1_PICST:0.03550,Mbp1_DEBHA:0.03550):0.02163,
MBP1_ASPNIVMRRRSDDW-INATHILKVAGF-DKP--ARTREKVQGGYGKYQGTWIPLQEGRQLAERN--NILDKLL-PIF
+
  Mbp1_CANAL:0.05713):0.16602):0.08349):0.03608,(((MbpA_NEUCR:0.13598,
MBP1_KLULAIMKRKADNW-VNATHILKAAKF-PKA--KRTREKVQGGFGKYQGTWIPLELASKLAEKF--EVLDELK-PLF
+
  (MbpA_MAGGR:0.07465,MbpA_GIBZE:0.07465):0.06133):0.04315,((MbpA_ASPTE:0.0083,
MBP1_GIBZEVMRRRNDSW-LNATQILKVAGV-DKG--KRTKEKVQGGYGKYQGTWIKFERGLQVCRQY--GVEELLR-PLL
+
  (MbpA_ASPNI:0.0,MbpA_ASPFU:0.0):0.0083):0.1645,MbpA_YARLI:0.1728):0.00632):0.10305,
MBP1_ASPTEVMRRRADDW-INATHILKVAGF-DKP--ARTREKVQGGYGKYQGTWIPLPEGRLLAERN--NIIDKLR-PIF
+
  (MbpB_USTMA:0.2437,MbpA_SCHPO:0.2437):0.03847):0.06055):0.0634,(((Swi4_CANGL:0.16035,
MBP1_CANALIMRRKKDSW-INATHILKIAKF-PKA--KRTREKVQGGYGKYQGTYVPLDLGAAIARNF--GVYDVLK-PIF
+
  (Swi4_SACCE:0.12425,Swi4_ASHGO:0.12425):0.0361):0.06113,Swi4_KLULA:0.22148):0.10572,
MBP1_CANGLIMKRKNDGW-VNATHILKAANF-AKA--KRTREKVQGGFGKYQGTWVPLNIAINLAEKF--DVYQDLK-PLF
+
  ((MbpA_PICST:0.06255,MbpA_DEBHA:0.06255):0.01428,MbpA_CANAL:0.07683):0.25038):0.0789):0.42038,
1770_YARLIVMRRRTDSS-LNATQILKVAGV-EKS--KRTKEKVQGGYGKYQGTWIPYERGVDLCRQY--SVYDVLQ-PLL
+
  (((((Sok2_MAGGR:0.01605,Sok2_GIBZE:0.01605):0.01462,(((Sok2_ASPNI:0.0,
2974_MAGGRVMRRRVDDW-INATHILKAAGF-DKP--ARTREKVQGGYGKYQGTWIPLEAGEALAHRN--NIFDRLR-PIF
+
  Sok2_ASPFU:0.0):0.00805,Sok2_ASPTE:0.00805):0.01688,SokA_ASPNI:0.02493):0.00574):0.04416,
1485_USTMAVMRRRGDGW-LNATQILKIAGI-EKT--RRTKEKIQGGYGKFQGTWIPLQRAQQVAAEY--NVSHLLQ-PIL
+
  SokA_YARLI:0.07483):0.04186,(((Sok2_CANGL:0.08693,(((Sok2_SACCE:0.0489,
MBP1_USTMAVMRRRSDDW-LNATQILKVVGL-DKP--QRTREKVQGGYGKYQGTWIPLDVAIELAERY--NIQGLLQ-PIT
+
  Sok2_ASHGO:0.0489):0.0079,Sok2_KLULA:0.0568):0.00698,((Sok2_PICST:0.0,
0560_GIBZEVMRRRSDDW-INATHILKAAGF-DKP--ARTREKIQGGYGKYQGTWIPLESGQALAERH--SVIDRLR-PIF
+
  Sok2_DEBHA:0.0):0.01605,Phd1_CANAL:0.01605):0.04773):0.02315):0.00887,
4232_ASPFU-MRRRGDDW-INATHILKVAGF-DKP--ARTREKVQGGYGKYQGTWIPLHEGRLLAERN--NIIDKLR-PIF
+
  Phd1_SACCE:0.09581):0.00666,Sok2_YARLI:0.10246):0.01423):0.08975,(SokA_CANGL:0.18773,
MBP1_CRYNEVMRRASDSW-VNATQILKVAGV-HKS--ARTKEKIQGGYGKYQGTWVPLDRGRDLAEQY--GVGSYLS-SVF
+
  (SokA_DEBHA:0.08588,(SokA_PICST:0.05025,Sok2_CANAL:0.05025):0.03563):0.10186):0.01871):0.62005):0.11528,
MBP1_NEUCRVMRRQKDGW-VNATQILKVANI-DKG--RRTKEKVQGGYGKYQGTWIPFERGLEVCRQY--GVEELLS-KLL
+
  ((MbpC_CANAL:0.28905,MbpB_DEBHA:0.28905):0.45758,MbpB_SCHPO:0.74662):0.19515):0.15737,
MBP1_DEBHAIMRRKLDSW-INATHILKIAKF-PKA--KRTREKVQGGYGKYQGTYVPLDLGADIAKNF--GVFDSLR-PIF
+
  (((Xbp1_MAGGR:0.14705,Xbp1_GIBZE:0.14705):0.15829,(XbpA_ASPNI:0.20350,
2876_CANALIMRRCKDDW-VNATQILKCCNF-PKA--KRTKEKVQGGFGRFQGTWIPLEDARRLAKTY--GVTEELA-PVL
+
  (Xbp1_ASPTE:0.14,(Xbp1_ASPNI:0.0269,Xbp1_ASPFU:0.0269):0.1131):0.0635):0.10184):0.49999,
MBP1_MAGGRVMKRIGDSK-LNATQILKVAGV-EKG--KRTKEKVQGGYGKYQGTWIKYERALEVCRQY--GVEELLR-PLL
+
  ((Xbp1_SACCE:0.56026,((Xbp1_DEBHA:0.12385,Xbp1_CANAL:0.12385):0.22894,
4319_ASPNIVMKRRSDGW-LNATQILKVAGV-VKA--RRTKEKVQGGYGKYQGTWVNYQRGVELCREY--HVEELLR-PLL
+
  (Xbp1_YARLI:0.28015,Xbp1_COPCI:0.28015):0.07264):0.20747):0.07706,
MBP1_ASPFUVMKRRSDSW-LNATQILKVAGV-VKA--RRTKEKVQGGYGKYQGTWVNYQRGVELCREY--HVEELLR-PLL
+
  Xbp1_USTMA:0.63732):0.16802):0.2938);
MBP1_SCHPOVMRRRRDSW-LNATQILKVADF-DKP--QRTREKVQGGYGKYQGTWVPFQRGVDLATKY--KVDGIMS-PIL
 
5548_ASPTEVMKRRSDSW-LNATQILKVAGV-VKA--RRTKEKVQGGYGKYQGTWVNYQRGVDLCREY--HVEELLR-PLL
 
5496_SCHPOLMKRCHDNW-LNATQILKIAEL-DKP--RRTREKIQGGCGKYQGTWVPSERAVELAHEY--NVFDLIQ-PLI
 
7246_DEBHAIMRRCKDDW-VNATQILKCCNF-PKA--KRTKEKIQGGYGRFQGTWIPLADAQRLAASY--GVTPDLA-PVL
 
MBP1_EREGOIMKRKADDW-VNATHILKAAKF-AKA--KRTREKVQGGFGKYQGTWVPLDIARRLAQKF--EVLEELR-PLF
 
6370_EREGOVMRRLHDDW-VNITQVFKVATF-SKT--QRTKEKIQGGYGRFQGTWIPLDSAKGLVAKY--EITDIVVLTVI
 
SWI4_SACCEVMRRTKDDW-INITQVFKIAQF-SKT--KRTKEKVQGGYGRFQGTWIPLDSAKFLVNKY--EIIDPVVNSIL
 
4890_KLULAIMRRCNDNW-LNITQVFKAGSF-TKA--QRTKEKIQGGYGRFQGTWIPWESTKYLVEKY--NINNKVVKRIV
 
4966_CANGLVMRRTMDDW-VNVTQVFKIAQF-SKT--QRTKEKVQGGYGRFQGTWVPLEAAKFMTTKY--NIDNPVVNTI-
 
9785_DEBHAVVRRADNNM-INGTKLLNVAQM-TRG--RRDGHVVKIGSMHLKGVWIPFERALAMAQRE--GIVDLLY-PLF
 
3009_ASPNIVMWDYNIGL-VRTTHLFKCNDY-SKT--TPAKHSITGGALAAQGYWMPYEAAKAIAATFCWKIRFALT-PLF
 
SOK2_SACCEVVRRADNDM-VNGTKLLNVTKM-TRG--RRDGHVVKIGSMHLKGVWIPFERALAIAQRE--KIADYLY-PLF
 
9680_CANGLVVRRADNDM-VNGTKLLNVTGM-TRG--RRDGDVVKGGPMTLKGVWIPIDRARAIARQE--GIEQWLY-PLF
 
3001_EREGOVVRRADNDM-INGTKLLNVAKM-TRG--RRDGHVVKIGSMHLKGVWIPFERALALAQRE--KIVDMLF-PLF
 
4197_CANALVVRRADNNM-INGTKLLNVAQM-TRG--RRDGHVVKIGSMHLKGVWIPFERALAMAQRE--QIVDMLY-PLF
 
4237_CANALVVRRADNNM-INGTKLLNVAQM-TRG--RRDGHVVKIGSMHLKGVWIPFERALAMAQRE--QIVDMLY-PLF
 
8256_ASPTEVARREDNSM-INGTKLLNVAGM-TRG--RRDGHVVKIGPMHLKGVWIPFERALEFANKE--KITDLLY-PLF
 
3440_ASPNIVARREDNGM-INGTKLLNVAGM-TRG--RRDGNVVKIGPMHLKGVWIPFDRALEFANKE--KITDLLY-PLF
 
2292_YARLIVARREDNDM-INGTKLLNVAGM-TRG--RRDGHVVKAGAMHLKGVWIPYDRALEFANKE--KIIDLLF-PLF
 
1102_YARLIVARREDNNM-INGTKLLNVVGM-TRG--RRDGHVVKIGAMHLKGVWIPYERALAFAQRE--RIVDVLY-PLF
 
5125_ASPFUVARREDNHM-INGTKLLNVAGM-TRG--RRDGHVVKIGPMHLKGVWIPFERALEFANKE--KITDLLY-PLF
 
PHD1_SACCEVVRRADNNM-INGTKLLNVTKM-TRG--RRDGEVVKIGSMHLKGVWIPFERAYILAQRE--QILDHLY-PLF
 
8847_CANGLVVRRADNDM-INGTKLLNVTKM-TRG--KRDGKVVKIGSMHLKGVWIPFERALFIAKRE--KIVDLLY-PLF
 
5499_YARLIIIWDYHTGY-VHLTGLWKAIGN-SKA--DIVKRRVRGGYLKIQGTWVPYDIARALASRTCYFIRFALI-PLF
 
5299_KLULAVVRRADNDM-INGTKLLNVTRM-TRG--RRDGHVVKIGSMHLKGVWIPFERALVMAQRE--KIVDLLY-ALF
 
0305_GIBZEVARREDNHM-INGTKLLNVAGM-TRG--RRDGHVVKIGPMHLKGVWIPYDRALDFANKE--KITELLY-PLF
 
  0837_NEUCRVARREDNAM-INGTKLLNVAGM-TRG--RRDGHVVKIGPMHLKGVWIPFERALDFANKE--KITELLY-PLF
 
  8552_MAGGRVARREDNHM-INGTKLLNVAGM-TRG--RRDGHVVKIGPMHLKGVWIPFERALDFANKE--KITELLY-PLF
 
  0447_DEBHAVSRREDTNY-VNGTKLLNVAGM-TRG--KRDGSVVKVGAMNLKGVWIPFERASEIARNE--GIDGLLY-PLF
 
  9978_GIBZEVMWDYNIGL-VRMTPFFKCRGY-GKT--IPAKHSITGGSIAAQGYWMPYRCAKAICATFCHPIAGALI-PIF
 
  1513_CANALVSRREDTNY-INGTKLLNVIGM-TRG--KRDGNVVKVGSMNLKGVWIPFDRAYEIARNE--GVDSLLY-PLF
 
  6132_SCHPO-LRRCPDSY-FNISQILRLAGT-SSS--ENAKENVDSKHPQIDGVWVPYDRAISIAKRY--GVYEILQ-PLI
 
  1244_ASPFUVMWDYNIGL-VRTTHLFKCNDY-SKM--LNA-HSITGGALAAQGYWMPYEAAKAVAATFCWKIRHALT-PLF
 
  0925_USTMAMMIDVDTSF-VRFTSITQALGK-NKV--NFGRTKLKGGYLSIQGTWLPFDLAKELSRRIAWEIRDHLV-PLF
 
  2599_ASPTEIMWDYNIGL-VRTTPLFRSQNY-SKT--TPAKHSITGGAIVKPGYWIPFEAAKAVAATFCWRIRYALT-PIF
 
  9773_DEBHAIIWDYETGF-VHLTGIWKASIN-DEVKADIVKKRIRGGFLKIQGTWLPFDLCKMLAKRFCYHIRFQLI-PIF
 
  0918_CANALVIWDYETGW-VHLTGIWKASLT-IDGKADIVKKRIRGGFLKIQGTWLPYKLCKILARRFCYYLRYSLI-PIF
 
  9901_DEBHAILRRVQDSY-INISQLFSILLKISEA--QLTNSSGGHEVRDLRGLWIPYDRAVSLALKF--DIYELAK-SLF
 
  7766_ASPNILMRRSKDGY-VSATGMFKIAFP-WAK--LEEETRPESEDEIAGNVWISPVLALELAAEY--KMYDWVR-ALL
 
  5459_GIBZELMRRSYDGF-VSATGMFKASFP-YAE--ASDESLPTSHEETAGNVWIPPEQALILAEEY--KISPWIR-ALL
 
  2267_NEUCRLMRRSQDGY-ISATGMFKATFP-YAS--QEEESIPTSSEETAGNVWIPPEQALILAEEY--QITPWIR-ALL
 
  3510_ASPFULMRRSKDGY-VSATGMFKIAFP-WAK--LEEETREGSEDEIAGNIWVSPLLALELAKEY--QMYDWVR-ALL
 
  3762_MAGGRLMRRSSDGY-VSATGMFKATFP-YAD--AEDESLPASKEETAGNVWISPDQALALAEEY--SIATWIR-ALL
 
  3412_CANALVLRRVQDSF-VNVTQLFQILIKLPTS--QVDNGSSSHQNIYLQGIWIPYDKAVNLALKF--DIYEITK-KLF
 
  6166_SCHPOLMRMAKDSS-ISATSMFRSAFP-KAT--QEEEDNLNIEDKRVAGLWVPPADALALAKDY--SMTPFIN-ALL
 
  XBP1_SACCE---------------RDLICQS-YKD--F--LKRIRGGYIKIQGTWLPMEISRLLCLRFCFPIRYFLV-PIF
 
  6355_ASPTETY-FLMDGY-VSATGMFKIAFP-WAK--LDEESREESEDEIAGNVWISPKLALELAGEY--QMYNWVR-ALL
 
  9301_MAGGRVMWDYGCGL-VRMTHFFKCRGY-TKT--VPGKYSITGGSISAQESPIDREEAESMYGRSMQAQAQQQG-PLR
 
  5262_KLULAYI---DLHWHLNP------TLS-TLL--G--QKRIRGGYIKIQGTWLPYPVSKELCSRFCYPLRYLLV-PLF
 
  3869_EREGOYT---DVHWNVDPTWKQRLCRL-YQQ--E--KKRIRGGYIKIQGTWLPMEICKRLCIRFCFPIRYFLV-PIF
 
  6482_CANGLSVNYLDFHW-FDISEKVRSQIF-EQF--K--QQRIRGGYIKIQGTWVPWYIAKLICIRFCFPIRYLLV-PIF
 

Revision as of 07:54, 28 November 2007

How this tree was computed

The input sequence alignment was derived from the APSES domains - MUSCLE aligned and sequence names revised file based on the MSA from Assignment 3. The PHYLIP input file is given in the Fallback data page. Columns that represented regions of uncertain alignment were deleted, as well as large gapped sections. Using the PHYLIP suite online, at the Institut Pasteur, as described in the instructions, the following tree was constructedas a UPGMA NJ tree .

The program 'retree was used on the output treefile to rotate particular subclades around their branchpoint. This was done to arrange the species within a clade as nearly as possible to correspondto in the reference cladogram. While this is a "cosmetic" change (rotations around branch points do not change the topology of a tree), it facilitates analysis, especially to evaluate how many species are present in each clade and which species may be missing.

The APSES Reference Tree

                                                 ,---13:Mbp1 NEUCR
                                                 !  
                                            ,---85     ,-12:Mbp1 MAGGR
                                            !    !  ,-89  
                                            !    !  !  `-11:Mbp1 GIBZE
                                            !    `-86  
                                            !       !  ,-10:Mbp1 ASPNI
                                            !       `-87  
                                            !          !  ,--9:Mbp1 ASPTE
                                         ,-84          `-88  
                                         !  !             `--8:Mbp1 ASPFU
                                         !  !  
                                         !  !         ,-14:Mbp1 COPCI
                                         !  !     ,--92  
                                         !  !  ,-91   `-15:MbpA CRYNE
                                      ,-83  !  !  !  
                                      !  !  `-90  `-----16:Mbp1 SCHPO
                                      !  !     !  
                                      !  !     `------17:Mbp1 USTMA
                                      !  !  
                                      !  !  ,------19:Mbp1 YARLI
                                      !  `-93  
                                   ,-76     `------18:Mbp1 CRYNE
                                   !  !  
                                   !  !          ,--2:Mbp1 CANGL
                                   !  !       ,-79  
                                   !  !       !  `--1:Mbp1 SACCE
                                   !  !  ,---78  
                                   !  !  !    !  ,--3:Mbp1 ASHGO
                                   !  !  !    `-80  
                                   !  `-77       `--4:Mbp1 KLULA
                                   !     !  
                                   !     !          ,--7:Mbp1 PICST
                                   !     !       ,-82  
                                   !     `------81  `--6:Mbp1 DEBHA
                                ,-75             !  
                                !  !             `--5:Mbp1 CANAL
                                !  !  
                                !  !         ,----28:MbpA NEUCR
                                !  !      ,100  
                                !  !      !  !  ,-27:MbpA MAGGR
                                !  !      !  `101  
                                !  !      !     `-26:MbpA GIBZE
                                !  !  ,--96  
                                !  !  !   !         ,-24:MbpA ASPTE
                                !  !  !   !  ,-----98  
                                !  !  !   !  !      !  ,-23:MbpA ASPNI
                                !  !  !   `-97      `-99  
                                !  `-94      !         `-22:MbpA ASPFU
             ,-----------------74     !      !  
             !                  !     !      `-----25:MbpA YARLI
             !                  !     !  
             !                  !     !  ,---------21:MbpB USTMA
             !                  !     `-95  
             !                  !        `---------20:MbpA SCHPO
             !                  !  
             !                  !          ,-----31:Swi4 CANGL
             !                  !       ,104  
             !                  !       !  !  ,---30:Swi4 SACCE
             !                  !   ,-103  `105  
             !                  !   !   !     `---29:Swi4 ASHGO
             !                  !   !   !  
             !                  !   !   `--------32:Swi4 KLULA
             !                  `-102  
             !                      !             ,-35:MbpA PICST
             !                      !          ,107  
             !                      `--------106  `-34:MbpA DEBHA
             !                                 !  
             !                                 `-33:MbpA CANAL
             !  
             !                                        ,-50:Sok2 MAGGR
             !                                     ,123  
        ,---73                                     !  `-49:Sok2 GIBZE
        !    !                                     !  
        !    !                                  ,119        ,-46:Sok2 ASPNI
        !    !                                  !  !     ,122  
        !    !                                  !  !  ,121  `-45:Sok2 ASPFU
        !    !                                  !  !  !  !  
        !    !                               ,118  `120  `-47:Sok2 ASPTE
        !    !                               !  !     !  
        !    !                               !  !     `-48:SokA ASPNI
        !    !                               !  !  
        !    !                               !  `-51:SokA YARLI
        !    !                               !  
        !    !                               !        ,--42:Sok2 CANGL
        !    !                               !        !  
        !    !                               !        !        ,-37:Sok2 SACCE
        !    !                           ,-109     ,112     ,115  
        !    !                           !   !     !  !  ,114  `-36:Sok2 ASHGO
        !    !                           !   !     !  !  !  !  
        !    !                           !   !     !  !  !  `-38:Sok2 KLULA
        !    !                           !   !     !  `113  
 ,-----72    !                           !   !  ,111     !     ,-41:Sok2 PICST
 !      !    !                           !   !  !  !     !  ,117  
 !      !    !                           !   !  !  !     `116  `-40:Sok2 DEBHA
 !      !    `-------------------------108   !  !  !        !  
 !      !                                !   `110  !        `-39:Phd1 CANAL
 !      !                                !      !  !  
 !      !                                !      !  `--43:Phd1 SACCE
 !      !                                !      !  
 !      !                                !      `--44:Sok2 YARLI
 !      !                                !  
 !      !                                !  ,------55:SokA CANGL
 !      !                                `124  
 !      !                                   !    ,-54:SokA DEBHA
 !      !                                   `--125  
 !      !                                        !  ,-53:SokA PICST
 !      !                                        `126  
 !      !                                           `-52:Sok2 CANAL

-71 !

 !      !                            ,-----------56:MbpC CANAL
 !      !        ,-----------------128  
 !      `------127                   `-----------57:MbpB DEBHA
 !               !  
 !               `-------------------------------58:MbpB SCHPO
 !  
 !                                          ,----64:Xbp1 MAGGR
 !                                   ,----134  
 !                                   !      `----63:Xbp1 GIBZE
 !            ,--------------------130  
 !            !                      !   ,-------62:XbpA ASPNI
 !            !                      `-131  
 !            !                          !  ,----61:Xbp1 ASPTE
 !            !                          `132  
 !            !                             !    ,-60:Xbp1 ASPNI
 !            !                             `--133  
 `----------129                                  `-59:Xbp1 ASPFU
              !  
              !          ,-----------------------69:Xbp1 SACCE
              !          !  
              !       ,136                   ,---66:Xbp1 DEBHA
              !       !  !         ,-------138  
              !       !  !         !         `---65:Xbp1 CANAL
              !       !  `-------137  
              `-----135            !  ,----------68:Xbp1 YARLI
                      !            `139  
                      !               `----------67:Xbp1 COPCI
                      !  
                      `--------------------------70:Xbp1 USTMA

PHYLIP Tree File

(((((((((Mbp1_NEUCR:0.12887,((Mbp1_MAGGR:0.08575,Mbp1_GIBZE:0.08575):0.01322,
(Mbp1_ASPNI:0.04245,(Mbp1_ASPTE:0.01625,Mbp1_ASPFU:0.01625):0.0262):0.05652):0.0299):0.10027,
(((Mbp1_COPCI:0.08125,MbpA_CRYNE:0.08125):0.08562,Mbp1_SCHPO:0.16687):0.01938,
Mbp1_USTMA:0.18625):0.04289):0.02119,(Mbp1_YARLI:0.19385,Mbp1_CRYNE:0.19385):0.05649):0.0563,
(((Mbp1_CANGL:0.06605,Mbp1_SACCE:0.06605):0.04984,(Mbp1_ASHGO:0.08655,
Mbp1_KLULA:0.08655):0.02934):0.10725,((Mbp1_PICST:0.03550,Mbp1_DEBHA:0.03550):0.02163,
Mbp1_CANAL:0.05713):0.16602):0.08349):0.03608,(((MbpA_NEUCR:0.13598,
(MbpA_MAGGR:0.07465,MbpA_GIBZE:0.07465):0.06133):0.04315,((MbpA_ASPTE:0.0083,
(MbpA_ASPNI:0.0,MbpA_ASPFU:0.0):0.0083):0.1645,MbpA_YARLI:0.1728):0.00632):0.10305,
(MbpB_USTMA:0.2437,MbpA_SCHPO:0.2437):0.03847):0.06055):0.0634,(((Swi4_CANGL:0.16035,
(Swi4_SACCE:0.12425,Swi4_ASHGO:0.12425):0.0361):0.06113,Swi4_KLULA:0.22148):0.10572,
((MbpA_PICST:0.06255,MbpA_DEBHA:0.06255):0.01428,MbpA_CANAL:0.07683):0.25038):0.0789):0.42038,
(((((Sok2_MAGGR:0.01605,Sok2_GIBZE:0.01605):0.01462,(((Sok2_ASPNI:0.0,
Sok2_ASPFU:0.0):0.00805,Sok2_ASPTE:0.00805):0.01688,SokA_ASPNI:0.02493):0.00574):0.04416,
SokA_YARLI:0.07483):0.04186,(((Sok2_CANGL:0.08693,(((Sok2_SACCE:0.0489,
Sok2_ASHGO:0.0489):0.0079,Sok2_KLULA:0.0568):0.00698,((Sok2_PICST:0.0,
Sok2_DEBHA:0.0):0.01605,Phd1_CANAL:0.01605):0.04773):0.02315):0.00887,
Phd1_SACCE:0.09581):0.00666,Sok2_YARLI:0.10246):0.01423):0.08975,(SokA_CANGL:0.18773,
(SokA_DEBHA:0.08588,(SokA_PICST:0.05025,Sok2_CANAL:0.05025):0.03563):0.10186):0.01871):0.62005):0.11528,
((MbpC_CANAL:0.28905,MbpB_DEBHA:0.28905):0.45758,MbpB_SCHPO:0.74662):0.19515):0.15737,
(((Xbp1_MAGGR:0.14705,Xbp1_GIBZE:0.14705):0.15829,(XbpA_ASPNI:0.20350,
(Xbp1_ASPTE:0.14,(Xbp1_ASPNI:0.0269,Xbp1_ASPFU:0.0269):0.1131):0.0635):0.10184):0.49999,
((Xbp1_SACCE:0.56026,((Xbp1_DEBHA:0.12385,Xbp1_CANAL:0.12385):0.22894,
(Xbp1_YARLI:0.28015,Xbp1_COPCI:0.28015):0.07264):0.20747):0.07706,
Xbp1_USTMA:0.63732):0.16802):0.2938);