Modele de crabe a colorier

Caractéristiques des cinq marqueurs moléculaires. Les fréquences de base empiriques, le modèle de substitution choisi par ModelTest et employés dans les analyses bayésiennes de toutes les partitions sont répertoriés les séquences ont été alignées à l`aide de CLUSTAL W (Thompson et al. 1994) avec des paramètres par défaut et confirmées par la traduction en amino séquences acides. L`ensemble des données totales a été analysé à l`aide des analyses de probabilité maximale (ML), de parsimonie maximale (MP) et d`inférence Bayésienne (BI). L`analyse MP a été effectuée à l`aide de la recherche heuristique et de la reconnexion d`arbre-bisection avec 1 000 répétitions de séquences d`addition aléatoire sur PAUP * 4.0 B10 (Swofford 2002). Les États de caractère étaient non ordonnés et pondérés également. Les lacunes ont été traitées comme des données manquantes. La prise en charge de bootstrap (BP) pour l`arbre le plus parsimonieux a été évaluée à l`aide de 1000 répétitions avec 100 répétitions d`addition de séquences aléatoires. Nous avons utilisé ModelTest 3,7 (Posada et Crandall 1998) pour sélectionner les modèles de substitution de nucléotides les mieux adaptés à chaque ensemble de données en fonction du critère d`information d`Akour (akle 1974). Le partitionnement des données de séquences provenant de plusieurs gènes sous un modèle mixte peut offrir une meilleure estimation des relations phylogénétiques (Castoe et al. 2004; Brandley et coll. 2005; Brown et Lemmon 2007). Par conséquent, nous avons tenté de tester et d`employer divers schémas de partition pour les analyses de ML et de BI afin de déterminer le schéma de partition le mieux adapté et l`inférence phylogénétique.

Nous avons divisé le jeu de données en différentes partitions en fonction de leur fonction biologique (c.-à-d. la position du gène et/ou du codon). Comme on s`attend à ce que les premières et deuxièmes positions de codon présentent des propriétés de substitution plus semblables par rapport à la troisième position du codon (Kimura 1980; Nei 1987), nous avons également essayé de combiner les deux dans une partition tandis que la troisième position codon est séparée en une autre partition. Nous employons un total de cinq schémas analytiques différents: (i) toutes les données combinées sans partitions (schéma de partition P1); (II) divisé par trois positions de codon différentes (P3); (III) divisé par le gène (P5); (IV) divisé par gène et le premier + deuxième et le troisième codon positions (P10); et (v) divisé par le gène et trois positions de codon (15) (tableau 3). L`analyse ML a été implémentée avec les 7.0.3 RAxML (Stamatakis 2006). Le modèle GTRGAMMAI a été utilisé pour différentes partitions, avec des paramètres de forme α individuels, des taux GTR et des fréquences de base estimés et optimisés pour chaque partition. Nous avons mené 1000 BP et cherché le meilleur marqueur de l`arbre ML. L`analyse bayésienne a été réalisée à l`aide de MrBayes v.

3.12 (Ronquist et Huelsenbeck 2003). Dans certains cas où le modèle déterminé par ModelTest pour certaines partitions n`était pas disponible dans MrBayes, nous avons utilisé le modèle le plus similaire disponible dans MrBayes (tableau 4). Deux séries indépendantes ont été réalisées avec quatre chaînes de Monte Carlo Markov jumelées et chauffées de manière différenciée pour 10 millions générations de personnes ont commencé à partir d`un arbre aléatoire. Les paramètres du modèle ont été estimés au cours de l`analyse.

Modele de crabe a colorier