UNIVERSIDADE ESTADUAL DE SANTA CRUZ

UNIVERSIDADE ESTADUAL DE SANTA CRUZ PROGRAMA DE PÓS-GRADUAÇÃO EM GENÉTICA E BIOLOGIA MOLECULAR DNA BARCODE EM ESPÉCIES ARBÓREAS DE SAPOTACEAE DA MATA...
50 downloads 0 Views 7MB Size
UNIVERSIDADE ESTADUAL DE SANTA CRUZ PROGRAMA DE PÓS-GRADUAÇÃO EM GENÉTICA E BIOLOGIA MOLECULAR

DNA BARCODE EM ESPÉCIES ARBÓREAS DE SAPOTACEAE DA MATA ATLÂNTICA

CAIO VINICIUS VIVAS DAMASCENO MELO

ILHÉUS – BAHIA - BRASIL FEVEREIRO DE 2012

CAIO VINICIUS VIVAS DAMASCENO MELO

DNA BARCODE EM ESPÉCIES ARBÓREAS DE SAPOTACEAE DA MATA ATLÂNTICA

Dissertação apresentada à Universidade Estadual de Santa Cruz, como parte das exigências para obtenção do título de Mestre em Genética e Biologia Molecular. Área de concentração: Biologia Molecular.

Genética

e

Orientadora: Drª. Fernanda Amato Gaiotto Co-orientador: Dr. Cássio van den Berg Co-orientador: Dr. Eduardo Mariano Neto

ILHÉUS – BAHIA - BRASIL FEVEREIRO DE 2012

M528

Melo, Caio Vinicius Vivas Damasceno. DNA barcode em espécies arbóreas de Sapotaceae da Mata Atlântica / Caio Vinicius Vivas Damasceno Melo. – Ilhéus, BA: UESC, 2012. x, 86f. : Il. Orientadora: Fernanda Amato Gaiotto. Dissertação (Mestrado) – Universidade Estadual de Santa Cruz. Programa de Pós-Graduação em Genética e Biologia Molecular. Inclui bibliografia e apêndice. 1. Genética vegetal. 2. Biologia - Classificação. 3. Plantas – Identificação. 4. Sapoti. I. Título. CDD 581.35

CAIO VINICIUS VIVAS DAMASCENO MELO

DNA BARCODE EM ESPÉCIES ARBÓREAS DE SAPOTACEAE DA MATA ATLÂNTICA

Dissertação apresentada à Universidade Estadual de Santa Cruz, como parte das exigências para obtenção do título de Mestre em Genética e Biologia Molecular. Área de concentração: Biologia Molecular.

Genética

Aprovada: 27 de fevereiro de 2012

Drª. Vânia Cristina Rennó Azevedo (CENARGEN/EMBRAPA)

Dr. André Márcio Araújo Amorim (UESC)

Drª. Fernanda Amato Gaiotto (UESC -Orientadora)

Dr. Marco Antônio Costa (UESC)

ii

e

AGRADECIMENTOS

Este trabalho é fruto do esforço e colaboração de várias pessoas. Por isso, gostaria de agradecer a: À professora Drª. Fernanda Amato Gaiotto, pela orientação, amizade e pelos valiosos ensinamentos e conselhos que contribuíram para a realização deste belo trabalho; Ao professor Dr. Eduardo Mariano Neto, pelos ensinamentos e amizade, desde a graduação, e pela valiosa contribuição na realização deste trabalho; Ao professor Dr. Cássio van den Berg, pelos ensinamentos, amizade e por ter aberto as portas do LAMOL para as reações de sequenciamento e análise dos dados; Ao amigo José Lima da Paixão, pela amizade, pelos momentos de descontração e pela grande ajuda na localização, coleta e herborização do material botânico, e por todo o conhecimento passado durante a realização deste trabalho; Ao grande amigo Ramires, parceiro de tantas coletas, pela amizade e pela grande contribuição na realização desde trabalho; Ao professor e amigo Dr. Roberto Tarazi, pelos ensinamentos, amizade e por toda a colaboração durante a execução deste trabalho; À Drª. Elisa Suganuma, pelas valiosas dicas que facilitaram a execução deste trabalho; Ao professor Dr. André Amorim e a toda equipe do Herbário CEPEC/CEPLAC (Tiago, Cristiane, Carlinhos, Lucas e Bispo) por ter aberto as portas do Herbário CEPEC/CEPLAC para mim e pela valiosa ajuda no processamento do material botânico; Ao Dr. Anderson Geyson Alves de Araújo (UFES) e ao Dr. Marccus Alves (UFPE), pela identificação das espécies; A toda equipe do LAMOL, em especial a Ricardo e a Maria pela ajuda na obtenção das sequências; À Kátia, pela ajuda no depósito das sequências no GenBank; Ao Paulo Ricardo e ao Fábio, pela amizade e por todo o apoio, durante a minha estadia em Feira de Santana; iii

À Veracel, por todo o apoio que possibilitou a coleta na RPPN Estação Veracel; À Michelin, por todo o apoio que possibilitou a coleta na Estação Ecológica da Michelin; Ao IESB, por todo o apoio que possibilitou a coleta na RPPN Capitão; À Secretaria do Meio Ambiente de Ilhéus, por todo o apoio que possibilitou a coleta no Parque Municipal da Boa Esperança; Ao Sr. Ronaldo Santana, por ter permitido a coleta na RPPN Mãe da Mata; Ao INEMA pela autorização para a coleta no Parque Estadual da Serra do Conduru; Ao ICMBio por ter concedido a licença de coleta e autorização para a coleta na Reserva Biológica de Una; A toda minha família, em especial a minha mãe (Aldene) e a minha namorada (Juliane), pelo carinho, apoio e incentivo durante esta jornada; Aos professores do PPG em Genética e Biologia Molecular por todo o conhecimento adquirido e pelos ensinamentos que aplicarei durante toda a minha vida profissional; A todos os colegas e amigos do Laboratório de Marcadores Moleculares, em especial a Ramiris, Fernanda, Jeiza, Allan, Kátia, Douglas, Rodrigo, Josiane, Alesandro, Acácia, Daniele e Flora pela amizade, ajuda e pelos momentos de descontração; A todos os colegas da Pós-graduação, em especial a Ramiris, Allan, Ronaldo, Cláusio, Fernanda, Fabi, Lívia, Ricardo, Gileno e Sanderson pela amizade e pelos momentos de descontração; À Fabrícia, por toda a ajuda durante esses dois anos de mestrado; A CAPES e a FAPESB pela bolsa de estudos; À Universidade Estadual de Santa Cruz, ao Departamento de Ciências Biológicas e ao Colegiado do PPG em Genética e Biologia Molecular por toda infra-estrutura concedida e pelo financiamento do projeto; A todos aqueles que de alguma forma contribuíram para o desenvolvimento deste trabalho.

A todos, muito obrigado! iv

EXTRATO

MELO, Caio Vinicius Vivas Damasceno, M.S., Universidade Estadual de Santa Cruz, Ilhéus, fevereiro de 2012. DNA barcode em espécies arbóreas de Sapotaceae da Mata Atlântica. Orientadora: Drª. Fernanda Amato Gaiotto. Co-orientador: Dr. Cássio van den Berg. Coorientador: Dr. Eduardo Mariano Neto.

A Floresta Atlântica apresenta elevada diversidade de espécies bem como uma alta taxa de endemismo, onde se destaca a região sul baiana. Dentre os táxons representados nesta região, a família Sapotaceae sobressai como uma das mais ricas no componente arbóreo. Algumas espécies dessa família são consideradas raras e de difícil identificação, sendo necessária uma abordagem que facilite a identificação das mesmas. Neste contexto, o DNA barcode, que consiste na utilização de uma ou várias regiões de DNA para a identificação de espécies, fornece um importante auxílio à taxonomia. Portanto, no presente trabalho foram avaliadas quatro regiões, ITS, matK, rbcL e trnH-psbA, em 26 espécies da família Sapotaceae ocorrentes na Mata Atlântica, tendo em vista a validação destas na identificação de tais espécies. A região ITS apresentou a maior divergência entre as espécies (12%), seguida de trnH-psbA (1,5%), matK (0,8%) e rbcL (0,2%). Na discriminação de espécies, baseada no algoritmo de neighbor-joining, a região ITS teve o melhor desempenho, com 91,3% das espécies identificadas, seguida de matK, trnH-psbA e rbcL que identificaram 50%, 40% e 34,6% das espécies, respectivamente. As análises combinadas de duas, três e quatro regiões não obtiveram taxas de discriminação superiores ao da região ITS. Portanto, recomendamos a região ITS para a identificação molecular de espécies arbóreas de Sapotaceae da Mata Atlântica.

Palavras-chave: DNA barcode, ITS, Espécies Arbóreas, Taxonomia.

v

ABSTRACT

MELO, Caio Vinicius Vivas Damasceno, M.S., Universidade Estadual de Santa Cruz, Ilhéus, fevereiro de 2012. DNA barcode in Sapotaceae tree species of the Atlantic Forest. Advisor: Drª. Fernanda Amato Gaiotto. Advisor Committee Members: Dr. Cássio van den Berg and Dr. Eduardo Mariano Neto.

The Atlantic Forest has high species diversity and rate of endemism, particularly in the southern of Bahia, Brazil. Among the taxa existing in this region, the family Sapotaceae stands out as one of the richest in tree species. Some species of this family are considered rare and difficult to identify, requiring an approach that facilitates its identification. In this context, the use of DNA barcodes, which consist in using of one or more regions of DNA for species identification, provides an important aid to taxonomy. Therefore, in this study we sequenced four regions, ITS, matK, rbcL and trnH-psbA, for 26 species of Sapotaceae occurring in the Atlantic Forest, aiming to validate the use of these genome regions for identification purposes. The ITS region displayed the greatest species divergence (12%), followed by trnHpsbA (1.5%), matK (0.8%) and rbcL (0.2%). For discrimination of species based on neighborjoining algorithm, the ITS region had the best performance with 91.3% of species identified, followed by matK, trnH-psbA and rbcL that have identified 50%, 40% and 34.6 % of species, respectively. The combined analysis of two, three and four regions did not obtain higher rates of discrimination than the ITS region alone. Thus, we recommend the ITS region for molecular identification of Sapotaceae species from the Atlantic Forest.

Keywords: DNA barcode, ITS, Tree Species, Taxonomy.

vi

LISTA DE FIGURAS

Figura 1

Figura 2

Figura 3 Figura 4 Figura 5

Figura 6 Figura 7

Figura 8 Figura 9

Figura 10 Figura 11

Figura 12

Figura 13

Características morfológicas de Sapotaceae: filotaxia alterna e folha simples com margem inteira em Chrysophyllum splendens (A); frutos do tipo drupa e detalhes do caule em Pradosia lactescens (B).................................................... Localização geográfica dos sítios de coleta dos exemplares de Sapotaceae utilizados neste estudo. 1 Reserva Ecológica da Michelin; 2 RPPN Capitão; 3 Parque Estadual da Serra do Conduru; 4 Parque Municipal da Boa Esperança; 5 RPPN Mãe da Mata; 6 Estrada Olivença - Vila Brasil; 7 Reserva Biológica de Una; 8 RPPN Estação Veracel............................................................................................................... Produtos amplificados da região trnH-psbA de espécimes de Sapotaceae 2 a 15 e 17 a 28. 1 e 16 ladder 1 kb.......................................................................... Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da região ITS em espécies da família Sapotaceae..................... Árvore de neighbor-joining baseada na análise da região ITS em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P)................................................................................................................... Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da região matK em espécies da família Sapotaceae.................. Árvore de neighbor-joining baseada na análise da região matK em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P)................................................................................................................... Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da região rbcL em espécies da família Sapotaceae................... Árvore de neighbor-joining baseada na análise da região rbcL em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P)................................................................................................................... Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da região trnH-psbA em espécies da família Sapotaceae.......... Árvore de neighbor-joining baseada na análise da região trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2parâmetros (K2P)................................................................................................ Árvore de neighbor-joining baseada na análise combinada das regiões ITS e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P)................................................................................................................... Árvore de neighbor-joining baseada na análise combinada das regiões ITS, matK, rbcL e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P)................................................................................................................... vii

5

18 23 25

26 27

28 29

30 31

32

35

36

LISTA DE TABELAS

Tabela 1 Campanhas para o código de barras da vida de diferentes táxons.......................

8

Tabela 2 Diferentes regiões propostas para DNA barcode em plantas............................... 11 Tabela 3 Primers utilizados nas reações de PCR e sequenciamento.................................. 21 Tabela 4 Avaliação de quatro regiões genômicas para a identificação molecular de espécies de Sapotaceae........................................................................................ 24 Tabela 5 Distância inter e intraespecífica e sucesso na identificação da análise combinada das regiões ITS, matK, rbcL e trnH-psbA em espécies da família Sapotaceae............................................................................................................ 33 Tabela 6 Distância inter e intraespecífica e sucesso na identificação da análise combinada das regiões ITS, matK, rbcL e trnH-psbA em espécies da família Sapotaceae............................................................................................................ 34

viii

ÍNDICE

EXTRATO............................................................................................................................

v

ABSTRACT........................................................................................................................

vi

1 INTRODUÇÃO...............................................................................................................

1

1.1 Objetivo Geral..............................................................................................................

3

1.1.1 Objetivos específicos..................................................................................................

3

2 REVISÃO DE LITERATURA......................................................................................

4

2.1 Mata Atlântica..............................................................................................................

4

2.2 Família Sapotaceae......................................................................................................

4

2.3 DNA barcode.................................................................................................................

7

2.3.1 Aplicações...................................................................................................................

9

2.3.2 DNA barcode em animais...........................................................................................

9

2.3.3 DNA barcode em plantas............................................................................................

10

2.3.3.1 Identificação molecular de plantas utilizando rbcL.................................................

14

2.3.3.2 Identificação molecular de plantas utilizando matK................................................

14

2.3.3.3 Identificação molecular de plantas utilizando ITS...................................................

15

2.3.3.4 Identificação molecular de plantas utilizando trnH-psbA........................................

16

3. MATERIAL E MÉTODOS..........................................................................................

18

3.1 Área de estudo, obtenção e identificação das amostras............................................

18

3.2 Extração de DNA.........................................................................................................

19

3.3 Amplificação, purificação e sequenciamento............................................................

20

3.4 Edição e alinhamento das sequências.........................................................................

21

3.5 Análises dos dados........................................................................................................

21

ix

4 RESULTADOS...............................................................................................................

23

4.1 Avaliação das regiões...................................................................................................

23

4.1.1 A região ITS................................................................................................................

24

4.1.2 A região matK.............................................................................................................

25

4.1.3 A região rbcL..............................................................................................................

27

4.1.4 A região trnH-psbA.....................................................................................................

29

4.2 Análises combinadas....................................................................................................

33

5 DISCUSSÃO....................................................................................................................

37

6 CONCLUSÕES...............................................................................................................

41

7 REFERÊNCIAS..............................................................................................................

42

APÊNDICES......................................................................................................................

52

x

1 INTRODUÇÃO

A identificação de amostras animais, vegetais e de microrganismos tem por objetivo determinar se um exemplar desconhecido pertence a uma espécie descrita ou representa um novo táxon, sendo importante em diversas áreas como na farmacologia, na agricultura, entre outros. Uma das formas de se identificar uma amostra vegetal desconhecida é consultar um botânico especialista no grupo em questão. Entretanto, o número de taxonomistas em atividade é insuficiente para atender a demanda existente de identificação e descrição de novas espécies, principalmente nas regiões tropicais, onde a identificação de espécimes tornase desafiadora, já que uma quantidade significativa da grande diversidade existente ainda não é conhecida pela ciência (JUDD et al., 2008). Para o planeta Terra, Mora et al., (2011) estimam em aproximadamente 8,7 milhões o número de espécies de eucariotos. No Brasil, Lewinsohn & Prado (2005) estimam em 1,8 milhão o número de espécies, e destacam que com a velocidade atual de descrição de novas espécies no Brasil, seriam necessários no mínimo oito séculos para descrever toda a biodiversidade deste país. Entretanto, este cenário não se restringe apenas ao Brasil, pois nos últimos três séculos apenas 1,7 milhão de espécies foram descritas, frente a uma diversidade estimada em mais de 8,7 milhões de espécies. Somado à falta de conhecimento e ao número limitado de taxonomistas, o aumento da taxa de extinção em cerca de 1000 vezes (PIMM et al., 1995) resulta na extinção de espécies antes mesmo destas serem conhecidas pela ciência, reflexo do impedimento taxonômico vivido atualmente (LIPSCOMB et al. 2003; TUBARO e ASTARLOA, 2008). Nesse contexto, um método que permitisse uma identificação de forma rápida, precisa e automatizada de espécies traria vantagens por permitir que especialistas dedicassem seu tempo principalmente à descrição de novas espécies enquanto “técnicos” ficariam encarregados da identificação e da triagem de prováveis espécies novas, as quais não constariam em um banco de dados pré-estabelecido e seriam encaminhadas para os especialistas para a descrição. Desta forma, a técnica denominada DNA barcode tem trazido benefícios para ecólogos, conservacionistas e para agências encarregadas de controle de pragas e espécies invasoras por permitir a identificação de amostras em que a identificação pelos métodos tradicionais seria impossível (HEBERT e GREGORY, 2005). Este método consiste na utilização de uma ou várias regiões genômicas curtas e padronizadas para a 1

identificação rápida e precisa de espécies (HERBERT et al., 2003) e pode ser muito útil para a identificação de espécies em regiões megadiversas (GONZALES et al., 2009). A Mata Atlântica é um dos domínios fitogeográficos mais diversos e ameaçados do planeta. Possui uma elevada diversidade de espécies animais e vegetais bem como uma alta taxa de endemismo, que somados à ameaça que este domínio vem sofrendo, devido a ações antrópicas que resultaram em uma perda considerável da sua cobertura vegetal, conferiu a este o status de hotspot da biodiversidade (MYERS, et al., 2000). Entre os táxons que ocorrem na Mata Atlântica e possuem dificuldade na sua identificação destaca-se a família Sapotaceae, por apresentar floração supra-anual e variação morfológica vegetativa, sendo necessária a análise de flores e frutos para a sua correta identificação (ALVES-ARAÚJO e MARIANONETO, com. pess.), além de muitas espécies desta família serem consideradas raras (CARNEIRO et al., 2009). Associado a isso, Joppa et al. (2010) estimam em 2.728 o número de espécies de Sapotaceae no mundo, das quais apenas 45,5% foram descritas, sendo necessária a utilização de metodologias que auxiliem na triagem de possíveis espécies novas para que estas possam ser monitoradas para a obtenção de material fértil para a sua descrição. Frente ao problema apresentado para a identificação da família Sapotaceae, ferramentas como o DNA barcode podem auxiliar tanto na identificação quanto na resolução de problemas taxonômicos das espécies pertencentes a esta família ainda remanescentes nos fragmentos de Mata Atlântica.

2

1.1 Objetivo Geral O presente trabalho teve por objetivo a validação das regiões ITS, matK, rbcL e trnHpsbA para a identificação molecular de espécies da família Sapotaceae da Mata Atlântica. 1.1.1 Objetivos específicos Verificar o sucesso de amplificação e sequenciamento dessas regiões em espécies da família Sapotaceae; Avaliar a capacidade das regiões ITS, matK, rbcL e trnH-psbA em discriminar as espécies de Sapotaceae em estudo; Depositar sequências barcodes para as espécies amostradas em bancos de dados públicos.

3

2 REVISÃO DE LITERATURA

2.1 Mata Atlântica A Mata Atlântica é a segunda maior floresta tropical da América do Sul, com uma cobertura original de aproximadamente 1.400.000 km2, estendendo-se ao longo da costa brasileira, do Rio Grande do Norte até o Rio Grande do Sul, além de porções situadas na Argentina e no Paraguai (SILVA e CASTELI, 2003). Apresenta uma elevada diversidade de espécies, com 16.146 espécies de plantas, sendo 7.524 endêmicas e 1.361 espécies de vertebrados, das quais 567 são consideradas endêmicas (MYERS, et al., 2000; FORZZA, et al., 2010). A Mata Atlântica é considerada um dos domínios fitogeográficos mais devastados do planeta, possuindo aproximadamente 7% da sua cobertura original. Esta perda da sua cobertura original é fruto de diversos ciclos econômicos que começaram com a colonização portuguesa no início do século XVI, além de possuir uma grande densidade populacional, cerca de dois terços da população brasileira, que exercem uma grande pressão sobre este domínio (GALINDO-LEAL e CÂMARA, 2003). A Mata Atlântica apresenta uma complexa história evolutiva que resultou na formação de diferentes ambientes por toda a sua extensão, sendo uma das prováveis causas da sua elevada diversidade biológica (SILVA e CASTELI, 2003), sendo, por exemplo, considerada um centro de diversificação da família Myrtaceae (MORI et al., 1983). As espécies endêmicas não estão distribuídas de forma igualitária neste domínio fitogeográfico (SILVA e CASTELI, 2003), e nesse sentido destaca-se a região correspondente ao Corredor Central da Mata Atlântica, considerada uma área de refúgio biológico pleistocênico (CARNAVAL e MORITZ, 2008; CARNAVAL et al., 2009), que possui uma elevada riqueza de espécies vegetais das quais uma quantidade significativa são endêmicas (THOMAS et al., 1998; MARTINI et al., 2007).

2.2 Famílias Sapotaceae A família Sapotaceae possui 53 gêneros e cerca de 1.250 espécies com distribuição pantropical, sendo encontradas principalmente em florestas úmidas. No Brasil são registrados 12 gêneros e cerca de 200 espécies, principalmente nas Florestas Amazônica e Atlântica (PENNINGTON, 1990; CARNEIRO et al., 2009), sendo em algumas áreas uma das famílias

4

mais ricas do componente arbóreo-arbustivo (HOPKINS, 2005; MARIANO-NETO, 2004; NEVES, 2005). É caracterizada pelo hábito arbóreo ou arbustivo, latescentes, filotaxia principalmente alterna, com folhas simples e margem quase sempre inteira (Figura 1A). Inflorescência fasciculada, com posicionamento axial, nos ramos ou no caule. Flores actinomorfas, uni ou bissexuadas, dialissépala, gamopétala, estames inseridos dentro do tubo da corola ou na base dos lobos da mesma, com algumas espécies do gênero Pouteria possuindo estames livres, com estaminódios presentes em alguns gêneros (ex. Manilkara e Sideroxylon). Possui ovário súpero, uni ou plurilocular, quase sempre uniovulado, fruto do tipo baga ou drupa com sementes de testa lisa e com cicatriz (Figura 1B) (PENNINGTON, 1990; CARNEIRO et al., 2009)

Figura 1: Características morfológicas de Sapotaceae: filotaxia alterna e folha simples com margem inteira em Chrysophyllum splendens (A); frutos do tipo drupa e detalhes do caule em Pradosia lactescens (B). Fotos: C. V. Vivas 2010.

Estudos filogenéticos apontam para o monofiletismo da família (ANDERBERG et al., 2002) e a divisão desta em três subfamílias: Chrysophylloideae, Sarcospermatoideae e Sapotoideae (SWENSON e ANDERBERG, 2005), contudo Swenson et al., (2008) consideram a classificação desta família um tanto difícil e apontaram para a necessidade da resolução de problemas sistemáticos dentro de cada subfamília. As classificações anteriores da família realizadas por diversos autores (AUBRÉVILLE, 1964; BAEHNI, 1965; PENNINGTON, 1991) diferem entre si, muitas vezes por conta dos caracteres morfológicos 5

utilizados nesses estudos, que às vezes são bastante homoplásicos nesta família (SWENSON e ANDERBERG, 2005). A filogenia molecular da subfamília Chrysophylloideae sugere que Chrysophyllum, Pouteria, e Pradosia sejam polifiléticos e aponta para a necessidade de uma nova circunscrição destes gêneros (SWENSON et al., 2008). Armstrong (2010) utilizando a região nuclear ITS e três regiões plastidiais não-codificantes, reconstruiu a filogenia do gênero Manilkara e verificou que o mesmo não representa um grupo monofilético, devido às espécies M. fasciculata (Warb.) H.J. Lam & Maas Geest., M. dissecta (L.f.) Dubard e M. udoido Kaneh. que são mais relacionadas com os gêneros Labourdonnaisia e Faucherea. Muitas espécies da família fornecem produtos economicamente importantes como o látex utilizado na produção de chicletes e a madeira de excelente qualidade, por ser dura, pesada e durável (PENNINGTON, 1990). Outras tantas espécies fornecem frutos que são utilizados na alimentação humana, como Chrysophyllum cainito L. (abiu-roxo), Manilkara huberi (Ducke) Chevalier (maçaranduba), Manilkara salzmannii (A.DC.) H.J. Lam (maçaranduba), Manilkara subsericea (Mart.) Dubard (maçaranduba), Manilkara zapota (L.) P. Royen (sapoti), Mimusops commersonii (G. Don) Engl. (abricó-da-praia), Pouteria bullata (S. Moore) Baehni (bapeba), Pouteria caimito (Ruiz & Pavon) Radlk. (abiu), Pouteria campechiana (Kunth) Baehni (canistel), Pouteria gardneriana (A. DC.) Radlk. (Aguaíguaçu), Pouteria gardnerii (Mart. & Miq.) Baehni (maçaranduba-vermelha), Pouteria grandiflora (A. DC.) Baehni (bapeba), Pouteria macrophylla (Lam.) Eyma (cutite), Pouteria pachycalyx T.D. Penn. (guapeba), Pouteria ramiflora (Mart.) Radlk. (curriola), Pouteria torta (Mart.) Radlk. (abiu-do-cerrado), Pouteria venosa (Mart.) Baehni (aboriana), Pouteria sapota (Jacq.) H.E. Moore & Stearn (mamei), Pradosia brevipes (Pierre) T.D. Penn. (curriolarasteira), Pradosia lactescens (Vell.) Radlk. (buranhém), Sideroxylon obtusifolium (Roem. & Schult.) T.D. Penn. (quixaba) e Synsepalum dulcificum (Schumach. & Thonn.) Daniell (frutamilagrosa) entre outras (LORENZI et al., 2006). Diversas espécies da família Sapotaceae são utilizadas por animais para a alimentação e outros fins. Por exemplo, Oliveira et al., (2010) conduziram um estudo para verificar quais as espécies são utilizadas na alimentação e como sítio de repouso para o mico-leão-da-caradourada (Leontopithecus chrysomelas) uma espécie endêmica da Mata Atlântica sul baiana. A família Sapotaceae obteve destaque neste estudo, sendo a segunda família mais utilizada pelo mico-leão-da-cara-dourada, com treze espécies utilizadas na alimentação e nove como sítio de 6

repouso, dentre elas Manilkara maxima, a segunda espécie mais utilizada por este animal como fonte de néctar e sítio de repouso. No Brasil, as espécies de Sapotaceae são encontradas principalmente na Floresta Amazônica. Na Mata Atlântica são encontradas cerca de 60 espécies distribuídas em nove gêneros, com destaque para o Corredor Central da Mata Atlântica que concentra o maior número de endemismos (PENNINGTON, 1990). A família Sapotaceae destaca-se como uma das famílias mais ricas da flora do Corredor Central da Mata Atlântica (MARIANO-NETO, 2004; NEVES, 2005; MARTINI et al., 2007; THOMAS et al., 2009) não ocorrendo o mesmo em outros trechos da Mata Atlântica (SILVA, 1989; GUEDES-BRUNI et al., 2006; URBANETZ et al., 2010).

2.3 DNA barcode DNA barcode consiste em um método de identificação que utiliza uma ou várias regiões de DNA para a discriminação de espécies, fornecendo um importante auxílio à taxonomia (HERBERT et al., 2003). De fato, sequências de DNA já vinham sendo utilizadas na identificação de espécies, como no trabalho realizado por Linder et al., (2000) que utilizaram o espaçador interno transcrito nuclear (ITS) para a identificação de fragmentos de raízes, pela comparação com uma banco de dados que permitiu a identificação com sucesso de todos as raízes em nível de gênero e muitas em nível específico. Porém, somente no ano de 2003, um sistema de identificação puramente baseado em sequências padronizadas de DNA foi proposto para organismos eucariotos, baseado na premissa de que cada espécie possui um único código de barras de DNA (DNA barcode). Este método pode ser utilizado na identificação de espécies a partir de qualquer tecido do qual seja possível extrair o seu DNA, amplificar e sequenciar a região em questão, possibilitando a identificação de espécies em situações onde os métodos tradicionais não obteriam sucesso (HERBERT et al., 2003). Para tanto, Herbert et al., (2003) compararam sequências de aproximadamente 650 pb do gene mitocondrial citocromo c oxidase I (COI) de diferentes táxons de animais e obtiveram sucesso na identificação da grande maioria das espécies em questão. Posteriormente, no ano de 2004, um consórcio internacional (Consortium for the Barcode of Life - CBOL) envolvendo a participação de museus, universidades e laboratórios foi criado com o objetivo de desenvolver o DNA barcode como modelo para a identificação de espécies. Desde então diversas campanhas visando à obtenção de dados de diversos táxons 7

estão sendo realizadas (Tabela 1) e um grande projeto internacional (International Barcode of Life Project - iBOL) foi criado no ano de 2009 com o objetivo de reunir dados (DNA barcode) de 5 milhões de espécimes de cerca de 500.000 espécies eucariotas em 5 anos (TUBARO e ASTARLOA, 2008). Tabela 1: Campanhas para o código de barras da vida de diferentes táxons. Campanha All Birds Barcoding Initiative (ABBI) Fish Barcode of Life (FishBOL) Lepidoptera Barcode of Life Mammalia Barcode of Life Formicidae Barcode of Life Mosquito Barcode Initiative (MBI) Shark Barcode of Life (SharkBOL) Sponge Barcoding Project (SpongeBOL) Tephritid Barcode Initiative (TBI) All Fungi Barcoding TreeBOL GrassBOL HealthBOL

Táxon Aves Peixes Lepidoptera Mamíferos Formigas Mosquitos Tubarões Esponjas Tephritidae Fungos Espécies arbóreas Gramíneas Parasitas, patógenos e vetores de doenças humanas

Também no ano de 2004 foi lançada a pedra fundamental do sistema de dados para o código de barras da vida (BOLD) que foi desenvolvido progressivamente e lançado oficialmente no ano de 2007. O BOLD é uma plataforma virtual que tem como objetivo a aquisição, armazenamento, análise e publicação de registros de DNA barcodes. O BOLD é formado por três unidades funcionais, o sistema de gerência e análise, o sistema de identificação e o sistema de conectividade externa. O sistema de gerência e análise permite o armazenamento de registros de DNA barcodes, permitindo a criação de projetos nesta plataforma para o depósito de sequências e a submissão de eletroferogramas e dados acerca do voucher, além de possuir algumas ferramentas analíticas que possibilitam a realização de análises de rotina, tais como uma árvore de identificação baseada no algoritmo de neighborjoining. Já o sistema de identificação, possibilita a identificação de amostras desconhecidas através de sequências de DNA de uma região padrão (ex: CO1 em animais) que são analisadas com base no banco de dados do BOLD e sempre que possível realiza a identificação em nível específico. Por fim, o sistema de conectividade externa expõe os dados e a funcionalidade do sistema possibilitando aos bioinformatas o registro e a integração de serviços externos ao BOLD, permitindo o acesso a dados remotos e a capacidade de fornecer atualizações diárias a outros sites que monitoram o progresso de registros de DNA barcodes para um táxon específico ou para uma determinada região geográfica (RATNASINGHAM e HEBERT, 2007). 8

Uma nova versão do BOLD está disponível, a V3.0, a qual passou por uma série de revisões para suportar o volume crescente de dados, além de permitir a identificação de até 100 sequências de uma só vez e fornecer suporte com os algoritmos de alinhamento de sequências Muscle e Kaling para auxiliar o trabalho com DNA barcodes de plantas. Atualmente o BOLD possui cerca de 146.000 espécies com códigos de barras formalmente descritas das quais 105.000 de animais, 38.700 de plantas e 2.290 de fungos (BOLD SYSTEMS V3.0, 2011).

2.3.1 Aplicações Existem muitas situações onde a identificação de uma amostra biológica é difícil ou até mesmo impossível utilizando os métodos taxonômicos tradicionais. Nesse sentido, o DNA barcode vem sendo utilizado com sucesso em diferentes frentes como: i) identificação de espécies diversas (HEBERT et al., 2004; FOOTTIT et al., 2009; NEWMASTER e RAGUPATHY, 2009); ii) autenticação de produtos naturais e alimentos (WONG e HANNER, 2008; GAO et al., 2010); iii) estudos ecológicos e biomonitoramento (SCHNEIDER e SCHUETTPELZ, 2006;VALENTINI et al., 2010; SWEENEY et al., 2011); iv) identificação de espécies invasivas (VAN DE WIEL et al., 2009); v) conservação de espécies (WITT et al., 2006) entre outras.

2.3.2 DNA barcode em animais A região padrão para a identificação molecular de animais é a porção 5’ do gene mitocondrial citocromo c oxidase I (CO1) com cerca de 650 pb sugerida por Hebert et al., (2003). Esta região possui características desejáveis para um DNA barcode tais como: i) herança uniparental; ii) fácil amplificação com primers padronizados; iii) variação suficiente para distinguir espécies; iv) sinal filogenético para permitir a identificação de amostras desconhecidas; v) curto o suficiente para permitir o sequenciamento em uma única reação; vi) e por ser uma região codificante, é facilmente alinhável permitindo a checagem de erros de sequenciamento ou a possibilidade da existência de pseudogenes através do rastreamento de códons de terminação na região sequenciada (HEBERT et al., 2003; VALENTINI et al., 2008; HOLLINGSWORTH et al., 2011).

9

Hebert et al., (2003) analisaram a divergência da região CO1 em espécies de 11 filos do reino animal, e verificaram uma média de 11,3% de divergência, variando de 0 a 53,7%, entre as espécies em questão. Setenta e nove por cento das espécies comparadas mostraram uma divergência superior a 8%, demonstrando a eficiência desta região para a identificação de animais. Porém para o filo Cnidaria, a região CO1 não apresentou divergência suficiente para discriminar espécies, com 94,1% das comparações entre espécies com menos de 2% de divergência, enquanto apenas 1,9% das comparações realizadas entre espécies dos outros filos apresentaram uma divergência tão limitada. Posteriormente Hebert et al., (2004) demonstraram em um estudo utilizando dados morfológicos, ecológicos e de DNA, a eficiência da região CO1 em discriminar 10 espécies crípticas de Astraptes fulgerator (Lepidoptera: Hesperiidae), antes reconhecida como uma única espécie. Witt et al., (2006) utilizaram a região CO1 para analisar crustáceos do gênero Hyalella, o qual possui uma taxonomia bastante complexa. Para tanto, analisaram diferentes populações das espécies Hyalella azteca, H. muerta e H. sandra e encontraram 2 linhagens distintas em H. sandra e 33 em Hyalella azteca, nas quais a região CO1 divergiu de 4,4% a 29,9%, apontando para um alto nível de espécies crípticas e endêmicas. Estes estudos demonstram a importância do DNA barcode em identificar espécies e revelar a diversidade antes desconhecida pela comunidade científica, auxiliando assim na elaboração de estratégias eficientes de conservação.

2.3.3 DNA barcode em plantas Ao contrário do observado na maioria das espécies de animais, a porção 5’ do gene mitocondrial citocromo c oxidase I não exibe variação suficiente para ser utilizado na identificação molecular de plantas. O genoma mitocondrial das plantas possui baixas taxas de substituição de nucleotídios e assim como a região do gene CO1 outras regiões mitocondriais de plantas não possuem as características desejáveis para um DNA barcodes (CHASE et al., 2005). Como alternativa, uma busca incessante foi realizada para encontrar regiões no genoma plastidial ou nuclear com as características desejáveis para a identificação molecular de plantas. Desde então, diversos estudos foram realizados por vários grupos de pesquisa em diferentes táxons que resultaram em diferentes regiões propostas para tal fim (Tabela 2).

10

Em 2005, Kress et al., analisaram o genoma plastidial das espécies Atropa belladonna e Nicotiana tabacum buscando regiões que apresentassem as características desejáveis para um DNA barcode e escolheram nove espaçadores intergênicos mais o gene rbcL e a região nuclear ITS, que serviram de base para um subsequente teste em uma amostra maior de espécies vegetais. As regiões ITS e trnH-psbA apresentaram os melhores resultados e os pesquisadores propuseram estas duas regiões para a identificação molecular de plantas, ressaltando a necessidade de testes em grande escala dessas duas regiões em diferentes táxons de angiospermas. No mesmo ano, Chase et al., (2005) avaliaram a performance da região nuclear ITS juntamente com o gene rbcL

(cerca de 1.400 pb) como DNA barcodes,

analisando sequências de DNA depositadas no GenBank e no EMBL, e consideraram que essas regiões tiveram um bom desempenho no conjunto de dados em questão, mas deixaram claro a necessidade do desenvolvimento de ferramentas mais eficientes para este fim.

Tabela 2: Diferentes regiões propostas para DNA barcode em plantas Região rbcL (parte do gene) matK trnH-psbA ITS ITS2 trnL (P6) accD ndhJ rpoB rpoC1 ycf5 rbcL (gene completo) atpF-H psbK-L UPA Adaptado de Hollingsworth et al., (2011)

Autor Kress e Erickson (2007) Kim et al., (com. pess.); Chase et al., (2007); Lahaye et al., (2008); Ford et al., (2009) Kress et al., (2005); Chase et al., (2007) Chase et al., (2005); Kress et al., (2005) Chen et al., (2010) Taberlet et al (2007) Ford et al., (2009) Ford et al., (2009) Chase et al., (2007); Ford et al., (2009) Chase et al., (2007); Ford et al., (2009) Ford et al., (2009) Chase et al., (2005); Newmaster et al (2006) Kim et al., (com. pess.) Kim et al., (com. pess.) Presting (2006)

Kress e Erickson (2007) analisaram o sucesso na amplificação e a taxa de discriminação específica de oito regiões plastidiais e uma nuclear em uma amostra de 96 espécies (48 gêneros) de diferentes táxons de plantas terrestres. Eles concluíram que a combinação de uma porção do gene rbcL mais a região não-codificante trnH-psbA seria a melhor escolha para a identificação molecular de espécies vegetais, com uma taxa de discriminação específica de

88%. Trabalhando em outra frente, Chase et al., (2007)

realizaram triagem de mais de 100 regiões plastidiais codificantes e não-codificantes 11

avaliando quais destas poderiam ser facilmente amplificadas, para em seguida utilizar as regiões mais promissoras para DNA barcode em uma amostra significante de espécies vegetais, onde avaliaram o sucesso na amplificação e o nível de variação das mesmas. Concluíram que para um maior sucesso na identificação de espécies vegetais seria necessáriaa utilização de três regiões e propuseram duas combinações diferentes: a combinação das regiões codificantes matK, rpoC1 e rpoB, ou a combinação das regiões codificantes matK e rpoC1 com a região não-codificante trnH-psbA. Também em 2007, Taberlet et al., propuseram a utilização do íntron do gene trnL como um DNA barcode para plantas, mesmo este apresentando uma baixa resolução específica, destacando sua utilidade na área biotecnológica e na identificação de amostras ambientais. Lahaye et al., (2008) compararam o desempenho de oito regiões plastidiais em 86 espécies vegetais e posteriormente utilizaram apenas a região matK em 1.036 espécies de Orchidaceae. Concluíram que a região matK é a mais apropriada para DNA barcode em plantas, por apresentar uma boa resolução específica, além de fácil amplificação e alinhamento, ao contrário do observado em outros estudos, que tiveram dificuldade em amplificar a região matK de alguns táxons (CHASE et al., 2007; KRESS e ERICKSON, 2007). Porém Fazekas et al., (2008) avaliaram oito regiões plastidiais e uma mitocondrial em uma amostra de 251 espécimes de 92 espécies de plantas terrestres e recomendaram a utilização de multiplas regiões para um DNA barcode vegetal, pois nenhuma das regiões analisadas preencheram todos os requisitos para o uso individual destas. Em 2009, Ford et al., analisaram in silico 41 regiões codificantes do genoma plastidial de Nicotiana tabacum em busca de regiões com potencial para DNA barcode. Destas, 12 foram avaliadas quanto ao sucesso na amplificação e número de sítios variáveis em uma amostra de 98 indivíduos de 46 espécies de diferentes táxons de plantas, sendo selecionadas as regiões matK, rpoB, rpoC1, ndhJ, ycf5 e accD que apresentaram melhores resultados quando analisadas em diferentes combinações. Por fim, um grupo de trabalho de plantas foi criado pelo CBOL, com a participação de vários grupos de pesquisa de diferentes países, com o objetivo de definir as regiões a serem utilizadas para a identificação molecular de plantas, permitindo o progresso nas pesquisas realizadas com DNA barcode de plantas (HOLLINGSWORTH et al., 2011). Para tanto, 12

quatro regiões plastidiais codificantes (matK, rbcL, rpoB e rpoC1) e três não-codificantes (atpF-atpH, psbK-psbI e trnH-psbA) foram avaliadas quanto ao sucesso na amplificação, discriminação de espécies e qualidade das sequências em 907 indivíduos de 550 espécies de fanerógamas e criptógamas. Individualmente essas regiões não apresentaram uma taxa de discriminação satisfatória, variando de 43% a 69%, optando-se assim pela análise combinada destas. Por não apresentar algum dos atributos desejáveis para um DNA barcode, quatro das sete regiões foram eliminadas restando as porções das regiões codificantes matK e rbcL e a região não-codificante trnH-psbA. A combinação das regiões matK e rbcL foi a preferida pelos pesquisadores, apesar da dificuldade na amplificação da região matK em alguns táxons, este problema foi considerado mais fácil de solucionar do que a obtenção de boas sequências da região trnH-psbA, causada pela presença de microssatélites. Já a região rbcL, apresenta uma boa performance na discriminação de espécies quando analisada em conjunto com outras regiões, além de ser facilmente amplificada e sequenciada. Em conjunto, as regiões matK e rbcL tiveram uma taxa de discriminação específica de 72% e genérica de 100% (CBOL Plant working group, 2009). Contudo no ano seguinte, uma porção da região nuclear ITS, a região ITS2, foi proposta por Chen et al., (2010) que demonstraram que a região ITS2 apresentou uma performance melhor em um estudo conduzido em 8.557 amostras de 5.905 espécies vegetais. Esta região permitiu identificar 92,7% das espécies e 99,8% dos gêneros, além de ter sido amplificada com sucesso em 93,8% das amostras. Em 2011, China Plant BOL Group et al., propuseram a incorporação de ITS/ITS2 entre as regiões formalmente reconhecidas para DNA barcode de plantas, após conduzirem um estudo com 6.286 exemplares de 1.757 espécies vegetais. Fica evidente que o desempenho das regiões testadas para a identificação molecular de plantas varia, dependendo dos táxons em questão, e que existe a necessidade em muitos casos da utilização de regiões adicionais, como ITS e trnH-psbA, para a obtenção de uma boa resolução específica, pois as regiões matK e rbcL, propostas pelo CBOL, em alguns táxons não possuem boa resolução. Desta forma, muitos pesquisadores vêm testando estas quatro regiões em grupos específicos de plantas (gêneros e famílias), avaliando o desempenho destas e indicando quais são as mais eficientes para a identificação molecular destes grupos (DU et al., 2011; FU et al., 2011; SHI et al., 2011; XIANG et al., 2011).

13

2.3.3.1 Identificação molecular de plantas utilizando rbcL O gene rbcL codifica a subunidade maior da ribulose-1,5-bifosfato carboxilase oxigenase (RuBisCo), uma enzima responsável pela fixação do carbono atmosférico (CO2) durante a fotossíntese (CLEGG et al., 1994). Este gene possui cerca de 1.400 pb e foi utilizado na inferência da primeira grande filogenia molecular das plantas, realizada por Chase et al. (1993). Chase et al., (2005) e Newmaster et al (2006) sugeriram a utilização da região completa deste gene como DNA barcode, o qual figura entre os mais sequenciados em plantas, possuindo um grande número de sequências depositadas em banco de dados públicos. Kress e Erickson (2007), entretanto, sugeriram a porção 5’ do gene rbcL, com aproximadamente 530 pb, a qual posteriormente foi escolhida juntamente com a região matK pelo grupo de trabalho de plantas do CBOL (CBOL Plant working group, 2009). A porção do gene rbcL utilizada para DNA barcode possui 599 pb e está localizada na região 5' do gene, entre os sítios 1 - 599 (pb), tomando como base o genoma plastidial de Arabidopsis thaliana (HOLLINGSWORTH et al., 2011). Esta região apresentou grande sucesso de amplificação em todos os táxons de plantas testados, além de ser facilmente sequenciada e alinhada (FU et al., 2011; GROOT et al., 2011; XIANG et al., 2011). De modo geral, não apresenta uma boa resolução quando analisado individualmente, contudo o sucesso na identificação de briófitas pode chegar a 90% utilizando esta região isoladamente (HOLLINGSWORTH et al., 2009).

2.3.3.2 Identificação molecular de plantas utilizando matK O gene matK, que codifica uma maturase envolvida no splicing dos íntrons do grupo II, possui cerca de 1.500 pb e está localizada no íntron do gene plastidial trnK (NEUHAUS e LINK, 1987; HILU e LIANG, 1997). É uma região largamente utilizada em estudos filogenéticos (JOHNSON e SOLTIS, 1995; SASLIS-LAGOUDAKIS et al., 2008; SIMMONS et al, 2008) sendo utilizada por Hilu et al., (2003) para inferir a filogenia das angiospermas. Esta região foi proposta como um código de barras de DNA para plantas por diversos pesquisadores (KIM et al., com. pess.; CHASE et al., 2007; LAHAYE et al., 2008; FORD et al., 2009) e acabou sendo escolhida pelo grupo de trabalho de plantas do CBOL, juntamente com a região rbcL, para este fim (CBOL Plant working group, 2009). A porção do gene matK utilizada está localizada entre os sítios 205 - 1046 (pb) da região central do gene, com cerca 14

de 840 pb, tomando como base o genoma plastidial de Arabidopsis thaliana (HOLLINGSWORTH et al., 2011). matK é uma das regiões codificantes plastidiais mais variáveis (HILU e LIANG, 1997) apresentando boa resolução específica em muitos táxons quando analisada individualmente ou de forma combinada (LAHAYE et al., 2008; FAZEKAS et al., 2008; NEWMASTER e RAGUPATHY, 2009), mas em outros não apresenta uma boa resolução (REN et al., 2010; SHI et al., 2011). Newmaster e Ragupathy (2009) utilizaram as regiões matK, rbcL e trnHpsbA para analisar um complexo de espécies do gênero Acacia, conhecida pela dificuldade de identificação pelos métodos tradicionais. A região matK permitiu identificar todas as espécies em questão, além de fornecer um padrão biogeográfico destas, enquanto as outras duas regiões tiveram 67% de sucesso na identificação das mesmas. No entanto, a região matK possui baixa taxa de amplificação em muitos táxons (KRESS e ERICKSON, 2007, FAZEKAS et al., 2008; CBOL Plant working group, 2009) o que vai de encontro a uma das características desejáveis para um DNA barcode. Contudo um grande esforço vem sendo realizado para a obtenção de primers que possibilitem a amplificação desta região de forma universal (YU et al., 2011; LI et al., 2011).

2.3.3.3 Identificação molecular de plantas utilizando ITS O espaçador transcrito interno (ITS) é uma região que faz parte do cístron ribossomal nuclear 18S - 5,8S - 26S, dividido em ITS1, 5,8S e ITS2. É uma das regiões mais utilizadas para inferências filogenéticas em nível genérico e infragenérico de plantas, por ser considerada de fácil amplificação, devido ao grande número de cópias existentes no genoma, que pode variar de centenas a milhares de cópias, e por apresentar altos níveis de variação interespecífica. A existência de primers descritos que amplificam nos mais variados grupos de plantas, bem como o seu tamanho, que varia de 500 a pouco mais de 700 pb em angiospermas, facilitam a obtenção de sequências desta região neste grupo (BALDWIN et al., 1995; ÁLVAREZ e WENDEL, 2003; FELINER e ROSSELLÓ, 2007). Contudo em gimnospermas, seu sequenciamento apresenta dificuldades, devido ao seu tamanho de aproximadamente 1.100 pb em grande parte das espécies (SASS et al., 2007). A região ITS foi sugerida por Chase et al., (2005) e Kress et al., (2005) para a identificação molecular de plantas, principalmente pelo alto nível de variação interespecífica 15

apresentada por esta, que possibilita a discriminação de espécies nos mais variados grupos de plantas. Entretanto, esta região apresenta em alguns táxons cópias divergentes em um mesmo organismo, causada pela evolução em concerto incompleta, como o observado por Denduangboripant e Cronk (2000) em espécies do gênero Aeschynanthus que apresentaram cópias desta região que divergiam em até 5% em um mesmo indivíduo. Porém, esta região continua sendo testada em diferentes táxons e vem demonstrando bons resultados quanto à discriminação de espécies, como em espécies do gênero Alnus onde identificou 76,9% das espécies (REN et al., 2010), em espécies de Potamogetonaceae onde obteve grande êxito na identificação de espécies (DU et al., 2011), em Taxus onde identificou 100% das espécies em questão (LIU et al., 2010), entre outros. Em 2010, Chen et al., propuseram a região ITS2 como DNA barcode para plantas por sua habilidade em discriminar espécies e pelo sucesso na sua amplificação e sequenciamento, devido ao seu tamanho (160 a 320 pb) que permite obtenção de boas sequências utilizando primers universais. Posteriormente, esta região foi proposta como uma região universal para a identificação molecular de plantas e como complementar à região CO1 na identificação de animais por Yao et al., (2010), que demonstraram sua eficiência em discriminar um número considerável de espécies desses táxons. No entanto, Liu et al., (2010) demonstraram a redução na discriminação de espécies de Taxus quando apenas a região ITS2 foi utilizada (45,5%) em relação à região ITS, a qual identificou 100% das espécies em questão. Recentemente, o China Plant BOL Group et al., (2011) analisaram as regiões matK, rbcL, ITS e trnH-psbA de um grande conjunto de dados, composto de 6.286 exemplares de 1.757 espécies vegetais. A região ITS teve um desempenho inferior em relação ao das regiões plastidiais nos quesitos amplificação e sequenciamento. Todavia, apresentou um desempenho superior na discriminação de espécies, frente ao observado para as regiões matK, rbcL e trnHpsbA. Desta forma, eles concluíram que a região ITS/ITS2 deveria ser incorporada entre as regiões formalmente reconhecidas para DNA barcode de plantas.

2.3.3.4 Identificação molecular de plantas utilizando trnH-psbA A região trnH-psbA é uma região não-codificante situada entre os genes plastidiais trnH e psbA, sendo uma das mais variáveis, com um tamanho médio de 465 pb, podendo variar de 198 a 1077 pb em algumas espécies (SHAW et al., 2005). É muito utilizada em 16

estudos filogenéticos e filogeográficos (TIAN, et al ., 2009; ANDRADE, et al., 2010; MONTEIRO, et al., 2010) tendo sido, primeiramente, proposta para DNA barcode por Kress et al., (2005) e, posteriormente, por Chase et al., (2007). Contudo, apesar do seu poder de discriminação e sucesso na amplificação (CBOL Plant working group, 2009), apresenta problemas no seu sequenciamento em muitos táxons, devido a existências de repetições mononucleotídicas (DEVEY et al., 2009), além da duplicação e da presença de microinversões dentro desta região em alguns táxons (SASS et al., 2007; WHITLOCK et al., 2010), que pode dificultar a sua utilização em larga escala para identificação molecular de plantas. Estudos em diferentes grupos de plantas foram realizados e a região trnH-psbA tem mostrado resultados satisfatórios. Em Alnus, esta região sozinha identificou 63.6% das espécies, e quando analisada de forma combinada com a região ITS o sucesso na identificação subiu para 88% (REN et al., 2010), tendo uma boa performance também em Tolpis (MORT et al., 2010) e Ligustrum, onde identificou 88.9% das amostras em questão (GU et al., 2011).

17

3. MATERIAL E MÉTODOS

3.1 Área de estudo, obtenção e identificação das amostras As coletas das espécies de Sapotaceae foram realizadas durante os anos de 2010 e 2011 na Mata Atlântica da região sul baiana nas seguintes localidades: RPPN Estação Veracel, no município de Porto Seguro; Reserva Biológica de Una, no município de Una; RPPN Mãe da Mata, Parque Municipal da Boa Esperança e na estrada Olivença – Vila Brasil, no município de Ilhéus; Parque Estadual da Serra do Conduru, no município de Uruçuca; RPPN Capitão, no município de Itacaré; Reserva Ecológica da Michelin, no município de Igrapiúna (Figura 2).

Figura 02: Localização geográfica dos sítios de coleta dos exemplares de Sapotaceae utilizados neste estudo. 1 Reserva Ecológica da Michelin; 2 RPPN Capitão; 3 Parque Estadual da Serra do Conduru; 4 Parque Municipal da Boa Esperança; 5 RPPN Mãe da Mata; 6 Estrada Olivença – Vila Brasil; 7 Reserva Biológica de Una; 8 RPPN Estação Veracel.

18

No total, foram coletados 216 espécimes da família Sapotaceae, das quais amostras das partes reprodutivas e/ou vegetativas foram obtidas para a identificação botânica e tecido foliar para as análises genéticas. Todos os indivíduos foram georreferenciados, fotografados e as características das partes reprodutivas e vegetativas, altura e o diâmetro do tronco à altura do peito (DAP) foram anotadas. As amostras foram herborizadas, morfotipadas e 98 exemplares foram enviados para identificação por especialista da família, dos quais 70 indivíduos de 26 espécies de Sapotaceae foram utilizados neste estudo (Apêndice 1). As exsicatas foram depositadas no Herbário CEPEC, com duplicatas enviadas para os herbários da Universidade Federal de Pernambuco (UFPE) e da Universidade Estadual de Santa Cruz (UESC). Para as análises moleculares, amostras foliares dos exemplares coletados foram acondicionadas em sacolas plásticas e encaminhadas para o Laboratório de Marcadores Moleculares do Centro de Biotecnologia e Genética da Universidade Estadual de Santa Cruz (UESC), onde foram armazenadas em freezer a -20ºC para uso posterior.

3.2 Extração de DNA A extração do DNA do material fresco foi realizada segundo o protocolo de Doyle e Doyle (1987). Foram adicionadas cerca de 50mg de tecido foliar em microtubos de 1,5 ml o qual foi macerado em nitrogênio líquido com auxílio de um pistilo. Em seguida foram adicionados 700μl de tampão de extração (CTAB 2%, NaCl 1,4 M, EDTA 20 mM, Tris-HCl 100 mM pH 8.0, β-mercaptoetanol 0,4% e PVP 1% ). Em seguida, as amostras foram homogeneizadas com auxílio de um vórtex e incubadas em banho-maria a 65°C por 40 minutos, vertendo-se os microtubos a cada 10 minutos. Posteriormente, os tubos foram resfriados e adicionou-se 600μl de clorofórmio-álcool-isoamílico na proporção de 24:1(v/v) para desproteinização. Os microtubos foram agitados por suaves inversões durante 5 minutos e centrifugados por 10 minutos a 13.000 rpm. O sobrenadante foi coletado e transferido para microtubos de 1,5 ml novos, e adicionou-se 500μl de isopropanol gelado para a precipitação do DNA, agitando os microtubos algumas vezes e acondicionando os mesmos a -20ºC por 2 horas. Posteriormente, as amostras foram centrifugadas por 5 minutos a 13.000 rpm. O isopropanol foi retirado e o pellet foi lavado duas vezes com álcool etílico 70% e uma vez com álcool etílico absoluto para a retirada dos sais, por 5 e 3 minutos respectivamente. O 19

pellet foi seco por aproximadamente 30 minutos e em seguida acrescentou-se 50μl de TE (Tris-HCl 10 mM, pH 8,0, EDTA 1 mM) com RNAse 10 mg/ml por 1 hora a 37ºC para digestão de RNA. As amostras de DNA foram quantificadas em gel de qualidade (agarose 0,8%) e armazenadas em freezer a –20°C.

3.3 Amplificação, purificação e sequenciamento Duas regiões recomendadas (matK e rbcL) e duas sugeridas como suplementares (ITS e trnH-psbA) pelo CBOL Plant Work Group (2009) para DNA barcode foram amplificadas neste estudo (Tabela 3). Para as reações de amplificação por PCR das regiões ITS, matK e rbcL o mix consistiu em tampão 1x (GoTaq®), dNTPs 0,4 mM, primers F e R 0,5 μM, BSA 0,1mg/ml, 1unidade de Taq polimerase (GoTaq®), 10 ng de DNA e água ultra pura autoclavada suficiente para 20 μl, utilizando os seguintes programas: 95°C por 5 min., seguido por 35 ciclos de 95°C por 30 seg., 50°C por 30 seg., 72°C por 90 seg., e um ciclo adicional de 72°C por 8 min. para a região ITS (BARTISH et al., 2005) e 94°C por 2.30 min., seguido por 10 ciclos de 94°C por 30 seg., 56°C por 30 seg., 72°C por 30 seg., mais 25 ciclos de 88°C por 30 seg., 56°C por 30 seg., 72°C por 30 seg. e um ciclo adicional de 72°C por 10 min. para as regiões matK e rbcL (Suganuma com. pess.). Para a amplificação da região trnHpsbA utilizou-se tampão 1x (GoTaq®), dNTPs 0.4 mM, primers F e R 0.5 µM, BSA 0.375mg/ml, 1 unidade de Taq polimerase (GoTaq®), 10 ng de DNA e água ultra pura autoclavada suficiente para 15 µl com o termociclador programado para 94ºC por 2 min. e 30 seg. para desnaturação, 35 ciclos de 94ºC por 30seg., 56ºC por 30seg. e 64ºC por 1 min., e por fim um extensão final de 64ºC por 10 min. (Suganuma com. pess.). As amostras que apresentaram um padrão fraco de bandas, foram amplificadas utilizando o kit TopTaq (Qiagen) seguindo as recomendações do fabricante, utilizando os mesmos programas descritos acima para a amplificação. Após a amplificação, os produtos de PCR foram purificados com polietilenoglicol (PEG) e sequenciados nas duas direções utilizando o kit Big Dye Terminator, version 3.1 (Applied Biosystems, Foster City, California, U.S.A.) e um sequenciador automático modelo ABI 3130XL.

20

Tabela 3: Primers utilizados nas reações de PCR e sequenciamento. Região

Primer

Sequência 5’ – 3’

ITS ITS ITS ITS matK

ITS-18SFA ITS-26SRA ITS4B ITS5B 3F_KIM f

GAACCTTATCGTTTAGAGGAAGG CCGCCAGATTTTCAGGCTGGGC TCCTCCGCTTATTGATATGC GGAAGTAAAAGTCGTAACAAGG CGTACAGTACTTTTGTGTTTACGAG

Referência

Rydin et al. 2004 Rydin et al. 2004 White et al, 1990 White et al, 1990 K. J. Kimnão publicado matK 1R_KIM r ACCCAGTCCATCTGGAAATCTTGGTTC K. J. Kimnão publicado rbcL rbcLa_f ATGTCACCACAAACAGAGACTAAAGC Kress e Erickson, 2007 rbcL rbcLaj634R GAAACGGTCTCTCCAACGCAT Fazekas et al. 2008 trnH- psbA trnHf_05 CGCGCATGGTGGATTCACAATCC Tate e Simpson, 2003 trnH- psbA psbA3 f GTTATGCATGAACGTAATGCTC Sang et al. 1997 A Primers utilizados nas reações de amplificação da região ITS; BPrimers utilizados nas reações de sequenciamentoda região ITS.

3.4 Edição e alinhamento das sequências As sequências foram editadas utilizando o programa Staden (STADEN et al., 1998) e o alinhamento realizado com o auxílio do aplicativo Clustal W (THOMPSON et al., 1994) por meio do programa Bioedit (HALL, 1999). Todas as sequências foram verificadas visualmente para a identificação de possíveis erros na edição e ajustes manuais foram realizados no alinhamento. Em seguida, as sequências geradas neste estudo foram depositadas no GenBanK (Apêndice 2).

3.5 Análises dos dados As regiões foram analisadas individualmente e de forma combinada. Nas análises combinadas só foram utilizadas amostras que obtiveram sucesso no sequenciamento para as quatro regiões em questão. No programa Mega5 (TAMURA et al., 2011), as distâncias par a par foram calculadas utilizando o modelo Kimura 2-parâmetros (KIMURA, 1980) para avaliar a divergência entre e dentro das espécies. Para avaliar o poder discriminatório das regiões, foram utilizados os métodos de neighbor-joining (SAITOU & NEI, 1987) e máxima parcimônia em análises individuais ou em diferentes combinações das regiões. As análises de máxima parcimônia foram realizadas no programa PAUP* 4.0 b10 (SWOFFORD, 2003) e consistiram em uma 21

busca inicial heurística com 2000 replicações, salvando 20 árvores por replicação, com adição aleatória de táxons, stepwise e swap com o algoritmo TBR. Uma segunda busca heurística foi realizada usando as árvores da busca anterior com o algoritmo swap TBR sem limite no número de árvores. Para visualização das árvores, foi utilizado enraizamento do ponto médio. Os suportes dos ramos internos foram calculados utilizando o método de bootstrap (FELSENSTEIN, 1985) com 1000 replicações, adição simples de táxons e mantendo até 20 árvores por replicação, por meio do programa PAUP* 4.0 b10 (SWOFFORD, 2003). Os indels não foram considerados nas análises de máxima parcimônia. As análises de neighborjoining foram realizadas no programa Mega5 (TAMURA et al., 2011) utilizando o modelo Kimura 2-parâmetros (KIMURA, 1980). Para os indels foi utilizada a opção de pairwisedeletion e os suportes para os ramos internos foram calculados utilizando o método de bootstrap (FELSENSTEIN, 1985) com 1000 replicações. Todas as árvores geradas foram visualizadas o programa FigTree v1.3.1 (RAMBAUT, 2009). As análises de DNA barcode não consistem em estudos filogenéticos por si, mas sim um método de identificação (NICOLALDE-MOREJÓN et al., 2011) que a priori vem utilizando métodos filogenéticos nas suas análises. Portanto, o sucesso na discriminação das espécies, neste trabalho, foi avaliado considerando os grupos monofiléticos específicos formados pelas análises de máxima parcimônia e neighbor-joining.

22

4 RESULTADOS

4.1 Avaliação das regiões

Ao todo foram obtidas 63 sequências da região ITS para 23 espécies de Sapotaceae, 68 de matK para 26 espécies, 70 de rbcL para 26 espécies e 62 da região trnH-psbA para 25 espécies de Sapotaceae nesse estudo. Os primers das regiões em questão mostraram-se universais com altas taxas de amplificação (Figura 3). Nas reações de sequenciamento as regiões rbcL (100%) e matK (98,6%) tiveram as melhores performances, seguido das regiões ITS (92,7) e trnH-psbA (86,6%) que tiveram desempenhos modestos. Quanto ao tamanho das sequências alinhadas, todas as regiões produziram matrizes superiores a 500 pb, onde a região ITS foi a mais variável e informativa, enquanto a região rbcL foi a mais conservada, com apenas 13 sítios varáveis dos quais nove são informativos para as análises de máxima parcimônia (Tabela 4).

Figura 3: Produtos amplificados da região trnH-psbA de espécimes de Sapotaceae 2 a 15 e 17 a 28. 1 e 16 ladder 1 kb.

A região ITS apresentou a maior distância interespecífica média (12%), a qual foi 30 vezes superior à distância intraespecífica média, com valores que variaram de 0,5 a 17,5% entre as espécies. A região trnH-psbA apresentou distâncias que variaram de 0 a 3,8%, ao passo que matK e rbcL exibiram valores de 0 a 1,9% e 0 a 0,9%, respectivamente (Tabela 4). 23

Tabela 4: Avaliação de quatro regiões genômicas para a identificação molecular de espécies de Sapotaceae. Região Universalidade Sucesso na PCR Sucesso no sequenciamento Tamanho da sequência alinhada (pb) Nº de sítios variáveis Nº de sítios informativos (MP) Distância interespecífica média (amplitude) Distância intraespecífica média (amplitude)

ITS sim 97,1% (68/70) 92,7% (63/68) 690 305 264 12% (0,5 a 17,5%) 0,4% (0 a 3,8%)

matK sim 98,6% (69/70) 98,6% (68/69) 796 41 28 0,8% (0 a 1,9%) 0,04% (0 a 0,3%)

rbcL sim 100% (70/70) 100% (70/70) 586 13 9 0,2% (0 a 0,9%) 0,02% (0 a 0,2%)

trnH-psbA sim 100% (70/70) 88,6% (62/70) 667 52 31 1,5% (0 a 3,8%) 0,1% (0 a 0,6%)

4.2.1 A região ITS Em 93,8% das comparações par a par entre espécies, as distâncias baseadas em Kimura 2-parâmetros para a região ITS foram superiores a 4%, onde 55,3% apresentaram distâncias interespecíficas maiores que 12%. (Figura 4). Intraespecíficamente, 86,4% das comparações par a par apresentaram distâncias inferiores a 1%. Na discriminação das espécies, a região ITS obteve o melhor desempenho entre todas as regiões, discriminando 91,3% (21/23) das espécies, identificando Chromolucuma apiculata, Chrysophyllum splendens, Diploon cuspidatum, Ecclinusa ramiflora, Manilkara longifolia, M. salzmannii, Micropholis crassipedicellata, M. guyanensis, M. gardneriana, M. venulosa, Pouteria bangii, P. caimito, P. durlandii, P. egregia, P. gardneri, P. glauca, P. macahensis, P. reticulata, P. torta, P. sp1 e Pradosia lactescens, utilizando os métodos de neighbor-joining (Figura 5) e máxima parcimônia (Apêndice 3).

24

60.0 50.0 40.0

% 30.0

Dist. Inter Dist. Intra

20.0 10.0 0.0 0

0,1 a 0,5

0,6 a 1

1,1 a 4

4,1 a 8

8,1 a 12

12,1 a 18

K2P Figura 4: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da região ITS em espécies da família Sapotaceae.

4.2.2 A região matK Na região matK, 56,6% das comparações interespecíficas tiveram distâncias superiores 0,5%, variando de 0,6 a 1,9% (Figura 6). Contudo, 43,4% das comparações par a par apresentaram distâncias interespecíficas entre 0 e 0,5%, intervalo onde 100% das comparações intraespecíficas foram acomodadas, mostrando uma clara sobreposição entre a variação inter e intraespecífica das amostras em questão para esta região. matK possibilitou a identificação de 13 das 26 espécies (50%) de Sapotaceae que tiveram sequências geradas para esta região, utilizando tanto neighbor-joining (Figura 7) quanto máxima parcimônia (Apêndice 4). O gênero Manilkara foi separado dos demais, porém as espécies contidas neste não puderam ser identificadas com esta abordagem, bem como outras nove espécies dos gêneros Micropholis, Pouteria e Chromolucuma que não foram discriminadas.

25

Figura 5: Árvore de neighbor-joining baseada na análise da região ITS em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2parâmetros (K2P).

26

80.0 70.0 60.0 50.0

%

40.0

Dist. Inter Dist. Intra

30.0 20.0 10.0 0.0 0

0,1 a 0,5

0,6 a 1

1,1 a 4

4,1 a 8

8,1 a 12

12,1 a 18

K2P Figura 6: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da região matK em espécies da família Sapotaceae.

4.2.3 A região rbcL Nas comparações interespecíficas par a par utilizando a região rbcL, 97,9% das comparações apresentaram entre 0 a 0,5% de divergência, onde 100% das comparações intraespecíficas foram acomodadas no mesmo intervalo, as quais variaram de 0 a 0,2% (Figura 8). Das regiões utilizadas, rbcL foi a que teve o menor desempenho na identificação das espécies, com uma resolução 34,6% (9/26) utilizando tanto neighbor-joining (Figura 9) quanto máxima parcimônia (Apêndice 5). O gênero Manilkara não apresentou variação entre suas espécies, onde as mesmas também apresentaram 0% de divergência em relação a espécies dos gêneros Micropholis e Pouteria.

27

Figura 7: Árvore de neighbor-joining baseada na análise da região matK em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).

28

100.0 90.0 80.0 70.0 60.0

% 50.0

Dist. Inter

40.0

Dist. Intra

30.0 20.0 10.0 0.0 0

0,1 a 0,5

0,6 a 1

1,1 a 4

4,1 a 8

8,1 a 12 12,1 a 18

K2P Figura 8: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da região rbcL em espécies da família Sapotaceae.

4.2.4 A região trnH-psbA A região trnH-psbA foi a segunda mais variável, com 82,9% das comparações par a par apresentando valores de divergência entre 0,6% e 3,8%. Já na variação intraespecífica, 68,8% das comparações não divergiram e outros 28,6% não ultrapassaram 0,5% de divergência (Figura 10).

29

Figura 9: Árvore de neighbor-joining baseada na análise da região rbcL em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2parâmetros (K2P).

30

As espécies Chrysophyllum gonocarpum, C. splendens, Chromolucuma apiculata, Diploon cuspidatum, Micropholis crassipedicellata, M. guyanensis, Pouteria durlandii, P. gardneri, P. macahensis e Pradosia lactescens, totalizando 40% (10/25) das espécies, foram identificadas utilizando o algoritmo de neighbor-joining (Figura 11) e as espécies Chrysophyllum gonocarpum, C. splendens, Chromolucuma apiculata, Diploon cuspidatum, Micropholis crassipedicellata, M. emarginata, M. gardneriana, M. guyanensis, M. venulosa, Pouteria durlandii, P. gardneri, P. macahensis, P. sp2 e Pradosia lactescens, totalizando 56% (14/25) das espécies sequenciadas para esta região, foram discriminadas utilizando a análise de máxima parcimônia (Apêndice 6).

80.0 70.0 60.0 50.0

% 40.0

Dist. Inter Dist. Intra

30.0 20.0 10.0 0.0 0

0,1 a 0,5

0,6 a 1

1,1 a 4

4,1 a 8

8,1 a 12

12,1 a 18

K2P Figura 10: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da região trnH-psbA em espécies da família Sapotaceae.

31

Figura 11: Árvore de neighbor-joining baseada na análise da região trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).

32

4.3 Análises combinadas Nas análises utilizando duas regiões, a combinação das regiões ITS/trnH-psbA foi a mais variável, seguida de ITS/rbcL, ITS/matK, matK/trnH-psbA, rbcL/trnH-psbA e matK/rbcL, que apresentaram uma divergência média entre os pares comparados de 7,2%, 5,9%, 5,4%, 1,1%, 0,8%, 0,5%, respectivamente (Tabela 5). Intraespecificamente a combinação ITS/matK apresentou uma média de 0,2%, variando de 0 a 1,7% ,ITS/rbcL com 0,2% média, variando de 0 a 2%, ITS/trnH-psbA com 0,3%, variando de 0 a 2,2%, matK/rbcL com 0,03%, variando de 0 a 0,1%, matK/trnH-psbA com 0,1%, variando de 0 a 0,2% e rbcL/trnH-psbA com uma média de 0,1%, variando de 0 a 0,3%. Não foi observada a formação de um intervalo na distribuição da variação inter e intraespecífica, com uma branda sobreposição observada nas combinações ITS/trnH-psbA, ITS/rbcL e ITS/matK (Apêndices 27 a 29), enquanto as combinações matK/trnH-psbA, rbcL/trnH-psbA e matK/rbcL apresentaram uma acentuada sobreposição (Apêndices 30 a 32).

Tabela 5: Distância inter e intraespecífica e sucesso na identificação da análise combinada das regiões ITS, matK, rbcL e trnH-psbA em espécies da família Sapotaceae. Combinação

ITS/matK

ITS/rbcL

Distância interespecífica média (amplitude) Distância intraespecífica média (amplitude) Sucesso na identificação

5,4% (0,2 a 8,2%) 0,2% (0 a 1,7%) 90,9%

5,9% (0,2 a 8,3%) 0,2% (0 a 2%) 90,9%

ITS/trnHpsbA 7,2% (0,3 a 10,4%) 0,3% (0 a 2,2%) 90,9%

matK/rbcL 0,5% (0 a 1,2%) 0,03% (0 a 0,1%) 40,9% (MP) 45,5% (NJ)*

matK/trnHpsbA 1,1% (0 a 2,3%) 0,1% (0 a 0,2%) 63,6%

rbcL/trnHpsbA 0,8% (0 a 1,5%) 0,1% (0 a 0,3%) 50%

*Máxima parcimônia (MP); Neighbor-joining (NJ)

Na identificação das espécies, as combinações ITS/matK, ITS/rbcL e ITS/trnH-psbA tiveram o mesmo desempenho, identificando com sucesso as espécies Chromolucuma apiculata, Chrysophyllum splendens, Diploon cuspidatum, Ecclinusa ramiflora, Manilkara longifolia, M. salzmannii, Micropholis crassipedicellata, M. guyanensis, M. gardneriana, M. venulosa, Pouteria bangii, P. caimito, P. durlandii, P. gardneri, P. glauca, P. macahensis, P. reticulata, P. torta, P. sp1 e Pradosia lactescens, as quais representam 90,9% (20/22) das espécies utilizadas nesta análise (Figura 12 e Apêndices 7 a 11). As combinações matK/trnHpsbA e rbcL/trnH-psbA tiveram um menor sucesso na identificação das espécies de Sapotaceae em questão, com um desempenho de 63,6% (14/22) e 50% (11/22), respectivamente (Apêndices 12 a 15). A combinação formada pelas regiões matK/rbcL, a 33

qual foi recomendada pelo CBOL como DNA barcode em plantas teve o menor desempenho, com 45,5% (10/22) das espécies identificadas utilizando o algoritmo de neighbor-joining e 40,9% (9/22) das espécies identificadas utilizando a análise de máxima parcimônia (Apêndices 16 e 17). Nas combinações de três e quatro regiões, as médias da distância interespecífica variaram de 0,8% a 4,6% e intraespecífica de 0,05% a 0,2% (Tabela 6). Com relação ao intervalo na distribuição da variação inter e intraespecífica, também foi observada uma sobreposição entre as mesmas, mais acentuada na combinação das regiões matK/trnHpsbA/rbcL (Apêndice 33) e mais branda nas combinações de matK/trnH-psbA/ITS, matK/rbcL/ITS, rbcL/ITS/trnH-psbA e ITS/matK/rbcL/trnH-psbA (Apêndices 34 a 37).

Tabela 6: Distância inter e intraespecífica e sucesso na identificação da análise combinada das regiões ITS, matK, rbcL e trnH-psbA em espécies da família Sapotaceae. Combinação Distância interespecífica média (amplitude) Distância intraespecífica média (amplitude) Sucesso na identificação

ITS/matK/rb cL 3,8% (0,1 a 5,7%)

ITS/matK/tr nH-psbA 4,4% (0,2 a 6,7%)

ITS/rbcL/trn H-psbA 4,6% (0,2 a 6,6%)

matK/rbcL/trn H-psbA 0,8% (0 a 1,6%)

ITS/matK/rbcL /trnH-psbA 3,4% (0,2 a 5,1%)

0,2% (0 a 1,2%)

0,2% (0 a 1,3%)

0,2% (0 a 1,5%)

0,05% (0 a 0,2%)

0,2% (0 a 1%)

90,9%

90,9%

90,9%

63,6%

90,9%

A combinação das regiões matK/rbcL/trnH-psbA discriminou apenas 63,6% (14/22) das espécies de Sapotaceae em questão (Apêndices 18 e 19), enquanto as combinações de ITS/matK/rbcL, ITS/matK/trnH-psbA, ITS/rbcL/trnH-psbA e ITS/matK/rbcL/trnH-psbA tiveram uma boa resolução (90,9%) utilizando os dois métodos de inferência, identificando as espécies Chromolucuma apiculata, Chrysophyllum splendens, Diploon cuspidatum, Ecclinusa ramiflora, Manilkara longifolia, M. salzmannii, Micropholis crassipedicellata, M. guyanensis, M. gardneriana, M. venulosa, Pouteria bangii, P. caimito, P. durlandii, P. gardneri, P. glauca, P. macahensis, P. reticulata, P. torta, P. sp1 e Pradosia lactescens (Figura 13 e Apêndices 20 a 26).

34

Figura 12: Árvore de neighbor-joining baseada na análise combinada das regiões ITS e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde

à

distância

Kimura

35

2-parâmetros

(K2P).

Figura 13: Árvore de neighbor-joining baseada na análise combinada das regiões ITS, matK, rbcL e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).

36

5 DISCUSSÃO

O sucesso na discriminação de espécies vegetais utilizando as regiões propostas pelo CBOL para DNA barcode em plantas pode variar (HOLLINGSWORTH et al., 2009; NEWMASTER e RAGUPATHY, 2009; REN et al., 2010), e dependendo do táxon em questão, existe a necessidade de utilizar regiões adicionais para este fim (CBOL Plant working group, 2009). No presente estudo foi realizada a primeira análise comparativa de diferentes regiões para a identificação molecular de espécies da família Sapotaceae da Mata Atlântica, na qual a região ITS, apesar de apresentar um desempenho inferior ao das regiões matK e rbcL na obtenção de boas sequências, possui uma ótima resolução específica. Os dados da região ITS também auxiliaram na identificação de amostras dos gêneros Diploon, Ecclinusa, Manilkara, Micropholis e Pouteria, mostrando a utilidade dos dados moleculares como auxiliares à taxonomia. As características desejáveis para um DNA barcode envolvem a universalidade dos primers, sucesso no sequenciamento e discriminação específica (KRESS et al., 2005; CBOL Plant working group, 2009; HOLLINGSWORTH et al., 2011). Neste trabalho, todas as regiões apresentaram altas taxas de amplificação, com rbcL e trnH-psbA amplificando em 100% das amostras e as demais regiões obtendo um sucesso acima de 95%. De fato, as regiões rbcL e trnH-psbA apresentam um bom desempenho na amplificação de espécies vegetais (CBOL Plant working group, 2009, REN et al., 2010) enquanto alguns estudos relatam a dificuldade da amplificação das regiões ITS e matK (FAZEKAS et al., 2008; CBOL Plant working group, 2009, GONZALES et al., 2009). No entanto, as regiões ITS e matK são amplificadas com sucesso em alguns táxons (REN et al., 2010; GU et al., 2011) e um grande esforço vem sendo feito para o desenvolvimento de primers para a região matK que possibilite o seu uso em larga escala nos grupos vegetais em que a amplificação desta região é difícil (YU et al., 2011; LI et al., 2011). Quanto à obtenção de sequências, novamente a região rbcL se destacou, com 100% de sucesso. Este resultado corrobora o encontrado por Ren et al., (2010) e Gu et al., (2011). A região com o menor desempenho foi trnH-psbA, que obteve 88,6%. O sequenciamento desta região em Sapotaceae foi um tanto difícil. Acredita-se que tal dificuldade tenha ocorrido devido à presença de repetições mononucleotídicas, que acabam comprometendo as reações de sequenciamento. Devey et al., (2009) relataram a ocorrência dessas repetições em muitas 37

espécies e demonstram como a interferência desses microssatélites resulta na obtenção de sequências de baixa qualidade dessa região, exatamente como foi observado no presente trabalho. Contudo, experimentos têm apontado para a solução desse problema, como a utilização de DNA polimerases capazes de amplificar essa região evitando a produção de stutter (FAZEKAS et al., 2010), o que pode ser aplicado nas amostras de Sapotaceae que apresentaram esse tipo de problema. No total dos espécimes ora analisados, apenas em uma amostra houve falha no sequenciamento da região matK. Esta, entretanto, não apresentava um DNA de boa qualidade, a que se atribuiu a possível causa da falha. Para esta amostra, da espécie Pouteria bangii, apenas a região rbcL foi sequenciada, mostrando sucesso no sequenciamento mesmo quando o DNA em questão não apresentou a condição considerada ideal para este procedimento. Já para a região ITS, o sucesso no sequenciamento foi de 92,7%. Resultado semelhante foi obtido por Parveen et al., (2012) em espécies do gênero Paphiopedilum, onde a região teve um desempenho no sequenciamento inferior em relação aos obtidos com as regiões matK e rbcL, mas ainda assim alcançando valores satisfatórios. Sequências de baixa qualidade requerem a edição manual para a obtenção dos contigs, o que demanda muito tempo e vai de encontro a uma das características desejadas para um DNA barcode, que é a obtenção dos dados de forma rápida, o que não ocorre quando as regiões em questão não apresentam boa qualidade de sequências. Nesse sentido, as regiões rbcL e matK tiveram os melhores resultados, necessitando de pouca intervenção manual, seguido da região ITS, que apresentou problemas em algumas amostras, e da região trnHpsbA, a qual demandou grande tempo para a obtenção dos contigs para muitas espécies de Sapotaceae. De fato, o baixo desempenho da região trnH-psbA na obtenção de contigs é conhecido, e Fazekas et al., (2008) precisaram sequenciar novamente algumas amostras para a obtenção dos contigs para esta região, enquanto o CBOL Plant working group (2009), relatam o baixo desempenho no sequenciamento desta região, que ficou abaixo dos 50%. A principal característica desejada para um DNA barcode é o sucesso na discriminação de espécies. Nesse sentido, a região ITS se destacou, com uma resolução específica de 91,3%, além de apresentar uma distância interespecífica média de 12%, 30 vezes maior do que a divergência média intraespecífica observada para esta região que foi de 0,4%. Em seguida vieram as regiões matK, trnH-psbA e por último a região rbcL, que tiveram uma performance bem abaixo do observado para a região ITS. Nossos resultados corroboram com os obtidos por Yan et al. (2011) em espécies de Primula, Zhang et al. (2012) em espécies de Lysimachia, 38

Ren et al. (2010) em espécies de Alnus, Guo et al., (2011) em espécies de Hedyotis, Du et al., (2011) em espécies da família Potamogetonaceae, entre outros, onde a região ITS apresentou boas taxas de discriminação de espécies. Por exemplo, Liu et al., (2010) obtiveram uma resolução específica de 100% em espécies do gênero Taxus, demonstrando que em alguns casos esta região sozinha é suficiente para a identificação molecular de espécies vegetais. Apenas duas espécies, Manilkara maxima e M. multifida, não foram separadas utilizando os dados da região ITS, a partir de uma abordagem filogenética. Este resultado sugere uma divergência recente entre estas duas espécies além da retenção de polimorfismo ancestral para a região ITS das populações que as originaram. Associado a isto, baixas taxas de divergência podem ser observadas em alguns grupos de espécies arbóreas, devido à longa geração das mesmas que resulta em menores taxas de mutação, o que dificulta a utilização desta abordagem nesses casos (HOLLINGSWORTH et al., 2011). A análise combinada das regiões não aumentou a porcentagem de espécies identificadas, quando comparada ao desempenho apenas da região ITS analisada isoladamente. A combinação proposta pelo CBOL (matK e rbcL) identificou apenas 45,5% das espécies utilizando o algoritmo de neighbor-joining e 40,9% das espécies utilizando a análise de máxima parcimônia, ficando bem abaixo das combinações que envolviam a região ITS. Em muitos casos, a utilização de duas ou três regiões possibilita a discriminação de um número maior de espécies (CHASE et al., 2007; FAZEKAS et al., 2008; CBOL Plant working group 2009). Contudo, Muellner et al., (2009) reportam a diminuição nas taxas de discriminação em espécies da família Meliaceae quando análises combinadas são realizadas, onde nesta família a região ITS sozinha também mostrou os melhores resultados na identificação de espécies. Uma atenção espécial deve ser dada as amostras identificadas como Pouteria reticulata, que pela divergência apresentada entre estas com base na região ITS, pode se tratar de um complexo de espécies. Para as amostras identificadas como Chromolucuma apiculata e Pouteria gardneri, a análise com base na região ITS sugere que estas possam pertencer a um mesmo gênero, devido à baixa divergência apresentada entre estes exemplares, de 0,5%, inferior ao observado para as comparações entre os demais gêneros que apresentaram divergências superiores a 8%. A utilização da região ITS para a identificação molecular de espécies de Sapotaceae cria novas perspectivas para estudos envolvendo espécies desta família, haja vista que a 39

identificação a partir de material estéril é um tanto laborioso para muitas espécies e em alguns casos até mesmo impossível. Devido ao grande número de espécies desta família que ainda não são conhecidas pela ciência (JOPPA et al. 2010), esta técnica também pode auxiliar na triagem inicial de possíveis espécies novas para posterior descrição por especialista, bem como auxiliar na resolução de problemas taxonômicos da família.

40

6 CONCLUSÕES



As regiões recomendadas pelo CBOL, matK e rbcL, para DNA barcode em plantas tiveram bons resultados nos quesitos universalidade e na obtenção das sequências, porém tiveram um desempenho baixo, seja individual ou de forma combinada, na discriminação de espécies arbóreas da família Sapotaceae da Mata Atlântica.



A região trnH-psbA, uma das regiões consideradas suplementares em estudos de DNA barcodes, mostrou um bom resultado nas amplificações, mas não teve um bom desempenho na discriminação de espécies e na obtenção de sequências.



A região ITS, considerada um barcode suplementar, teve o melhor desempenho na identificação de espécies, exibiu um bom resultado no quesito amplificação, e um desempenho razoável na obtenção das sequências.



As análises combinadas não apresentaram resultados superiores ao da região ITS analisada individualmente.



É necessário o uso de uma abordagem molecular, em conjunto com os métodos tradicionais de identificação, para um maior sucesso na identificação de espécies de Sapotaceae, principalmente nos casos em que apenas material estéril esteja disponível.



Baseado nos resultados obtidos no presente estudo, recomendamos a utilização da região ITS para a identificação molecular de espécies arbóreas de Sapotaceae da Mata Atlântica, sem a necessidade de coleta de dados das regiões rbcL, matK e trnH-psbA, o que implicará em um menor gasto de tempo e de recursos financeiros destinados para este fim.

41

7 REFERÊNCIAS

ÁLVAREZ, I.; WENDEL, J. F. Ribosomal ITS sequences and plant phylogenetic inference. Molecular Phylogenetics and Evolution, v. 29, 417-434, 2003. ANDERBERG, A.A., RYDIN, C., KALLERSJO, M. Phylogenetic relationships in the order Ericales S.L. analyses of molecular data from five genes from the plastid and mitochondrial genomes. American Journal of Botany,v. 89, 677-687, 2002. ANDRADE,M. J. G.; GIULIETTI, A. M.; RAPINI, A.; QUEIROZ, L. P.; CONCEIÇÃO, A. S.; ALMEIDA, P. R. M.; van den BERG, C. A comprehensive phylogenetic analysis of Eriocaulaceae: Evidence from nuclear (ITS) and plastid (psbA-trnH and trnL-F) DNA sequences. Taxon, v. 59, n. 2, 379-388, 2010. ARMSTRONG, K. Systematics and biogeography of the pantropical genus Manilkara Adans. (Sapotaceae). 2010. 244 f. Tese (Doctor of Philosophy) - Instituto de Biologia Evolutiva da Universidade de Edinburgo, Edinburgo, 2010. AUBRÉVILLE, A. Les Sapotacées: taxonomie et phytogéographie. Adansonia, v. 1, 1-157, 1964. BAEHNI, C. Mémoires sur les Sapotacées 3. Inventaire des Genres. Boissiera, v. 11, 1-262, 1965. BALDWIN, B. G.; SANDERSON, M. J.; PORTER, J. M.; WOJCIECHOWSKI, M. F.; CAMPBELL, C. S.; DONOGHUE, M. J. The ITS region of nuclear ribosomal DNA: A valuable source of evidence on angiosperm phylogeny. Annals of the Missouri Botanical Garden,v. 82, 247-277, 1995. BARTISH, I. V.; SWENSON, U.; MUNZINGER, J.; ANDERBERG, A. A. Phylogenetic relationships among New Caledonian Sapotaceae (Ericales): molecular evidence for generic polyphyly and repeated dispersal. American Journal of Botany. v. 92, 667-673, 2005. BOLD SYSTEMS V3.0, 2011. Disponível em:. Acesso em: 03 de janeiro de 2012. CARNAVAL, A. C.; HICKERSON, M. J.; HADDAD, C. F. B.; RODRIGUES, M. T.; MORITZ, C. Stability Predicts Genetic Diversity in the Brazilian Atlantic Forest Hotspot. Science, v. 323, 785-789, 2009. CARNAVAL, A. C.; MORITZ, C. Historical climate modelling predicts patterns of current biodiversity in the Brazilian Atlantic forest. Journal of Biogeography, v. 35, 1187-1201, 2008.

42

CARNEIRO, C. E.; ALMEIDA JR, E. B.; ZICKEL, C. S.; RODRIGUES, W. A. Sapotaceae. In: GIULIETTI, A. M. et al. (Org.). Plantas Raras do Brasil. Belo Horizonte, MG: Conservação Internacional, 2009. CBOL PLANT WORKING GROUP. A DNA barcode for land plants. Proceedings of the National Academy of Sciences, USA,v. 106, n. 31, 12794-12797, 2009. CHASE, M. W.; COWAN, R. S.; HOLLINGSWORTH, P. M.; van den BERG, C.; MADRINAN, S. et al. A proposal for a standardised protocol to barcode all land plants. Taxon, v. 56, 295-299, 2007. CHASE, M. W.; SALAMIN, N.; WILKINSON, M.; DUNWELL, J. M.; KESANAKURTHI, R. P. et al. Land plants and DNA barcodes: short-term and long-term goals. Proceedings of the Royal Society of London B, v. 360, 1889-1895, 2005. CHASE, M. W.; SOLTIS, D. E.; OLMSTEAD, R. G.; MORGAN, D. et al. Phylogenetics of seed plants: an analysis of nucleotide sequences from the plastid gene rbcL. Annals of the Missouri Botanical Garden, v. 80, 528-580, 1993. CHEN, S.; YAO, H.; HAN, J.; LIU, C.; SONG, J. et al. Validation of the ITS2 region as a novel DNA barcode for identifying medicinal plant species. Public Library of Science ONE, v. 5, n. 1, 2010. CHINA PLANT BOL GROUP et al. Comparative analysis of a large dataset indicates that internal transcribed spacer (ITS) should be incorporated into the core barcode for seed plants. Proceedings of the National Academy of Sciences, USA, v. 108, n. 49, 19641-19646, 2011. CLEGG, M. T.; GAUT, B. S.; LEARN, G. H.; MORTON, B. R. Rates and patterns of chloroplast DNA evolution. Proceedings of the National Academy of Sciences, USA, v. 91, 6795-6801, 1994. DENDUANGBORIPANT, J.; CRONK, Q. C. B. High intraindividual variation in internal transcribed spacer sequences in Aeschynanthus (Gesneriaceae): implications for phylogenetics. Proceedings of the Royal Society of London B, v. 267, 1407-1415, 2000. DEVEY, D. S.; CHASE, M. W.; CLARKSON, J. J. A stuttering start to plant DNA barcoding: microsatellites present a previously overlooked problem in non-coding plastid regions. Taxon, v. 58, n. 1, 7-15, 2009. DOYLE, J. J.; DOYLE, J. L. A rapid DNA isolation procedure for small amounts of fresh leaf tissue. Phytochemistry Bulletin of the Botanical Society of America, v. 19, 11-15, 1987. DU, Z. Y.; QIMIKE, A.; YANG, C. F.; CHEN, J. M.; WANG, Q. F. Testing four barcoding markers for species identification of Potamogetonaceae. Journal of Systematics and Evolution, v. 49, n. 3, 246-251, 2011. 43

FAZEKAS, A. J.; BURGESS, K. S.; KESANAKURTI, P. R.; GRAHAM, S. W.; NEWMASTER, S. G., HUSBAND, B. C. et al. Multiple multilocus DNA barcodes from the plastid genome discriminate plant species equally well. Public Library of Science ONE, v. 3, n. 7, 2008. FAZEKAS, A. J.; STEEVES, R.; NEWMASTER, S. G. Improving sequencing quality from PCR products containing long mononucleotide repeats. BioTechniques, v. 48, n. 4, 2010. FELINER, G. N.; ROSSELLÓ, J. A. Better the devil you know? Guidelines for insightful utilization of nrDNA ITS in species-level evolutionary studies in plants. Molecular Phylogenetics and Evolution, v. 44, 911-919, 2007. FELSENSTEIN J. Confidence limits on phylogenies: an approach using the bootstrap. Evolution, v. 39, 783-791, 1985. FOOTTIT, R. G.; MAW, H. E. L.; HAVILL, N. P.; AHERN, R . G.; MONTGOMERY, M. E. DNA barcodes to identify species and explore diversity in the Adelgidae (Insecta: Hemiptera: Aphidoidea). Molecular Ecology Resources, v. 9, supl. 1, 188-195, 2009. FORD, C. S.; AYRES, K. L.; HAIDER, N.; TOOMEY, N.; van-ALPEN-STOHL, J. et al. Selection of candidate DNA barcoding regions for use on land plants. Botanical Journal of the Linnean Society, v. 159, 1-11, 2009. FORZZA, R. C.; BAUMGRATZ, J. F. A.; BICUDO, C. E. M. et al. Síntese da Diversidade Brasileira. In: FORZZA, R. C. et al. (Org.). Catálogo de plantas e fungos do Brasil, v. 1. Rio de Janeiro: Andrea Jakobsson Estúdio, Instituto de Pesquisas Jardim Botânico do Rio de Janeiro, 2010. FU, Y. M.; JIANG, W. M.; FU, C. X. Identification of species within Tetrastigma (Miq.) Planch. (Vitaceae) based on DNA barcoding techniques. Journal of Systematics and Evolution, v. 49, n. 3, 237-245, 2011. GALINDO-LEAL, C.; CÂMARA, I. G. Atlantic Forest hotspot status: an overview. In: Galindo-Leal, C.; CÂMARA, I. G. (Org.). The Atlantic Forest of South America: biodiversity status, threats, and outlook. Washington: Center for Applied Biodiversity Science at Conservation International, 2003. GAO, T.; YAO, H.; SONG, J.; LIU, C.; ZHU, Y.; MA, X.; PANG, X.; XU, H.; CHEN, S. Identification of medicinal plants in the family Fabaceae using a potential DNA barcode ITS2. Journal of Ethnopharmacology, v. 130, 116-121, 2010. GAO, T.; YAO, H.; SONG, J. ZHU, Y.; LIU, C. CHEN, S. Evaluating the feasibility of using candidate DNA barcodes in discriminating species of the large Asteraceae family. BMC Evolutionary Biology, v. 10, 324, 2010. 44

GONZALEZ, M. A.; BARALOTO, C.; ENGEL, J.; MORI, S. A.; PÉTRONELLI, P.; RIÉRA, B. et al. Identification of Amazonian trees with DNA barcodes. Public Library of Science ONE, v. 4, n. 10, 2009. GROOT, G. A.; DURING, H. J.; MAAS, J. W.; SCHNEIDER, H.; VOGEL, J. C.; ERKENS, R. H. J. Use of rbcL and trnL-F as a Two-Locus DNA Barcode for Identification of NWEuropean Ferns: An Ecological Perspective. Public Library of Science ONE, v. 6, n. 1, 2011. GU, J.; SU, J. X.; LIN, R. Z.; LI, R. Q.; XIAO, P. G. Testing four proposed barcoding markers for the identification of species within Ligustrum L. (Oleaceae). Journal of Systematics and Evolution, v. 49, n. 3, 213-224, 2011. GUEDES-BRUNI, R. R.; NETO, J. S.; MORIM, M. P.; MANTOVANI, W. Composição florística e estrutura de trecho de floresta ombrófila densa atlântica aluvial na reserva biológica de Poço das Antas, Silva Jardim, Rio de Janeiro, Brasil. Rodriguésia, v. 57, 3, 413428. 2006. GUO, X.; SIMMONS, M. P.; BUT, P. P-H.; SHAW, P-C.; WANG, R-J. Application of DNA barcodes in Hedyotis L. (Spermacoceae, Rubiaceae). Journal of Systematics and Evolution, v. 49, n. 3, 203-212, 2011. HALL, T. A. BioEdit: a user-friendly biological sequence alignment editor and analysis program for Windows 95/98/NT. Nucleic Acids Symposium Series,v. 41, 95-98, 1999. HEBERT, P. D. N.; CYWINSKA, A.; BALL, S. L.; WAARD, J. R. Biological identifications through DNA barcodes. Proceedings of the Royal Society of London B, v. 270, 313-321, 2003. HEBERT, P. D. N; GREGORY, T. R. The Promise of DNA Barcoding for Taxonomy. Systematic Biology,v. 54, n. 5, 852-859, 2005. HEBERT, P. D. N.; PENTON, E. H.; BURNS, J. M.; JANZEN, D. H.; HALLWACHS, W. Ten species in one: DNA barcoding reveals cryptic species in the neotropical skipper butterfly Astraptes fulgerator. Proceedings of the National Academy of Sciences, USA, v. 101, n. 41, 14812-14817, 2004. HEBERT, P. D. N.; RATNASINGHAM, S.; WAARD, J. R. Barcoding animal life: cytochrome c oxidase subunit 1 divergences among closely related species. Proceedings of the Royal Society of London B,v. 270, 96-99, 2003. HILU, K. W.; BORSCH, T.; MÜLLER, K.; SOLTIS, D. E.; SOLTIS, P. S. et al. Angiosperm phylogeny based on matK sequence information. American Journal of Botany, v. 90, n. 12, 1758-1776, 2003. 45

HILU, K. W.; LIANG, H. The matK gene: sequence variation and application in plant systematics. American Journal of Botany, v. 84, n. 6, 830-839, 1997. HOLLINGSWORTH, M. L.; CLARK, A. A.; FORREST, L. L.; RICHARDSON, J.; PENNINGTON, R. T. et al. Selecting barcoding loci for plants: evaluation of seven candidate loci with species-level sampling in three divergent groups of land plants. Molecular Ecology Resources, v. 9, 439-457, 2009. HOLLINGSWORTH, P. M.; GRAHAM, S. W. LITTLE, D. P. Choosing and Using a Plant DNA Barcode. Public Library of Science ONE, v. 6, n. 5, 2011. HOPKINS, M. J. G. Flora da reserva Ducke, Amazonas, Brasil. Rodriguésia, v. 56, n. 86, 925, 2005. JOHNSON L. A.; SOLTIS, D. E. Phylogenetic inference in Saxifragaceae Sensu Stricto and Gilia (Polemoniaceae) using matK sequences. Annals of the Missouri Botanic Garden, v. 82, 149-175, 1995. JOPPA, L. N.; ROBERTS, D. L.; PIMM, S. L. How many species of flowering plants are there? Proceedings of the Royal Society of London B, v. 278, 554-559, 2010. JUDD, W. S.; CAMPBELL, C. S.; KELLOGG, E. A.; STEVENS, P. F.; DONOGHUE, M. J. Plant systematics: a phylogenetic approach. 3º ed. Sunderland: Sinauer Associates, 2008. KIMURA, M. A simple method for estimating evolutionary rate of base substitutions through comparative studies of nucleotide sequences. Journal of Molecular Evolution, v. 15, 111120, 1980. KRESS W. J.; ERICKSON, D. L. A two-locus global DNA barcode for land plants: The coding rbcL gene complements the non-coding trnH-psbA spacer region. Public Library of Science ONE, v. 2, n. 6, 2007. KRESS, J. W.; WURDACK, K. J.; ZIMMER, E. A.; WEIGT, L. A.; JANZEN, D. H. Use of DNA barcodes to identify flowering plants. Proceedings of the National Academy of Sciences, USA, v. 102, 8369-8374, 2005. LAHAYE, R.; VAN DER BANK, M.; BOGARIN, D.; WARNER, J.; PUPULIN, F. et al. DNA barcoding the floras of biodiversity hotspots. Proceedings of the National Academy of Sciences, USA, v. 105, 2923-2928, 2008. LEWINSOHN, T. M.; PRADO, P. I. Quantas espécies há no Brasil? Megadiversidade, v. 1, n. 1, 2005. LI, Y.; GAO, L. M.; POUDEL, R. C.; LI, D. Z.; FORREST, A. High universality of matK primers for barcoding gymnosperms. Journal of Systematics and Evolution, v. 49, n. 3, 169-175, 2011. 46

LINDER, C. R.; MOORE, L. A.; JACKSON, R. B. A universal molecular method for identifying underground plant parts to species. Molecular Ecology, v. 9, 1549-1559, 2000. LIPSCOMB, D.; PLATNICK, N.; WHEELER, Q. The intellectual content of taxonomy: a comment on DNA taxonomy. Trends in Ecology and Evolution, v. 18, n. 2, 65-66, 2003. LIU, J.; MÖLLER, M.; GAO L. M.; ZHANG, D. Q.; LI D. Z. DNA barcoding for the discrimination of Eurasian yews (Taxus L., Taxaceae) and the discovery of cryptic species. Molecular Ecology Resources, v. 11, 89-100, 2010. LORENZI, H; BACHER, L.; LACERDA, M.; SARTORI, S. Frutas brasileiras e exóticas cultivadas. Nova Odessa, SP: Instituto Plantarum, 2006. MARIANO-NETO, E. Efeitos da fragmentação sobre comunidades arbustivo-arbóreas em Mata Atlântica, Una BA. 2004. 221 f. Tese (Doutorado em Ciências - Ecologia) Instituto de Biociências da Universidade de São Paulo, São Paulo, 2004. MARTINI, A. M. Z.; FIASCHI, P.; AMORIM, A. M.; PAIXÃO, J. L. A hot-point within a hot-spot: a high diversity site in Brazils Atlantic Forest. Biodiversity and Conservation,v. 16, 3111-3128, 2007. MONTEIRO, S. H. N.; SELBACH-SCHNADELBACH, A.; OLIVEIRA, R. P.; van den BERG, C. Molecular phylogenetics of Galeandra (Orchidaceae: Catasetinae) based on plastid and nuclear DNA sequences. Systematic Botany, v. 35, n. 3, 476-486, 2010. MORA, C.; TITTENSOR, D. P.; ADL, S.; SIMPSON, A. G. B.; WORM, B. How many species are there on earth and in the ocean? Public Library of Science Biology, v. 9, n. 8, 2011. MORI, S. A.; BOOM, B. M; CARVALHO, A. M. V.; SANTOS, T. S. Ecological importance of Myrtaceae in a eastern Brazilian wet forest. Biotropica,v. 15, 68-70, 1983. MORT, M. E.; CRAWFORD, D. J.; ARCHIBALD, J. K.; O’LEARY, T. R.; SANTOSGUERRA, A. Plant DNA barcoding: A test using Macaronesian taxa of Tolpis (Asteraceae). Taxon, v. 59, n. 2, 581-587, 2010. MUELLNER, A. N.; SCHAEFER, H.; LAHAYE, R. Evaluation of candidate DNA barcoding loci for economically important timber species of the mahogany family (Meliaceae). Molecular Ecology Resources, v. 11, 450-460, 2011. MYERS, N.; MITTERMEIER, R. A.; MITTERMEIER, C. G.; da FONSECA, G. A. B.; KENT, J. Biodiversity hotspots for conservation priorities. Nature,v. 403, 853-858, 2000. NEUHAUS, H.; LINK, G. The chloroplast tRNALys (UUU) gene from mustard (Sinapsis alba) contains a class II intron potentially coding for a maturase related polypeptide. Current Genetics, v. 11, 251-257, 1987.

47

NEVES, M. L. C. Caracterização da vegetação de um trecho de Mata Atlântica de encosta na Serra da Jibóia, Bahia. 2005. 116 f. Dissertação (Mestrado em Botânica) Universidade Estadual de Feira de Santana, Feira de Santana, 2005. NEWMASTER, S. G.; FAZEKAS, A. J.; RAGUPATHY, S. DNA barcoding in land plants: evaluation of rbcL in a multigene tiered approach. Canadian Journal of Botany-Revue Canadienne de Botanique, v. 84, 335-341, 2006. NEWMASTER, S. G.; RAGUPATHY, S. Testing plant barcoding in a sister species complex of pantropical Acacia (Mimosoideae, Fabaceae). Molecular Ecology Resources, v. 9, supl. 1, 172-180, 2009. NICOLALDE-MOREJÓN, F.; VERGARA-SILVA, F.; GONZÁLEZ-ASTORGA, J.; STEVENSON, D. W. Character-based, population-level DNA barcoding in Mexican species of Zamia L. (Zamiaceae: Cycadales). Mitochondrial DNA, v. 21, 51-59, 2010. OLIVEIRA, L.C.; HANKERSON, S. J.; DIETZ, J. M.; RABOY, B. E. Key tree species for the golden-headed lion tamarin and implications for shade-cocoa management in southern Bahia, Brazil. Animal Conservation, v. 13, 60-70, 2010. PARVEEN, I.; SINGH, H. H.; RAGHUVANSHI, S.; PRADHAN, U. C.; BABBAR, S. B. DNA barcoding of endangered Indian Paphiopedilum species. Molecular Ecology Resources, v. 12, 82-90, 2012. PENNINGTON, T. D. Flora Neotropica, monographyes n°52 (Sapotaceae). New York: New York Botanical Garden Press, 1990. PENNINGTON, T. D. The genera of Sapotaceae. Kew: Royal Botanic Gardens, 1991. PIMM, S. L.; RUSSEL, G. L.; GITTLEMAN, J. L.; BROOKS, T. M. The future of biodiversity. Science,v. 269, 347-350, 1995. PRESTING, G. G. Identification of conserved regions in the plastid genome: implications for DNA barcoding and biological function. Canadian Journal of Botany-Revue Canadienne de Botanique, v. 84, 1434-1443, 2006. RAMBAUT, A. FigTree v1.2.3. Program distributed by the author, 2009. RATNASINGHAM, S.; HEBERT, P. D. N. BOLD: The Barcode of Life Data System. Molecular Ecology Notes, v. 7, 355-364, 2007. REN, B. Q.; XIANG, X. G.; CHEN, Z. D. Species identification of Alnus (Betulaceae) using nrDNA and cpDNA genetic markers. Molecular Ecology Resources, v. 10, 594-605, 2010. RYDIN, C.; PEDERSEN, K. R.; FRIIS, E.M. On the evolutionary history of Ephedra: Cretaceous fossils and extant molecules. Proceedings of the National Academy of Sciences, USA, v. 101, 16571-16576, 2004. 48

SAITOU, N.; NEI, M. The neighbor-joining method: a new method for reconstructing evolutionary trees. Molecular Biology and Evolution, v. 4, 406-425, 1987. SANG, T.; CRAWFORD, D. J.; STUESSY, T. F. Chloroplast phylogeny, reticulate evolution, and biogeography of Paeonia (Paeoniaceae). American Journal of Botany, v. 84, 1120-1136, 1997. SASLIS-LAGOUDAKIS, C.; CHASE, M. W.; ROBINSON, D. N.; RUSSELL, S. J.;4 KLITGAARD, B. B. Phylogenetics of neotropical Platymiscium (Peguminosae: Dalbergieae): systematics, divergence times, and biogeography inferred from nuclear ribosomal and plastid DNA sequence data. American Journal of Botany, v. 95, n. 10, 1270-1286, 2008. SASS, C.; LITTLE, D. P.; STEVENSON, D. W.; SPECHT, C. D. DNA barcoding in the Cycadales: Testing the potential of proposed barcoding markers for species identification of cycads. Public Library of Science ONE, v. 2, n. 11, 2007. SCHNEIDER, H.; SCHUETTPELZ, E. Identifying fern gametophytes using DNA sequences. Molecular Ecology Notes, v. 6, 989-991, 2006. SHAW, J.; LICKEY, E. B.; BECK, J. T.; FARMER, S. B. LIU, W. et al. The tortoise and the hare II: relative utility of 21 noncoding chloroplast DNA sequences for phylogenetic analysis. American Journal of Botany, v. 92, n. 1, 142-166, 2005. SHI, L. C.; ZHANG, J.; HAN, J. P.; SONG, J. Y. et al. Testing the potential of proposed DNA barcodes for species identification of Zingiberaceae. Journal of Systematics and Evolution, v. 49, n. 3, 261-266, 2011. SILVA, F. C. Composição florística e estrutura fitossociológica da floresta tropical ombrófila da encosta atlântica no município de MORRETES (Paraná). Boletim de Pesquisa Florestal,Colombo, n. 18/19, 1989. SILVA, J. M. C.; CASTELETI, C. H. M. Estado da biodiversidade da Mata Atlântica brasileira. In: Galindo-Leal, C.; CÂMARA, I. G. (Org.). The Atlantic Forest of South America: biodiversity status, threats, and outlook. Washington: Center for Applied Biodiversity Science at Conservation International, 2003. SIMMONS, M. P.; CAPPA, J. J.; ARCHER, R. H.; FORD, A. J.; EICHSTEDT, D.; CLEVINGER, C. C. Phylogeny of the Celastreae (Celastraceae) and the relationships of Catha edulis (qat) inferred from morphological characters and nuclear and plastid genes. Molecular Phylogenetics and Evolution, v. 48, 745-757, 2008. STADEN, R.; BEAL, K.; BONFIELD, J. K. The Staden package. In: Misener, S., Krawets, S. A. (ed.), Computer Methods in Molecular Biology 132, Bioinformatics Methods and Protocols. Totowa: Humana Press, 115-130, 1998.

49

SWEENEY, B. W.; BATTLE, J. M.; JACKSON, J. K. Can DNA barcodes of stream macroinvertebrates improve descriptions of community structure and water quality? Journal of the North American Benthological Society, v. 30, n. 1, 195-216, 2011. SWENSON, U.; ANDERBERG, A. A. Phylogeny, character evolution, and classification of Sapotaceae (Ericales). Cladistics, v. 21, 101-130, 2005. SWENSON, U.; RICHARDSON, J. E.; BARTISH, I. V. Multi-gene phylogeny of the pantropical subfamily Chrysophylloideae (Sapotaceae): evidence of generic polyphyly and extensive morphological homoplasy. Cladistics,v. 24, 1006-1031, 2008. SWOFFORD, D. L. PAUP*:Phylogenetic Analysis using Parsimony (* and other methods), ver. 4.0b10. Sinauer, Sunderland, Massachusetts, 2003. TABERLET, P.; COISSAC, E.; POMPANON, F.; GIELLY, L.; MIQUEL, C. et al. Power and limitations of the chloroplast trnL (UAA) intron for plant DNA barcoding. Nucleic Acids Research, v. 35, n. 3, 2007. TAMURA, K.; PETERSON, D.; PETERSON, N.; STECHER, G.; NEI, M.; KUMAR, S. MEGA5: Molecular Evolutionary Genetics Analysis using Maximum Likelihood, Evolutionary Distance, and Maximum Parsimony Methods. Molecular Biology and Evolution, v. 28, n. 10, 2731-2739, 2011. TATE, J. A.; SIMPSON, B. B. Paraphyly of Tarasa philippi (Malvaceae) and diverse origins of the polyploid species. Systematic Botany, v. 28, 723-737, 2003. THOMAS, W. W., CARVALHO, A. M. V., AMORIM, A. M., GARRISON, J.; ARBELÁEZ, A. L. Plant endemism in two forests in southern Bahia, Brazil. Biodiversity and Conservation, v. 7, n. 3, 311-322, 1998. THOMAS, W. W.; JARDIM, J. G.; FIASCHI, P.; MARIANO-NETO, E.; AMORIM, A. M. Composição florística e estrutura do componente arbóreo de uma área transicional de Floresta Atlântica no sul da Bahia, Brasil. Revista Brasileira de Botânica, v.32, n. 1, 65-78, 2009. THOMPSON J. D.; HIGGINS, D. G.; GIBSON, T. J. CLUSTALW: improving the sensitivity of progressive multiple alignment through sequence weighing, position specific gap penalties and weight matrix choice. Nucleic Acids Research, v. 22, 4673-4680, 1994. TIAN, B.; LIU, R.; WANG, L.; QIU, Q.; CHEN, K. LIU, J. Phylogeographic analyses suggest that a deciduous species (Ostryopsis davidiana Decne., Betulaceae) survived in northern China during the Last Glacial Maximum. Journal of Biogeography, v. 36, 21482155, 2009. TUBARO, P. L.; ASTARLOA, J. M. D. ¿Qué bicho es? Ciencia Hoy, v. 18, n. 106, 2008. URBANETZ, C.; TAMASHIRO, J. Y.; KINOSHITA, L. S. Floristic composition and similarity analysis of an Atlantic rain forest fragment in Cananéia, São Paulo State, Brazil. Revista Brasileira de Botânica, v.33, n. 4, 639-651, 2010. 50

VALENTINI, A.; MIQUEL, C.; TABERLET, P. DNA Barcoding for Honey Biodiversity. Diversity, v. 2, 610-617, 2010. VALENTINI, A.; POMPANON, F.; TABERLET, P. DNA barcoding for ecologists. Trends in Ecology and Evolution, v. 24, n. 2, 2008. VAN DE WIEL, C. C. M.; VAN DER SCHOOT, J.; VAN VALKENBURG, J . L. C . H.; DUISTERMAAT, H.; SMULDERS, M. J. M. DNA barcoding discriminates the noxious invasive plant species, floating pennywort (Hydrocotyle ranunculoides L.f.), from noninvasive relatives. Molecular Ecology Resources, v. 9, 1086-1091, 2009. WHITE, T. J.; BRUNS, T.; LEE, S.; TAYLOR, J. W. Amplification and direct sequencing of fungal ribosomal RNA genes for phylogenetics. p. 315-322 In: PCR Protocols: A Guide to Methods and Applications, eds. INNIS, M. A.; GELFAND, D. H.; SNINSKY, J. J.; WHITE, T. J. New York: Academic Press, Inc., 1990. WHITLOCK, B. A.; HALE, A. M.; GROFF, P. A. Intraspecific inversions pose a challenge for the trnH-psbA plant DNA barcode. Public Library of Science ONE, v. 5, n. 7, 2010. WITT, J. D. S.; THRELOFF, D. L.; HEBERT, P. D. N. DNA barcoding reveals extraordinary cryptic diversity in an amphipod genus: implications for desert spring conservation. Molecular Ecology, v. 15, 3073-3082, 2006. WONG, E. H. K.; HANNER, R. H. DNA barcoding detects market substitution in North American seafood. Food Research International, v. 41, 828-837, 2008. XIANG, X. G.; ZHANG, J. B.; LU, A. M.; LI, R. Q. Molecular identification of species in Juglandaceae: A tiered method. Journal of Systematics and Evolution, v. 49, n. 3, 252-260, 2011. YAN, H-F.; HAO, G.; HU, C-M.; GE, X-J. DNA barcoding in closely related species: A case study of Primula L. sect. Proliferae Pax (Primulaceae) in China. Journal of Systematics and Evolution, v. 49, n. 3, 225–236, 2011. YAO, H.; SONG, J.; LIU, C.; LUO, K.; HAN, J.; LI, Y. et al. Use of ITS2 region as the universal DNA barcode for plants and animals. Public Library of Science ONE, v. 5, n. 10, 2010. YU, J.; XUE, J. H.; ZHOU, S. L. New universal matK primers for DNA barcoding angiosperms. Journal of Systematics and Evolution, v. 49, n. 3, 176-181, 2011. ZHANG, C-Y; WANG, F-Y.; YAN, H-F.; HAO, G.; HU, C-M.; GE, X-J. Testing DNA barcoding in closely related groups of Lysimachia L. (Myrsinaceae). Molecular Ecology Resources, v. 12, 98–108, 2012.

51

APÊNDICES

52

Apêndice 1: Exemplares testemunhos sequenciados para a identificação molecular de espécies de Sapotaceae. Espécie Chromolucuma apiculata AlvesAraújo & M. Alves Chrysophyllum gonocarpum (Mart. &Eich.) Engl. Chrysophyllum splendens Spreng.

Voucher

Localidade

Vivas, C. V. 160

Reserva Biológica de Una - Una

Vivas, C. V. 211 Vivas, C. V. 003

Parque Municipal da Boa Esperança - Ilhéus Reserva Biológica de Una - Una Parque Estadual da Serra do Conduru Uruçuca RPPN Estação Veracel – Porto Seguro RPPN Capitão - Itacaré Reserva Ecológica da Michelin - Igrapiúna Reserva Ecológica da Michelin - Igrapiúna Parque Municipal da Boa Esperança - Ilhéus RPPN Estação Veracel – Porto Seguro RPPN Capitão - Itacaré RPPN Estação Veracel – Porto Seguro RPPN Capitão - Itacaré Reserva Ecológica da Michelin - Igrapiúna Reserva Biológica de Una - Una Parque Estadual da Serra do Conduru Uruçuca Reserva Biológica de Una - Una RPPN Capitão - Itacaré Parque Estadual da Serra do Conduru Uruçuca RPPN Capitão - Itacaré Estrada Olivença/Vila Brasil - Ilhéus Reserva Biológica de Una - Una Parque Estadual da Serra do Conduru Uruçuca RPPN Estação Veracel – Porto Seguro Reserva Biológica de Una - Una Reserva Ecológica da Michelin - Igrapiúna

Chrysophyllum splendens Spreng. Chrysophyllum splendens Spreng. Chrysophyllum splendens Spreng. Chrysophyllum splendens Spreng. Diploon cuspidatum (Hoehne) Cronq. Diploon cuspidatum (Hoehne) Cronq. Diploon cuspidatum (Hoehne) Cronq. Diploon cuspidatum (Hoehne) Cronq. Ecclinusa ramiflora Mart. Ecclinusa ramiflora Mart. Ecclinusa ramiflora Mart. Ecclinusa ramiflora Mart.

Vivas, C. V. 109 Vivas, C. V. 143 Vivas, C. V. 161 Vivas, C. V. 190 Vivas, C. V. 180 Vivas, C. V. 207 Vivas, C. V. 149 Vivas, C. V. 164 Vivas, C. V. 131 Vivas, C. V. 166 Vivas, C. V. 184 Vivas, C. V. 017

Manilkara longifolia (A.DC.) Dubard Manilkara longifolia (A.DC.) Dubard Manilkara longifolia (A.DC.) Dubard

Vivas, C. V. 105 Vivas, C. V. 153 Vivas, C. V. 176

Manilkara maxima T.D. Penn. Manilkara maxima T.D. Penn. Manilkara maxima T.D. Penn. Manilkara maxima T.D. Penn.

Vivas, C. V. 094 Vivas, C. V. 162 Vivas, C. V. 203 Vivas, C. V. 002

Manilkara multifida T.D. Penn. Manilkara multifida T.D. Penn. Manilkara multifida T.D. Penn. Manilkara multifida T.D. Penn. Manilkara salzmannii (A.DC.) H.J. Lam Manilkara salzmannii (A.DC.) H.J. Lam Manilkara salzmannii (A.DC.) H.J. Lam Manilkara salzmannii (A.DC.) H.J. Lam Manilkara salzmannii (A.DC.) H.J. Lam Manilkara salzmannii (A.DC.) H.J. Lam Micropholis emarginata T.D. Penn. Micropholis crassipedicellata (Mart. &Eich.) Pierre Micropholis crassipedicellata (Mart. &Eich.) Pierre Micropholis crassipedicellata (Mart. &Eich.) Pierre Micropholis crassipedicellata (Mart. &Eich.) Pierre Micropholis crassipedicellata (Mart. &Eich.) Pierre

Vivas, C. V. 103 Vivas, C. V. 129 Vivas, C. V. 082 Vivas, C. V. 182

Micropholis gardneriana (A.DC.)

Vivas, C. V. 004 Vivas, C. V. 112

Reserva Biológica de Una - Una Parque Estadual da Serra do Conduru Uruçuca

Vivas, C. V. 135

RPPN Estação Veracel – Porto Seguro

Vivas, C. V. 173

RPPN Capitão - Itacaré

Vivas, C. V. 187

Reserva Ecológica da Michelin - Igrapiúna

Vivas, C. V. 206 Vivas, C. V. 204

Estrada Olivença/Vila Brasil - Ilhéus Estrada Olivença/Vila Brasil - Ilhéus

Vivas, C. V. 171

RPPN Capitão - Itacaré

Vivas, C. V. 181

Reserva Ecologica da Michelin - Igrapiúna

Vivas, C. V. 041

Reserva Biológica de Una - Una

Vivas, C. V. 216

Parque Municipal da Boa Esperança - Ilhéus

Vivas, C. V. 134

RPPN Estação Veracel – Porto Seguro

Vivas, C. V. 205

Estrada Olivença/Vila Brasil - Ilhéus

53

Pierre Micropholis gardneriana (A.DC.) Pierre Micropholis gardneriana (A.DC.) Pierre Micropholis gardneriana (A.DC.) Pierre Micropholis venulosa (Mart. & Eich.) Pierre Micropholis guyanensis (A.DC.) Pierre Micropholis guyanensis (A.DC.) Pierre Micropholis guyanensis (A.DC.) Pierre Micropholis guyanensis (A.DC.) Pierre Pouteria bangii (Rusby) T.D. Penn.

Vivas, C. V. 177

RPPN Capitão - Itacaré

Vivas, C. V. 070

Reserva Biológica de Una - Una

Vivas, C. V. 215

Parque Municipal da Boa Esperança - Ilhéus

Vivas, C. V. 051 Vivas, C. V. 113

Reserva Biológica de Una - Una Parque Estadual da Serra do Conduru Uruçuca

Vivas, C. V. 167

RPPN Capitão - Itacaré

Vivas, C. V. 200

RPPN Mãe da Mata - Ilhéus

Vivas, C. V. 024 Vivas, C. V. 055

Reserva Biológica de Una - Una Reserva Biológica de Una - Una Parque Estadual da Serra do Conduru Uruçuca RPPN Estação Veracel – Porto Seguro Serra do Corcovado - Almadina Parque Municipal da Boa Esperança - Ilhéus

Pouteria bangii (Rusby) T.D. Penn. Pouteria bangii (Rusby) T.D. Penn. Pouteria bangii (Rusby) T.D. Penn. Pouteria bangii (Rusby) T.D. Penn. Pouteria caimito (Ruiz & Pavon) Radlk.

Vivas, C. V. 114 Vivas, C. V. 137 Paixão, J. L. 1707 Vivas, C. V. 208

Pouteria durlandii (Standl.) Baehni Pouteria egregia Sandwith Pouteria gardneri (Mart. & Miq.) Baehni Pouteria glauca T.D. Penn. Pouteria macahensis T.D. Penn. Pouteria macahensis T.D. Penn. Pouteria reticulata (Engl.) Eyma Pouteria reticulata (Engl.) Eyma Pouteria reticulata (Engl.) Eyma Pouteria torta subsp. gallifructa (Cronq.) T.D. Penn.

Vivas, C. V. 116 Vivas, C. V. 027

Reserva Biológica de Una - Una Parque Estadual da Serra do Conduru Uruçuca Reserva Biológica de Una - Una

Vivas, C. V. 191 Vivas, C. V. 054 Vivas, C. V. 008 Vivas, C. V. 132 Vivas, C. V. 012 Vivas, C. V. 186 Vivas, C. V. 202

Reserva Ecológica da Michelin - Igrapiúna Reserva Biológica de Una - Una Reserva Biológica de Una - Una RPPN Estação Veracel – Porto Seguro Reserva Biológica de Una - Una Reserva Ecológica da Michelin - Igrapiúna RPPN Mãe da Mata - Ilhéus

Vivas, C. V. 133

Pouteria sp1 Pouteria sp1 Pouteria sp2

Vivas, C. V. 118 Vivas, C. V. 201 Vivas, C. V. 192

Pradosia lactescens (Vell.) Radlk. Pradosia lactescens (Vell.) Radlk. Pradosia lactescens (Vell.) Radlk. Pradosia lactescens (Vell.) Radlk.

Vivas, C. V. 091 Vivas, C. V. 146 Vivas, C. V. 174 Vivas, C. V. 188

RPPN Estação Veracel – Porto Seguro Parque Estadual da Serra do Conduru Uruçuca RPPN Mãe da Mata - Ilhéus Reserva Ecológica da Michelin - Igrapiúna Parque Estadual da Serra do Conduru Uruçuca RPPN Estação Veracel – Porto Seguro RPPN Capitão - Itacaré Reserva Ecológica da Michelin - Igrapiúna

Vivas, C. V. 039

54

Apêndice 2: Número de acesso às sequências das espécies de Sapotaceae no GenBank.

GenBank matK JQ413926 JQ413927

GenBank rbcL JQ413809 JQ413811

GenBank trnH-psbA JQ434254 JQ434255

Chrysophyllum splendens 003

GenBank ITS JQ434173 __ JQ434150

JQ413879

JQ413832

JQ434232

Chrysophyllum splendens 109

JQ434151

JQ413880

JQ413833

JQ434233

Chrysophyllum splendens 143

JQ434152

JQ413881

JQ413834

JQ434234

Chrysophyllum splendens 161

JQ434153

JQ413882

JQ413835

JQ434231

Chrysophyllum splendens 190

JQ434193

JQ413883

JQ413836

JQ434235

Diploon cuspidatum 180

JQ434171

JQ413928

JQ413812

JQ434243

Diploon cuspidatum 207

JQ434172

JQ413813

JQ434244

Diploon cuspidatum 149

JQ434170

__ JQ413916

JQ413869

JQ434242

Diploon cuspidatum 164

JQ434169

JQ413924

JQ413877

JQ434241

Ecclinusa ramiflora 131

JQ434194

JQ413884

JQ413837

JQ434236

Ecclinusa ramiflora 166

JQ434154

JQ413885

JQ413838

JQ434237

Ecclinusa ramiflora 184

JQ434155

JQ413886

JQ413839

JQ434238

Ecclinusa ramiflora 017

JQ434195

JQ413887

JQ413840

JQ434239

Manilkara longifolia 105

JQ434141

JQ413896

JQ413849

JQ434204

Manilkara longifolia 153

JQ434142

JQ413897

JQ413850

JQ434205

Manilkara longifolia 176

JQ434143

JQ413898

JQ413851

JQ434206

Manilkara maxima 094

JQ434145

JQ413900

JQ413853

JQ434208

Manilkara maxima 162

JQ434189

JQ413901

JQ413854

JQ434209

Manilkara maxima 203

JQ434190

JQ413902

JQ413855

JQ434210

Manilkara maxima 002

JQ434144

JQ413899

JQ413852

JQ434207

Manilkara multifida 103

JQ434137

JQ413892

JQ413845

JQ434200

Manilkara multifida 129

JQ434138

JQ413893

JQ413846

JQ434201

Manilkara multifida 082

JQ434139

JQ413894

JQ413847

JQ434202

Manilkara multifida 182

JQ434140

JQ413895

JQ413848

JQ434203

Manilkara salzmannii 004

JQ434148

JQ413907

JQ413860

JQ434211

Manilkara salzmannii 112

JQ434146

JQ413903

JQ413856

JQ434212

Manilkara salzmannii 135

JQ434191

JQ413904

JQ413857

JQ434213

Manilkara salzmannii 173

JQ434192

JQ413905

JQ413858

JQ434214

Manilkara salzmannii 187

JQ434147

JQ413906

JQ413859

JQ434215

Manilkara salzmannii 206

JQ434149

JQ413908

JQ413861

JQ434216

Micropholis emarginata 204

JQ413914

JQ413867

JQ434226

Micropholis crassipedicellata 171

__ JQ434164

JQ413912

JQ413865

JQ434223

Micropholis crassipedicellata 181

JQ434165

JQ413913

JQ413866

JQ434224

Micropholis crassipedicellata 041

JQ434163

JQ413923

JQ413876

JQ434225

Micropholis crassipedicellata 216

__

JQ413925

JQ413878 JQ413864

__ JQ434222

Micropholis gardneriana 205

__ JQ434159

JQ413911 JQ413910

JQ413863

JQ434218

Micropholis gardneriana 177

JQ434158

JQ413909

JQ413862

JQ434217

Micropholis gardneriana 070

JQ434160

JQ413915

JQ413868

JQ434219

Espécie Chromolucuma apiculata 160 Chrysophyllum gonocarpum 211

Micropholis crassipedicellata 134

55

Micropholis venulosa 51

JQ434161 JQ434162

JQ413917 JQ413918

JQ413870 JQ413871

JQ434220 JQ434221

Micropholis guyanensis 113

JQ434166

JQ413919

JQ413872

JQ434227

Micropholis guyanensis 167

JQ434198

JQ413920

JQ413873

JQ434229

Micropholis guyanensis 200

JQ434167

JQ413921

JQ413874

JQ434228

Micropholis guyanensis 024

JQ434168

JQ413922

JQ413875

JQ434230

Pouteria bangii 055

JQ434174

JQ413929

JQ413814

JQ434256

Pouteria bangii 114

__ JQ434175

JQ413930

JQ413815

JQ413931

JQ413816

__ JQ434257

__ JQ413934

JQ413817

Pouteria bangii 208

__ JQ434176

JQ413820

__ JQ434259

Pouteria caimito 39

JQ434181

JQ413932

JQ413818

JQ434245

Pouteria durlandii 116

JQ434182

JQ413933

JQ413819

JQ434258

Pouteria egrégia 027

JQ434177

JQ413935

JQ413821

Pouteria gardneri 191

JQ434178

JQ413936

JQ413822

__ JQ434260

Pouteria glauca 054

JQ434183

JQ413937

JQ413823

JQ434246

Pouteria macahensis 008

JQ434179

JQ413938

JQ413824

JQ434261

Pouteria macahensis 132

JQ434180

JQ413939

JQ413825

Pouteria reticulata 12

JQ434184

JQ413940

JQ413826

__ JQ434247

Pouteria reticulata 186

JQ434185

JQ413941

JQ413827

JQ434248

Pouteria reticulata 202

JQ434186

JQ413942

JQ413828

JQ434249

Pouteria torta subsp. gallifructa 133

JQ434187

JQ413943

JQ413829

JQ434250

Pouteria sp1 118 Pouteria sp1 201

JQ434188

JQ413944

JQ413830

JQ434251

JQ434199 __ JQ434156

JQ413946 JQ413945

JQ413810 JQ413831

JQ434253 JQ434252

JQ413888

JQ413841

JQ434197

JQ413891

JQ413844

JQ434196 JQ434157

JQ413889 JQ413890

JQ413842 JQ413843

Micropholis gardneriana 215

Pouteria bangii 137 Pouteria bangii 1707

Pouteria sp2 192 Pradosia lactescens 091 Pradosia lactescens 146 Pradosia lactescens 174 Pradosia lactescens 188

56

__ __ JQ434240 __

Apêndice 3: Árvore de máxima parcimônia baseada na análise da região ITS em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.

57

Apêndice 4: Árvore de máxima parcimônia baseada na análise da região matK em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.

58

Apêndice 5: Árvore de máxima parcimônia baseada na análise da região rbcL em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.

59

Apêndice 6: Árvore de máxima parcimônia baseada na análise da região trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.

60

Apêndice 7: Árvore de máxima parcimônia baseada na análise combinada das regiões ITS e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.

61

Apêndice 8: Árvore de neighbor-joining baseada na análise combinada das regiões ITS e matK em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).

62

Apêndice 9: Árvore de máxima parcimônia baseada na análise combinada das regiões ITS e matK em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.

63

Apêndice 10: Árvore de neighbor-joining baseada na análise combinada das regiões ITS e rbcL em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).

64

Apêndice 11: Árvore de máxima parcimônia baseada na análise combinada das regiões ITS e rbcL em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.

65

Apêndice 12: Árvore de neighbor-joining baseada na análise combinada das regiões matK e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).

66

Apêndice 13: Árvore de máxima parcimônia baseada na análise combinada das regiões matK e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.

67

Apêndice 14: Árvore de neighbor-joining baseada na análise combinada das regiões rbcL e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).

68

Apêndice 15: Árvore de máxima parcimônia baseada na análise combinada das regiões rbcL e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.

69

Apêndice 16: Árvore de neighbor-joining baseada na análise combinada das regiões matK e rbcL em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).

70

Apêndice 17: Árvore de máxima parcimônia baseada na análise combinada das regiões matK e rbcL em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.

71

Apêndice 18: Árvore de neighbor-joining baseada na análise combinada das regiões matK, rbcL e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).

72

Apêndice 19: Árvore de máxima parcimônia baseada na análise combinada das regiões matK, rbcL e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.

73

Apêndice 20: Árvore de neighbor-joining baseada na análise combinada das regiões ITS, rbcL e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).

74

Apêndice 21: Árvore de máxima parcimônia baseada na análise combinada das regiões ITS, rbcL e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.

75

Apêndice 22: Árvore de neighbor-joining baseada na análise combinada das regiões ITS, matK e rbcL em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).

76

Apêndice 23: Árvore de máxima parcimônia baseada na análise combinada das regiões ITS, matK e rbcL em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.

77

Apêndice 24: Árvore de neighbor-joining baseada na análise combinada das regiões ITS, matK e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).

78

Apêndice 25: Árvore de máxima parcimônia baseada na análise combinada das regiões ITS, matK e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.

79

Apêndice 26: Árvore de máxima parcimônia baseada na análise combinada das regiões ITS, matK, rbcL e trnHpsbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo

80

100.0 90.0 80.0 70.0 60.0

% 50.0

Dist. Inter

40.0

Dist. Intra

30.0 20.0 10.0 0.0 0

0,1 a 0,5

0,6 a 1

1,1 a 4

4,1 a 8

8,1 a 12 12,1 a 18

K2P Apêndice 27: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões ITS e matK em espécies da família Sapotaceae.

100.0 90.0 80.0 70.0 60.0

% 50.0

Dist. Inter

40.0

Dist. Intra

30.0 20.0 10.0 0.0 0

0,1 a 0,5

0,6 a 1

1,1 a 4

4,1 a 8

8,1 a 12 12,1 a 18

K2P Apêndice 28: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões ITS e rbcL em espécies da família Sapotaceae.

81

70.0 60.0 50.0 40.0 Dist. Inter

% 30.0

Dist. Intra

20.0 10.0 0.0 0

0,1 a 0,5

0,6 a 1

1,1 a 4

4,1 a 8

8,1 a 12

12,1 a 18

K2P Apêndice 29: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões ITS e trnH-psbA em espécies da família Sapotaceae.

70.0 60.0 50.0 40.0

%

Dist. Inter 30.0

Dist. Intra

20.0 10.0 0.0 0

0,1 a 0,5

0,6 a 1

1,1 a 4

4,1 a 8

8,1 a 12

12,1 a 18

K2P Apêndice 30: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões matK e rbcL em espécies da família Sapotaceae.

82

60.0 50.0 40.0

% 30.0

Dist. Inter Dist. Intra

20.0 10.0 0.0 0

0,1 a 0,5

0,6 a 1

1,1 a 4

4,1 a 8

8,1 a 12

12,1 a 18

K2P Apêndice 31: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões matK e trnH-psbA em espécies da família Sapotaceae.

60.0 50.0 40.0

% 30.0

Dist. Inter Dist. Intra

20.0 10.0 0.0 0

0,1 a 0,5

0,6 a 1

1,1 a 4

4,1 a 8

8,1 a 12

12,1 a 18

K2P Apêndice 32: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões rbcL e trnH-psbA em espécies da família Sapotaceae.

83

70.0 60.0 50.0 40.0 Dist. Inter

% 30.0

Dist. Intra

20.0 10.0 0.0 0

0,1 a 0,5

0,6 a 1

1,1 a 4

4,1 a 8

8,1 a 12

12,1 a 18

K2P Apêndice 33: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões matK, rbcL e trnH-psbA em espécies da família Sapotaceae.

80.0 70.0 60.0 50.0

% 40.0

Dist. Inter Dist. Intra

30.0 20.0 10.0 0.0 0

0,1 a 0,5

0,6 a 1

1,1 a 4

4,1 a 8

8,1 a 12

12,1 a 18

K2P Apêndice 34: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões ITS, matK e trnH-psbA em espécies da família Sapotaceae.

84

60.0 50.0 40.0

% 30.0

Dist. Inter Dist. Intra

20.0 10.0 0.0 0

0,1 a 0,5

0,6 a 1

1,1 a 4

4,1 a 8

8,1 a 12

12,1 a 18

K2P Apêndice 35: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões ITS, matK e rbcL em espécies da família Sapotaceae.

90.0 80.0 70.0 60.0 50.0

%

Dist. Inter

40.0

Dist. Intra

30.0 20.0 10.0 0.0 0

0,1 a 0,5

0,6 a 1

1,1 a 4

4,1 a 8

8,1 a 12

12,1 a 18

K2P Apêndice 36: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões ITS, rbcL e trnH-psbA em espécies da família Sapotaceae.

85

70.0 60.0 50.0 40.0

%

Dist. Inter 30.0

Dist. Intra

20.0 10.0 0.0 0

0,1 a 0,5

0,6 a 1

1,1 a 4

4,1 a 8

8,1 a 12

12,1 a 18

K2P Apêndice 37: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões ITS, matK, rbcL e trnH-psbA em espécies da família Sapotaceae.

86