UNIVERSIDADE ESTADUAL DE SANTA CRUZ PROGRAMA DE PÓS-GRADUAÇÃO EM GENÉTICA E BIOLOGIA MOLECULAR
DNA BARCODE EM ESPÉCIES ARBÓREAS DE SAPOTACEAE DA MATA ATLÂNTICA
CAIO VINICIUS VIVAS DAMASCENO MELO
ILHÉUS – BAHIA - BRASIL FEVEREIRO DE 2012
CAIO VINICIUS VIVAS DAMASCENO MELO
DNA BARCODE EM ESPÉCIES ARBÓREAS DE SAPOTACEAE DA MATA ATLÂNTICA
Dissertação apresentada à Universidade Estadual de Santa Cruz, como parte das exigências para obtenção do título de Mestre em Genética e Biologia Molecular. Área de concentração: Biologia Molecular.
Genética
e
Orientadora: Drª. Fernanda Amato Gaiotto Co-orientador: Dr. Cássio van den Berg Co-orientador: Dr. Eduardo Mariano Neto
ILHÉUS – BAHIA - BRASIL FEVEREIRO DE 2012
M528
Melo, Caio Vinicius Vivas Damasceno. DNA barcode em espécies arbóreas de Sapotaceae da Mata Atlântica / Caio Vinicius Vivas Damasceno Melo. – Ilhéus, BA: UESC, 2012. x, 86f. : Il. Orientadora: Fernanda Amato Gaiotto. Dissertação (Mestrado) – Universidade Estadual de Santa Cruz. Programa de Pós-Graduação em Genética e Biologia Molecular. Inclui bibliografia e apêndice. 1. Genética vegetal. 2. Biologia - Classificação. 3. Plantas – Identificação. 4. Sapoti. I. Título. CDD 581.35
CAIO VINICIUS VIVAS DAMASCENO MELO
DNA BARCODE EM ESPÉCIES ARBÓREAS DE SAPOTACEAE DA MATA ATLÂNTICA
Dissertação apresentada à Universidade Estadual de Santa Cruz, como parte das exigências para obtenção do título de Mestre em Genética e Biologia Molecular. Área de concentração: Biologia Molecular.
Genética
Aprovada: 27 de fevereiro de 2012
Drª. Vânia Cristina Rennó Azevedo (CENARGEN/EMBRAPA)
Dr. André Márcio Araújo Amorim (UESC)
Drª. Fernanda Amato Gaiotto (UESC -Orientadora)
Dr. Marco Antônio Costa (UESC)
ii
e
AGRADECIMENTOS
Este trabalho é fruto do esforço e colaboração de várias pessoas. Por isso, gostaria de agradecer a: À professora Drª. Fernanda Amato Gaiotto, pela orientação, amizade e pelos valiosos ensinamentos e conselhos que contribuíram para a realização deste belo trabalho; Ao professor Dr. Eduardo Mariano Neto, pelos ensinamentos e amizade, desde a graduação, e pela valiosa contribuição na realização deste trabalho; Ao professor Dr. Cássio van den Berg, pelos ensinamentos, amizade e por ter aberto as portas do LAMOL para as reações de sequenciamento e análise dos dados; Ao amigo José Lima da Paixão, pela amizade, pelos momentos de descontração e pela grande ajuda na localização, coleta e herborização do material botânico, e por todo o conhecimento passado durante a realização deste trabalho; Ao grande amigo Ramires, parceiro de tantas coletas, pela amizade e pela grande contribuição na realização desde trabalho; Ao professor e amigo Dr. Roberto Tarazi, pelos ensinamentos, amizade e por toda a colaboração durante a execução deste trabalho; À Drª. Elisa Suganuma, pelas valiosas dicas que facilitaram a execução deste trabalho; Ao professor Dr. André Amorim e a toda equipe do Herbário CEPEC/CEPLAC (Tiago, Cristiane, Carlinhos, Lucas e Bispo) por ter aberto as portas do Herbário CEPEC/CEPLAC para mim e pela valiosa ajuda no processamento do material botânico; Ao Dr. Anderson Geyson Alves de Araújo (UFES) e ao Dr. Marccus Alves (UFPE), pela identificação das espécies; A toda equipe do LAMOL, em especial a Ricardo e a Maria pela ajuda na obtenção das sequências; À Kátia, pela ajuda no depósito das sequências no GenBank; Ao Paulo Ricardo e ao Fábio, pela amizade e por todo o apoio, durante a minha estadia em Feira de Santana; iii
À Veracel, por todo o apoio que possibilitou a coleta na RPPN Estação Veracel; À Michelin, por todo o apoio que possibilitou a coleta na Estação Ecológica da Michelin; Ao IESB, por todo o apoio que possibilitou a coleta na RPPN Capitão; À Secretaria do Meio Ambiente de Ilhéus, por todo o apoio que possibilitou a coleta no Parque Municipal da Boa Esperança; Ao Sr. Ronaldo Santana, por ter permitido a coleta na RPPN Mãe da Mata; Ao INEMA pela autorização para a coleta no Parque Estadual da Serra do Conduru; Ao ICMBio por ter concedido a licença de coleta e autorização para a coleta na Reserva Biológica de Una; A toda minha família, em especial a minha mãe (Aldene) e a minha namorada (Juliane), pelo carinho, apoio e incentivo durante esta jornada; Aos professores do PPG em Genética e Biologia Molecular por todo o conhecimento adquirido e pelos ensinamentos que aplicarei durante toda a minha vida profissional; A todos os colegas e amigos do Laboratório de Marcadores Moleculares, em especial a Ramiris, Fernanda, Jeiza, Allan, Kátia, Douglas, Rodrigo, Josiane, Alesandro, Acácia, Daniele e Flora pela amizade, ajuda e pelos momentos de descontração; A todos os colegas da Pós-graduação, em especial a Ramiris, Allan, Ronaldo, Cláusio, Fernanda, Fabi, Lívia, Ricardo, Gileno e Sanderson pela amizade e pelos momentos de descontração; À Fabrícia, por toda a ajuda durante esses dois anos de mestrado; A CAPES e a FAPESB pela bolsa de estudos; À Universidade Estadual de Santa Cruz, ao Departamento de Ciências Biológicas e ao Colegiado do PPG em Genética e Biologia Molecular por toda infra-estrutura concedida e pelo financiamento do projeto; A todos aqueles que de alguma forma contribuíram para o desenvolvimento deste trabalho.
A todos, muito obrigado! iv
EXTRATO
MELO, Caio Vinicius Vivas Damasceno, M.S., Universidade Estadual de Santa Cruz, Ilhéus, fevereiro de 2012. DNA barcode em espécies arbóreas de Sapotaceae da Mata Atlântica. Orientadora: Drª. Fernanda Amato Gaiotto. Co-orientador: Dr. Cássio van den Berg. Coorientador: Dr. Eduardo Mariano Neto.
A Floresta Atlântica apresenta elevada diversidade de espécies bem como uma alta taxa de endemismo, onde se destaca a região sul baiana. Dentre os táxons representados nesta região, a família Sapotaceae sobressai como uma das mais ricas no componente arbóreo. Algumas espécies dessa família são consideradas raras e de difícil identificação, sendo necessária uma abordagem que facilite a identificação das mesmas. Neste contexto, o DNA barcode, que consiste na utilização de uma ou várias regiões de DNA para a identificação de espécies, fornece um importante auxílio à taxonomia. Portanto, no presente trabalho foram avaliadas quatro regiões, ITS, matK, rbcL e trnH-psbA, em 26 espécies da família Sapotaceae ocorrentes na Mata Atlântica, tendo em vista a validação destas na identificação de tais espécies. A região ITS apresentou a maior divergência entre as espécies (12%), seguida de trnH-psbA (1,5%), matK (0,8%) e rbcL (0,2%). Na discriminação de espécies, baseada no algoritmo de neighbor-joining, a região ITS teve o melhor desempenho, com 91,3% das espécies identificadas, seguida de matK, trnH-psbA e rbcL que identificaram 50%, 40% e 34,6% das espécies, respectivamente. As análises combinadas de duas, três e quatro regiões não obtiveram taxas de discriminação superiores ao da região ITS. Portanto, recomendamos a região ITS para a identificação molecular de espécies arbóreas de Sapotaceae da Mata Atlântica.
Palavras-chave: DNA barcode, ITS, Espécies Arbóreas, Taxonomia.
v
ABSTRACT
MELO, Caio Vinicius Vivas Damasceno, M.S., Universidade Estadual de Santa Cruz, Ilhéus, fevereiro de 2012. DNA barcode in Sapotaceae tree species of the Atlantic Forest. Advisor: Drª. Fernanda Amato Gaiotto. Advisor Committee Members: Dr. Cássio van den Berg and Dr. Eduardo Mariano Neto.
The Atlantic Forest has high species diversity and rate of endemism, particularly in the southern of Bahia, Brazil. Among the taxa existing in this region, the family Sapotaceae stands out as one of the richest in tree species. Some species of this family are considered rare and difficult to identify, requiring an approach that facilitates its identification. In this context, the use of DNA barcodes, which consist in using of one or more regions of DNA for species identification, provides an important aid to taxonomy. Therefore, in this study we sequenced four regions, ITS, matK, rbcL and trnH-psbA, for 26 species of Sapotaceae occurring in the Atlantic Forest, aiming to validate the use of these genome regions for identification purposes. The ITS region displayed the greatest species divergence (12%), followed by trnHpsbA (1.5%), matK (0.8%) and rbcL (0.2%). For discrimination of species based on neighborjoining algorithm, the ITS region had the best performance with 91.3% of species identified, followed by matK, trnH-psbA and rbcL that have identified 50%, 40% and 34.6 % of species, respectively. The combined analysis of two, three and four regions did not obtain higher rates of discrimination than the ITS region alone. Thus, we recommend the ITS region for molecular identification of Sapotaceae species from the Atlantic Forest.
Keywords: DNA barcode, ITS, Tree Species, Taxonomy.
vi
LISTA DE FIGURAS
Figura 1
Figura 2
Figura 3 Figura 4 Figura 5
Figura 6 Figura 7
Figura 8 Figura 9
Figura 10 Figura 11
Figura 12
Figura 13
Características morfológicas de Sapotaceae: filotaxia alterna e folha simples com margem inteira em Chrysophyllum splendens (A); frutos do tipo drupa e detalhes do caule em Pradosia lactescens (B).................................................... Localização geográfica dos sítios de coleta dos exemplares de Sapotaceae utilizados neste estudo. 1 Reserva Ecológica da Michelin; 2 RPPN Capitão; 3 Parque Estadual da Serra do Conduru; 4 Parque Municipal da Boa Esperança; 5 RPPN Mãe da Mata; 6 Estrada Olivença - Vila Brasil; 7 Reserva Biológica de Una; 8 RPPN Estação Veracel............................................................................................................... Produtos amplificados da região trnH-psbA de espécimes de Sapotaceae 2 a 15 e 17 a 28. 1 e 16 ladder 1 kb.......................................................................... Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da região ITS em espécies da família Sapotaceae..................... Árvore de neighbor-joining baseada na análise da região ITS em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P)................................................................................................................... Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da região matK em espécies da família Sapotaceae.................. Árvore de neighbor-joining baseada na análise da região matK em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P)................................................................................................................... Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da região rbcL em espécies da família Sapotaceae................... Árvore de neighbor-joining baseada na análise da região rbcL em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P)................................................................................................................... Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da região trnH-psbA em espécies da família Sapotaceae.......... Árvore de neighbor-joining baseada na análise da região trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2parâmetros (K2P)................................................................................................ Árvore de neighbor-joining baseada na análise combinada das regiões ITS e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P)................................................................................................................... Árvore de neighbor-joining baseada na análise combinada das regiões ITS, matK, rbcL e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P)................................................................................................................... vii
5
18 23 25
26 27
28 29
30 31
32
35
36
LISTA DE TABELAS
Tabela 1 Campanhas para o código de barras da vida de diferentes táxons.......................
8
Tabela 2 Diferentes regiões propostas para DNA barcode em plantas............................... 11 Tabela 3 Primers utilizados nas reações de PCR e sequenciamento.................................. 21 Tabela 4 Avaliação de quatro regiões genômicas para a identificação molecular de espécies de Sapotaceae........................................................................................ 24 Tabela 5 Distância inter e intraespecífica e sucesso na identificação da análise combinada das regiões ITS, matK, rbcL e trnH-psbA em espécies da família Sapotaceae............................................................................................................ 33 Tabela 6 Distância inter e intraespecífica e sucesso na identificação da análise combinada das regiões ITS, matK, rbcL e trnH-psbA em espécies da família Sapotaceae............................................................................................................ 34
viii
ÍNDICE
EXTRATO............................................................................................................................
v
ABSTRACT........................................................................................................................
vi
1 INTRODUÇÃO...............................................................................................................
1
1.1 Objetivo Geral..............................................................................................................
3
1.1.1 Objetivos específicos..................................................................................................
3
2 REVISÃO DE LITERATURA......................................................................................
4
2.1 Mata Atlântica..............................................................................................................
4
2.2 Família Sapotaceae......................................................................................................
4
2.3 DNA barcode.................................................................................................................
7
2.3.1 Aplicações...................................................................................................................
9
2.3.2 DNA barcode em animais...........................................................................................
9
2.3.3 DNA barcode em plantas............................................................................................
10
2.3.3.1 Identificação molecular de plantas utilizando rbcL.................................................
14
2.3.3.2 Identificação molecular de plantas utilizando matK................................................
14
2.3.3.3 Identificação molecular de plantas utilizando ITS...................................................
15
2.3.3.4 Identificação molecular de plantas utilizando trnH-psbA........................................
16
3. MATERIAL E MÉTODOS..........................................................................................
18
3.1 Área de estudo, obtenção e identificação das amostras............................................
18
3.2 Extração de DNA.........................................................................................................
19
3.3 Amplificação, purificação e sequenciamento............................................................
20
3.4 Edição e alinhamento das sequências.........................................................................
21
3.5 Análises dos dados........................................................................................................
21
ix
4 RESULTADOS...............................................................................................................
23
4.1 Avaliação das regiões...................................................................................................
23
4.1.1 A região ITS................................................................................................................
24
4.1.2 A região matK.............................................................................................................
25
4.1.3 A região rbcL..............................................................................................................
27
4.1.4 A região trnH-psbA.....................................................................................................
29
4.2 Análises combinadas....................................................................................................
33
5 DISCUSSÃO....................................................................................................................
37
6 CONCLUSÕES...............................................................................................................
41
7 REFERÊNCIAS..............................................................................................................
42
APÊNDICES......................................................................................................................
52
x
1 INTRODUÇÃO
A identificação de amostras animais, vegetais e de microrganismos tem por objetivo determinar se um exemplar desconhecido pertence a uma espécie descrita ou representa um novo táxon, sendo importante em diversas áreas como na farmacologia, na agricultura, entre outros. Uma das formas de se identificar uma amostra vegetal desconhecida é consultar um botânico especialista no grupo em questão. Entretanto, o número de taxonomistas em atividade é insuficiente para atender a demanda existente de identificação e descrição de novas espécies, principalmente nas regiões tropicais, onde a identificação de espécimes tornase desafiadora, já que uma quantidade significativa da grande diversidade existente ainda não é conhecida pela ciência (JUDD et al., 2008). Para o planeta Terra, Mora et al., (2011) estimam em aproximadamente 8,7 milhões o número de espécies de eucariotos. No Brasil, Lewinsohn & Prado (2005) estimam em 1,8 milhão o número de espécies, e destacam que com a velocidade atual de descrição de novas espécies no Brasil, seriam necessários no mínimo oito séculos para descrever toda a biodiversidade deste país. Entretanto, este cenário não se restringe apenas ao Brasil, pois nos últimos três séculos apenas 1,7 milhão de espécies foram descritas, frente a uma diversidade estimada em mais de 8,7 milhões de espécies. Somado à falta de conhecimento e ao número limitado de taxonomistas, o aumento da taxa de extinção em cerca de 1000 vezes (PIMM et al., 1995) resulta na extinção de espécies antes mesmo destas serem conhecidas pela ciência, reflexo do impedimento taxonômico vivido atualmente (LIPSCOMB et al. 2003; TUBARO e ASTARLOA, 2008). Nesse contexto, um método que permitisse uma identificação de forma rápida, precisa e automatizada de espécies traria vantagens por permitir que especialistas dedicassem seu tempo principalmente à descrição de novas espécies enquanto “técnicos” ficariam encarregados da identificação e da triagem de prováveis espécies novas, as quais não constariam em um banco de dados pré-estabelecido e seriam encaminhadas para os especialistas para a descrição. Desta forma, a técnica denominada DNA barcode tem trazido benefícios para ecólogos, conservacionistas e para agências encarregadas de controle de pragas e espécies invasoras por permitir a identificação de amostras em que a identificação pelos métodos tradicionais seria impossível (HEBERT e GREGORY, 2005). Este método consiste na utilização de uma ou várias regiões genômicas curtas e padronizadas para a 1
identificação rápida e precisa de espécies (HERBERT et al., 2003) e pode ser muito útil para a identificação de espécies em regiões megadiversas (GONZALES et al., 2009). A Mata Atlântica é um dos domínios fitogeográficos mais diversos e ameaçados do planeta. Possui uma elevada diversidade de espécies animais e vegetais bem como uma alta taxa de endemismo, que somados à ameaça que este domínio vem sofrendo, devido a ações antrópicas que resultaram em uma perda considerável da sua cobertura vegetal, conferiu a este o status de hotspot da biodiversidade (MYERS, et al., 2000). Entre os táxons que ocorrem na Mata Atlântica e possuem dificuldade na sua identificação destaca-se a família Sapotaceae, por apresentar floração supra-anual e variação morfológica vegetativa, sendo necessária a análise de flores e frutos para a sua correta identificação (ALVES-ARAÚJO e MARIANONETO, com. pess.), além de muitas espécies desta família serem consideradas raras (CARNEIRO et al., 2009). Associado a isso, Joppa et al. (2010) estimam em 2.728 o número de espécies de Sapotaceae no mundo, das quais apenas 45,5% foram descritas, sendo necessária a utilização de metodologias que auxiliem na triagem de possíveis espécies novas para que estas possam ser monitoradas para a obtenção de material fértil para a sua descrição. Frente ao problema apresentado para a identificação da família Sapotaceae, ferramentas como o DNA barcode podem auxiliar tanto na identificação quanto na resolução de problemas taxonômicos das espécies pertencentes a esta família ainda remanescentes nos fragmentos de Mata Atlântica.
2
1.1 Objetivo Geral O presente trabalho teve por objetivo a validação das regiões ITS, matK, rbcL e trnHpsbA para a identificação molecular de espécies da família Sapotaceae da Mata Atlântica. 1.1.1 Objetivos específicos Verificar o sucesso de amplificação e sequenciamento dessas regiões em espécies da família Sapotaceae; Avaliar a capacidade das regiões ITS, matK, rbcL e trnH-psbA em discriminar as espécies de Sapotaceae em estudo; Depositar sequências barcodes para as espécies amostradas em bancos de dados públicos.
3
2 REVISÃO DE LITERATURA
2.1 Mata Atlântica A Mata Atlântica é a segunda maior floresta tropical da América do Sul, com uma cobertura original de aproximadamente 1.400.000 km2, estendendo-se ao longo da costa brasileira, do Rio Grande do Norte até o Rio Grande do Sul, além de porções situadas na Argentina e no Paraguai (SILVA e CASTELI, 2003). Apresenta uma elevada diversidade de espécies, com 16.146 espécies de plantas, sendo 7.524 endêmicas e 1.361 espécies de vertebrados, das quais 567 são consideradas endêmicas (MYERS, et al., 2000; FORZZA, et al., 2010). A Mata Atlântica é considerada um dos domínios fitogeográficos mais devastados do planeta, possuindo aproximadamente 7% da sua cobertura original. Esta perda da sua cobertura original é fruto de diversos ciclos econômicos que começaram com a colonização portuguesa no início do século XVI, além de possuir uma grande densidade populacional, cerca de dois terços da população brasileira, que exercem uma grande pressão sobre este domínio (GALINDO-LEAL e CÂMARA, 2003). A Mata Atlântica apresenta uma complexa história evolutiva que resultou na formação de diferentes ambientes por toda a sua extensão, sendo uma das prováveis causas da sua elevada diversidade biológica (SILVA e CASTELI, 2003), sendo, por exemplo, considerada um centro de diversificação da família Myrtaceae (MORI et al., 1983). As espécies endêmicas não estão distribuídas de forma igualitária neste domínio fitogeográfico (SILVA e CASTELI, 2003), e nesse sentido destaca-se a região correspondente ao Corredor Central da Mata Atlântica, considerada uma área de refúgio biológico pleistocênico (CARNAVAL e MORITZ, 2008; CARNAVAL et al., 2009), que possui uma elevada riqueza de espécies vegetais das quais uma quantidade significativa são endêmicas (THOMAS et al., 1998; MARTINI et al., 2007).
2.2 Famílias Sapotaceae A família Sapotaceae possui 53 gêneros e cerca de 1.250 espécies com distribuição pantropical, sendo encontradas principalmente em florestas úmidas. No Brasil são registrados 12 gêneros e cerca de 200 espécies, principalmente nas Florestas Amazônica e Atlântica (PENNINGTON, 1990; CARNEIRO et al., 2009), sendo em algumas áreas uma das famílias
4
mais ricas do componente arbóreo-arbustivo (HOPKINS, 2005; MARIANO-NETO, 2004; NEVES, 2005). É caracterizada pelo hábito arbóreo ou arbustivo, latescentes, filotaxia principalmente alterna, com folhas simples e margem quase sempre inteira (Figura 1A). Inflorescência fasciculada, com posicionamento axial, nos ramos ou no caule. Flores actinomorfas, uni ou bissexuadas, dialissépala, gamopétala, estames inseridos dentro do tubo da corola ou na base dos lobos da mesma, com algumas espécies do gênero Pouteria possuindo estames livres, com estaminódios presentes em alguns gêneros (ex. Manilkara e Sideroxylon). Possui ovário súpero, uni ou plurilocular, quase sempre uniovulado, fruto do tipo baga ou drupa com sementes de testa lisa e com cicatriz (Figura 1B) (PENNINGTON, 1990; CARNEIRO et al., 2009)
Figura 1: Características morfológicas de Sapotaceae: filotaxia alterna e folha simples com margem inteira em Chrysophyllum splendens (A); frutos do tipo drupa e detalhes do caule em Pradosia lactescens (B). Fotos: C. V. Vivas 2010.
Estudos filogenéticos apontam para o monofiletismo da família (ANDERBERG et al., 2002) e a divisão desta em três subfamílias: Chrysophylloideae, Sarcospermatoideae e Sapotoideae (SWENSON e ANDERBERG, 2005), contudo Swenson et al., (2008) consideram a classificação desta família um tanto difícil e apontaram para a necessidade da resolução de problemas sistemáticos dentro de cada subfamília. As classificações anteriores da família realizadas por diversos autores (AUBRÉVILLE, 1964; BAEHNI, 1965; PENNINGTON, 1991) diferem entre si, muitas vezes por conta dos caracteres morfológicos 5
utilizados nesses estudos, que às vezes são bastante homoplásicos nesta família (SWENSON e ANDERBERG, 2005). A filogenia molecular da subfamília Chrysophylloideae sugere que Chrysophyllum, Pouteria, e Pradosia sejam polifiléticos e aponta para a necessidade de uma nova circunscrição destes gêneros (SWENSON et al., 2008). Armstrong (2010) utilizando a região nuclear ITS e três regiões plastidiais não-codificantes, reconstruiu a filogenia do gênero Manilkara e verificou que o mesmo não representa um grupo monofilético, devido às espécies M. fasciculata (Warb.) H.J. Lam & Maas Geest., M. dissecta (L.f.) Dubard e M. udoido Kaneh. que são mais relacionadas com os gêneros Labourdonnaisia e Faucherea. Muitas espécies da família fornecem produtos economicamente importantes como o látex utilizado na produção de chicletes e a madeira de excelente qualidade, por ser dura, pesada e durável (PENNINGTON, 1990). Outras tantas espécies fornecem frutos que são utilizados na alimentação humana, como Chrysophyllum cainito L. (abiu-roxo), Manilkara huberi (Ducke) Chevalier (maçaranduba), Manilkara salzmannii (A.DC.) H.J. Lam (maçaranduba), Manilkara subsericea (Mart.) Dubard (maçaranduba), Manilkara zapota (L.) P. Royen (sapoti), Mimusops commersonii (G. Don) Engl. (abricó-da-praia), Pouteria bullata (S. Moore) Baehni (bapeba), Pouteria caimito (Ruiz & Pavon) Radlk. (abiu), Pouteria campechiana (Kunth) Baehni (canistel), Pouteria gardneriana (A. DC.) Radlk. (Aguaíguaçu), Pouteria gardnerii (Mart. & Miq.) Baehni (maçaranduba-vermelha), Pouteria grandiflora (A. DC.) Baehni (bapeba), Pouteria macrophylla (Lam.) Eyma (cutite), Pouteria pachycalyx T.D. Penn. (guapeba), Pouteria ramiflora (Mart.) Radlk. (curriola), Pouteria torta (Mart.) Radlk. (abiu-do-cerrado), Pouteria venosa (Mart.) Baehni (aboriana), Pouteria sapota (Jacq.) H.E. Moore & Stearn (mamei), Pradosia brevipes (Pierre) T.D. Penn. (curriolarasteira), Pradosia lactescens (Vell.) Radlk. (buranhém), Sideroxylon obtusifolium (Roem. & Schult.) T.D. Penn. (quixaba) e Synsepalum dulcificum (Schumach. & Thonn.) Daniell (frutamilagrosa) entre outras (LORENZI et al., 2006). Diversas espécies da família Sapotaceae são utilizadas por animais para a alimentação e outros fins. Por exemplo, Oliveira et al., (2010) conduziram um estudo para verificar quais as espécies são utilizadas na alimentação e como sítio de repouso para o mico-leão-da-caradourada (Leontopithecus chrysomelas) uma espécie endêmica da Mata Atlântica sul baiana. A família Sapotaceae obteve destaque neste estudo, sendo a segunda família mais utilizada pelo mico-leão-da-cara-dourada, com treze espécies utilizadas na alimentação e nove como sítio de 6
repouso, dentre elas Manilkara maxima, a segunda espécie mais utilizada por este animal como fonte de néctar e sítio de repouso. No Brasil, as espécies de Sapotaceae são encontradas principalmente na Floresta Amazônica. Na Mata Atlântica são encontradas cerca de 60 espécies distribuídas em nove gêneros, com destaque para o Corredor Central da Mata Atlântica que concentra o maior número de endemismos (PENNINGTON, 1990). A família Sapotaceae destaca-se como uma das famílias mais ricas da flora do Corredor Central da Mata Atlântica (MARIANO-NETO, 2004; NEVES, 2005; MARTINI et al., 2007; THOMAS et al., 2009) não ocorrendo o mesmo em outros trechos da Mata Atlântica (SILVA, 1989; GUEDES-BRUNI et al., 2006; URBANETZ et al., 2010).
2.3 DNA barcode DNA barcode consiste em um método de identificação que utiliza uma ou várias regiões de DNA para a discriminação de espécies, fornecendo um importante auxílio à taxonomia (HERBERT et al., 2003). De fato, sequências de DNA já vinham sendo utilizadas na identificação de espécies, como no trabalho realizado por Linder et al., (2000) que utilizaram o espaçador interno transcrito nuclear (ITS) para a identificação de fragmentos de raízes, pela comparação com uma banco de dados que permitiu a identificação com sucesso de todos as raízes em nível de gênero e muitas em nível específico. Porém, somente no ano de 2003, um sistema de identificação puramente baseado em sequências padronizadas de DNA foi proposto para organismos eucariotos, baseado na premissa de que cada espécie possui um único código de barras de DNA (DNA barcode). Este método pode ser utilizado na identificação de espécies a partir de qualquer tecido do qual seja possível extrair o seu DNA, amplificar e sequenciar a região em questão, possibilitando a identificação de espécies em situações onde os métodos tradicionais não obteriam sucesso (HERBERT et al., 2003). Para tanto, Herbert et al., (2003) compararam sequências de aproximadamente 650 pb do gene mitocondrial citocromo c oxidase I (COI) de diferentes táxons de animais e obtiveram sucesso na identificação da grande maioria das espécies em questão. Posteriormente, no ano de 2004, um consórcio internacional (Consortium for the Barcode of Life - CBOL) envolvendo a participação de museus, universidades e laboratórios foi criado com o objetivo de desenvolver o DNA barcode como modelo para a identificação de espécies. Desde então diversas campanhas visando à obtenção de dados de diversos táxons 7
estão sendo realizadas (Tabela 1) e um grande projeto internacional (International Barcode of Life Project - iBOL) foi criado no ano de 2009 com o objetivo de reunir dados (DNA barcode) de 5 milhões de espécimes de cerca de 500.000 espécies eucariotas em 5 anos (TUBARO e ASTARLOA, 2008). Tabela 1: Campanhas para o código de barras da vida de diferentes táxons. Campanha All Birds Barcoding Initiative (ABBI) Fish Barcode of Life (FishBOL) Lepidoptera Barcode of Life Mammalia Barcode of Life Formicidae Barcode of Life Mosquito Barcode Initiative (MBI) Shark Barcode of Life (SharkBOL) Sponge Barcoding Project (SpongeBOL) Tephritid Barcode Initiative (TBI) All Fungi Barcoding TreeBOL GrassBOL HealthBOL
Táxon Aves Peixes Lepidoptera Mamíferos Formigas Mosquitos Tubarões Esponjas Tephritidae Fungos Espécies arbóreas Gramíneas Parasitas, patógenos e vetores de doenças humanas
Também no ano de 2004 foi lançada a pedra fundamental do sistema de dados para o código de barras da vida (BOLD) que foi desenvolvido progressivamente e lançado oficialmente no ano de 2007. O BOLD é uma plataforma virtual que tem como objetivo a aquisição, armazenamento, análise e publicação de registros de DNA barcodes. O BOLD é formado por três unidades funcionais, o sistema de gerência e análise, o sistema de identificação e o sistema de conectividade externa. O sistema de gerência e análise permite o armazenamento de registros de DNA barcodes, permitindo a criação de projetos nesta plataforma para o depósito de sequências e a submissão de eletroferogramas e dados acerca do voucher, além de possuir algumas ferramentas analíticas que possibilitam a realização de análises de rotina, tais como uma árvore de identificação baseada no algoritmo de neighborjoining. Já o sistema de identificação, possibilita a identificação de amostras desconhecidas através de sequências de DNA de uma região padrão (ex: CO1 em animais) que são analisadas com base no banco de dados do BOLD e sempre que possível realiza a identificação em nível específico. Por fim, o sistema de conectividade externa expõe os dados e a funcionalidade do sistema possibilitando aos bioinformatas o registro e a integração de serviços externos ao BOLD, permitindo o acesso a dados remotos e a capacidade de fornecer atualizações diárias a outros sites que monitoram o progresso de registros de DNA barcodes para um táxon específico ou para uma determinada região geográfica (RATNASINGHAM e HEBERT, 2007). 8
Uma nova versão do BOLD está disponível, a V3.0, a qual passou por uma série de revisões para suportar o volume crescente de dados, além de permitir a identificação de até 100 sequências de uma só vez e fornecer suporte com os algoritmos de alinhamento de sequências Muscle e Kaling para auxiliar o trabalho com DNA barcodes de plantas. Atualmente o BOLD possui cerca de 146.000 espécies com códigos de barras formalmente descritas das quais 105.000 de animais, 38.700 de plantas e 2.290 de fungos (BOLD SYSTEMS V3.0, 2011).
2.3.1 Aplicações Existem muitas situações onde a identificação de uma amostra biológica é difícil ou até mesmo impossível utilizando os métodos taxonômicos tradicionais. Nesse sentido, o DNA barcode vem sendo utilizado com sucesso em diferentes frentes como: i) identificação de espécies diversas (HEBERT et al., 2004; FOOTTIT et al., 2009; NEWMASTER e RAGUPATHY, 2009); ii) autenticação de produtos naturais e alimentos (WONG e HANNER, 2008; GAO et al., 2010); iii) estudos ecológicos e biomonitoramento (SCHNEIDER e SCHUETTPELZ, 2006;VALENTINI et al., 2010; SWEENEY et al., 2011); iv) identificação de espécies invasivas (VAN DE WIEL et al., 2009); v) conservação de espécies (WITT et al., 2006) entre outras.
2.3.2 DNA barcode em animais A região padrão para a identificação molecular de animais é a porção 5’ do gene mitocondrial citocromo c oxidase I (CO1) com cerca de 650 pb sugerida por Hebert et al., (2003). Esta região possui características desejáveis para um DNA barcode tais como: i) herança uniparental; ii) fácil amplificação com primers padronizados; iii) variação suficiente para distinguir espécies; iv) sinal filogenético para permitir a identificação de amostras desconhecidas; v) curto o suficiente para permitir o sequenciamento em uma única reação; vi) e por ser uma região codificante, é facilmente alinhável permitindo a checagem de erros de sequenciamento ou a possibilidade da existência de pseudogenes através do rastreamento de códons de terminação na região sequenciada (HEBERT et al., 2003; VALENTINI et al., 2008; HOLLINGSWORTH et al., 2011).
9
Hebert et al., (2003) analisaram a divergência da região CO1 em espécies de 11 filos do reino animal, e verificaram uma média de 11,3% de divergência, variando de 0 a 53,7%, entre as espécies em questão. Setenta e nove por cento das espécies comparadas mostraram uma divergência superior a 8%, demonstrando a eficiência desta região para a identificação de animais. Porém para o filo Cnidaria, a região CO1 não apresentou divergência suficiente para discriminar espécies, com 94,1% das comparações entre espécies com menos de 2% de divergência, enquanto apenas 1,9% das comparações realizadas entre espécies dos outros filos apresentaram uma divergência tão limitada. Posteriormente Hebert et al., (2004) demonstraram em um estudo utilizando dados morfológicos, ecológicos e de DNA, a eficiência da região CO1 em discriminar 10 espécies crípticas de Astraptes fulgerator (Lepidoptera: Hesperiidae), antes reconhecida como uma única espécie. Witt et al., (2006) utilizaram a região CO1 para analisar crustáceos do gênero Hyalella, o qual possui uma taxonomia bastante complexa. Para tanto, analisaram diferentes populações das espécies Hyalella azteca, H. muerta e H. sandra e encontraram 2 linhagens distintas em H. sandra e 33 em Hyalella azteca, nas quais a região CO1 divergiu de 4,4% a 29,9%, apontando para um alto nível de espécies crípticas e endêmicas. Estes estudos demonstram a importância do DNA barcode em identificar espécies e revelar a diversidade antes desconhecida pela comunidade científica, auxiliando assim na elaboração de estratégias eficientes de conservação.
2.3.3 DNA barcode em plantas Ao contrário do observado na maioria das espécies de animais, a porção 5’ do gene mitocondrial citocromo c oxidase I não exibe variação suficiente para ser utilizado na identificação molecular de plantas. O genoma mitocondrial das plantas possui baixas taxas de substituição de nucleotídios e assim como a região do gene CO1 outras regiões mitocondriais de plantas não possuem as características desejáveis para um DNA barcodes (CHASE et al., 2005). Como alternativa, uma busca incessante foi realizada para encontrar regiões no genoma plastidial ou nuclear com as características desejáveis para a identificação molecular de plantas. Desde então, diversos estudos foram realizados por vários grupos de pesquisa em diferentes táxons que resultaram em diferentes regiões propostas para tal fim (Tabela 2).
10
Em 2005, Kress et al., analisaram o genoma plastidial das espécies Atropa belladonna e Nicotiana tabacum buscando regiões que apresentassem as características desejáveis para um DNA barcode e escolheram nove espaçadores intergênicos mais o gene rbcL e a região nuclear ITS, que serviram de base para um subsequente teste em uma amostra maior de espécies vegetais. As regiões ITS e trnH-psbA apresentaram os melhores resultados e os pesquisadores propuseram estas duas regiões para a identificação molecular de plantas, ressaltando a necessidade de testes em grande escala dessas duas regiões em diferentes táxons de angiospermas. No mesmo ano, Chase et al., (2005) avaliaram a performance da região nuclear ITS juntamente com o gene rbcL
(cerca de 1.400 pb) como DNA barcodes,
analisando sequências de DNA depositadas no GenBank e no EMBL, e consideraram que essas regiões tiveram um bom desempenho no conjunto de dados em questão, mas deixaram claro a necessidade do desenvolvimento de ferramentas mais eficientes para este fim.
Tabela 2: Diferentes regiões propostas para DNA barcode em plantas Região rbcL (parte do gene) matK trnH-psbA ITS ITS2 trnL (P6) accD ndhJ rpoB rpoC1 ycf5 rbcL (gene completo) atpF-H psbK-L UPA Adaptado de Hollingsworth et al., (2011)
Autor Kress e Erickson (2007) Kim et al., (com. pess.); Chase et al., (2007); Lahaye et al., (2008); Ford et al., (2009) Kress et al., (2005); Chase et al., (2007) Chase et al., (2005); Kress et al., (2005) Chen et al., (2010) Taberlet et al (2007) Ford et al., (2009) Ford et al., (2009) Chase et al., (2007); Ford et al., (2009) Chase et al., (2007); Ford et al., (2009) Ford et al., (2009) Chase et al., (2005); Newmaster et al (2006) Kim et al., (com. pess.) Kim et al., (com. pess.) Presting (2006)
Kress e Erickson (2007) analisaram o sucesso na amplificação e a taxa de discriminação específica de oito regiões plastidiais e uma nuclear em uma amostra de 96 espécies (48 gêneros) de diferentes táxons de plantas terrestres. Eles concluíram que a combinação de uma porção do gene rbcL mais a região não-codificante trnH-psbA seria a melhor escolha para a identificação molecular de espécies vegetais, com uma taxa de discriminação específica de
88%. Trabalhando em outra frente, Chase et al., (2007)
realizaram triagem de mais de 100 regiões plastidiais codificantes e não-codificantes 11
avaliando quais destas poderiam ser facilmente amplificadas, para em seguida utilizar as regiões mais promissoras para DNA barcode em uma amostra significante de espécies vegetais, onde avaliaram o sucesso na amplificação e o nível de variação das mesmas. Concluíram que para um maior sucesso na identificação de espécies vegetais seria necessáriaa utilização de três regiões e propuseram duas combinações diferentes: a combinação das regiões codificantes matK, rpoC1 e rpoB, ou a combinação das regiões codificantes matK e rpoC1 com a região não-codificante trnH-psbA. Também em 2007, Taberlet et al., propuseram a utilização do íntron do gene trnL como um DNA barcode para plantas, mesmo este apresentando uma baixa resolução específica, destacando sua utilidade na área biotecnológica e na identificação de amostras ambientais. Lahaye et al., (2008) compararam o desempenho de oito regiões plastidiais em 86 espécies vegetais e posteriormente utilizaram apenas a região matK em 1.036 espécies de Orchidaceae. Concluíram que a região matK é a mais apropriada para DNA barcode em plantas, por apresentar uma boa resolução específica, além de fácil amplificação e alinhamento, ao contrário do observado em outros estudos, que tiveram dificuldade em amplificar a região matK de alguns táxons (CHASE et al., 2007; KRESS e ERICKSON, 2007). Porém Fazekas et al., (2008) avaliaram oito regiões plastidiais e uma mitocondrial em uma amostra de 251 espécimes de 92 espécies de plantas terrestres e recomendaram a utilização de multiplas regiões para um DNA barcode vegetal, pois nenhuma das regiões analisadas preencheram todos os requisitos para o uso individual destas. Em 2009, Ford et al., analisaram in silico 41 regiões codificantes do genoma plastidial de Nicotiana tabacum em busca de regiões com potencial para DNA barcode. Destas, 12 foram avaliadas quanto ao sucesso na amplificação e número de sítios variáveis em uma amostra de 98 indivíduos de 46 espécies de diferentes táxons de plantas, sendo selecionadas as regiões matK, rpoB, rpoC1, ndhJ, ycf5 e accD que apresentaram melhores resultados quando analisadas em diferentes combinações. Por fim, um grupo de trabalho de plantas foi criado pelo CBOL, com a participação de vários grupos de pesquisa de diferentes países, com o objetivo de definir as regiões a serem utilizadas para a identificação molecular de plantas, permitindo o progresso nas pesquisas realizadas com DNA barcode de plantas (HOLLINGSWORTH et al., 2011). Para tanto, 12
quatro regiões plastidiais codificantes (matK, rbcL, rpoB e rpoC1) e três não-codificantes (atpF-atpH, psbK-psbI e trnH-psbA) foram avaliadas quanto ao sucesso na amplificação, discriminação de espécies e qualidade das sequências em 907 indivíduos de 550 espécies de fanerógamas e criptógamas. Individualmente essas regiões não apresentaram uma taxa de discriminação satisfatória, variando de 43% a 69%, optando-se assim pela análise combinada destas. Por não apresentar algum dos atributos desejáveis para um DNA barcode, quatro das sete regiões foram eliminadas restando as porções das regiões codificantes matK e rbcL e a região não-codificante trnH-psbA. A combinação das regiões matK e rbcL foi a preferida pelos pesquisadores, apesar da dificuldade na amplificação da região matK em alguns táxons, este problema foi considerado mais fácil de solucionar do que a obtenção de boas sequências da região trnH-psbA, causada pela presença de microssatélites. Já a região rbcL, apresenta uma boa performance na discriminação de espécies quando analisada em conjunto com outras regiões, além de ser facilmente amplificada e sequenciada. Em conjunto, as regiões matK e rbcL tiveram uma taxa de discriminação específica de 72% e genérica de 100% (CBOL Plant working group, 2009). Contudo no ano seguinte, uma porção da região nuclear ITS, a região ITS2, foi proposta por Chen et al., (2010) que demonstraram que a região ITS2 apresentou uma performance melhor em um estudo conduzido em 8.557 amostras de 5.905 espécies vegetais. Esta região permitiu identificar 92,7% das espécies e 99,8% dos gêneros, além de ter sido amplificada com sucesso em 93,8% das amostras. Em 2011, China Plant BOL Group et al., propuseram a incorporação de ITS/ITS2 entre as regiões formalmente reconhecidas para DNA barcode de plantas, após conduzirem um estudo com 6.286 exemplares de 1.757 espécies vegetais. Fica evidente que o desempenho das regiões testadas para a identificação molecular de plantas varia, dependendo dos táxons em questão, e que existe a necessidade em muitos casos da utilização de regiões adicionais, como ITS e trnH-psbA, para a obtenção de uma boa resolução específica, pois as regiões matK e rbcL, propostas pelo CBOL, em alguns táxons não possuem boa resolução. Desta forma, muitos pesquisadores vêm testando estas quatro regiões em grupos específicos de plantas (gêneros e famílias), avaliando o desempenho destas e indicando quais são as mais eficientes para a identificação molecular destes grupos (DU et al., 2011; FU et al., 2011; SHI et al., 2011; XIANG et al., 2011).
13
2.3.3.1 Identificação molecular de plantas utilizando rbcL O gene rbcL codifica a subunidade maior da ribulose-1,5-bifosfato carboxilase oxigenase (RuBisCo), uma enzima responsável pela fixação do carbono atmosférico (CO2) durante a fotossíntese (CLEGG et al., 1994). Este gene possui cerca de 1.400 pb e foi utilizado na inferência da primeira grande filogenia molecular das plantas, realizada por Chase et al. (1993). Chase et al., (2005) e Newmaster et al (2006) sugeriram a utilização da região completa deste gene como DNA barcode, o qual figura entre os mais sequenciados em plantas, possuindo um grande número de sequências depositadas em banco de dados públicos. Kress e Erickson (2007), entretanto, sugeriram a porção 5’ do gene rbcL, com aproximadamente 530 pb, a qual posteriormente foi escolhida juntamente com a região matK pelo grupo de trabalho de plantas do CBOL (CBOL Plant working group, 2009). A porção do gene rbcL utilizada para DNA barcode possui 599 pb e está localizada na região 5' do gene, entre os sítios 1 - 599 (pb), tomando como base o genoma plastidial de Arabidopsis thaliana (HOLLINGSWORTH et al., 2011). Esta região apresentou grande sucesso de amplificação em todos os táxons de plantas testados, além de ser facilmente sequenciada e alinhada (FU et al., 2011; GROOT et al., 2011; XIANG et al., 2011). De modo geral, não apresenta uma boa resolução quando analisado individualmente, contudo o sucesso na identificação de briófitas pode chegar a 90% utilizando esta região isoladamente (HOLLINGSWORTH et al., 2009).
2.3.3.2 Identificação molecular de plantas utilizando matK O gene matK, que codifica uma maturase envolvida no splicing dos íntrons do grupo II, possui cerca de 1.500 pb e está localizada no íntron do gene plastidial trnK (NEUHAUS e LINK, 1987; HILU e LIANG, 1997). É uma região largamente utilizada em estudos filogenéticos (JOHNSON e SOLTIS, 1995; SASLIS-LAGOUDAKIS et al., 2008; SIMMONS et al, 2008) sendo utilizada por Hilu et al., (2003) para inferir a filogenia das angiospermas. Esta região foi proposta como um código de barras de DNA para plantas por diversos pesquisadores (KIM et al., com. pess.; CHASE et al., 2007; LAHAYE et al., 2008; FORD et al., 2009) e acabou sendo escolhida pelo grupo de trabalho de plantas do CBOL, juntamente com a região rbcL, para este fim (CBOL Plant working group, 2009). A porção do gene matK utilizada está localizada entre os sítios 205 - 1046 (pb) da região central do gene, com cerca 14
de 840 pb, tomando como base o genoma plastidial de Arabidopsis thaliana (HOLLINGSWORTH et al., 2011). matK é uma das regiões codificantes plastidiais mais variáveis (HILU e LIANG, 1997) apresentando boa resolução específica em muitos táxons quando analisada individualmente ou de forma combinada (LAHAYE et al., 2008; FAZEKAS et al., 2008; NEWMASTER e RAGUPATHY, 2009), mas em outros não apresenta uma boa resolução (REN et al., 2010; SHI et al., 2011). Newmaster e Ragupathy (2009) utilizaram as regiões matK, rbcL e trnHpsbA para analisar um complexo de espécies do gênero Acacia, conhecida pela dificuldade de identificação pelos métodos tradicionais. A região matK permitiu identificar todas as espécies em questão, além de fornecer um padrão biogeográfico destas, enquanto as outras duas regiões tiveram 67% de sucesso na identificação das mesmas. No entanto, a região matK possui baixa taxa de amplificação em muitos táxons (KRESS e ERICKSON, 2007, FAZEKAS et al., 2008; CBOL Plant working group, 2009) o que vai de encontro a uma das características desejáveis para um DNA barcode. Contudo um grande esforço vem sendo realizado para a obtenção de primers que possibilitem a amplificação desta região de forma universal (YU et al., 2011; LI et al., 2011).
2.3.3.3 Identificação molecular de plantas utilizando ITS O espaçador transcrito interno (ITS) é uma região que faz parte do cístron ribossomal nuclear 18S - 5,8S - 26S, dividido em ITS1, 5,8S e ITS2. É uma das regiões mais utilizadas para inferências filogenéticas em nível genérico e infragenérico de plantas, por ser considerada de fácil amplificação, devido ao grande número de cópias existentes no genoma, que pode variar de centenas a milhares de cópias, e por apresentar altos níveis de variação interespecífica. A existência de primers descritos que amplificam nos mais variados grupos de plantas, bem como o seu tamanho, que varia de 500 a pouco mais de 700 pb em angiospermas, facilitam a obtenção de sequências desta região neste grupo (BALDWIN et al., 1995; ÁLVAREZ e WENDEL, 2003; FELINER e ROSSELLÓ, 2007). Contudo em gimnospermas, seu sequenciamento apresenta dificuldades, devido ao seu tamanho de aproximadamente 1.100 pb em grande parte das espécies (SASS et al., 2007). A região ITS foi sugerida por Chase et al., (2005) e Kress et al., (2005) para a identificação molecular de plantas, principalmente pelo alto nível de variação interespecífica 15
apresentada por esta, que possibilita a discriminação de espécies nos mais variados grupos de plantas. Entretanto, esta região apresenta em alguns táxons cópias divergentes em um mesmo organismo, causada pela evolução em concerto incompleta, como o observado por Denduangboripant e Cronk (2000) em espécies do gênero Aeschynanthus que apresentaram cópias desta região que divergiam em até 5% em um mesmo indivíduo. Porém, esta região continua sendo testada em diferentes táxons e vem demonstrando bons resultados quanto à discriminação de espécies, como em espécies do gênero Alnus onde identificou 76,9% das espécies (REN et al., 2010), em espécies de Potamogetonaceae onde obteve grande êxito na identificação de espécies (DU et al., 2011), em Taxus onde identificou 100% das espécies em questão (LIU et al., 2010), entre outros. Em 2010, Chen et al., propuseram a região ITS2 como DNA barcode para plantas por sua habilidade em discriminar espécies e pelo sucesso na sua amplificação e sequenciamento, devido ao seu tamanho (160 a 320 pb) que permite obtenção de boas sequências utilizando primers universais. Posteriormente, esta região foi proposta como uma região universal para a identificação molecular de plantas e como complementar à região CO1 na identificação de animais por Yao et al., (2010), que demonstraram sua eficiência em discriminar um número considerável de espécies desses táxons. No entanto, Liu et al., (2010) demonstraram a redução na discriminação de espécies de Taxus quando apenas a região ITS2 foi utilizada (45,5%) em relação à região ITS, a qual identificou 100% das espécies em questão. Recentemente, o China Plant BOL Group et al., (2011) analisaram as regiões matK, rbcL, ITS e trnH-psbA de um grande conjunto de dados, composto de 6.286 exemplares de 1.757 espécies vegetais. A região ITS teve um desempenho inferior em relação ao das regiões plastidiais nos quesitos amplificação e sequenciamento. Todavia, apresentou um desempenho superior na discriminação de espécies, frente ao observado para as regiões matK, rbcL e trnHpsbA. Desta forma, eles concluíram que a região ITS/ITS2 deveria ser incorporada entre as regiões formalmente reconhecidas para DNA barcode de plantas.
2.3.3.4 Identificação molecular de plantas utilizando trnH-psbA A região trnH-psbA é uma região não-codificante situada entre os genes plastidiais trnH e psbA, sendo uma das mais variáveis, com um tamanho médio de 465 pb, podendo variar de 198 a 1077 pb em algumas espécies (SHAW et al., 2005). É muito utilizada em 16
estudos filogenéticos e filogeográficos (TIAN, et al ., 2009; ANDRADE, et al., 2010; MONTEIRO, et al., 2010) tendo sido, primeiramente, proposta para DNA barcode por Kress et al., (2005) e, posteriormente, por Chase et al., (2007). Contudo, apesar do seu poder de discriminação e sucesso na amplificação (CBOL Plant working group, 2009), apresenta problemas no seu sequenciamento em muitos táxons, devido a existências de repetições mononucleotídicas (DEVEY et al., 2009), além da duplicação e da presença de microinversões dentro desta região em alguns táxons (SASS et al., 2007; WHITLOCK et al., 2010), que pode dificultar a sua utilização em larga escala para identificação molecular de plantas. Estudos em diferentes grupos de plantas foram realizados e a região trnH-psbA tem mostrado resultados satisfatórios. Em Alnus, esta região sozinha identificou 63.6% das espécies, e quando analisada de forma combinada com a região ITS o sucesso na identificação subiu para 88% (REN et al., 2010), tendo uma boa performance também em Tolpis (MORT et al., 2010) e Ligustrum, onde identificou 88.9% das amostras em questão (GU et al., 2011).
17
3. MATERIAL E MÉTODOS
3.1 Área de estudo, obtenção e identificação das amostras As coletas das espécies de Sapotaceae foram realizadas durante os anos de 2010 e 2011 na Mata Atlântica da região sul baiana nas seguintes localidades: RPPN Estação Veracel, no município de Porto Seguro; Reserva Biológica de Una, no município de Una; RPPN Mãe da Mata, Parque Municipal da Boa Esperança e na estrada Olivença – Vila Brasil, no município de Ilhéus; Parque Estadual da Serra do Conduru, no município de Uruçuca; RPPN Capitão, no município de Itacaré; Reserva Ecológica da Michelin, no município de Igrapiúna (Figura 2).
Figura 02: Localização geográfica dos sítios de coleta dos exemplares de Sapotaceae utilizados neste estudo. 1 Reserva Ecológica da Michelin; 2 RPPN Capitão; 3 Parque Estadual da Serra do Conduru; 4 Parque Municipal da Boa Esperança; 5 RPPN Mãe da Mata; 6 Estrada Olivença – Vila Brasil; 7 Reserva Biológica de Una; 8 RPPN Estação Veracel.
18
No total, foram coletados 216 espécimes da família Sapotaceae, das quais amostras das partes reprodutivas e/ou vegetativas foram obtidas para a identificação botânica e tecido foliar para as análises genéticas. Todos os indivíduos foram georreferenciados, fotografados e as características das partes reprodutivas e vegetativas, altura e o diâmetro do tronco à altura do peito (DAP) foram anotadas. As amostras foram herborizadas, morfotipadas e 98 exemplares foram enviados para identificação por especialista da família, dos quais 70 indivíduos de 26 espécies de Sapotaceae foram utilizados neste estudo (Apêndice 1). As exsicatas foram depositadas no Herbário CEPEC, com duplicatas enviadas para os herbários da Universidade Federal de Pernambuco (UFPE) e da Universidade Estadual de Santa Cruz (UESC). Para as análises moleculares, amostras foliares dos exemplares coletados foram acondicionadas em sacolas plásticas e encaminhadas para o Laboratório de Marcadores Moleculares do Centro de Biotecnologia e Genética da Universidade Estadual de Santa Cruz (UESC), onde foram armazenadas em freezer a -20ºC para uso posterior.
3.2 Extração de DNA A extração do DNA do material fresco foi realizada segundo o protocolo de Doyle e Doyle (1987). Foram adicionadas cerca de 50mg de tecido foliar em microtubos de 1,5 ml o qual foi macerado em nitrogênio líquido com auxílio de um pistilo. Em seguida foram adicionados 700μl de tampão de extração (CTAB 2%, NaCl 1,4 M, EDTA 20 mM, Tris-HCl 100 mM pH 8.0, β-mercaptoetanol 0,4% e PVP 1% ). Em seguida, as amostras foram homogeneizadas com auxílio de um vórtex e incubadas em banho-maria a 65°C por 40 minutos, vertendo-se os microtubos a cada 10 minutos. Posteriormente, os tubos foram resfriados e adicionou-se 600μl de clorofórmio-álcool-isoamílico na proporção de 24:1(v/v) para desproteinização. Os microtubos foram agitados por suaves inversões durante 5 minutos e centrifugados por 10 minutos a 13.000 rpm. O sobrenadante foi coletado e transferido para microtubos de 1,5 ml novos, e adicionou-se 500μl de isopropanol gelado para a precipitação do DNA, agitando os microtubos algumas vezes e acondicionando os mesmos a -20ºC por 2 horas. Posteriormente, as amostras foram centrifugadas por 5 minutos a 13.000 rpm. O isopropanol foi retirado e o pellet foi lavado duas vezes com álcool etílico 70% e uma vez com álcool etílico absoluto para a retirada dos sais, por 5 e 3 minutos respectivamente. O 19
pellet foi seco por aproximadamente 30 minutos e em seguida acrescentou-se 50μl de TE (Tris-HCl 10 mM, pH 8,0, EDTA 1 mM) com RNAse 10 mg/ml por 1 hora a 37ºC para digestão de RNA. As amostras de DNA foram quantificadas em gel de qualidade (agarose 0,8%) e armazenadas em freezer a –20°C.
3.3 Amplificação, purificação e sequenciamento Duas regiões recomendadas (matK e rbcL) e duas sugeridas como suplementares (ITS e trnH-psbA) pelo CBOL Plant Work Group (2009) para DNA barcode foram amplificadas neste estudo (Tabela 3). Para as reações de amplificação por PCR das regiões ITS, matK e rbcL o mix consistiu em tampão 1x (GoTaq®), dNTPs 0,4 mM, primers F e R 0,5 μM, BSA 0,1mg/ml, 1unidade de Taq polimerase (GoTaq®), 10 ng de DNA e água ultra pura autoclavada suficiente para 20 μl, utilizando os seguintes programas: 95°C por 5 min., seguido por 35 ciclos de 95°C por 30 seg., 50°C por 30 seg., 72°C por 90 seg., e um ciclo adicional de 72°C por 8 min. para a região ITS (BARTISH et al., 2005) e 94°C por 2.30 min., seguido por 10 ciclos de 94°C por 30 seg., 56°C por 30 seg., 72°C por 30 seg., mais 25 ciclos de 88°C por 30 seg., 56°C por 30 seg., 72°C por 30 seg. e um ciclo adicional de 72°C por 10 min. para as regiões matK e rbcL (Suganuma com. pess.). Para a amplificação da região trnHpsbA utilizou-se tampão 1x (GoTaq®), dNTPs 0.4 mM, primers F e R 0.5 µM, BSA 0.375mg/ml, 1 unidade de Taq polimerase (GoTaq®), 10 ng de DNA e água ultra pura autoclavada suficiente para 15 µl com o termociclador programado para 94ºC por 2 min. e 30 seg. para desnaturação, 35 ciclos de 94ºC por 30seg., 56ºC por 30seg. e 64ºC por 1 min., e por fim um extensão final de 64ºC por 10 min. (Suganuma com. pess.). As amostras que apresentaram um padrão fraco de bandas, foram amplificadas utilizando o kit TopTaq (Qiagen) seguindo as recomendações do fabricante, utilizando os mesmos programas descritos acima para a amplificação. Após a amplificação, os produtos de PCR foram purificados com polietilenoglicol (PEG) e sequenciados nas duas direções utilizando o kit Big Dye Terminator, version 3.1 (Applied Biosystems, Foster City, California, U.S.A.) e um sequenciador automático modelo ABI 3130XL.
20
Tabela 3: Primers utilizados nas reações de PCR e sequenciamento. Região
Primer
Sequência 5’ – 3’
ITS ITS ITS ITS matK
ITS-18SFA ITS-26SRA ITS4B ITS5B 3F_KIM f
GAACCTTATCGTTTAGAGGAAGG CCGCCAGATTTTCAGGCTGGGC TCCTCCGCTTATTGATATGC GGAAGTAAAAGTCGTAACAAGG CGTACAGTACTTTTGTGTTTACGAG
Referência
Rydin et al. 2004 Rydin et al. 2004 White et al, 1990 White et al, 1990 K. J. Kimnão publicado matK 1R_KIM r ACCCAGTCCATCTGGAAATCTTGGTTC K. J. Kimnão publicado rbcL rbcLa_f ATGTCACCACAAACAGAGACTAAAGC Kress e Erickson, 2007 rbcL rbcLaj634R GAAACGGTCTCTCCAACGCAT Fazekas et al. 2008 trnH- psbA trnHf_05 CGCGCATGGTGGATTCACAATCC Tate e Simpson, 2003 trnH- psbA psbA3 f GTTATGCATGAACGTAATGCTC Sang et al. 1997 A Primers utilizados nas reações de amplificação da região ITS; BPrimers utilizados nas reações de sequenciamentoda região ITS.
3.4 Edição e alinhamento das sequências As sequências foram editadas utilizando o programa Staden (STADEN et al., 1998) e o alinhamento realizado com o auxílio do aplicativo Clustal W (THOMPSON et al., 1994) por meio do programa Bioedit (HALL, 1999). Todas as sequências foram verificadas visualmente para a identificação de possíveis erros na edição e ajustes manuais foram realizados no alinhamento. Em seguida, as sequências geradas neste estudo foram depositadas no GenBanK (Apêndice 2).
3.5 Análises dos dados As regiões foram analisadas individualmente e de forma combinada. Nas análises combinadas só foram utilizadas amostras que obtiveram sucesso no sequenciamento para as quatro regiões em questão. No programa Mega5 (TAMURA et al., 2011), as distâncias par a par foram calculadas utilizando o modelo Kimura 2-parâmetros (KIMURA, 1980) para avaliar a divergência entre e dentro das espécies. Para avaliar o poder discriminatório das regiões, foram utilizados os métodos de neighbor-joining (SAITOU & NEI, 1987) e máxima parcimônia em análises individuais ou em diferentes combinações das regiões. As análises de máxima parcimônia foram realizadas no programa PAUP* 4.0 b10 (SWOFFORD, 2003) e consistiram em uma 21
busca inicial heurística com 2000 replicações, salvando 20 árvores por replicação, com adição aleatória de táxons, stepwise e swap com o algoritmo TBR. Uma segunda busca heurística foi realizada usando as árvores da busca anterior com o algoritmo swap TBR sem limite no número de árvores. Para visualização das árvores, foi utilizado enraizamento do ponto médio. Os suportes dos ramos internos foram calculados utilizando o método de bootstrap (FELSENSTEIN, 1985) com 1000 replicações, adição simples de táxons e mantendo até 20 árvores por replicação, por meio do programa PAUP* 4.0 b10 (SWOFFORD, 2003). Os indels não foram considerados nas análises de máxima parcimônia. As análises de neighborjoining foram realizadas no programa Mega5 (TAMURA et al., 2011) utilizando o modelo Kimura 2-parâmetros (KIMURA, 1980). Para os indels foi utilizada a opção de pairwisedeletion e os suportes para os ramos internos foram calculados utilizando o método de bootstrap (FELSENSTEIN, 1985) com 1000 replicações. Todas as árvores geradas foram visualizadas o programa FigTree v1.3.1 (RAMBAUT, 2009). As análises de DNA barcode não consistem em estudos filogenéticos por si, mas sim um método de identificação (NICOLALDE-MOREJÓN et al., 2011) que a priori vem utilizando métodos filogenéticos nas suas análises. Portanto, o sucesso na discriminação das espécies, neste trabalho, foi avaliado considerando os grupos monofiléticos específicos formados pelas análises de máxima parcimônia e neighbor-joining.
22
4 RESULTADOS
4.1 Avaliação das regiões
Ao todo foram obtidas 63 sequências da região ITS para 23 espécies de Sapotaceae, 68 de matK para 26 espécies, 70 de rbcL para 26 espécies e 62 da região trnH-psbA para 25 espécies de Sapotaceae nesse estudo. Os primers das regiões em questão mostraram-se universais com altas taxas de amplificação (Figura 3). Nas reações de sequenciamento as regiões rbcL (100%) e matK (98,6%) tiveram as melhores performances, seguido das regiões ITS (92,7) e trnH-psbA (86,6%) que tiveram desempenhos modestos. Quanto ao tamanho das sequências alinhadas, todas as regiões produziram matrizes superiores a 500 pb, onde a região ITS foi a mais variável e informativa, enquanto a região rbcL foi a mais conservada, com apenas 13 sítios varáveis dos quais nove são informativos para as análises de máxima parcimônia (Tabela 4).
Figura 3: Produtos amplificados da região trnH-psbA de espécimes de Sapotaceae 2 a 15 e 17 a 28. 1 e 16 ladder 1 kb.
A região ITS apresentou a maior distância interespecífica média (12%), a qual foi 30 vezes superior à distância intraespecífica média, com valores que variaram de 0,5 a 17,5% entre as espécies. A região trnH-psbA apresentou distâncias que variaram de 0 a 3,8%, ao passo que matK e rbcL exibiram valores de 0 a 1,9% e 0 a 0,9%, respectivamente (Tabela 4). 23
Tabela 4: Avaliação de quatro regiões genômicas para a identificação molecular de espécies de Sapotaceae. Região Universalidade Sucesso na PCR Sucesso no sequenciamento Tamanho da sequência alinhada (pb) Nº de sítios variáveis Nº de sítios informativos (MP) Distância interespecífica média (amplitude) Distância intraespecífica média (amplitude)
ITS sim 97,1% (68/70) 92,7% (63/68) 690 305 264 12% (0,5 a 17,5%) 0,4% (0 a 3,8%)
matK sim 98,6% (69/70) 98,6% (68/69) 796 41 28 0,8% (0 a 1,9%) 0,04% (0 a 0,3%)
rbcL sim 100% (70/70) 100% (70/70) 586 13 9 0,2% (0 a 0,9%) 0,02% (0 a 0,2%)
trnH-psbA sim 100% (70/70) 88,6% (62/70) 667 52 31 1,5% (0 a 3,8%) 0,1% (0 a 0,6%)
4.2.1 A região ITS Em 93,8% das comparações par a par entre espécies, as distâncias baseadas em Kimura 2-parâmetros para a região ITS foram superiores a 4%, onde 55,3% apresentaram distâncias interespecíficas maiores que 12%. (Figura 4). Intraespecíficamente, 86,4% das comparações par a par apresentaram distâncias inferiores a 1%. Na discriminação das espécies, a região ITS obteve o melhor desempenho entre todas as regiões, discriminando 91,3% (21/23) das espécies, identificando Chromolucuma apiculata, Chrysophyllum splendens, Diploon cuspidatum, Ecclinusa ramiflora, Manilkara longifolia, M. salzmannii, Micropholis crassipedicellata, M. guyanensis, M. gardneriana, M. venulosa, Pouteria bangii, P. caimito, P. durlandii, P. egregia, P. gardneri, P. glauca, P. macahensis, P. reticulata, P. torta, P. sp1 e Pradosia lactescens, utilizando os métodos de neighbor-joining (Figura 5) e máxima parcimônia (Apêndice 3).
24
60.0 50.0 40.0
% 30.0
Dist. Inter Dist. Intra
20.0 10.0 0.0 0
0,1 a 0,5
0,6 a 1
1,1 a 4
4,1 a 8
8,1 a 12
12,1 a 18
K2P Figura 4: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da região ITS em espécies da família Sapotaceae.
4.2.2 A região matK Na região matK, 56,6% das comparações interespecíficas tiveram distâncias superiores 0,5%, variando de 0,6 a 1,9% (Figura 6). Contudo, 43,4% das comparações par a par apresentaram distâncias interespecíficas entre 0 e 0,5%, intervalo onde 100% das comparações intraespecíficas foram acomodadas, mostrando uma clara sobreposição entre a variação inter e intraespecífica das amostras em questão para esta região. matK possibilitou a identificação de 13 das 26 espécies (50%) de Sapotaceae que tiveram sequências geradas para esta região, utilizando tanto neighbor-joining (Figura 7) quanto máxima parcimônia (Apêndice 4). O gênero Manilkara foi separado dos demais, porém as espécies contidas neste não puderam ser identificadas com esta abordagem, bem como outras nove espécies dos gêneros Micropholis, Pouteria e Chromolucuma que não foram discriminadas.
25
Figura 5: Árvore de neighbor-joining baseada na análise da região ITS em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2parâmetros (K2P).
26
80.0 70.0 60.0 50.0
%
40.0
Dist. Inter Dist. Intra
30.0 20.0 10.0 0.0 0
0,1 a 0,5
0,6 a 1
1,1 a 4
4,1 a 8
8,1 a 12
12,1 a 18
K2P Figura 6: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da região matK em espécies da família Sapotaceae.
4.2.3 A região rbcL Nas comparações interespecíficas par a par utilizando a região rbcL, 97,9% das comparações apresentaram entre 0 a 0,5% de divergência, onde 100% das comparações intraespecíficas foram acomodadas no mesmo intervalo, as quais variaram de 0 a 0,2% (Figura 8). Das regiões utilizadas, rbcL foi a que teve o menor desempenho na identificação das espécies, com uma resolução 34,6% (9/26) utilizando tanto neighbor-joining (Figura 9) quanto máxima parcimônia (Apêndice 5). O gênero Manilkara não apresentou variação entre suas espécies, onde as mesmas também apresentaram 0% de divergência em relação a espécies dos gêneros Micropholis e Pouteria.
27
Figura 7: Árvore de neighbor-joining baseada na análise da região matK em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).
28
100.0 90.0 80.0 70.0 60.0
% 50.0
Dist. Inter
40.0
Dist. Intra
30.0 20.0 10.0 0.0 0
0,1 a 0,5
0,6 a 1
1,1 a 4
4,1 a 8
8,1 a 12 12,1 a 18
K2P Figura 8: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da região rbcL em espécies da família Sapotaceae.
4.2.4 A região trnH-psbA A região trnH-psbA foi a segunda mais variável, com 82,9% das comparações par a par apresentando valores de divergência entre 0,6% e 3,8%. Já na variação intraespecífica, 68,8% das comparações não divergiram e outros 28,6% não ultrapassaram 0,5% de divergência (Figura 10).
29
Figura 9: Árvore de neighbor-joining baseada na análise da região rbcL em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2parâmetros (K2P).
30
As espécies Chrysophyllum gonocarpum, C. splendens, Chromolucuma apiculata, Diploon cuspidatum, Micropholis crassipedicellata, M. guyanensis, Pouteria durlandii, P. gardneri, P. macahensis e Pradosia lactescens, totalizando 40% (10/25) das espécies, foram identificadas utilizando o algoritmo de neighbor-joining (Figura 11) e as espécies Chrysophyllum gonocarpum, C. splendens, Chromolucuma apiculata, Diploon cuspidatum, Micropholis crassipedicellata, M. emarginata, M. gardneriana, M. guyanensis, M. venulosa, Pouteria durlandii, P. gardneri, P. macahensis, P. sp2 e Pradosia lactescens, totalizando 56% (14/25) das espécies sequenciadas para esta região, foram discriminadas utilizando a análise de máxima parcimônia (Apêndice 6).
80.0 70.0 60.0 50.0
% 40.0
Dist. Inter Dist. Intra
30.0 20.0 10.0 0.0 0
0,1 a 0,5
0,6 a 1
1,1 a 4
4,1 a 8
8,1 a 12
12,1 a 18
K2P Figura 10: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da região trnH-psbA em espécies da família Sapotaceae.
31
Figura 11: Árvore de neighbor-joining baseada na análise da região trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).
32
4.3 Análises combinadas Nas análises utilizando duas regiões, a combinação das regiões ITS/trnH-psbA foi a mais variável, seguida de ITS/rbcL, ITS/matK, matK/trnH-psbA, rbcL/trnH-psbA e matK/rbcL, que apresentaram uma divergência média entre os pares comparados de 7,2%, 5,9%, 5,4%, 1,1%, 0,8%, 0,5%, respectivamente (Tabela 5). Intraespecificamente a combinação ITS/matK apresentou uma média de 0,2%, variando de 0 a 1,7% ,ITS/rbcL com 0,2% média, variando de 0 a 2%, ITS/trnH-psbA com 0,3%, variando de 0 a 2,2%, matK/rbcL com 0,03%, variando de 0 a 0,1%, matK/trnH-psbA com 0,1%, variando de 0 a 0,2% e rbcL/trnH-psbA com uma média de 0,1%, variando de 0 a 0,3%. Não foi observada a formação de um intervalo na distribuição da variação inter e intraespecífica, com uma branda sobreposição observada nas combinações ITS/trnH-psbA, ITS/rbcL e ITS/matK (Apêndices 27 a 29), enquanto as combinações matK/trnH-psbA, rbcL/trnH-psbA e matK/rbcL apresentaram uma acentuada sobreposição (Apêndices 30 a 32).
Tabela 5: Distância inter e intraespecífica e sucesso na identificação da análise combinada das regiões ITS, matK, rbcL e trnH-psbA em espécies da família Sapotaceae. Combinação
ITS/matK
ITS/rbcL
Distância interespecífica média (amplitude) Distância intraespecífica média (amplitude) Sucesso na identificação
5,4% (0,2 a 8,2%) 0,2% (0 a 1,7%) 90,9%
5,9% (0,2 a 8,3%) 0,2% (0 a 2%) 90,9%
ITS/trnHpsbA 7,2% (0,3 a 10,4%) 0,3% (0 a 2,2%) 90,9%
matK/rbcL 0,5% (0 a 1,2%) 0,03% (0 a 0,1%) 40,9% (MP) 45,5% (NJ)*
matK/trnHpsbA 1,1% (0 a 2,3%) 0,1% (0 a 0,2%) 63,6%
rbcL/trnHpsbA 0,8% (0 a 1,5%) 0,1% (0 a 0,3%) 50%
*Máxima parcimônia (MP); Neighbor-joining (NJ)
Na identificação das espécies, as combinações ITS/matK, ITS/rbcL e ITS/trnH-psbA tiveram o mesmo desempenho, identificando com sucesso as espécies Chromolucuma apiculata, Chrysophyllum splendens, Diploon cuspidatum, Ecclinusa ramiflora, Manilkara longifolia, M. salzmannii, Micropholis crassipedicellata, M. guyanensis, M. gardneriana, M. venulosa, Pouteria bangii, P. caimito, P. durlandii, P. gardneri, P. glauca, P. macahensis, P. reticulata, P. torta, P. sp1 e Pradosia lactescens, as quais representam 90,9% (20/22) das espécies utilizadas nesta análise (Figura 12 e Apêndices 7 a 11). As combinações matK/trnHpsbA e rbcL/trnH-psbA tiveram um menor sucesso na identificação das espécies de Sapotaceae em questão, com um desempenho de 63,6% (14/22) e 50% (11/22), respectivamente (Apêndices 12 a 15). A combinação formada pelas regiões matK/rbcL, a 33
qual foi recomendada pelo CBOL como DNA barcode em plantas teve o menor desempenho, com 45,5% (10/22) das espécies identificadas utilizando o algoritmo de neighbor-joining e 40,9% (9/22) das espécies identificadas utilizando a análise de máxima parcimônia (Apêndices 16 e 17). Nas combinações de três e quatro regiões, as médias da distância interespecífica variaram de 0,8% a 4,6% e intraespecífica de 0,05% a 0,2% (Tabela 6). Com relação ao intervalo na distribuição da variação inter e intraespecífica, também foi observada uma sobreposição entre as mesmas, mais acentuada na combinação das regiões matK/trnHpsbA/rbcL (Apêndice 33) e mais branda nas combinações de matK/trnH-psbA/ITS, matK/rbcL/ITS, rbcL/ITS/trnH-psbA e ITS/matK/rbcL/trnH-psbA (Apêndices 34 a 37).
Tabela 6: Distância inter e intraespecífica e sucesso na identificação da análise combinada das regiões ITS, matK, rbcL e trnH-psbA em espécies da família Sapotaceae. Combinação Distância interespecífica média (amplitude) Distância intraespecífica média (amplitude) Sucesso na identificação
ITS/matK/rb cL 3,8% (0,1 a 5,7%)
ITS/matK/tr nH-psbA 4,4% (0,2 a 6,7%)
ITS/rbcL/trn H-psbA 4,6% (0,2 a 6,6%)
matK/rbcL/trn H-psbA 0,8% (0 a 1,6%)
ITS/matK/rbcL /trnH-psbA 3,4% (0,2 a 5,1%)
0,2% (0 a 1,2%)
0,2% (0 a 1,3%)
0,2% (0 a 1,5%)
0,05% (0 a 0,2%)
0,2% (0 a 1%)
90,9%
90,9%
90,9%
63,6%
90,9%
A combinação das regiões matK/rbcL/trnH-psbA discriminou apenas 63,6% (14/22) das espécies de Sapotaceae em questão (Apêndices 18 e 19), enquanto as combinações de ITS/matK/rbcL, ITS/matK/trnH-psbA, ITS/rbcL/trnH-psbA e ITS/matK/rbcL/trnH-psbA tiveram uma boa resolução (90,9%) utilizando os dois métodos de inferência, identificando as espécies Chromolucuma apiculata, Chrysophyllum splendens, Diploon cuspidatum, Ecclinusa ramiflora, Manilkara longifolia, M. salzmannii, Micropholis crassipedicellata, M. guyanensis, M. gardneriana, M. venulosa, Pouteria bangii, P. caimito, P. durlandii, P. gardneri, P. glauca, P. macahensis, P. reticulata, P. torta, P. sp1 e Pradosia lactescens (Figura 13 e Apêndices 20 a 26).
34
Figura 12: Árvore de neighbor-joining baseada na análise combinada das regiões ITS e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde
à
distância
Kimura
35
2-parâmetros
(K2P).
Figura 13: Árvore de neighbor-joining baseada na análise combinada das regiões ITS, matK, rbcL e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).
36
5 DISCUSSÃO
O sucesso na discriminação de espécies vegetais utilizando as regiões propostas pelo CBOL para DNA barcode em plantas pode variar (HOLLINGSWORTH et al., 2009; NEWMASTER e RAGUPATHY, 2009; REN et al., 2010), e dependendo do táxon em questão, existe a necessidade de utilizar regiões adicionais para este fim (CBOL Plant working group, 2009). No presente estudo foi realizada a primeira análise comparativa de diferentes regiões para a identificação molecular de espécies da família Sapotaceae da Mata Atlântica, na qual a região ITS, apesar de apresentar um desempenho inferior ao das regiões matK e rbcL na obtenção de boas sequências, possui uma ótima resolução específica. Os dados da região ITS também auxiliaram na identificação de amostras dos gêneros Diploon, Ecclinusa, Manilkara, Micropholis e Pouteria, mostrando a utilidade dos dados moleculares como auxiliares à taxonomia. As características desejáveis para um DNA barcode envolvem a universalidade dos primers, sucesso no sequenciamento e discriminação específica (KRESS et al., 2005; CBOL Plant working group, 2009; HOLLINGSWORTH et al., 2011). Neste trabalho, todas as regiões apresentaram altas taxas de amplificação, com rbcL e trnH-psbA amplificando em 100% das amostras e as demais regiões obtendo um sucesso acima de 95%. De fato, as regiões rbcL e trnH-psbA apresentam um bom desempenho na amplificação de espécies vegetais (CBOL Plant working group, 2009, REN et al., 2010) enquanto alguns estudos relatam a dificuldade da amplificação das regiões ITS e matK (FAZEKAS et al., 2008; CBOL Plant working group, 2009, GONZALES et al., 2009). No entanto, as regiões ITS e matK são amplificadas com sucesso em alguns táxons (REN et al., 2010; GU et al., 2011) e um grande esforço vem sendo feito para o desenvolvimento de primers para a região matK que possibilite o seu uso em larga escala nos grupos vegetais em que a amplificação desta região é difícil (YU et al., 2011; LI et al., 2011). Quanto à obtenção de sequências, novamente a região rbcL se destacou, com 100% de sucesso. Este resultado corrobora o encontrado por Ren et al., (2010) e Gu et al., (2011). A região com o menor desempenho foi trnH-psbA, que obteve 88,6%. O sequenciamento desta região em Sapotaceae foi um tanto difícil. Acredita-se que tal dificuldade tenha ocorrido devido à presença de repetições mononucleotídicas, que acabam comprometendo as reações de sequenciamento. Devey et al., (2009) relataram a ocorrência dessas repetições em muitas 37
espécies e demonstram como a interferência desses microssatélites resulta na obtenção de sequências de baixa qualidade dessa região, exatamente como foi observado no presente trabalho. Contudo, experimentos têm apontado para a solução desse problema, como a utilização de DNA polimerases capazes de amplificar essa região evitando a produção de stutter (FAZEKAS et al., 2010), o que pode ser aplicado nas amostras de Sapotaceae que apresentaram esse tipo de problema. No total dos espécimes ora analisados, apenas em uma amostra houve falha no sequenciamento da região matK. Esta, entretanto, não apresentava um DNA de boa qualidade, a que se atribuiu a possível causa da falha. Para esta amostra, da espécie Pouteria bangii, apenas a região rbcL foi sequenciada, mostrando sucesso no sequenciamento mesmo quando o DNA em questão não apresentou a condição considerada ideal para este procedimento. Já para a região ITS, o sucesso no sequenciamento foi de 92,7%. Resultado semelhante foi obtido por Parveen et al., (2012) em espécies do gênero Paphiopedilum, onde a região teve um desempenho no sequenciamento inferior em relação aos obtidos com as regiões matK e rbcL, mas ainda assim alcançando valores satisfatórios. Sequências de baixa qualidade requerem a edição manual para a obtenção dos contigs, o que demanda muito tempo e vai de encontro a uma das características desejadas para um DNA barcode, que é a obtenção dos dados de forma rápida, o que não ocorre quando as regiões em questão não apresentam boa qualidade de sequências. Nesse sentido, as regiões rbcL e matK tiveram os melhores resultados, necessitando de pouca intervenção manual, seguido da região ITS, que apresentou problemas em algumas amostras, e da região trnHpsbA, a qual demandou grande tempo para a obtenção dos contigs para muitas espécies de Sapotaceae. De fato, o baixo desempenho da região trnH-psbA na obtenção de contigs é conhecido, e Fazekas et al., (2008) precisaram sequenciar novamente algumas amostras para a obtenção dos contigs para esta região, enquanto o CBOL Plant working group (2009), relatam o baixo desempenho no sequenciamento desta região, que ficou abaixo dos 50%. A principal característica desejada para um DNA barcode é o sucesso na discriminação de espécies. Nesse sentido, a região ITS se destacou, com uma resolução específica de 91,3%, além de apresentar uma distância interespecífica média de 12%, 30 vezes maior do que a divergência média intraespecífica observada para esta região que foi de 0,4%. Em seguida vieram as regiões matK, trnH-psbA e por último a região rbcL, que tiveram uma performance bem abaixo do observado para a região ITS. Nossos resultados corroboram com os obtidos por Yan et al. (2011) em espécies de Primula, Zhang et al. (2012) em espécies de Lysimachia, 38
Ren et al. (2010) em espécies de Alnus, Guo et al., (2011) em espécies de Hedyotis, Du et al., (2011) em espécies da família Potamogetonaceae, entre outros, onde a região ITS apresentou boas taxas de discriminação de espécies. Por exemplo, Liu et al., (2010) obtiveram uma resolução específica de 100% em espécies do gênero Taxus, demonstrando que em alguns casos esta região sozinha é suficiente para a identificação molecular de espécies vegetais. Apenas duas espécies, Manilkara maxima e M. multifida, não foram separadas utilizando os dados da região ITS, a partir de uma abordagem filogenética. Este resultado sugere uma divergência recente entre estas duas espécies além da retenção de polimorfismo ancestral para a região ITS das populações que as originaram. Associado a isto, baixas taxas de divergência podem ser observadas em alguns grupos de espécies arbóreas, devido à longa geração das mesmas que resulta em menores taxas de mutação, o que dificulta a utilização desta abordagem nesses casos (HOLLINGSWORTH et al., 2011). A análise combinada das regiões não aumentou a porcentagem de espécies identificadas, quando comparada ao desempenho apenas da região ITS analisada isoladamente. A combinação proposta pelo CBOL (matK e rbcL) identificou apenas 45,5% das espécies utilizando o algoritmo de neighbor-joining e 40,9% das espécies utilizando a análise de máxima parcimônia, ficando bem abaixo das combinações que envolviam a região ITS. Em muitos casos, a utilização de duas ou três regiões possibilita a discriminação de um número maior de espécies (CHASE et al., 2007; FAZEKAS et al., 2008; CBOL Plant working group 2009). Contudo, Muellner et al., (2009) reportam a diminuição nas taxas de discriminação em espécies da família Meliaceae quando análises combinadas são realizadas, onde nesta família a região ITS sozinha também mostrou os melhores resultados na identificação de espécies. Uma atenção espécial deve ser dada as amostras identificadas como Pouteria reticulata, que pela divergência apresentada entre estas com base na região ITS, pode se tratar de um complexo de espécies. Para as amostras identificadas como Chromolucuma apiculata e Pouteria gardneri, a análise com base na região ITS sugere que estas possam pertencer a um mesmo gênero, devido à baixa divergência apresentada entre estes exemplares, de 0,5%, inferior ao observado para as comparações entre os demais gêneros que apresentaram divergências superiores a 8%. A utilização da região ITS para a identificação molecular de espécies de Sapotaceae cria novas perspectivas para estudos envolvendo espécies desta família, haja vista que a 39
identificação a partir de material estéril é um tanto laborioso para muitas espécies e em alguns casos até mesmo impossível. Devido ao grande número de espécies desta família que ainda não são conhecidas pela ciência (JOPPA et al. 2010), esta técnica também pode auxiliar na triagem inicial de possíveis espécies novas para posterior descrição por especialista, bem como auxiliar na resolução de problemas taxonômicos da família.
40
6 CONCLUSÕES
As regiões recomendadas pelo CBOL, matK e rbcL, para DNA barcode em plantas tiveram bons resultados nos quesitos universalidade e na obtenção das sequências, porém tiveram um desempenho baixo, seja individual ou de forma combinada, na discriminação de espécies arbóreas da família Sapotaceae da Mata Atlântica.
A região trnH-psbA, uma das regiões consideradas suplementares em estudos de DNA barcodes, mostrou um bom resultado nas amplificações, mas não teve um bom desempenho na discriminação de espécies e na obtenção de sequências.
A região ITS, considerada um barcode suplementar, teve o melhor desempenho na identificação de espécies, exibiu um bom resultado no quesito amplificação, e um desempenho razoável na obtenção das sequências.
As análises combinadas não apresentaram resultados superiores ao da região ITS analisada individualmente.
É necessário o uso de uma abordagem molecular, em conjunto com os métodos tradicionais de identificação, para um maior sucesso na identificação de espécies de Sapotaceae, principalmente nos casos em que apenas material estéril esteja disponível.
Baseado nos resultados obtidos no presente estudo, recomendamos a utilização da região ITS para a identificação molecular de espécies arbóreas de Sapotaceae da Mata Atlântica, sem a necessidade de coleta de dados das regiões rbcL, matK e trnH-psbA, o que implicará em um menor gasto de tempo e de recursos financeiros destinados para este fim.
41
7 REFERÊNCIAS
ÁLVAREZ, I.; WENDEL, J. F. Ribosomal ITS sequences and plant phylogenetic inference. Molecular Phylogenetics and Evolution, v. 29, 417-434, 2003. ANDERBERG, A.A., RYDIN, C., KALLERSJO, M. Phylogenetic relationships in the order Ericales S.L. analyses of molecular data from five genes from the plastid and mitochondrial genomes. American Journal of Botany,v. 89, 677-687, 2002. ANDRADE,M. J. G.; GIULIETTI, A. M.; RAPINI, A.; QUEIROZ, L. P.; CONCEIÇÃO, A. S.; ALMEIDA, P. R. M.; van den BERG, C. A comprehensive phylogenetic analysis of Eriocaulaceae: Evidence from nuclear (ITS) and plastid (psbA-trnH and trnL-F) DNA sequences. Taxon, v. 59, n. 2, 379-388, 2010. ARMSTRONG, K. Systematics and biogeography of the pantropical genus Manilkara Adans. (Sapotaceae). 2010. 244 f. Tese (Doctor of Philosophy) - Instituto de Biologia Evolutiva da Universidade de Edinburgo, Edinburgo, 2010. AUBRÉVILLE, A. Les Sapotacées: taxonomie et phytogéographie. Adansonia, v. 1, 1-157, 1964. BAEHNI, C. Mémoires sur les Sapotacées 3. Inventaire des Genres. Boissiera, v. 11, 1-262, 1965. BALDWIN, B. G.; SANDERSON, M. J.; PORTER, J. M.; WOJCIECHOWSKI, M. F.; CAMPBELL, C. S.; DONOGHUE, M. J. The ITS region of nuclear ribosomal DNA: A valuable source of evidence on angiosperm phylogeny. Annals of the Missouri Botanical Garden,v. 82, 247-277, 1995. BARTISH, I. V.; SWENSON, U.; MUNZINGER, J.; ANDERBERG, A. A. Phylogenetic relationships among New Caledonian Sapotaceae (Ericales): molecular evidence for generic polyphyly and repeated dispersal. American Journal of Botany. v. 92, 667-673, 2005. BOLD SYSTEMS V3.0, 2011. Disponível em:. Acesso em: 03 de janeiro de 2012. CARNAVAL, A. C.; HICKERSON, M. J.; HADDAD, C. F. B.; RODRIGUES, M. T.; MORITZ, C. Stability Predicts Genetic Diversity in the Brazilian Atlantic Forest Hotspot. Science, v. 323, 785-789, 2009. CARNAVAL, A. C.; MORITZ, C. Historical climate modelling predicts patterns of current biodiversity in the Brazilian Atlantic forest. Journal of Biogeography, v. 35, 1187-1201, 2008.
42
CARNEIRO, C. E.; ALMEIDA JR, E. B.; ZICKEL, C. S.; RODRIGUES, W. A. Sapotaceae. In: GIULIETTI, A. M. et al. (Org.). Plantas Raras do Brasil. Belo Horizonte, MG: Conservação Internacional, 2009. CBOL PLANT WORKING GROUP. A DNA barcode for land plants. Proceedings of the National Academy of Sciences, USA,v. 106, n. 31, 12794-12797, 2009. CHASE, M. W.; COWAN, R. S.; HOLLINGSWORTH, P. M.; van den BERG, C.; MADRINAN, S. et al. A proposal for a standardised protocol to barcode all land plants. Taxon, v. 56, 295-299, 2007. CHASE, M. W.; SALAMIN, N.; WILKINSON, M.; DUNWELL, J. M.; KESANAKURTHI, R. P. et al. Land plants and DNA barcodes: short-term and long-term goals. Proceedings of the Royal Society of London B, v. 360, 1889-1895, 2005. CHASE, M. W.; SOLTIS, D. E.; OLMSTEAD, R. G.; MORGAN, D. et al. Phylogenetics of seed plants: an analysis of nucleotide sequences from the plastid gene rbcL. Annals of the Missouri Botanical Garden, v. 80, 528-580, 1993. CHEN, S.; YAO, H.; HAN, J.; LIU, C.; SONG, J. et al. Validation of the ITS2 region as a novel DNA barcode for identifying medicinal plant species. Public Library of Science ONE, v. 5, n. 1, 2010. CHINA PLANT BOL GROUP et al. Comparative analysis of a large dataset indicates that internal transcribed spacer (ITS) should be incorporated into the core barcode for seed plants. Proceedings of the National Academy of Sciences, USA, v. 108, n. 49, 19641-19646, 2011. CLEGG, M. T.; GAUT, B. S.; LEARN, G. H.; MORTON, B. R. Rates and patterns of chloroplast DNA evolution. Proceedings of the National Academy of Sciences, USA, v. 91, 6795-6801, 1994. DENDUANGBORIPANT, J.; CRONK, Q. C. B. High intraindividual variation in internal transcribed spacer sequences in Aeschynanthus (Gesneriaceae): implications for phylogenetics. Proceedings of the Royal Society of London B, v. 267, 1407-1415, 2000. DEVEY, D. S.; CHASE, M. W.; CLARKSON, J. J. A stuttering start to plant DNA barcoding: microsatellites present a previously overlooked problem in non-coding plastid regions. Taxon, v. 58, n. 1, 7-15, 2009. DOYLE, J. J.; DOYLE, J. L. A rapid DNA isolation procedure for small amounts of fresh leaf tissue. Phytochemistry Bulletin of the Botanical Society of America, v. 19, 11-15, 1987. DU, Z. Y.; QIMIKE, A.; YANG, C. F.; CHEN, J. M.; WANG, Q. F. Testing four barcoding markers for species identification of Potamogetonaceae. Journal of Systematics and Evolution, v. 49, n. 3, 246-251, 2011. 43
FAZEKAS, A. J.; BURGESS, K. S.; KESANAKURTI, P. R.; GRAHAM, S. W.; NEWMASTER, S. G., HUSBAND, B. C. et al. Multiple multilocus DNA barcodes from the plastid genome discriminate plant species equally well. Public Library of Science ONE, v. 3, n. 7, 2008. FAZEKAS, A. J.; STEEVES, R.; NEWMASTER, S. G. Improving sequencing quality from PCR products containing long mononucleotide repeats. BioTechniques, v. 48, n. 4, 2010. FELINER, G. N.; ROSSELLÓ, J. A. Better the devil you know? Guidelines for insightful utilization of nrDNA ITS in species-level evolutionary studies in plants. Molecular Phylogenetics and Evolution, v. 44, 911-919, 2007. FELSENSTEIN J. Confidence limits on phylogenies: an approach using the bootstrap. Evolution, v. 39, 783-791, 1985. FOOTTIT, R. G.; MAW, H. E. L.; HAVILL, N. P.; AHERN, R . G.; MONTGOMERY, M. E. DNA barcodes to identify species and explore diversity in the Adelgidae (Insecta: Hemiptera: Aphidoidea). Molecular Ecology Resources, v. 9, supl. 1, 188-195, 2009. FORD, C. S.; AYRES, K. L.; HAIDER, N.; TOOMEY, N.; van-ALPEN-STOHL, J. et al. Selection of candidate DNA barcoding regions for use on land plants. Botanical Journal of the Linnean Society, v. 159, 1-11, 2009. FORZZA, R. C.; BAUMGRATZ, J. F. A.; BICUDO, C. E. M. et al. Síntese da Diversidade Brasileira. In: FORZZA, R. C. et al. (Org.). Catálogo de plantas e fungos do Brasil, v. 1. Rio de Janeiro: Andrea Jakobsson Estúdio, Instituto de Pesquisas Jardim Botânico do Rio de Janeiro, 2010. FU, Y. M.; JIANG, W. M.; FU, C. X. Identification of species within Tetrastigma (Miq.) Planch. (Vitaceae) based on DNA barcoding techniques. Journal of Systematics and Evolution, v. 49, n. 3, 237-245, 2011. GALINDO-LEAL, C.; CÂMARA, I. G. Atlantic Forest hotspot status: an overview. In: Galindo-Leal, C.; CÂMARA, I. G. (Org.). The Atlantic Forest of South America: biodiversity status, threats, and outlook. Washington: Center for Applied Biodiversity Science at Conservation International, 2003. GAO, T.; YAO, H.; SONG, J.; LIU, C.; ZHU, Y.; MA, X.; PANG, X.; XU, H.; CHEN, S. Identification of medicinal plants in the family Fabaceae using a potential DNA barcode ITS2. Journal of Ethnopharmacology, v. 130, 116-121, 2010. GAO, T.; YAO, H.; SONG, J. ZHU, Y.; LIU, C. CHEN, S. Evaluating the feasibility of using candidate DNA barcodes in discriminating species of the large Asteraceae family. BMC Evolutionary Biology, v. 10, 324, 2010. 44
GONZALEZ, M. A.; BARALOTO, C.; ENGEL, J.; MORI, S. A.; PÉTRONELLI, P.; RIÉRA, B. et al. Identification of Amazonian trees with DNA barcodes. Public Library of Science ONE, v. 4, n. 10, 2009. GROOT, G. A.; DURING, H. J.; MAAS, J. W.; SCHNEIDER, H.; VOGEL, J. C.; ERKENS, R. H. J. Use of rbcL and trnL-F as a Two-Locus DNA Barcode for Identification of NWEuropean Ferns: An Ecological Perspective. Public Library of Science ONE, v. 6, n. 1, 2011. GU, J.; SU, J. X.; LIN, R. Z.; LI, R. Q.; XIAO, P. G. Testing four proposed barcoding markers for the identification of species within Ligustrum L. (Oleaceae). Journal of Systematics and Evolution, v. 49, n. 3, 213-224, 2011. GUEDES-BRUNI, R. R.; NETO, J. S.; MORIM, M. P.; MANTOVANI, W. Composição florística e estrutura de trecho de floresta ombrófila densa atlântica aluvial na reserva biológica de Poço das Antas, Silva Jardim, Rio de Janeiro, Brasil. Rodriguésia, v. 57, 3, 413428. 2006. GUO, X.; SIMMONS, M. P.; BUT, P. P-H.; SHAW, P-C.; WANG, R-J. Application of DNA barcodes in Hedyotis L. (Spermacoceae, Rubiaceae). Journal of Systematics and Evolution, v. 49, n. 3, 203-212, 2011. HALL, T. A. BioEdit: a user-friendly biological sequence alignment editor and analysis program for Windows 95/98/NT. Nucleic Acids Symposium Series,v. 41, 95-98, 1999. HEBERT, P. D. N.; CYWINSKA, A.; BALL, S. L.; WAARD, J. R. Biological identifications through DNA barcodes. Proceedings of the Royal Society of London B, v. 270, 313-321, 2003. HEBERT, P. D. N; GREGORY, T. R. The Promise of DNA Barcoding for Taxonomy. Systematic Biology,v. 54, n. 5, 852-859, 2005. HEBERT, P. D. N.; PENTON, E. H.; BURNS, J. M.; JANZEN, D. H.; HALLWACHS, W. Ten species in one: DNA barcoding reveals cryptic species in the neotropical skipper butterfly Astraptes fulgerator. Proceedings of the National Academy of Sciences, USA, v. 101, n. 41, 14812-14817, 2004. HEBERT, P. D. N.; RATNASINGHAM, S.; WAARD, J. R. Barcoding animal life: cytochrome c oxidase subunit 1 divergences among closely related species. Proceedings of the Royal Society of London B,v. 270, 96-99, 2003. HILU, K. W.; BORSCH, T.; MÜLLER, K.; SOLTIS, D. E.; SOLTIS, P. S. et al. Angiosperm phylogeny based on matK sequence information. American Journal of Botany, v. 90, n. 12, 1758-1776, 2003. 45
HILU, K. W.; LIANG, H. The matK gene: sequence variation and application in plant systematics. American Journal of Botany, v. 84, n. 6, 830-839, 1997. HOLLINGSWORTH, M. L.; CLARK, A. A.; FORREST, L. L.; RICHARDSON, J.; PENNINGTON, R. T. et al. Selecting barcoding loci for plants: evaluation of seven candidate loci with species-level sampling in three divergent groups of land plants. Molecular Ecology Resources, v. 9, 439-457, 2009. HOLLINGSWORTH, P. M.; GRAHAM, S. W. LITTLE, D. P. Choosing and Using a Plant DNA Barcode. Public Library of Science ONE, v. 6, n. 5, 2011. HOPKINS, M. J. G. Flora da reserva Ducke, Amazonas, Brasil. Rodriguésia, v. 56, n. 86, 925, 2005. JOHNSON L. A.; SOLTIS, D. E. Phylogenetic inference in Saxifragaceae Sensu Stricto and Gilia (Polemoniaceae) using matK sequences. Annals of the Missouri Botanic Garden, v. 82, 149-175, 1995. JOPPA, L. N.; ROBERTS, D. L.; PIMM, S. L. How many species of flowering plants are there? Proceedings of the Royal Society of London B, v. 278, 554-559, 2010. JUDD, W. S.; CAMPBELL, C. S.; KELLOGG, E. A.; STEVENS, P. F.; DONOGHUE, M. J. Plant systematics: a phylogenetic approach. 3º ed. Sunderland: Sinauer Associates, 2008. KIMURA, M. A simple method for estimating evolutionary rate of base substitutions through comparative studies of nucleotide sequences. Journal of Molecular Evolution, v. 15, 111120, 1980. KRESS W. J.; ERICKSON, D. L. A two-locus global DNA barcode for land plants: The coding rbcL gene complements the non-coding trnH-psbA spacer region. Public Library of Science ONE, v. 2, n. 6, 2007. KRESS, J. W.; WURDACK, K. J.; ZIMMER, E. A.; WEIGT, L. A.; JANZEN, D. H. Use of DNA barcodes to identify flowering plants. Proceedings of the National Academy of Sciences, USA, v. 102, 8369-8374, 2005. LAHAYE, R.; VAN DER BANK, M.; BOGARIN, D.; WARNER, J.; PUPULIN, F. et al. DNA barcoding the floras of biodiversity hotspots. Proceedings of the National Academy of Sciences, USA, v. 105, 2923-2928, 2008. LEWINSOHN, T. M.; PRADO, P. I. Quantas espécies há no Brasil? Megadiversidade, v. 1, n. 1, 2005. LI, Y.; GAO, L. M.; POUDEL, R. C.; LI, D. Z.; FORREST, A. High universality of matK primers for barcoding gymnosperms. Journal of Systematics and Evolution, v. 49, n. 3, 169-175, 2011. 46
LINDER, C. R.; MOORE, L. A.; JACKSON, R. B. A universal molecular method for identifying underground plant parts to species. Molecular Ecology, v. 9, 1549-1559, 2000. LIPSCOMB, D.; PLATNICK, N.; WHEELER, Q. The intellectual content of taxonomy: a comment on DNA taxonomy. Trends in Ecology and Evolution, v. 18, n. 2, 65-66, 2003. LIU, J.; MÖLLER, M.; GAO L. M.; ZHANG, D. Q.; LI D. Z. DNA barcoding for the discrimination of Eurasian yews (Taxus L., Taxaceae) and the discovery of cryptic species. Molecular Ecology Resources, v. 11, 89-100, 2010. LORENZI, H; BACHER, L.; LACERDA, M.; SARTORI, S. Frutas brasileiras e exóticas cultivadas. Nova Odessa, SP: Instituto Plantarum, 2006. MARIANO-NETO, E. Efeitos da fragmentação sobre comunidades arbustivo-arbóreas em Mata Atlântica, Una BA. 2004. 221 f. Tese (Doutorado em Ciências - Ecologia) Instituto de Biociências da Universidade de São Paulo, São Paulo, 2004. MARTINI, A. M. Z.; FIASCHI, P.; AMORIM, A. M.; PAIXÃO, J. L. A hot-point within a hot-spot: a high diversity site in Brazils Atlantic Forest. Biodiversity and Conservation,v. 16, 3111-3128, 2007. MONTEIRO, S. H. N.; SELBACH-SCHNADELBACH, A.; OLIVEIRA, R. P.; van den BERG, C. Molecular phylogenetics of Galeandra (Orchidaceae: Catasetinae) based on plastid and nuclear DNA sequences. Systematic Botany, v. 35, n. 3, 476-486, 2010. MORA, C.; TITTENSOR, D. P.; ADL, S.; SIMPSON, A. G. B.; WORM, B. How many species are there on earth and in the ocean? Public Library of Science Biology, v. 9, n. 8, 2011. MORI, S. A.; BOOM, B. M; CARVALHO, A. M. V.; SANTOS, T. S. Ecological importance of Myrtaceae in a eastern Brazilian wet forest. Biotropica,v. 15, 68-70, 1983. MORT, M. E.; CRAWFORD, D. J.; ARCHIBALD, J. K.; O’LEARY, T. R.; SANTOSGUERRA, A. Plant DNA barcoding: A test using Macaronesian taxa of Tolpis (Asteraceae). Taxon, v. 59, n. 2, 581-587, 2010. MUELLNER, A. N.; SCHAEFER, H.; LAHAYE, R. Evaluation of candidate DNA barcoding loci for economically important timber species of the mahogany family (Meliaceae). Molecular Ecology Resources, v. 11, 450-460, 2011. MYERS, N.; MITTERMEIER, R. A.; MITTERMEIER, C. G.; da FONSECA, G. A. B.; KENT, J. Biodiversity hotspots for conservation priorities. Nature,v. 403, 853-858, 2000. NEUHAUS, H.; LINK, G. The chloroplast tRNALys (UUU) gene from mustard (Sinapsis alba) contains a class II intron potentially coding for a maturase related polypeptide. Current Genetics, v. 11, 251-257, 1987.
47
NEVES, M. L. C. Caracterização da vegetação de um trecho de Mata Atlântica de encosta na Serra da Jibóia, Bahia. 2005. 116 f. Dissertação (Mestrado em Botânica) Universidade Estadual de Feira de Santana, Feira de Santana, 2005. NEWMASTER, S. G.; FAZEKAS, A. J.; RAGUPATHY, S. DNA barcoding in land plants: evaluation of rbcL in a multigene tiered approach. Canadian Journal of Botany-Revue Canadienne de Botanique, v. 84, 335-341, 2006. NEWMASTER, S. G.; RAGUPATHY, S. Testing plant barcoding in a sister species complex of pantropical Acacia (Mimosoideae, Fabaceae). Molecular Ecology Resources, v. 9, supl. 1, 172-180, 2009. NICOLALDE-MOREJÓN, F.; VERGARA-SILVA, F.; GONZÁLEZ-ASTORGA, J.; STEVENSON, D. W. Character-based, population-level DNA barcoding in Mexican species of Zamia L. (Zamiaceae: Cycadales). Mitochondrial DNA, v. 21, 51-59, 2010. OLIVEIRA, L.C.; HANKERSON, S. J.; DIETZ, J. M.; RABOY, B. E. Key tree species for the golden-headed lion tamarin and implications for shade-cocoa management in southern Bahia, Brazil. Animal Conservation, v. 13, 60-70, 2010. PARVEEN, I.; SINGH, H. H.; RAGHUVANSHI, S.; PRADHAN, U. C.; BABBAR, S. B. DNA barcoding of endangered Indian Paphiopedilum species. Molecular Ecology Resources, v. 12, 82-90, 2012. PENNINGTON, T. D. Flora Neotropica, monographyes n°52 (Sapotaceae). New York: New York Botanical Garden Press, 1990. PENNINGTON, T. D. The genera of Sapotaceae. Kew: Royal Botanic Gardens, 1991. PIMM, S. L.; RUSSEL, G. L.; GITTLEMAN, J. L.; BROOKS, T. M. The future of biodiversity. Science,v. 269, 347-350, 1995. PRESTING, G. G. Identification of conserved regions in the plastid genome: implications for DNA barcoding and biological function. Canadian Journal of Botany-Revue Canadienne de Botanique, v. 84, 1434-1443, 2006. RAMBAUT, A. FigTree v1.2.3. Program distributed by the author, 2009. RATNASINGHAM, S.; HEBERT, P. D. N. BOLD: The Barcode of Life Data System. Molecular Ecology Notes, v. 7, 355-364, 2007. REN, B. Q.; XIANG, X. G.; CHEN, Z. D. Species identification of Alnus (Betulaceae) using nrDNA and cpDNA genetic markers. Molecular Ecology Resources, v. 10, 594-605, 2010. RYDIN, C.; PEDERSEN, K. R.; FRIIS, E.M. On the evolutionary history of Ephedra: Cretaceous fossils and extant molecules. Proceedings of the National Academy of Sciences, USA, v. 101, 16571-16576, 2004. 48
SAITOU, N.; NEI, M. The neighbor-joining method: a new method for reconstructing evolutionary trees. Molecular Biology and Evolution, v. 4, 406-425, 1987. SANG, T.; CRAWFORD, D. J.; STUESSY, T. F. Chloroplast phylogeny, reticulate evolution, and biogeography of Paeonia (Paeoniaceae). American Journal of Botany, v. 84, 1120-1136, 1997. SASLIS-LAGOUDAKIS, C.; CHASE, M. W.; ROBINSON, D. N.; RUSSELL, S. J.;4 KLITGAARD, B. B. Phylogenetics of neotropical Platymiscium (Peguminosae: Dalbergieae): systematics, divergence times, and biogeography inferred from nuclear ribosomal and plastid DNA sequence data. American Journal of Botany, v. 95, n. 10, 1270-1286, 2008. SASS, C.; LITTLE, D. P.; STEVENSON, D. W.; SPECHT, C. D. DNA barcoding in the Cycadales: Testing the potential of proposed barcoding markers for species identification of cycads. Public Library of Science ONE, v. 2, n. 11, 2007. SCHNEIDER, H.; SCHUETTPELZ, E. Identifying fern gametophytes using DNA sequences. Molecular Ecology Notes, v. 6, 989-991, 2006. SHAW, J.; LICKEY, E. B.; BECK, J. T.; FARMER, S. B. LIU, W. et al. The tortoise and the hare II: relative utility of 21 noncoding chloroplast DNA sequences for phylogenetic analysis. American Journal of Botany, v. 92, n. 1, 142-166, 2005. SHI, L. C.; ZHANG, J.; HAN, J. P.; SONG, J. Y. et al. Testing the potential of proposed DNA barcodes for species identification of Zingiberaceae. Journal of Systematics and Evolution, v. 49, n. 3, 261-266, 2011. SILVA, F. C. Composição florística e estrutura fitossociológica da floresta tropical ombrófila da encosta atlântica no município de MORRETES (Paraná). Boletim de Pesquisa Florestal,Colombo, n. 18/19, 1989. SILVA, J. M. C.; CASTELETI, C. H. M. Estado da biodiversidade da Mata Atlântica brasileira. In: Galindo-Leal, C.; CÂMARA, I. G. (Org.). The Atlantic Forest of South America: biodiversity status, threats, and outlook. Washington: Center for Applied Biodiversity Science at Conservation International, 2003. SIMMONS, M. P.; CAPPA, J. J.; ARCHER, R. H.; FORD, A. J.; EICHSTEDT, D.; CLEVINGER, C. C. Phylogeny of the Celastreae (Celastraceae) and the relationships of Catha edulis (qat) inferred from morphological characters and nuclear and plastid genes. Molecular Phylogenetics and Evolution, v. 48, 745-757, 2008. STADEN, R.; BEAL, K.; BONFIELD, J. K. The Staden package. In: Misener, S., Krawets, S. A. (ed.), Computer Methods in Molecular Biology 132, Bioinformatics Methods and Protocols. Totowa: Humana Press, 115-130, 1998.
49
SWEENEY, B. W.; BATTLE, J. M.; JACKSON, J. K. Can DNA barcodes of stream macroinvertebrates improve descriptions of community structure and water quality? Journal of the North American Benthological Society, v. 30, n. 1, 195-216, 2011. SWENSON, U.; ANDERBERG, A. A. Phylogeny, character evolution, and classification of Sapotaceae (Ericales). Cladistics, v. 21, 101-130, 2005. SWENSON, U.; RICHARDSON, J. E.; BARTISH, I. V. Multi-gene phylogeny of the pantropical subfamily Chrysophylloideae (Sapotaceae): evidence of generic polyphyly and extensive morphological homoplasy. Cladistics,v. 24, 1006-1031, 2008. SWOFFORD, D. L. PAUP*:Phylogenetic Analysis using Parsimony (* and other methods), ver. 4.0b10. Sinauer, Sunderland, Massachusetts, 2003. TABERLET, P.; COISSAC, E.; POMPANON, F.; GIELLY, L.; MIQUEL, C. et al. Power and limitations of the chloroplast trnL (UAA) intron for plant DNA barcoding. Nucleic Acids Research, v. 35, n. 3, 2007. TAMURA, K.; PETERSON, D.; PETERSON, N.; STECHER, G.; NEI, M.; KUMAR, S. MEGA5: Molecular Evolutionary Genetics Analysis using Maximum Likelihood, Evolutionary Distance, and Maximum Parsimony Methods. Molecular Biology and Evolution, v. 28, n. 10, 2731-2739, 2011. TATE, J. A.; SIMPSON, B. B. Paraphyly of Tarasa philippi (Malvaceae) and diverse origins of the polyploid species. Systematic Botany, v. 28, 723-737, 2003. THOMAS, W. W., CARVALHO, A. M. V., AMORIM, A. M., GARRISON, J.; ARBELÁEZ, A. L. Plant endemism in two forests in southern Bahia, Brazil. Biodiversity and Conservation, v. 7, n. 3, 311-322, 1998. THOMAS, W. W.; JARDIM, J. G.; FIASCHI, P.; MARIANO-NETO, E.; AMORIM, A. M. Composição florística e estrutura do componente arbóreo de uma área transicional de Floresta Atlântica no sul da Bahia, Brasil. Revista Brasileira de Botânica, v.32, n. 1, 65-78, 2009. THOMPSON J. D.; HIGGINS, D. G.; GIBSON, T. J. CLUSTALW: improving the sensitivity of progressive multiple alignment through sequence weighing, position specific gap penalties and weight matrix choice. Nucleic Acids Research, v. 22, 4673-4680, 1994. TIAN, B.; LIU, R.; WANG, L.; QIU, Q.; CHEN, K. LIU, J. Phylogeographic analyses suggest that a deciduous species (Ostryopsis davidiana Decne., Betulaceae) survived in northern China during the Last Glacial Maximum. Journal of Biogeography, v. 36, 21482155, 2009. TUBARO, P. L.; ASTARLOA, J. M. D. ¿Qué bicho es? Ciencia Hoy, v. 18, n. 106, 2008. URBANETZ, C.; TAMASHIRO, J. Y.; KINOSHITA, L. S. Floristic composition and similarity analysis of an Atlantic rain forest fragment in Cananéia, São Paulo State, Brazil. Revista Brasileira de Botânica, v.33, n. 4, 639-651, 2010. 50
VALENTINI, A.; MIQUEL, C.; TABERLET, P. DNA Barcoding for Honey Biodiversity. Diversity, v. 2, 610-617, 2010. VALENTINI, A.; POMPANON, F.; TABERLET, P. DNA barcoding for ecologists. Trends in Ecology and Evolution, v. 24, n. 2, 2008. VAN DE WIEL, C. C. M.; VAN DER SCHOOT, J.; VAN VALKENBURG, J . L. C . H.; DUISTERMAAT, H.; SMULDERS, M. J. M. DNA barcoding discriminates the noxious invasive plant species, floating pennywort (Hydrocotyle ranunculoides L.f.), from noninvasive relatives. Molecular Ecology Resources, v. 9, 1086-1091, 2009. WHITE, T. J.; BRUNS, T.; LEE, S.; TAYLOR, J. W. Amplification and direct sequencing of fungal ribosomal RNA genes for phylogenetics. p. 315-322 In: PCR Protocols: A Guide to Methods and Applications, eds. INNIS, M. A.; GELFAND, D. H.; SNINSKY, J. J.; WHITE, T. J. New York: Academic Press, Inc., 1990. WHITLOCK, B. A.; HALE, A. M.; GROFF, P. A. Intraspecific inversions pose a challenge for the trnH-psbA plant DNA barcode. Public Library of Science ONE, v. 5, n. 7, 2010. WITT, J. D. S.; THRELOFF, D. L.; HEBERT, P. D. N. DNA barcoding reveals extraordinary cryptic diversity in an amphipod genus: implications for desert spring conservation. Molecular Ecology, v. 15, 3073-3082, 2006. WONG, E. H. K.; HANNER, R. H. DNA barcoding detects market substitution in North American seafood. Food Research International, v. 41, 828-837, 2008. XIANG, X. G.; ZHANG, J. B.; LU, A. M.; LI, R. Q. Molecular identification of species in Juglandaceae: A tiered method. Journal of Systematics and Evolution, v. 49, n. 3, 252-260, 2011. YAN, H-F.; HAO, G.; HU, C-M.; GE, X-J. DNA barcoding in closely related species: A case study of Primula L. sect. Proliferae Pax (Primulaceae) in China. Journal of Systematics and Evolution, v. 49, n. 3, 225–236, 2011. YAO, H.; SONG, J.; LIU, C.; LUO, K.; HAN, J.; LI, Y. et al. Use of ITS2 region as the universal DNA barcode for plants and animals. Public Library of Science ONE, v. 5, n. 10, 2010. YU, J.; XUE, J. H.; ZHOU, S. L. New universal matK primers for DNA barcoding angiosperms. Journal of Systematics and Evolution, v. 49, n. 3, 176-181, 2011. ZHANG, C-Y; WANG, F-Y.; YAN, H-F.; HAO, G.; HU, C-M.; GE, X-J. Testing DNA barcoding in closely related groups of Lysimachia L. (Myrsinaceae). Molecular Ecology Resources, v. 12, 98–108, 2012.
51
APÊNDICES
52
Apêndice 1: Exemplares testemunhos sequenciados para a identificação molecular de espécies de Sapotaceae. Espécie Chromolucuma apiculata AlvesAraújo & M. Alves Chrysophyllum gonocarpum (Mart. &Eich.) Engl. Chrysophyllum splendens Spreng.
Voucher
Localidade
Vivas, C. V. 160
Reserva Biológica de Una - Una
Vivas, C. V. 211 Vivas, C. V. 003
Parque Municipal da Boa Esperança - Ilhéus Reserva Biológica de Una - Una Parque Estadual da Serra do Conduru Uruçuca RPPN Estação Veracel – Porto Seguro RPPN Capitão - Itacaré Reserva Ecológica da Michelin - Igrapiúna Reserva Ecológica da Michelin - Igrapiúna Parque Municipal da Boa Esperança - Ilhéus RPPN Estação Veracel – Porto Seguro RPPN Capitão - Itacaré RPPN Estação Veracel – Porto Seguro RPPN Capitão - Itacaré Reserva Ecológica da Michelin - Igrapiúna Reserva Biológica de Una - Una Parque Estadual da Serra do Conduru Uruçuca Reserva Biológica de Una - Una RPPN Capitão - Itacaré Parque Estadual da Serra do Conduru Uruçuca RPPN Capitão - Itacaré Estrada Olivença/Vila Brasil - Ilhéus Reserva Biológica de Una - Una Parque Estadual da Serra do Conduru Uruçuca RPPN Estação Veracel – Porto Seguro Reserva Biológica de Una - Una Reserva Ecológica da Michelin - Igrapiúna
Chrysophyllum splendens Spreng. Chrysophyllum splendens Spreng. Chrysophyllum splendens Spreng. Chrysophyllum splendens Spreng. Diploon cuspidatum (Hoehne) Cronq. Diploon cuspidatum (Hoehne) Cronq. Diploon cuspidatum (Hoehne) Cronq. Diploon cuspidatum (Hoehne) Cronq. Ecclinusa ramiflora Mart. Ecclinusa ramiflora Mart. Ecclinusa ramiflora Mart. Ecclinusa ramiflora Mart.
Vivas, C. V. 109 Vivas, C. V. 143 Vivas, C. V. 161 Vivas, C. V. 190 Vivas, C. V. 180 Vivas, C. V. 207 Vivas, C. V. 149 Vivas, C. V. 164 Vivas, C. V. 131 Vivas, C. V. 166 Vivas, C. V. 184 Vivas, C. V. 017
Manilkara longifolia (A.DC.) Dubard Manilkara longifolia (A.DC.) Dubard Manilkara longifolia (A.DC.) Dubard
Vivas, C. V. 105 Vivas, C. V. 153 Vivas, C. V. 176
Manilkara maxima T.D. Penn. Manilkara maxima T.D. Penn. Manilkara maxima T.D. Penn. Manilkara maxima T.D. Penn.
Vivas, C. V. 094 Vivas, C. V. 162 Vivas, C. V. 203 Vivas, C. V. 002
Manilkara multifida T.D. Penn. Manilkara multifida T.D. Penn. Manilkara multifida T.D. Penn. Manilkara multifida T.D. Penn. Manilkara salzmannii (A.DC.) H.J. Lam Manilkara salzmannii (A.DC.) H.J. Lam Manilkara salzmannii (A.DC.) H.J. Lam Manilkara salzmannii (A.DC.) H.J. Lam Manilkara salzmannii (A.DC.) H.J. Lam Manilkara salzmannii (A.DC.) H.J. Lam Micropholis emarginata T.D. Penn. Micropholis crassipedicellata (Mart. &Eich.) Pierre Micropholis crassipedicellata (Mart. &Eich.) Pierre Micropholis crassipedicellata (Mart. &Eich.) Pierre Micropholis crassipedicellata (Mart. &Eich.) Pierre Micropholis crassipedicellata (Mart. &Eich.) Pierre
Vivas, C. V. 103 Vivas, C. V. 129 Vivas, C. V. 082 Vivas, C. V. 182
Micropholis gardneriana (A.DC.)
Vivas, C. V. 004 Vivas, C. V. 112
Reserva Biológica de Una - Una Parque Estadual da Serra do Conduru Uruçuca
Vivas, C. V. 135
RPPN Estação Veracel – Porto Seguro
Vivas, C. V. 173
RPPN Capitão - Itacaré
Vivas, C. V. 187
Reserva Ecológica da Michelin - Igrapiúna
Vivas, C. V. 206 Vivas, C. V. 204
Estrada Olivença/Vila Brasil - Ilhéus Estrada Olivença/Vila Brasil - Ilhéus
Vivas, C. V. 171
RPPN Capitão - Itacaré
Vivas, C. V. 181
Reserva Ecologica da Michelin - Igrapiúna
Vivas, C. V. 041
Reserva Biológica de Una - Una
Vivas, C. V. 216
Parque Municipal da Boa Esperança - Ilhéus
Vivas, C. V. 134
RPPN Estação Veracel – Porto Seguro
Vivas, C. V. 205
Estrada Olivença/Vila Brasil - Ilhéus
53
Pierre Micropholis gardneriana (A.DC.) Pierre Micropholis gardneriana (A.DC.) Pierre Micropholis gardneriana (A.DC.) Pierre Micropholis venulosa (Mart. & Eich.) Pierre Micropholis guyanensis (A.DC.) Pierre Micropholis guyanensis (A.DC.) Pierre Micropholis guyanensis (A.DC.) Pierre Micropholis guyanensis (A.DC.) Pierre Pouteria bangii (Rusby) T.D. Penn.
Vivas, C. V. 177
RPPN Capitão - Itacaré
Vivas, C. V. 070
Reserva Biológica de Una - Una
Vivas, C. V. 215
Parque Municipal da Boa Esperança - Ilhéus
Vivas, C. V. 051 Vivas, C. V. 113
Reserva Biológica de Una - Una Parque Estadual da Serra do Conduru Uruçuca
Vivas, C. V. 167
RPPN Capitão - Itacaré
Vivas, C. V. 200
RPPN Mãe da Mata - Ilhéus
Vivas, C. V. 024 Vivas, C. V. 055
Reserva Biológica de Una - Una Reserva Biológica de Una - Una Parque Estadual da Serra do Conduru Uruçuca RPPN Estação Veracel – Porto Seguro Serra do Corcovado - Almadina Parque Municipal da Boa Esperança - Ilhéus
Pouteria bangii (Rusby) T.D. Penn. Pouteria bangii (Rusby) T.D. Penn. Pouteria bangii (Rusby) T.D. Penn. Pouteria bangii (Rusby) T.D. Penn. Pouteria caimito (Ruiz & Pavon) Radlk.
Vivas, C. V. 114 Vivas, C. V. 137 Paixão, J. L. 1707 Vivas, C. V. 208
Pouteria durlandii (Standl.) Baehni Pouteria egregia Sandwith Pouteria gardneri (Mart. & Miq.) Baehni Pouteria glauca T.D. Penn. Pouteria macahensis T.D. Penn. Pouteria macahensis T.D. Penn. Pouteria reticulata (Engl.) Eyma Pouteria reticulata (Engl.) Eyma Pouteria reticulata (Engl.) Eyma Pouteria torta subsp. gallifructa (Cronq.) T.D. Penn.
Vivas, C. V. 116 Vivas, C. V. 027
Reserva Biológica de Una - Una Parque Estadual da Serra do Conduru Uruçuca Reserva Biológica de Una - Una
Vivas, C. V. 191 Vivas, C. V. 054 Vivas, C. V. 008 Vivas, C. V. 132 Vivas, C. V. 012 Vivas, C. V. 186 Vivas, C. V. 202
Reserva Ecológica da Michelin - Igrapiúna Reserva Biológica de Una - Una Reserva Biológica de Una - Una RPPN Estação Veracel – Porto Seguro Reserva Biológica de Una - Una Reserva Ecológica da Michelin - Igrapiúna RPPN Mãe da Mata - Ilhéus
Vivas, C. V. 133
Pouteria sp1 Pouteria sp1 Pouteria sp2
Vivas, C. V. 118 Vivas, C. V. 201 Vivas, C. V. 192
Pradosia lactescens (Vell.) Radlk. Pradosia lactescens (Vell.) Radlk. Pradosia lactescens (Vell.) Radlk. Pradosia lactescens (Vell.) Radlk.
Vivas, C. V. 091 Vivas, C. V. 146 Vivas, C. V. 174 Vivas, C. V. 188
RPPN Estação Veracel – Porto Seguro Parque Estadual da Serra do Conduru Uruçuca RPPN Mãe da Mata - Ilhéus Reserva Ecológica da Michelin - Igrapiúna Parque Estadual da Serra do Conduru Uruçuca RPPN Estação Veracel – Porto Seguro RPPN Capitão - Itacaré Reserva Ecológica da Michelin - Igrapiúna
Vivas, C. V. 039
54
Apêndice 2: Número de acesso às sequências das espécies de Sapotaceae no GenBank.
GenBank matK JQ413926 JQ413927
GenBank rbcL JQ413809 JQ413811
GenBank trnH-psbA JQ434254 JQ434255
Chrysophyllum splendens 003
GenBank ITS JQ434173 __ JQ434150
JQ413879
JQ413832
JQ434232
Chrysophyllum splendens 109
JQ434151
JQ413880
JQ413833
JQ434233
Chrysophyllum splendens 143
JQ434152
JQ413881
JQ413834
JQ434234
Chrysophyllum splendens 161
JQ434153
JQ413882
JQ413835
JQ434231
Chrysophyllum splendens 190
JQ434193
JQ413883
JQ413836
JQ434235
Diploon cuspidatum 180
JQ434171
JQ413928
JQ413812
JQ434243
Diploon cuspidatum 207
JQ434172
JQ413813
JQ434244
Diploon cuspidatum 149
JQ434170
__ JQ413916
JQ413869
JQ434242
Diploon cuspidatum 164
JQ434169
JQ413924
JQ413877
JQ434241
Ecclinusa ramiflora 131
JQ434194
JQ413884
JQ413837
JQ434236
Ecclinusa ramiflora 166
JQ434154
JQ413885
JQ413838
JQ434237
Ecclinusa ramiflora 184
JQ434155
JQ413886
JQ413839
JQ434238
Ecclinusa ramiflora 017
JQ434195
JQ413887
JQ413840
JQ434239
Manilkara longifolia 105
JQ434141
JQ413896
JQ413849
JQ434204
Manilkara longifolia 153
JQ434142
JQ413897
JQ413850
JQ434205
Manilkara longifolia 176
JQ434143
JQ413898
JQ413851
JQ434206
Manilkara maxima 094
JQ434145
JQ413900
JQ413853
JQ434208
Manilkara maxima 162
JQ434189
JQ413901
JQ413854
JQ434209
Manilkara maxima 203
JQ434190
JQ413902
JQ413855
JQ434210
Manilkara maxima 002
JQ434144
JQ413899
JQ413852
JQ434207
Manilkara multifida 103
JQ434137
JQ413892
JQ413845
JQ434200
Manilkara multifida 129
JQ434138
JQ413893
JQ413846
JQ434201
Manilkara multifida 082
JQ434139
JQ413894
JQ413847
JQ434202
Manilkara multifida 182
JQ434140
JQ413895
JQ413848
JQ434203
Manilkara salzmannii 004
JQ434148
JQ413907
JQ413860
JQ434211
Manilkara salzmannii 112
JQ434146
JQ413903
JQ413856
JQ434212
Manilkara salzmannii 135
JQ434191
JQ413904
JQ413857
JQ434213
Manilkara salzmannii 173
JQ434192
JQ413905
JQ413858
JQ434214
Manilkara salzmannii 187
JQ434147
JQ413906
JQ413859
JQ434215
Manilkara salzmannii 206
JQ434149
JQ413908
JQ413861
JQ434216
Micropholis emarginata 204
JQ413914
JQ413867
JQ434226
Micropholis crassipedicellata 171
__ JQ434164
JQ413912
JQ413865
JQ434223
Micropholis crassipedicellata 181
JQ434165
JQ413913
JQ413866
JQ434224
Micropholis crassipedicellata 041
JQ434163
JQ413923
JQ413876
JQ434225
Micropholis crassipedicellata 216
__
JQ413925
JQ413878 JQ413864
__ JQ434222
Micropholis gardneriana 205
__ JQ434159
JQ413911 JQ413910
JQ413863
JQ434218
Micropholis gardneriana 177
JQ434158
JQ413909
JQ413862
JQ434217
Micropholis gardneriana 070
JQ434160
JQ413915
JQ413868
JQ434219
Espécie Chromolucuma apiculata 160 Chrysophyllum gonocarpum 211
Micropholis crassipedicellata 134
55
Micropholis venulosa 51
JQ434161 JQ434162
JQ413917 JQ413918
JQ413870 JQ413871
JQ434220 JQ434221
Micropholis guyanensis 113
JQ434166
JQ413919
JQ413872
JQ434227
Micropholis guyanensis 167
JQ434198
JQ413920
JQ413873
JQ434229
Micropholis guyanensis 200
JQ434167
JQ413921
JQ413874
JQ434228
Micropholis guyanensis 024
JQ434168
JQ413922
JQ413875
JQ434230
Pouteria bangii 055
JQ434174
JQ413929
JQ413814
JQ434256
Pouteria bangii 114
__ JQ434175
JQ413930
JQ413815
JQ413931
JQ413816
__ JQ434257
__ JQ413934
JQ413817
Pouteria bangii 208
__ JQ434176
JQ413820
__ JQ434259
Pouteria caimito 39
JQ434181
JQ413932
JQ413818
JQ434245
Pouteria durlandii 116
JQ434182
JQ413933
JQ413819
JQ434258
Pouteria egrégia 027
JQ434177
JQ413935
JQ413821
Pouteria gardneri 191
JQ434178
JQ413936
JQ413822
__ JQ434260
Pouteria glauca 054
JQ434183
JQ413937
JQ413823
JQ434246
Pouteria macahensis 008
JQ434179
JQ413938
JQ413824
JQ434261
Pouteria macahensis 132
JQ434180
JQ413939
JQ413825
Pouteria reticulata 12
JQ434184
JQ413940
JQ413826
__ JQ434247
Pouteria reticulata 186
JQ434185
JQ413941
JQ413827
JQ434248
Pouteria reticulata 202
JQ434186
JQ413942
JQ413828
JQ434249
Pouteria torta subsp. gallifructa 133
JQ434187
JQ413943
JQ413829
JQ434250
Pouteria sp1 118 Pouteria sp1 201
JQ434188
JQ413944
JQ413830
JQ434251
JQ434199 __ JQ434156
JQ413946 JQ413945
JQ413810 JQ413831
JQ434253 JQ434252
JQ413888
JQ413841
JQ434197
JQ413891
JQ413844
JQ434196 JQ434157
JQ413889 JQ413890
JQ413842 JQ413843
Micropholis gardneriana 215
Pouteria bangii 137 Pouteria bangii 1707
Pouteria sp2 192 Pradosia lactescens 091 Pradosia lactescens 146 Pradosia lactescens 174 Pradosia lactescens 188
56
__ __ JQ434240 __
Apêndice 3: Árvore de máxima parcimônia baseada na análise da região ITS em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.
57
Apêndice 4: Árvore de máxima parcimônia baseada na análise da região matK em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.
58
Apêndice 5: Árvore de máxima parcimônia baseada na análise da região rbcL em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.
59
Apêndice 6: Árvore de máxima parcimônia baseada na análise da região trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.
60
Apêndice 7: Árvore de máxima parcimônia baseada na análise combinada das regiões ITS e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.
61
Apêndice 8: Árvore de neighbor-joining baseada na análise combinada das regiões ITS e matK em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).
62
Apêndice 9: Árvore de máxima parcimônia baseada na análise combinada das regiões ITS e matK em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.
63
Apêndice 10: Árvore de neighbor-joining baseada na análise combinada das regiões ITS e rbcL em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).
64
Apêndice 11: Árvore de máxima parcimônia baseada na análise combinada das regiões ITS e rbcL em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.
65
Apêndice 12: Árvore de neighbor-joining baseada na análise combinada das regiões matK e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).
66
Apêndice 13: Árvore de máxima parcimônia baseada na análise combinada das regiões matK e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.
67
Apêndice 14: Árvore de neighbor-joining baseada na análise combinada das regiões rbcL e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).
68
Apêndice 15: Árvore de máxima parcimônia baseada na análise combinada das regiões rbcL e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.
69
Apêndice 16: Árvore de neighbor-joining baseada na análise combinada das regiões matK e rbcL em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).
70
Apêndice 17: Árvore de máxima parcimônia baseada na análise combinada das regiões matK e rbcL em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.
71
Apêndice 18: Árvore de neighbor-joining baseada na análise combinada das regiões matK, rbcL e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).
72
Apêndice 19: Árvore de máxima parcimônia baseada na análise combinada das regiões matK, rbcL e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.
73
Apêndice 20: Árvore de neighbor-joining baseada na análise combinada das regiões ITS, rbcL e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).
74
Apêndice 21: Árvore de máxima parcimônia baseada na análise combinada das regiões ITS, rbcL e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.
75
Apêndice 22: Árvore de neighbor-joining baseada na análise combinada das regiões ITS, matK e rbcL em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).
76
Apêndice 23: Árvore de máxima parcimônia baseada na análise combinada das regiões ITS, matK e rbcL em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.
77
Apêndice 24: Árvore de neighbor-joining baseada na análise combinada das regiões ITS, matK e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde à distância Kimura 2-parâmetros (K2P).
78
Apêndice 25: Árvore de máxima parcimônia baseada na análise combinada das regiões ITS, matK e trnH-psbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo.
79
Apêndice 26: Árvore de máxima parcimônia baseada na análise combinada das regiões ITS, matK, rbcL e trnHpsbA em espécies da família Sapotaceae. Os números acima dos nós correspondem aos valores de bootstrap >50%. Escala corresponde ao comprimento de cada ramo
80
100.0 90.0 80.0 70.0 60.0
% 50.0
Dist. Inter
40.0
Dist. Intra
30.0 20.0 10.0 0.0 0
0,1 a 0,5
0,6 a 1
1,1 a 4
4,1 a 8
8,1 a 12 12,1 a 18
K2P Apêndice 27: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões ITS e matK em espécies da família Sapotaceae.
100.0 90.0 80.0 70.0 60.0
% 50.0
Dist. Inter
40.0
Dist. Intra
30.0 20.0 10.0 0.0 0
0,1 a 0,5
0,6 a 1
1,1 a 4
4,1 a 8
8,1 a 12 12,1 a 18
K2P Apêndice 28: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões ITS e rbcL em espécies da família Sapotaceae.
81
70.0 60.0 50.0 40.0 Dist. Inter
% 30.0
Dist. Intra
20.0 10.0 0.0 0
0,1 a 0,5
0,6 a 1
1,1 a 4
4,1 a 8
8,1 a 12
12,1 a 18
K2P Apêndice 29: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões ITS e trnH-psbA em espécies da família Sapotaceae.
70.0 60.0 50.0 40.0
%
Dist. Inter 30.0
Dist. Intra
20.0 10.0 0.0 0
0,1 a 0,5
0,6 a 1
1,1 a 4
4,1 a 8
8,1 a 12
12,1 a 18
K2P Apêndice 30: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões matK e rbcL em espécies da família Sapotaceae.
82
60.0 50.0 40.0
% 30.0
Dist. Inter Dist. Intra
20.0 10.0 0.0 0
0,1 a 0,5
0,6 a 1
1,1 a 4
4,1 a 8
8,1 a 12
12,1 a 18
K2P Apêndice 31: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões matK e trnH-psbA em espécies da família Sapotaceae.
60.0 50.0 40.0
% 30.0
Dist. Inter Dist. Intra
20.0 10.0 0.0 0
0,1 a 0,5
0,6 a 1
1,1 a 4
4,1 a 8
8,1 a 12
12,1 a 18
K2P Apêndice 32: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões rbcL e trnH-psbA em espécies da família Sapotaceae.
83
70.0 60.0 50.0 40.0 Dist. Inter
% 30.0
Dist. Intra
20.0 10.0 0.0 0
0,1 a 0,5
0,6 a 1
1,1 a 4
4,1 a 8
8,1 a 12
12,1 a 18
K2P Apêndice 33: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões matK, rbcL e trnH-psbA em espécies da família Sapotaceae.
80.0 70.0 60.0 50.0
% 40.0
Dist. Inter Dist. Intra
30.0 20.0 10.0 0.0 0
0,1 a 0,5
0,6 a 1
1,1 a 4
4,1 a 8
8,1 a 12
12,1 a 18
K2P Apêndice 34: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões ITS, matK e trnH-psbA em espécies da família Sapotaceae.
84
60.0 50.0 40.0
% 30.0
Dist. Inter Dist. Intra
20.0 10.0 0.0 0
0,1 a 0,5
0,6 a 1
1,1 a 4
4,1 a 8
8,1 a 12
12,1 a 18
K2P Apêndice 35: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões ITS, matK e rbcL em espécies da família Sapotaceae.
90.0 80.0 70.0 60.0 50.0
%
Dist. Inter
40.0
Dist. Intra
30.0 20.0 10.0 0.0 0
0,1 a 0,5
0,6 a 1
1,1 a 4
4,1 a 8
8,1 a 12
12,1 a 18
K2P Apêndice 36: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões ITS, rbcL e trnH-psbA em espécies da família Sapotaceae.
85
70.0 60.0 50.0 40.0
%
Dist. Inter 30.0
Dist. Intra
20.0 10.0 0.0 0
0,1 a 0,5
0,6 a 1
1,1 a 4
4,1 a 8
8,1 a 12
12,1 a 18
K2P Apêndice 37: Variação relativa (%) das distâncias Kimura 2-parâmetros (K2P) inter e intraespecíficas da análise combinada das regiões ITS, matK, rbcL e trnH-psbA em espécies da família Sapotaceae.
86