______________________________________________

Michelyne Sidney Castro Faria

“Programa de descoberta gênica em Schistosoma mansoni: Geração e Análise de1335 Etiquetas de Seqüências Transcritas (ESTs) de duas bibliotecas de cDNA de ovo”

Dissertação apresentada ao Curso de Pós-Graduação do Departamento de Biologia Geral do Instituto de Ciências Biológicas da Universidade Federal de Minas Gerais, como requisito parcial para a obtenção do título de Mestre em Ciências. Área de Concentração: Genética

Orientador: Prof. Vasco Carvalho Azevedo Co-Orientadora: Profa. Glória Regina Franco

Universidade Federal de Minas Gerais Instituto de Ciências Biológicas Departamento de Biologia Geral Belo Horizonte – MG Junho de 2000

______________________________________________

043 F224p 2000

Faria, Michelyne Sidney Castro Programa de descoberta gênica em Schistosoma mansoni: geração e análise de 1335 Etiquetas de Seqüências Transcritas (ESTs) de duas bibliotecas de cDNA de ovo. / Michelyne Sidney Castro Faria, 2000. 88p. Orientador: Dr. Vasco Ariston de Carvalho Azevedo. Co-orientadora: Dra. Glória Regina Franco. Dissertação (mestrado) – Universidade Federal de Minas Gerais. Instituto de Ciências Biológicas, Departamento de Biologia Geral. Pós-Graduação em Genética. 1. Projeto Genoma de Schistosoma mansoni. 2. Etiquetas de Sequências Transcritas (ESTs). 3. Biblioteca de cDNA. I. Título. II. Azevedo, Vasco Ariston de Carvalho. III. Franco, Glória Regina.

_____________________________________________

“Nosso futuro não depende só de nossa ciência e inteligência, mas principalmente de nossa ética e força de vontade”. Augustin Álvarez

_____________________________________________

_____________________________________________

Aos meus pais, Osvaldo e Magaly e a minha irmã Keila Fernanda, muito obrigada pela confiança, carinho, paciência e infra-estrutura essenciais para a execução desse trabalho.

_____________________________________________

Agradecimentos

AGRADECIMENTOS

Ao Dr. Vasco Azevedo, pela oportunidade de desenvolver esse trabalho sob sua orientação. Agradeço por ter me mostrado que não existem limites quando se quer atingir um objetivo, e o quanto se deve lutar por ele. À Dra. Glória Franco pela impecável orientação. Muito obrigada pela confiança, amizade, apoio, estímulo e dedicação constantes, requisitos fundamentais para a concretização dessa dissertação. Ao Dr. Guilherme Corrêa Oliveira, pela amizade e colaboração nessa dissertação, sempre mostrando disponibilidade proporcionando a mim e a essa pesquisa todo o suporte científico, técnico e financeiro para a geração de grande parte das ESTs descritas nesse trabalho. À Dra. Élida Rabelo pela contribuição, gerando parte das ESTs apresentadas nesse trabalho. À Profa. Cleusa da Graça Fonseca, coordenadora do curso de Pós-graduação da Genética pelo apoio durante a execução desse trabalho. Aos meus amigos do Laboratório de Genética Celular e Molecular, Dra. Ana Lúcia Brunialti, Mônica, Maria Rosa, Dani I, Dani II, Elias, Flú, Kika, Lino pela disponibilidade no decorrer deste trabalho e pelo apoio nas horas difíceis. Anderson, a você o meu agradecimento especial por tantas horas de estudo na preparação para a prova de mestrado e amizade durante todo o curso. Aos colegas da 1º Turma da Pós-Graduação em Genética Alessandra, Anderson, Daniela, Fábio, Isabel, Márcia e Maria Dulce e os da 2º Turma, Cláudia, Daniela Freitas, Daiane, Flávia Cristina, Luciana, Vânia e Vilminha, pela amizade e agradável convivência durante o período de desenvolvimento desse trabalho. Aos professores do Departamento de Biologia Geral pela valiosa colaboração no meu crescimento teórico. À grande amiga Márcia Nogueira, pelo apoio e atenção no momento mais difícil do mestrado, sempre pronta a me ajudar. A você o meu eterno MUITO OBRIGADA! À tão querida amiga Marina, pelo impecável profissionalismo, amizade e boa vontade de sempre. À Claudinha secretária do Departamento da Biologia Geral pela disponibilidade e alegria de sempre. Aos amigos do Laboratório de Imunologia das Doenças Infecciosas: Dr. Sérgio Costa Oliveira, Grácia, Maria Cristina, Kika, Rubinho, Adriana, Cristiana e Sofie. Ao Professor Miguel Ortega que tanto contribuiu com seu bom humor e prestatividade na utilização do programa ICATOOLS e na confeccção de gráficos. Pode ter certeza que se eu precisar eu assobio !!!

Dissertação de Mestrado

Michelyne Sidney Castro Faria

Agradecimentos À todos os amigos do Laboratório de Genética e Bioquímica e de uma forma muito especial ao Túlio, Patrícia I, Analina e Patrícia II, o meu muito obrigada pelo apoio e disponibilidade que sempre me receberam, tornando os meus dias no LGB muito agradáveis. À Kátia Barroso pelo trabalho eficiente na operação do sequenciador automático de DNA. À Neuza Antunes Rodrigues pela prestatividade e disponibilidade sempre quando solicitada. Ao Dr. Alvaro Romanha, chefe do Laboratório de Parasitologia Celular e Molecular do CPqRR, pelo carinho com que me recebeu em seu laboratório, onde foi desenvolvida grande parte dessa dissertação. À “minha ídola” e amiga Isabela, pela eterna amizade, grande apoio e essencial ajuda na correção dessa dissertação. MUITO OBRIGADA! À amiga Flávia, sempre na torcida pelo meu sucesso... A sua amizade sem limites e prestatividade foram fundamentais para que eu concluísse essa dissertação. OBRIGADA por tudo! À querida Julia, que participou efetivamente da confecção e edição das ESTs e operação do sequenciador automático de DNA com muita competência, facilitando a conclusão do árduo trabalho prático dessa dissertação. Agradeço também a amizade, o seu sorriso e a sua disponibilidade para o que eu precisasse, sempre. Aos amigos que pertencem ou que já pertenceram ao Laboratório de Parasitologia Celular e Molecular do CPqRR: Flávia, Isabela, Julia, Guilherme, Alvaro, Silvane, Rosana, Liana, Luís Fernando, Juçara, Wal, Edmundo, Wagner, Marcos, Maureen, Elenita, Letícia, Ciro e Geralda, pela agradável convivência e em especial ao Ronaldo, Nilton, Andréa Carla e Ângela, pela grande ajuda e valiosas sugestões. À Maureen, pela amizade, prestatividade e grande ajuda nas referências bibliográficas. À Juliana Assis que me “apresentou” para a pesquisa. Se estou terminando o meu mestrado foi porque você me ajudou a começar. Muito obrigada! À Juçara Parra, minha primeira orientadora, e Walderez Dutra pela confiança que me receberam no CPqRR, recém formada e com muita vontade de “fazer pesquisa”. Ao ex-diretor Dr. Naftale Katz e ao atual Dr. Roberto Sena Rocha por terem me recebido no CPqRR possibilitando a realização de grande parte desse trabalho. À Celma, bibliotecária do CPqRR pela eficiência na busca dos trabalhos bibliográficos relacionados a essa dissertação. Ao Gustavo, Edmar e Elton do setor de informática do CPqRR, pela disponibilidade e paciência para solucionar os problemas que surgiram durante o desenvolvimento dessa dissertação. A todos os colegas do Centro de Pesquisas René Rachou.

Dissertação de Mestrado

Michelyne Sidney Castro Faria

Agradecimentos Aos grandes amigos do Laboratório de Biologia Molecular de Microorganismos: Dra. Beth Margutti que contribuiu muito no início de minha formação profissional. Obrigada também ao Lydston, Ándréa, Rodrigo, Bernadete, Maria Clara e Vanessa pela amizade, apoio e incentivo sempre presentes durante o desenvolvimento dessa dissertação. Ao Professor e amigo Alfredo Góes pelo bom humor de sempre e por deixar as portas do seu laboratório abertas para o que eu precisasse. Obrigada também a Claudinha e ao Bernardo. Aos amigos do GIDE pela convivência em especial a Florence. Aos meus pais, Osvaldo e Magaly, e a minha irmã Keila Fernanda: o carinho, apoio e dedicação de vocês foram essenciais para a superação das dificuldades e o conseqüente desenvolvimento do meu trabalho. Amo muito vocês. MUITO OBRIGADA! À Mariana, amiga e companheira desde a graduação, agradeço pela amizade sincera, pura e simples, sempre pronta ouvir minhas confidências e reclamações da “vida difícil” que nós “mestrandos” levamos! À Micheline, presente sempre me dando força e incentivo. Muito obrigada! Ao Paulo Emílio, pelo apoio e pela valiosa ajuda na produção das tabelas e gráficos. Ao Dr. Jerson Lima da UFRJ pela amizade, e constante incentivo ao meu trabalho. Muito obrigada também por ter concedido a mim a utilização de uma bolsa de aperfeiçoamento do seu laboratório quando eu ainda estagiava no CPqRR. À Dra. Ana Flávia, que me ensinou como enfrentar os problemas de frente, com coragem e determinação. Muito obrigada! Ao Júlio Hübner, pela criação da capa dessa dissertação. Aos desafios, por inúmeras vezes representados por pessoas, agradeço pela oportunidade de superação e crescimento. Aos membros da banca examinadora pela paciência e pelo tempo dedicado a leitura dessa dissertação. Aos órgãos financiadores FAPEMIG (Fundação de Amparo a Pesquisa de Minas Gerais) pela concessão de uma bolsa durante parte do período de realização desse trabalho, a OMS (Organização Mundial de Saúde), CNPq (Conselho Nacional de Desenvolvimento Científico e Tecnológico) , CPqRR (Centro de Pesquisas René Rachou) e Fiocruz (Fundação Oswaldo Cruz). À todos, enfim, que auxiliaram, direta ou indiretamente na realização desse trabalho, os meus agradecimentos.

Michelyne

Dissertação de Mestrado

Michelyne Sidney Castro Faria

Sumário

SUMÁRIO LISTA DE FIGURAS .................................................................................................................. III LISTA DE TABELAS ................................................................................................................. IV LISTA DE ABREVIATURAS ...................................................................................................... V RESUMO .................................................................................................................................. VII ABSTRACT ............................................................................................................................. VIII INTRODUÇÃO ............................................................................................................................ 1 1 - A esquistossomose ................................................................................................................ 1 1.1 - O ciclo de vida do parasito .................................................................................................. 5 1.2 - Patogenia e Patologia ......................................................................................................... 7 2 - O ovo do Schistosoma mansoni ............................................................................................. 8 3 - O genoma do Schistosoma mansoni ....................................................................................12 4 - Projetos Genoma ................................................................................................................. 13 4.1 – Projetos Genoma de Parasitos ......................................................................................... 20 4.2 – Projeto Genoma de Schistosoma mansoni ...................................................................... 23 OBJETIVOS .............................................................................................................................. 29 MATERIAIS E MÉTODOS ........................................................................................................ 30 1 – Excisão “in vivo” dos insertos clonados em λZap ............................................................... 31 2 – Seleção de clones recombinantes ....................................................................................... 35 2.1 – Seleção de colônias brancas ............................................................................................ 35 2.2 – PCR das colônias ............................................................................................................. 35 3 – Amplificação e purificação do DNA plasmidiano pelo método da lise alcalina ................... 36 3.1- “Kit Promega Wizard Mini Prep”.......................................................................................... 36 3. 2 – “Kit QIAprep Miniprep da QIAGEN” ................................................................................. 37 4 – Dosagem do DNA plasmidiano ........................................................................................... 38 5 – Sequenciamento dos cDNAs e geração das ESTs ............................................................. 38

Dissertação de Mestrado

I

Michelyne Sidney Castro Faria

Sumário

6 – Pesquisa de similaridade em bancos de dados .................................................................. 39 6.1- Blast N e Blast X ................................................................................................................ 39 6.2 – Análise de “cluster” por ICATOOLS ................................................................................. 40 RESULTADOS E DISCUSSÃO ............................................................................................... 41 CONCLUSÕES ......................................................................................................................... 77 PERSPECTIVAS ....................................................................................................................... 79 REFERÊNCIAS BIBLIOGRÁFICAS ......................................................................................... 80

Dissertação de Mestrado

II

Michelyne Sidney Castro Faria

Lista de Figuras

LISTA DE FIGURAS Figura 1 – O Schistosoma mansoni ............................................................................................ 2 Figura 2 – Área de endemicidade da esquistossomose ............................................................. 3 Figura 3 – O ciclo de vida do Schistosoma mansoni .................................................................. 6 Figura 4 – O ovo de Schistosoma mansoni ................................................................................ 9 Figura 5 – Número de ESTs e genes de Schistosoma mansoni depositados em bancos de dados de 1993 a 1999 ............................................................................................................... 26 Figura 6 – Diagrama dos experimentos realizados para produção das ESTs ......................... 30 Figura 7 – Excisão no vetor lambda ZAP II .............................................................................. 32 Figura 8 – Sumário do processo da excisão “in vivo”................................................................ 34 Figura 9 – Análise da presença e do tamanho do inserto de clones das bibliotecas de cDNA do ovo de Schistosoma mansoni .................................................................................................... 42 Figura 10 – Categoria das ESTs obtidas de duas bibliotecas de cDNA de ovo de Schistosoma mansoni ..................................................................................................................................... 44 Figura 11 – ESTs similares a genes de Schistosoma mansoni ................................................ 46 Figura 12 - ESTs similares a genes de outros organismos ...................................................... 51 Figura 13 – ESTs similares a seqüências depositadas no dbEST............................................ 56 Figura 14 – Número de genes distintos obtidos das bibliotecas de cDNA de ovo de Schistosoma mansoni ............................................................................................................... 71 Figura 15 – Redundância no sequenciamento das bibliotecas de cDNA de ovo de Schistosoma mansoni ..................................................................................................................................... 74

Dissertação de Mestrado

III

Michelyne Sidney Castro Faria

Lista de Tabelas

LISTA DE TABELAS Tabela 1 – Evolução do número de seqüências de diferentes organismos disponíveis no dbEST......................................................................................................................................... 15 Tabela 2 – Sítios WWW do Projeto Genoma de Parasitos........................................................ 22 Tabela 3 – Características do vetor Lambda (λ) ZAP................................................................ 33 Tabela 4 – Caracterização das ESTs de bibliotecas de cDNA de ovo: ESTs similares a genes de S. mansoni ........................................................................................................................... 47 Tabela 5 - Caracterização das ESTs de bibliotecas de cDNA de ovo: ESTs similares a genes de outros organismos ................................................................................................................ 52 Tabela 6 - Caracterização das ESTs de bibliotecas de cDNA de ovo: ESTs similares a outras ESTs no banco de dados dbEST............................................................................................... 57 Tabela 7 – Caracterização das ESTs de bibliotecas de cDNA de ovo: ESTs parcialmente similares a genes de S. mansoni e outros organismos ............................................................ 62 Tabela 8 - Caracterização das ESTs de bibliotecas de cDNA de ovo: ESTs sem similaridade a seqüências depositadas em bancos de dados........................................................................... 65

Dissertação de Mestrado

IV

Michelyne Sidney Castro Faria

Abreviaturas

LISTA DE ABREVIATURAS BAC

(“Bacterial Artificial Chromosome”) Cromossomo Artificial de Bactérias

Blast

Basic Local Alignment Search Tool

Blast N

(Basic Local Alignment Search Tool) para análise de seqüências de nucleotídios

Blast X

(Basic Local Alignment Search Tool) para análise de seqüências de proteínas

CPqRR

Centro de Pesquisas René Rachou

CVC

Clorose Variegada de Citros

dbEST

(“EST Data Base”) Banco de dados de EST (Etiqueta de Seqüência Transcrita)

dNTPs

Desoxiribonucleotídeos de Adenina, Citosina, Guanina ou Timina

EST

(“Expressed Sequence Tag”) Etiqueta de Seqüência Transcrita

EDTA

Ácido etilenodiamino tetracético

EtBr

Brometo de etídio

FAPESP

Fundação de Amparo a Pesquisa do Estado de São Paulo

FIOCRUZ

Fundação Oswaldo Cruz

FISH

(“Fluorescent in situ Hybridization”) Hibridização Fluorescente “in situ”

ICB

Instituto de Ciências Biológicas

IPTG

Isopropil-β-tio-D-galactopiranosídeo

mtDNA

DNA mitocondrial

NIH

(“National Institutes of Health”) Instituto Nacional de Saúde

NCBI

(“National

Center

for

Biotechnology

Information”)

Centro

Nacional

de

Informações em Biotecnologia NR

Não redundante

NRC

“National Research Council”

OMS

Organização Mundial de Saúde

ONSA

(“Organization for Nucleotyde Sequencing and Analysis”) Organização de Sequenciamento e Análise de Nucleotídeo

pb

pares de base

Dissertação de Mestrado

V

Michelyne Sidney Castro Faria

Abreviaturas

PCR

(“Polymerase Chain Reaction”) Reação em Cadeia da Polimerase

PG

Projeto Genoma

PGH

Projeto Genoma Humano

PGSM Projeto Genoma de Schistosoma mansoni Sm

Schistosoma mansoni

TDR

(“Special Programme for Research and Training in Tropical Diseases”) Programa Especial para Pesquisa e Treinamento em Doenças Tropicais.

TIGR

(“The Institute for Genomic Research”) Instituto para Pesquisa Genômica

UFMG Universidade Federal de Minas Gerais ufp

(“Plaque Forming Unit”) Unidade Formadora de Placas

WHO

World Health Organization

WWW “World Wide Web” YAC

(“Yeast Artificial Chromosome”) Cromossomo Artificial de Levedura

Dissertação de Mestrado

VI

Michelyne Sidney Castro Faria

Resumo

RESUMO O Schistosoma mansoni é o parasito causador da esquistossomose, um dos principais problemas de saúde pública em países tropicais. Para que possamos compreender o funcionamento completo de um organismo, é absolutamente fundamental que tenhamos o conhecimento de todas as informações contidas nos seus genes. Esse conhecimento pode ser adquirido através do sequenciamento. Sendo assim, iniciou-se em 1992 o programa de descoberta gênica em Schistosoma mansoni, uma iniciativa brasileira, que visa o sequenciamento parcial de cDNAs obtidos aleatoriamente de bibliotecas para a geração de Etiquetas de Sequências Transcritas (ESTs). As ESTs são usadas na identificação do respectivo gene por similaridade com sequências depositadas em bancos de dados. Estudos comparativos do perfil de expressão gênica do parasito nas várias fases do seu ciclo de vida estão sendo feitos baseando-se na geração e análise das ESTs. Essa abordagem tem sido utilizada numa tentativa de se conhecer genes especificamente expressos em cada estágio, assim como os genes expressos durante todo o desenvolvimento do parasito. Em 1998, iniciamos o estudo em larga escala de uma biblioteca de cDNA de ovo, responsável pela patogenia da doença. Nessa dissertação, estamos relatando os resultados obtidos da análise de 1335 ESTs de duas biblioteca de ovo do S. mansoni. Do total de ESTs, 6,4% apresentam similaridade com genes anteriormente caracterizados em S. mansoni e 6,2% foram similares à sequências de outros organismos. A grande maioria das ESTs (72,6%) não apresentam similaridade com quaisquer sequências depositadas nos bancos de dados e podem corresponder a genes específicos de S. mansoni. Somente 3% das ESTs foram consideradas não úteis (provenientes de DNA mitocondrial, RNA ribossomal, quimeras, vetores sem insertos ou sequências contaminantes de bactérias), demonstrando a boa qualidade dessas bibliotecas para estudos de sequenciamento em larga escala. A biblioteca mostrou também um baixo nível de redundância, uma vez que o gene mais freqüente nessa biblioteca foi isolado 14 vezes por seleção aleatória de clones e corresponde a um gene não identificado. No total foram catalogados 1104 genes, sendo que destes 1060 eram novos e estão sendo descritos pela primeira vez neste trabalho. Todas as ESTs úteis foram depositadas no banco de dados dbEST e estão disponíveis para a comunidade científica.

Dissertação de Mestrado

VII

Michelyne Sidney Castro Faria

Abstract

ABSTRACT Schistosoma mansoni is the parasite which causes schistosomiasis, a chronic disease that is one of the main public health problems in tropical countries. To understand the full functioning of an organism it is absolutely necessary that we know all information contained in its genes. All this knowledge can be obtained by genome sequencing. Having this in mind, a Brazilian gene discovery program for S. mansoni was initiated in 1992, with the aim of obtaining Expressed Sequence Tags (ESTs) by partial sequencing of cDNAs randomly chosen from libraries. ESTs can be used for identification of genes by similarity with sequences deposited in public databases. Comparative studies of the parasite gene expression profile in different stages of its life cycle has been done based on the generation and analysis of ESTs. This approach has been used with the objective of discovering genes specifically expressed in each stage or expressed in all stages of the parasite life cycle. In 1998 we have started a large scale study to understand the egg gene expression, the stage which is responsible for the pathogenesis of the disease. Here we report the results obtained after analysis of 1335 ESTs generated from two egg cDNA libraries of S. mansoni. From the total ESTs, 6.4% were homologous to genes previously characterized in S. mansoni and 6.2% presented homology with genes from other organisms. The majority of ESTs (72.6%) had no matches with sequences deposited in databases and may correspond to S. mansoni specific genes. Only 3% were considered nonuseful ESTs (they are sequences from mtDNA, rDNA, chimerical clones, vector without insert or contamination with Escherichia coli sequences), demonstrating the good quality of these libraries for large scale sequencing programs. A low level of redundancy was observed in the libraries and the most frequent gene isolated from one of these, an unknown gene, was randomly selected only 14 times. In total, we have catalogued 1104 genes, being 1060 of these described from the first time in the parasite. All useful ESTs were deposited in the database dbEST and they are available for the scientific community.

Dissertação de Mestrado

VIII

Michelyne Sidney Castro Faria

1

Introdução

INTRODUÇÃO 1- A esquistossomose A esquistossomose mansoni é uma doença parasitária crônica, debilitante e, em muitos casos, fatal. Ésta doença é causada pelo Schistosoma mansoni, um platelminto trematódeo, digenético, que apresenta dimorfismo sexual na fase adulta (Figura 1). Bilhartz, em 1852, descreveu um parasito intravascular ao qual denominou Distoma haematobia. Posteriormente, Weinland denominou o gênero deste helminto de Schistosoma, uma vez que o macho apresenta o corpo fendido (Schisto = fenda; soma = corpo), sendo esta designação aceita até hoje. O nome fenda é incorreto, uma vez que o sulco é na realidade formado pelas extremidades laterais do macho, que se dobram no sentido ventral (Revisão em: Melo & Zech-Coelho, 2000). O macho tem as ventosas oral e ventral bem desenvolvidas, são achatados dorsoventralmente e menores do que as fêmeas que são mais cilíndricas e delgadas (Figura 1). Segundo dados da Organização Mundial de Saúde, (WHO, 1998), essa parasitose representa um dos mais importantes problemas de saúde pública, afetando cerca de 200 milhões de pessoas principalmente em áreas rurais. Deste total 120 milhões são sintomáticos, 20 milhões sofrem graves conseqüências da doença. Estima-se que seiscentos milhões de pessoas estão em risco de infecção em todo mundo. No Brasil, estima-se que cerca de 12 milhões de pessoas estejam infectadas (Kloetzel, 1989). Em termos sócio-econômicos e de saúde pública, a esquistossomose é considerada importante nas áreas tropicais e sub-tropicais do mundo. A infecção pelo S. mansoni é encontrada na África, América Latina, Ilhas do Caribe e Mediterrâneo Oriental (WHO, 1998). Na América do Sul, as áreas endêmicas estão situadas no Brasil, Colômbia, Venezuela e Guianas. No Brasil, as áreas endêmicas localizam-se em uma faixa que abrange regiões do Rio Grande do Norte, Paraíba, Pernambuco, quase todo o estado de Alagoas, Sergipe, grande parte da Bahia, Minas Gerais e algumas zonas do Espírito Santo (Figura 2).

Dissertação de Mestrado

Michelyne Sidney Castro Faria

2

Introdução

A

B

Figura 1 - O Schistosoma mansoni. A – o casal de parasitos com a fêmea alojada no canal ginecóforo do macho; B – vista da ventosa oral e ventral do macho e da fêmea. Fonte: [http://www.cdfound.to.it/_atlas.htm]

Dissertação de Mestrado

Michelyne Sidney Castro Faria

3

Introdução

Figura 2 – Área de endemicidade da esquistossomose – Brasil (1999) (Melo & Zech-Coelho, 2000)

Dissertação de Mestrado

Michelyne Sidney Castro Faria

4

Introdução

O surgimento de novos focos da doença muitas vezes se encontra associado ao deslocamento de massas de trabalhadores em busca de melhores condições de trabalho, ao desenvolvimento de projetos de irrigação, à construção de barragens, à implantação de usinas hidroelétricas e abertura de novas vias de comunicação. Tais projetos, não apenas contribuem para um aumento do número de habitats favoráveis ao desenvolvimento de moluscos planorbídeos do gênero Biomphalaria, hospedeiros intermediários, como também contribuem para o surgimento de novos focos de transmissão. Isto porque promovem o contato de trabalhadores (freqüentemente oriundos de área endêmicas e portadores da doença) com moluscos hospedeiros intermediários susceptíveis, mas ainda não infectados, disseminando ainda mais essa parasitose. A especificidade da interação entre os esquistossomas e seus hospedeiros intermediários representa um importante fator condicionador da distribuição geográfica da doença. Apesar da esquistossomose atualmente ser uma doença prevenível e curável em muitos países em desenvolvimento, ela mostra poucos sinais de controle. A correlação existente entre a presença da esquistossomose e um alto nível de miséria da população atingida torna claro que, mesmo em face aos recentes avanços científicos relacionados ao conhecimento da doença, a resolução do problema permanece ainda como uma questão de cunho político-social. Sendo assim, drogas e vacinas eficazes no combate a esse parasito ainda são extremamente necessárias para a saúde da nossa população. Uma variedade de medidas tem sido adotada num esforço integrado para o controle da esquistossomose, mas até o momento a principal é o tratamento quimioterápico. O potencial dos parasitos para desenvolver resistência às drogas disponíveis, os problemas de reinfecção com necessidade de um novo tratamento, o custo envolvido no diagnóstico e distribuição do medicamento indicam que, apesar da quimioterapia ser uma medida de controle útil a curto prazo, medidas alternativas se fazem necessárias a longo prazo. Inúmeros estudos têm sido feitos no sentido de se obter uma vacina capaz de proteger o indivíduo da infecção pelo S. mansoni, ou mesmo limitar o desenvolvimento das fêmeas, diminuindo a oviposição e, por

Dissertação de Mestrado

Michelyne Sidney Castro Faria

5

Introdução

conseqüência, a patologia da doença (TDR-WHO, 1991; Berquist, 1995a e b; Capron et al., 1995).

1.1 - O ciclo de vida do parasito O S. mansoni apresenta um ciclo de vida complexo (Figura 3), que se alterna entre dois estágios distintos: um ocorre em algumas espécies de moluscos aquáticos do gênero Biomphalaria (hospedeiro intermediário no Brasil), onde há reprodução assexuada, e o outro em vertebrados (principalmente o homem) que é o hospedeiro definitivo, onde ocorre a reprodução sexuada (Pessoa & Martins, 1977). No Brasil, as espécies de Biomphalaria encontradas com infecção natural por esse trematódeo são: B. glabrata, B. tenagophila e B. straminea, que têm ampla distribuição geográfica no país. O hospedeiro de maior importância epidemiológica é o B. glabrata, pois elimina um número elevado de cercárias, devido à compatibilidade desse organismo com trematódeo (Souza et al., 1995). Os ovos maduros eliminados junto com as fezes do hospedeiro definitivo, eclodem em contato com a água, liberando os miracídios que nadam ativamente até encontrarem o hospedeiro intermediário. Após a penetração no hospedeiro, os miracídios sofrem uma série de modificações, transformando-se em esporocistos, que vão originar as cercárias. As cercárias liberadas pelo caramujo penetram no homem através da pele, sofrem transformações bioquímicas, perdendo a cauda e o glicocálice e originam a forma jovem do verme, o esquistossômulo (Gordon & Griffiths, 1951). Após uma rota migratória através do tecido cutâneo, ganham o sistema sangüíneo ou linfático, chegam aos pulmões, alcançando o sistema porta hepático. Neste sistema, eles permanecem, se alimentam e atingem a maturidade sexual. Os vermes adultos vivem acasalados no plexo venoso mesentérico e portal e para oviposição migram até as veias mesentéricas inferiores. Seu tempo de vida é de cinco a dez anos e cada fêmea pode produzir até quatrocentos ovos por dia (von Lichtenberg, 1987). Alguns desses ovos atravessam a parede do intestino e são evacuados junto com as fezes. Outra parte dos ovos fica alojada na mucosa intestinal, ou nos capilares do sistema porta,

Dissertação de Mestrado

Michelyne Sidney Castro Faria

6

Introdução

sendo circundados por células características da resposta inflamatória granulomatosa do hospedeiro (Warren et al., 1967). Os ovos eliminados nas fezes para o ambiente externo precisam alcançar a água para que liberem o miracídio, que através de natação ativa encontram o seu hospedeiro intermediário e recomeçam o ciclo.

Fígado e intestino

Cercária durante a penetração

Maturação no fígado e circulação

Casal Schistosoma mansoni

Ovos na fezes

Cercária na água

Esporocisto

Miracídio

Biomphalaria sp.

Figura 3 – O ciclo de vida do Schistosoma mansoni. Fonte: [http://www.cdfound.to.it/_atlas.htm]

Dissertação de Mestrado

Michelyne Sidney Castro Faria

Introdução

7

1.2 - Patogenia e Patologia Do ponto de vista clínico, a doença possui duas fases evolutivas: aguda e crônica. Em áreas endêmicas, o período inicial da infecção é quase sempre assintomático, não sendo comum a ocorrência de formas agudas. Na fase crônica, a patologia é caracterizada por diversas manifestações clínicas, podendo apresentar as chamadas formas brandas intestinal e hepatointestinal, que são geralmente assintomáticas, e as formas graves, a hepatoesplênica, a pulmonar e a cardiopulmonar (Prata, 1978). Em geral, as formas graves tem evolução lenta e surgem de cinco a quinze anos após a infecção, podendo também estar relacionadas às reinfecções sucessivas e periódicas (Colley et al., 1986) e associadas a outras doenças, como por exemplo, salmoneloses. Em torno de 5 a 10% dos pacientes com forma clínica intestinal e hepatointestinal evoluem para a forma hepatoesplênica. Além dessas formas, ocorrem também as ectópicas e raras, como polipose intestinal, nervosa, pseudotumoral e renal (Tonelli et al., 1984). As manifestações da fase aguda raramente ocorrem em indivíduos de áreas endêmicas devido às exposições pré-natal via transporte transplacentário (Carlier et al., 1980), e pós-natal devido às infecções repetidas. Os sintomas dessa fase incluem febre, edema, diarréia e eosinofilia (Warren, 1973), e aparecem entre 2 a 10 semanas após a exposição às cercárias, coincidindo com o período migratório do esquistossômulo para os pulmões e fígado, maturação dos vermes e oviposição nas veias mesentéricas. Na grande maioria dos casos, os sintomas são transitórios e desaparecem espontaneamente com a passagem da infecção ao estado crônico. A evolução da patologia está ligada a vários fatores, tais como: cepa do parasito, carga parasitária adquirida, idade, estado nutricional, predisposições genéticas e resposta imunológica do indivíduo. Existe uma correspondência direta entre a carga parasitária, que é estimada pela contagem de ovos por grama de fezes e a sintomatologia (Pereira, 1991). Assim, em populações com média de número de ovos nas fezes muito elevada, a forma hepatoesplênica é mais freqüente. Sabe-se também que as alterações cutâneas (dermatites) e

Dissertação de Mestrado

Michelyne Sidney Castro Faria

8

Introdução

hepáticas são grandemente influenciadas pela resposta imune do paciente, frente aos antígenos dos esquistossômulos e dos ovos. A maior incidência da infecção pelo parasito ocorre na infância e tende a aumentar na juventude, atingindo um pico em torno de 20 anos e diminuindo gradativamente a partir dos 30 (Clarke, 1966; Kloetzel & Silva, 1967; Bradley & McCullough, 1973; Butterworth et al., 1984), possivelmente devido aos costumes adquiridos no decorrer dos anos. A simples presença do verme não gera danos graves ao hospedeiro. Por outro lado, os ovos retidos principalmente no fígado e intestino são os responsáveis diretos pela patologia da esquistossomose, desencadeando uma resposta inflamatória granulomatosa e provocando hemorragias e ulcerações durante sua passagem para a luz intestinal (Boros & Warren, 1970). Os ovos de S. mansoni apresentam uma espícula lateral que permite a eles resistir ao fluxo sangüíneo e podem também auxiliar na penetração da parede das vênulas. Enzimas histolíticas liberadas pelos ovos permitem seu deslocamento durante sua passagem pelos tecidos em direção a luz do intestino. O granuloma ocorre devido à reação do sistema imune do hospedeiro aos antígenos solúveis liberados pelos ovos, levando a uma fibrose progressiva que pode causar lesões vasculares obstrutivas, hipertensão portal, ascite e varizes esofageanas, cujo rompimento pode ser fatal (Neves, 1983; Dunne et al., 1995).

2 - O ovo do Schistosoma mansoni

O ovo do S. mansoni (Figura 4) é o elemento fundamental da patologia da esquistossomose. Sua eliminação junto com as fezes merece estudo especial por fornecer o principal e mais seguro meio de diagnóstico da esquistossomose. Os ovos medem cerca de 150µm de comprimento por 65µm de largura. Sua casca é transparente e frágil, por isso aparecem bem em preparações opacas e podem ser destruídos pela pressão (Pessoa, 1982).

Dissertação de Mestrado

Michelyne Sidney Castro Faria

9

Introdução

Figura 4 - Ovo de S. mansoni. A espícula lateral é vista na parte de cima da figura. Fonte: [http://www.cdfound.to.it/_atlas.htm]

Dissertação de Mestrado

Michelyne Sidney Castro Faria

10

Introdução

A casca exterior do ovo, ou cório, tem forma oval, bastante regular, apenas interrompida pela espícula, cujo ápice agudo é compacto, sendo a base cônica e escavada. Essa casca é revestida por uma variedade de esclerotina, onde as proteínas e substâncias eliminadas pelas células vitelinas sofrem um processo de condensação em torno dos elementos ovulares (célula ovo e células vitelinas). Os ovos consomem vários metabólitos exógenos, demonstrando síntese ativa de DNA e catabolismo elevado de aminoácidos enquanto que a glicólise é muito baixa, pois o miracídio conta com um ciclo de Krebs muito eficiente (Pessoa, 1982; Rey, 1991). No momento da postura, os ovos são não embrionados. Após a postura, ocorrerá a segmentação do ovo, uma célula formará os elementos somáticos e a outra se manterá com caráter de célula germinativa. A célula somática divide-se várias vezes e algumas das células filhas, que estão na periferia, vão formar a membrana vitelina, uma membrana hialina, diretamente sob a casca, onde as células filhas perdem sua estrutura celular. A célula germinativa também se divide várias vezes, dando em cada mitose uma célula germinativa e outra somática. Cada nova célula somática irá juntar-se ao grupo de células somáticas acima referido, para constituir o corpo do embrião. A célula germinativa forma o grupo de elementos indiferenciados que permanece incluído no segmento posterior do corpo do miracídio e se destina a formar a próxima geração de larvas no hospedeiro intermediário. Sempre haverá um aglomerado de células germinativas responsável pela fase evolutiva seguinte. São necessários seis dias para o ovo do S. mansoni chegar à maturidade em tecidos humanos; e somente quando está maduro, o ovo é excretado junto com as fezes (Rey, 1991). Pouco se conhece a respeito do mecanismo de migração dos ovos. Eles se aderem à parede do capilar e são excluídos do vaso sem que haja hemorragia. Quando aglomerados em grande número, há desorganização dos capilares obstruídos. Possivelmente, ações mecânicas devidas ao peristaltismo intestinal e ações líticas desenvolvidas por enzimas do próprio miracídio ou dos eosinófilos, que se aderem em grande número à superfície ovular, poderiam contribuir para a progressão dos ovos (Rey, 1991). Quando apenas um pequeno número de ovos viáveis consegue atingir a luz intestinal as lesões produzidas são mínimas, com reparações teciduais rápidas; quando os ovos estão

Dissertação de Mestrado

Michelyne Sidney Castro Faria

11

Introdução

presentes em grande número, podem provocar hemorragias, edemas da submucosa e fenômenos degenerativos, com formações ulcerativas pequenas e superficiais. Essas lesões são em geral reparadas, com reconstituição da integridade dos tecidos. Os ovos maduros e o antígeno

solúvel

excretados

pelos

poros

dos

ovos

provocam

reação

inflamatória

granulomatosa e os granulomas formados podem apresentar-se em pontos isolados ou difusos no intestino grosso e fígado (Neves,1995). A viabilidade dos ovos maduros é de aproximadamente 20 dias, morrendo o miracídio caso a expulsão não se complete dentro de três a quatro semanas após a oviposição. No meio exterior, em massa fecal sólida, o miracídio pode conservar-se vivo dentro do ovo na temperatura ambiente durante dois a três dias, sem mortalidade apreciável. Em fezes semilíquidas ou líquidas, nas quais o fenômenos de fermentação e putrefação são mais ativos, eles apenas conseguem resistir por 24 horas. O mecanismo de eclosão parece depender sobretudo da hipotonicidade do meio, que promovendo a passagem de água para dentro da casca determina um aumento da tensão interna. A ruptura do ovo, porém só se completa quando este é exposto à luz. Isso se deve à ação de uma substância, talvez uma enzima que, sensibilizada pela luz age atacando e enfraquecendo toda a casca do ovo. Água limpa e temperatura apropriada, em torno de 28°C, também são condições que favorecem a eclosão. Esse fenômeno é completamente inibido a 4°C e nunca se realiza no interior do hospedeiro, aparentemente, devido às condições de isotonicidade que aí prevalecem (Rey,1991; Pessoa, 1982). O miracídio é revestido por cílios, voltados para trás na sua parte anterior, com dois pares de glândulas adesivas. Há duas aberturas tubulares do sistema excretório constituído por dois pares de células em forma de chama e uma glândula de penetração, contendo materiais que se supõe, sejam enzimas. A parede do corpo completa-se com um folheto mesodérmico que contém fibras musculares. Eles são notavelmente fototrópicos e se movem para o lado mais iluminado após a eclosão (Pessoa, 1982).

Dissertação de Mestrado

Michelyne Sidney Castro Faria

12

Introdução

3 - O genoma do Schistosoma mansoni O S. mansoni é um organismo diplóide, contendo sete pares de autossomos e um par de cromossomos sexuais. O sexo homogamético é o macho (ZZ) e o heterogamético, a fêmea (ZW). A definição de cariótipos é possível usando a morfologia do cromossomo e a técnica de bandeamento C, que identifica regiões de heterocromatina em cromossomos metafásicos (Short & Grossman, 1981; Short, 1983). Os oito pares de cromossomos são divididos em três grupos, de acordo com o seu tamanho: dois pares grandes incluindo os cromossomos sexuais, três pares médios e três pares pequenos. O tamanho estimado do genoma hapllóide do 8

Schistosoma é de 2,7x10 pb, sendo equivalente a um décimo do genoma humano. O genoma consiste de aproximadamente 4% de DNA altamente repetitivo (>1000 cópias) e de 35 a 40% de DNA de média repetição (Simpson et al., 1982). Possui um elevado conteúdo médio de A+T (66%), obtido pelos perfis de desnaturação térmica e cálculos de densidade de flutuação (Hillyer, 1974). O conteúdo médio de A+T varia dependendo se o DNA é de região codificadora (em torno de 60%) ou não (70%) (Meadows & Simpson, 1989; Milhon & Tracy, 1995). Baseado no seu tamanho e posição evolutiva (Omer et al., 1991), calcula-se que o genoma do Schistosoma contenha de 15.000 a 20.000 genes expressos. Entretanto, tem-se pouca informação sobre o seu genoma e o número de genes completa ou parcialmente sequenciados e depositados em bancos de dados é somente pouco mais que 30% do total estimado [http://www.nhm.ac.uk/hostedsites/schisto] .

Dissertação de Mestrado

Michelyne Sidney Castro Faria

13

Introdução

4 - Projetos Genoma Os diversos Projetos Genoma (PGs) têm se baseado em duas estratégias distintas: o sequenciamento total do DNA genômico, ou o sequenciamento parcial apenas das porções correspondentes a genes expressos. A obtenção das seqüências completas de grandes porções de DNA genômico é uma abordagem pioneira que vem sendo utilizada no conhecimento detalhado de genomas de organismos, desde o advento das enzimas de restrição e das DNA polimerases. Em 1977, foi publicada a primeira seqüência completa de um genoma, a do bacteriófago φX (Sanger et al., 1977a) com cerca de 5 Kb. No entanto, os protocolos de sequenciamento apenas ganharam impulso com a publicação dos métodos de sequenciamento

por

terminação

da

cadeia

de

DNA

através

da

incorporação

de

didesoxinucleotídeos (Sanger et al, 1977b) e degradação química (Maxam & Gilbert, 1977). Essas metodologias serviram de base para posterior obtenção da seqüência completa do DNA mitocondrial humano (Anderson et al, 1981), e da seqüência completa do bacteriófago T7 (Dunn & Studier, 1983). Esses dois métodos forneceram o embasamento prático e teórico de toda a tecnologia de sequenciamento atualmente empregada. Com o advento dos sequenciadores automáticos de DNA, a produção de seqüências se tornou muito mais rápida e eficiente e isto se refletiu no custo final do sequenciamento, caindo de cerca de U$ 4,00/base, para em torno de U$ 1,00/base ou até menos (Chen, 1994). A obtenção da seqüência completa do cromossomo III de levedura (Oliver et al, 1992), representou um marco importante como primeiro sequenciamento completo de um cromossomo. A seqüência das 315 Kb revelou 182 fase abertas de leitura (>100 aa), das quais apenas 37 correspondiam a genes conhecidos na época da publicação do trabalho. Hoje já presenciamos a conclusão de projetos extremamente ambiciosos, que permitiram o sequenciamento

completo

de

genomas

de

vinte

e

nove

microorganismos

(http:\\www.ncbi.nlm.nih.gov/entrez), e organismos multicelulares, chegando aos mais precisos detalhes da sua “anatomia molecular”.

Dissertação de Mestrado

Michelyne Sidney Castro Faria

14

Introdução

Diante do imenso tamanho dos genomas dos organismos mais desenvolvidos, uma alternativa razoável seria a de priorizar o sequenciamento das regiões codificadoras que, apesar de geralmente representarem um pequeno percentual do genoma, contêm a maior parte de sua informação. Adams e cplaboradores, em 1991, mostraram uma abordagem pioneira que permitiu acelerar o descobrimento de seqüências de genes expressos, utilizando as chamadas “Etiquetas de Seqüências Transcritas”, ou ESTs (do inglês – “Expressed Sequence Tags”). As ESTs representam o sequenciamento parcial de uma ou ambas extremidades de cDNAs selecionados ao acaso de bibliotecas. São assim gerados, fragmentos de genes que podem ser utilizados na busca de similaridades com seqüências depositadas em bancos de dados de domínio público, levando a identificação destes genes em um único passo. Esta abordagem oferece uma maneira fácil, eficiente e rápida de obtenção de seqüências de um grande número de clones, sendo ainda hoje uma das principais estratégias empregadas nos diversos Projetos Genoma dos mais diversos organismos. As ESTs produzidas, em geral, são depositadas em um banco de dados específico, criado dentro do GenBank em 1993 e denominado dbEST (banco de dados de etiquetas de seqüências transcritas - Boguski et al, 1993). Nesse banco de dados, além das seqüências serem armazenadas, são procuradas e removidas regiões repetitivas ou porções de vetores que eventualmente foram depositadas como parte de ESTs. As seqüências desse banco também são freqüentemente comparadas com seqüências já conhecidas, na tentativa de se identificar ESTs depositadas (Cooke et al, 1996). A evolução do dbEST, em termos de número de seqüências, é tremenda. A versão liberada em 2 de janeiro de 1997 continha mais de um milhão de ESTs de oitenta diferentes organismos. Em 01 de junho de 2000, existiam mais de quatro milhões de ESTs disponíveis provenientes de mais de duzentas espécies distintas (release 052600). Na Tabela 1 é mostrada a evolução do número de ESTs depositadas de algumas espécies no dbEST.

Dissertação de Mestrado

Michelyne Sidney Castro Faria

15

Introdução

Tabela 1– Evolução do número de seqüências de diferentes organismos disponíveis no dbEST

Organismos

Número de seqüências no dbEST 11/01/1996* 08/11/1997* 02/10/1998* 30/06/1999* 14/01/2000*

Homo sapiens

322.044

539.706

1.108.190

01/06/2000*

1.553.608

1.709.377

1.957.342

4.770

120.098

370.350

688.084

904.535

983.211

Caenorhabitis elegans

23.950

30.196

72.569

100.845

101.232

101.252

Arabdopsis thaliana

22.641

29.166

37.446

37.766

45.757

49.167

Oryza sativa

11.301

12.672

27.975

46.418

47.449

49.464

206

8.165

10.676

10.741

10.741

12.177

Rattus sp

5.336

6.615

63.085

124.324

132.623

158.856

Brugia malayi

1.208

5.184

16.578

18.426

20.773

22.041

Saccharomyces cerevisiae

2.944

2.944

3.041

3.041

3.041

3.041

Caenorhabitis briggsae

2.425

2.424

2.424

2.424

2.424

2.424

518

2.175

3.519

4.742

4.742

4.809

Schistosoma mansoni

1.106 1.439

2.011 1.958

2.871 6.534

2.871 11.639

2.871 12.509

2.871 12.675

Zea mays

1.183

1.757

2.749

30.472

47.143

56.944

Brassica napus

1.021

1.427

1.434

1.702

1.702

1.702

Sus scrofa

817

1.055

2.365

4.136

4.136

22.427

Brassica campestris

965

965

966

936

963

963

Ricinus communis

750

750

750

747

747

747

Mus musculus + domesticus

Toxoplasma gondii

Trypanosoma brucei Plasmodium falciparum

-

577

577

577

577

577

Leishmania major

271

527

2.191

2.191

2.191

2.191

Onchocerca volvulus

310

306

5.014

8.045

8.561

10.306

Pinus taeda

256

256

1.953

3.848

9.845

13.789

Capra hircus

108

245

245

245

245

245

Strongylocentrotus purpuratus

242

242

242

313

1.076

1.076

Oryctolagus cuniculus

237

206

1.659

2.086

2.094

2.094

97

191

304

388

4.194

12.479

Pyrococcus furiosus

Gallus gallus

128

128

4.205

35.723

53.878

67.156

Schistosoma japonicum

-

109

719

1.106

1.395

1.598

Saccharum sp

-

105

469

495

495

495

Wuchereria bancrofti

-

99

125

125

125

131

Glycine max

88

97

97

19.826

35.619

78.281

Sorghum bicolor

91

91

107

107

5.431

20.473

-

87

87

87

87

87

85

85

85

335

335

335

-

78

567

567

567

567

60

60

199

249

254

47.792

406.597

772.757

3.179.734

3.701.785

Danio rerio

Citrus sinensis Aspergillus niger Cryptosporidium parvum Bos taurus Total de seqüências no dbEST

1.752.367

2.719.235

* Data da pesquisa feita no dbEST Fonte: [http://www.ncbi.nlm.nih.gov/dbEST/dbEST_summary.html]

Dissertação de Mestrado

Michelyne Sidney Castro Faria

Introdução

16

A geração de ESTs pela seleção aleatória de clones de bibliotecas de cDNA permitiu que um grande número de Projetos Genoma fosse iniciado e que milhares de novas seqüências fossem descritas nos mais diversos organismos. Essa metodologia é uma ferramenta poderosa na obtenção de informações importantes tais como a quantidade e o tipo de genes mais abundantemente expressos em um determinado tecido, órgão ou estágio evolutivo, ou ainda em determinadas fases do desenvolvimento de um determinado organismo. Entre os PGs, o mais ambicioso deles é, sem dúvida, o Projeto Genoma Humano (PGH). A conclusão desse projeto é prevista para 2003 pelo grupo do PGH do NIH, mas a “Celera Genomics”, empresa privada dirigida por Craig Venter assumiu um compromisso de conclusão em 2001. O grupo de Venter anunciou em abril de 2000 que após ter sequenciado todas as bases, atualmente está trabalhando na ordenação do genoma humano. A seqüência do cromossomo 22 foi publicada em dezembro de 1999 e mostrou ser um marco importante na descrição da primeira seqüência completa do PGH. Esse cromossomo consiste de 12 “contigs” com 33,4Mb e contém 545 genes e 134 pseudogenes, fornecendo o primeiro mapa de um cromossomo e nos dando uma idéia do que pode ser encontrado no restante do genoma (Dunham et. al., 1999). Em 18 de maio de 2000 foi publicado pela revista Nature um artigo sobre a seqüência completa do cromossomo 21, realizado principalmente por grupos japoneses e alemães. Esse cromossomo representa de 1 a 1,5% do genoma humano e é o menor dos autossomos. Uma cópia extra do cromossomo 21 provoca a síndrome de Down, a causa genética mais freqüente e significativa do retardo mental, que afeta um a cada setecentos nascimentos. Esse trabalho relata com alta precisão a seqüência do braço longo do cromossomo 21 com 33,5Mb de DNA e 281 Kb do braço curto o que cobre 99,7% do 21q. A análise do cromossomo revela 127 genes conhecidos, 98 possíveis genes e 59 pseudogenes (Hattori, et al., 2000). Na proposta inicial do PGH (NRC, 1988) uma grande ênfase foi dada à produção de mapas e ao sequenciamento do genoma de organismos modelo, a fim de se permitir uma troca de informações principalmente com respeito aos genes que, na maioria dos casos, são

Dissertação de Mestrado

Michelyne Sidney Castro Faria

17

Introdução

conservados entre as espécies. Alguns destes organismos modelo são de interesse médico ou evolutivo e seus genomas, de maneira geral, tem um tamanho bem menor que o humano. Entre os organismos escolhidos estavam o nematódeo Caenorhabiditis elegans, a levedura Saccharomyces cerevisiae, a mosca de frutas Drosophila melanogaster, a planta dicotiledônea Arabidopsis thaliana e o camundongo (Mus musculus). Desses organismos, o C.elegans (Ainscough et al.,1998), o Saccharomyces cerevisiae (Goffeau et al.,1997) e a D. melanogaster (Adams et al., 2000) já tiveram os seus genomas completamente sequenciados. Um grande acontecimento com relação ao sequenciamento de genoma de organismos de vida livre foi relatado por Fleischmann et al., (1995). O Haemophilus influenza foi a primeira bactéria a ser completamente sequenciada usando a estratégia de “shot-gun”. Este estudo demonstrou que o organismo possui 1.830.137pb e um número estimado de 1.743 genes. Destes, 42% não apresentavam níveis de similaridade significativos nos bancos de dados e os 1.007 restantes (58%), apresentaram similaridade significativa com proteínas associadas a diversas funções: 14% estariam ligados à tradução; 12,2% teriam a função de ligação e transporte; 10,4% seriam ligadas ao metabolismo energético e 8,6% participariam no processo de replicação (Fleischmann et al., 1995). A estratégia de “shot-gun” trabalha com clones de DNA genômico em plasmídios, bacteriófagos, cosmídios e BACs, que são parcial ou totalmente sequenciados a partir de ambas as extremidades, e tem suas seqüências sobrepostas em busca de regiões que permitam ordenar os clones e fazer montagens de seqüências contínuas. Essa mesma estratégia foi usada no sequenciamento completo dos genomas das bactérias Mycoplasma genitalium (Fraser et al., 1995) Methanococcus jannaschii (Bult et al., 1996), Synechocystis sp. (Kaneko et al., 1996 a,b) e Mycoplasma pneumoniae (Himmerlreich et al., 1996). Atualmente, 29 microorganismos já tiveram o seu genoma totalmente sequenciado e 85 estão em

andamento (http:\\www.ncbi.nlm.nih.gov/entrez).

A obtenção da seqüência

nucleotídica completa do Saccharomyces cerevisiae, o primeiro organismo eucarioto a ser sequenciado, foi uma marca nesse tipo de projeto. A análise da seqüência nucleotídica dos 16 cromossomos (12.086Kb), mostrou a existência de genes, em média, a cada 2Kb do genoma, indicando que provavelmente 70% do DNA é formado por fases abertas de leitura com um total

Dissertação de Mestrado

Michelyne Sidney Castro Faria

18

Introdução

de 5.885 genes. Dentre algumas características interessantes do genoma da levedura, podemos citar: o pequeno percentual de genes contendo introns (4%) e a alta redundância do genoma, com várias cópias similares de diversos genes, representando possivelmente diferentes isoformas ou membros de famílias gênicas (Goffeau et al., 1996). O nematódeo C. elegans foi o primeiro organismo multicelular a ter o genoma sequenciado, revelando através de 97Mb mais de 19.000 genes (Ainscough, et al., 1998; http://www.sanger.ac.uk/Projects/C_elegans/). A D. melanogaster, um dos organismos mais intensivamente estudados, teve o sequenciamento do seu genoma publicado por Adams et al., em março de 2000. A drosófila é um modelo para a investigação dos processos celulares comuns entre os eucariotos superiores, incluindo os humanos. Seu genoma codifica aproximadamente 13.600 genes, um número um pouco menor que o genoma do C. elegans, mas apresenta uma diversidade funcional bastante semelhante. É impossível falarmos hoje de evolução do PG no Brasil, sem citarmos o PG da Xylella fastidiosa, bactéria causadora de uma grave doença relacionada ao xilema das laranjeiras, a clorose variegada dos citros (CVC) ou amarelinho, e que são muito importantes economicamente. Esse projeto, idealizado pela FAPESP, teve uma importância estratégica por seus frutos diretos e indiretos. O estado de São Paulo é uma das maiores regiões produtoras de cítricos do mundo e uma séria ameaça à sua produção é a CVC, que já mostra sinais de infecção em 30% das plantações do mesmo produto nesse estado. Foi então criado o primeiro grupo de sequenciamento em larga escala fora do primeiro mundo e estabelecido um centro virtual de sequenciamento de DNA, denominado ONSA (“Organization for Nucleotide Sequencing and Analysis”), que agrupou todos os membros do projeto (Teixeira,1999). Os sintomas da CVC incluem variegações visíveis em folhas mais velhas, e na face superior são encontradas lesões marron claras e um material semelhante a uma goma na face inferior. As frutas afetadas são pequenas, endurecidas e sem valor comercial. Seu primeiro registro no Brasil se deu em 1987, afetando todo o comércio de laranjas doces. Em 1993, a

Dissertação de Mestrado

Michelyne Sidney Castro Faria

19

Introdução

primeira linhagen de Xylella fastidiosa causadora da doença foi identificada e em 1996 descobriram que sua transmissão ocorria através de uma espécie de cigarra cicadellidae. O genoma da Xylella fastidiosa é composto de 2.679.305 pb em um cromossomo circular e de dois plasmídeos de 51.158 pb e 1.285pb. Foram sugeridas funções para 47% das regiões codificantes, como funções metabólicas eficientes, que se utilizam do açúcar como principal fonte de energia e carbono, mantendo uma “seiva de xilema” pobre em nutrientes. Os mecanismos associados com a patogenicidade e virulência envolvem toxinas, antibióticos e sistemas de “sequestro de íons” tanto quanto interações bactéria-bactéria e bactériahospedeiro, mediadas por uma série de proteínas. Antes da elucidação da sequência completa do genoma da Xylella fastidiosa, muito pouco era conhecido a respeito do seu mecanismo molecular de patogenicidade. A viabilidade deste primeiro genoma, completamente sequenciado de um fitopatógeno, permitirá o início de comparações detalhadas entre patógenos de animais e plantas no que se refere ao genoma total. Esta informação poderá fornecer as bases para experimentos rápidos de análise das interações entre Xylella fastidiosa e os hospedeiros que podem levar a novas idéias dentro de potenciais abordagens para o controle da CVC (Simpson et.al., 2000). A conclusão desses projetos vem inaugurar a era pós-gênomica que tem como objetivo elucidar a função de todos os novos genes revelados nesses projetos. Essa fase representa um grande desafio que exige um intenso esforço de colaboração entre os membros da comunidade científica mundial. Sem dúvida, o conhecimento cada vez maior do conteúdo genético dos organismos modelo e também do homem promoverá um forte incentivo aos estudos de questões evolutivas e das inter-relações entre diferentes funções biológicas dos genes descobertos. Cerca de 100 genomas e cromossomos de microorganismos ainda estão sendo estudados por várias instituições e certamente irão contribuir com muitas informações extremamente valiosas (http://www.tigr.org/tdb/mdb/mdb.html e http://www.celera.com).

Dissertação de Mestrado

Michelyne Sidney Castro Faria

Introdução

20

4.1 - Projetos Genoma de Parasitos Os parasitos são encontrados em todo o redor do mundo, devastando plantações e causando doenças em criações e no homem. O seu controle é difícil, devido a uma longa e bem sucedida adaptação aos seus hospedeiros, adquirida durante dezenas de milhões de anos de co-evolução. Esta co-evolução permitiu o desenvolvimento de eficientes mecanismos de escape das defesas imunológicas dos hospedeiros e, recentemente, o surgimento de mecanismos de resistência a diversas drogas. Esses fatores fazem com que, ainda nos dias de hoje, as doenças parasitárias estejam entre os mais graves problemas de saúde pública que atingem o homem. Seu crescimento pode ser demonstrado pelos milhões de casos novos que surgem a cada ano e a sua gravidade é refletida nos milhões de óbitos anuais em todo o mundo, principalmente nas regiões menos desenvolvidas do globo. O desenvolvimento de métodos de análises moleculares que permitam conhecer a fundo as características biológicas do parasito, deverá possibilitar o desenvolvimento de abordagens eficazes e de baixo custo, úteis no controle dessas endemias. Após o início do PGH em 1990, surgiram vários outros PGs dos mais diversos organismos e dentre eles os PGs de parasitos. A entrada do Brasil na era da pesquisa genômica em larga escala iniciou-se com o primeiro PG, o PG de Schistosoma mansoni, em 1992. Em 1994, na tentativa de estimular o progresso de PGs de parasitos extremamente relevantes na saúde pública, mas sem um financiamento substancial de entidades privadas, a Organização Mundial de Saúde (OMS) através do seu Programa Especial para Pesquisa e Treinamento em Doenças Tropicais (TDR), começou a apoiar e financiar parcialmente alguns destes PGs. Foram escolhidos os parasitos relacionados a cinco doenças: esquistossomose (Schistosoma mansoni e Schistosoma japonicum), filariose (Brugia mallayi, Wuchereria bancrofti, e Onchocerca volvulus), leishmanioses (Leishmania sp), doença de chagas (Trypanosoma cruzi) e tripanosomíase africana (Trypanosoma brucei), que junto com a malária (Plasmodium sp) e a toxoplasmose (Toxoplasma gondii) constituem as parasitoses mais graves

Dissertação de Mestrado

Michelyne Sidney Castro Faria

Introdução

21

e de maior incidência no mundo. A iniciativa da OMS teve como objetivos principais o desenvolvimento de mapas detalhados do genoma de parasitos, a implementação de novas tecnologias, o desenvolvimento de bancos de dados acessíveis aos pesquisadores interessados, o desenvolvimento de métodos de análises genéticas de parasitos, e o treinamento de pesquisadores de países do Terceiro Mundo onde essas parasitoses são endêmicas (UNDP/WORLD BANK/WHO-TDR, http://www.bdt.org.br/leishnet/lgp/whoann.html). A proposta dos PGs de Parasitos já provou ser um mecanismo extremamente eficiente para gerar informações abundantes e fundamentais sobre os parasitos. Informações sobre os vários PGs de parasitos podem ser obtidas em diversos “sites” que estão listados na Tabela 2.

Dissertação de Mestrado

Michelyne Sidney Castro Faria

22

Introdução

Tabela 2 - Sítios WWW do projeto Genoma de Parasitos

Sítios do Projeto Genoma de Malária

http://parasite.arf.ufl.edu/malaria.html

(P. falciparum)

(Gene sequence tag project) http://www.sanger.ac.uk/Projects/P_falciparum/ (Genomic Sequencing project)

- Banco de dados de malária

http://www.wehi.edu.au/MaIDB-www/who.html

- Sítio do Projeto Genoma de Leishmania

http://www.ebi.ac.uk/parasites/leish.html

- Sítio do Projeto Genoma de T. brucei

http://parsun1.path.cam.ac.uk/

- Sítio do Projeto Genoma de T.cruzi

http://www.dbbm.fiocruz.br/genome/tcruzi/tcruzi.html

- Sítios do Projeto Genoma de S. mansoni

http://www.nhm.ac.uk/hosted_sites/schisto/ http://www.who.int/ctd/html/schisto.html http://www.cdc.gov/ncidod/dpd/schisto.htm

- Sítios do Projeto Genoma de Filária

UK: http://helios.bto.ed.ac.uk/mbx/fgn/filgen1.html US Mirror: http://math.smith.edu/~sawlab/fgn/filgen.html

Sítios de coordenação - Sítio WHO de Projeto Genoma - Sítio WHO do Projeto Genoma (FTP) - WHO-TDR Comitê do Projeto Genoma - Projeto Genoma de Parasitos - Lista e arquivo

http://www.ebi.ac.uk/parasites/parasite-genome.html (incluindo o servidor BLAST para grupos individuais de dados de parasitos) ftp.ebi.ac.uk/pub/databases/parasites/ http://www.who.ch/tdr/workplan/genome.htm http://www.mailbase.ac.uk/lists-p-t/parasite-genome/

de Clientes:

Dissertação de Mestrado

Michelyne Sidney Castro Faria

Introdução

23

A descoberta gênica de parasitos tem tido um enorme sucesso, resultando em um crescimento logarítmico da lista de seqüências conhecidas de parasitos. É importante para os PGs de parasitos agora dedicarem-se a análise do Pós-Genoma, buscando as funções para os genes catalogados (Johnston et al., 1999). O projeto genoma de Schistosoma mansoni é discutido a seguir como um tópico especial, dado a sua importância como tema dessa dissertação. A iniciativa da WHO-TDR e dos vários laboratórios de Primeiro e Terceiro Mundo envolvidos no desenvolvimento de tais projetos, abriu precedentes para o início de outros projetos genoma de parasitos que são de grande importância médica nos países em desenvolvimento.

4.2 - Projeto Genoma de Schistosoma mansoni A primeira iniciativa de um Projeto Genoma no Brasil envolveu o sequenciamento dos genes expressos no Schistosoma mansoni. O projeto foi iniciado em 1992, por um esforço conjunto do Dr. Sérgio Pena (Depto. de Bioquímica e Imunologia do Instituto de Ciências Biológicas da Universidade Federal de Minas Gerais - ICB – UFMG) e do Dr. Andrew Simpson (até então chefe do Laboratório de Biologia Molecular do Centro de Pesquisas René Rachou da Fundação Oswaldo Cruz – CPqRR, FIOCRUZ), ambos em Belo Horizonte. Na sua fase inicial, o Projeto Genoma de Schistosoma mansoni (PGSM) contou com o importante apoio logístico do Dr. Craig Venter (até então Diretor do “The Institute for Genomic Research” – TIGR, em Gaithersburg, MD, Estados Unidos). Quando o PGSM teve início, menos de 100 genes de S. mansoni tinham sido completamente ou parcialmente sequenciados, e depositados em bancos de dados. Para que se conseguisse sequenciar a porção expressa do genoma de S. mansoni, era necessário adotar uma técnica que fosse ao mesmo tempo eficiente e rápida. A estratégia básica que passou a ser utilizada, envolveu o sequenciamento em um único passo de clones de cDNA selecionados aleatoriamente de bibliotecas, para a obtenção das Etiquetas de Seqüências

Dissertação de Mestrado

Michelyne Sidney Castro Faria

24

Introdução

Transcritas (ESTs). As ESTs representam uma metodologia extremamente simples, de custo moderado, sendo portanto acessível a pequenos laboratórios. Além de permitir trabalhar apenas com seqüências expressas e identificar rapidamente uma grande quantidade delas por meio de comparações feitas com seqüências depositadas em bancos de dados via Internet, as ESTs tem muitas outras aplicações. Elas mostraram ter grande aplicabilidade na construção de mapas físicos, na caracterização de grandes seqüências genômicas e em tecnologias aplicadas à indústria farmacêutica, numa tentativa de desenvolver tratamentos mais eficazes para doenças (Zweiger & Scott, 1997). O S. mansoni tem um complexo ciclo de vida e a sua manutenção em laboratório é feita infectando hospedeiros invertebrados (caramujos) e hospedeiros vertebrados (camundongos ou hamsters). A complexidade do seu ciclo de vida torna difícil a obtenção de genes das várias fases. Foi decidido então pelo WHO Schistosoma “Genome Network”, que o PGSM usaria bibliotecas de cDNA já disponíveis na comunidade científica, até que novas bibliotecas de diferentes estágios do parasito fossem construídas. O sequenciamento de cDNAs isolados de bibliotecas construídas dos diversos estágios, permitiria então, fazer comparações dos diferentes padrões de expressão gênica nos vários estágios de desenvolvimento do parasito. Atualmente bibliotecas de verme adulto (mista; de macho; de fêmea; enriquecida em macho e enriquecida em fêmea), ovo, cercária, miracídio e esquistossômulo (de 7 e 25 dias), tem sido usadas no sequenciamento em larga escala (http://www.nhm.ac.uk/hosted_sites/schisto/gene_discovery/cDNA_libraries.html). O trabalho de sequenciamento do genoma expresso de S. mansoni foi iniciado nos Estados Unidos pela Dra. Glória Franco, da equipe do Dr. Sérgio Pena (Depto. de Bioquímica e Imunologia do Instituto de Ciências Biológicas da Universidade Federal de Minas Gerais - ICB UFMG), após a construção de uma biblioteca direcional de cDNA de vermes adultos da cepa NMRI (Fletcher et al., 1981) de S. mansoni. Esse trabalho permitiu a primeira publicação do PGSM com 607 ESTs que foram sequenciadas a partir de 429 clones, correspondendo a 169 genes distintos do parasito e aumentando assim, o número de seqüências disponíveis nos bancos de dados (Franco et al., 1995). Do total de genes distintos, 154 representavam genes

Dissertação de Mestrado

Michelyne Sidney Castro Faria

25

Introdução

ainda não conhecidos e apenas 15 já haviam sido sequenciados anteriormente nesse parasito. Esses novos genes descritos de S. mansoni constituíram uma ampla gama de transcritos distribuídos entre proteínas estruturais e regulatórias de citoplasma, enzimas, proteínas secretoras, proteínas de membrana e núcleo e proteínas com outras funções. Em 1997, Rabelo et al., sequenciaram outros 363 cDNAs de verme adulto gerando 205 ESTs derivadas de 185 clones. Essas ESTs permitiram a identificação de 91 genes diferentes, dentre os quais haviam 74 genes (81,3%) ainda não descritos em S. mansoni. Franco et al. (1997), iniciaram um estudo comparativo da expressão gênica em diferentes estágios de desenvolvimento do S. mansoni e relataram a geração de 1.401 ESTs a partir de 7 diferentes bibliotecas de cDNA construídas com 4 estágios distintos do parasito. As bibliotecas foram primeiramente avaliadas quanto à sua qualidade para posterior utilização para a produção de ESTs em larga escala. Esse estudo mostrou que existia menos de 20% de clones não úteis nas bibliotecas, 71,5% de novos genes e 8,3% de genes já identificados em S. mansoni. A redundância também foi analisada e mostrou que apenas uma das bibliotecas de verme adulto era composta de um pequeno número de genes altamente freqüentes, podendo representar genes “housekeeping”. Alguns genes foram detectados em vários estágios de desenvolvimento do parasito, sendo que a grande maioria foi isolada apenas uma vez das bibliotecas. Recentemente, bibliotecas de cDNA de cercária e de ovo começaram a ser exploradas. Um trabalho de descoberta gênica em cercária, foi desenvolvido nos laboratórios de GenéticaBioquímica (Depto. de Bioquímica e Imunologia) e de Genética Molecular e Celular (Depto de Biologia Geral) e concentrou-se na exploração de duas bibliotecas de cDNA de cercária, gerando 962 ESTs (que representam 453 genes distintos) dessa fase específica (Santos et al., 1999). As ESTs mais abundantes são associadas ao metabolismo energético, sendo que Sm8, uma proteína ligadora de cálcio, representa 8% dessas seqüências. Foram identificadas ainda 11 categorias de genes ligados a outros tipos de metabolismos, transportes, proteínas estruturais e de citoesqueleto, proteínas tegumentar e de membrana, proteínas regulatórias e de sinalização, proteínas relacionadas com transcrição e tradução, entre outras.

Dissertação de Mestrado

Michelyne Sidney Castro Faria

26

Introdução

Encorajado pelos resultados iniciais obtidos, laboratórios na Inglaterra, Egito, Estados Unidos, Japão e França se associaram aos grupos brasileiros. Atualmente esse projeto é coordenado pelo Dr. Phillip LoVerde (State University of New York, de Buffalo, USA). Os dados referentes ao PGSM estão armazenados em “sites” desenvolvidos pelo Dr. David Johnston do NIH e no EBI em Cambridge, pelo Dr. Martin Aslett (Tabela 2). No Brasil, o PGSM recebeu o apoio financeiro de entidades como FAPEMIG, FIOCRUZ, CNPq/PADCT e desde 1994 o PGSM vem sendo financiado também pela OMS. O sucesso do programa de descoberta gênica em S. mansoni, utilizando a estratégia das ESTs, é demonstrado pelo número de genes catalogados que já cobre de 20% a 30% do genoma, representados por mais de 12.500 ESTs que se encontram disponíveis em bancos de dados de acesso público dbEST release 041400 (http://www.ncbi.nlm.nih.gov/dbEST/dbEST_summary.html)

Núme ro de e ntrada s nos ban cos de da dos

(Figura 5).

12000 9000 6000 3000 0 1993

1994

1995

1996

1997

1998

1999

Ano EST

GENE

Figura 5 – Número de ESTs e genes depositados em bancos de dados de 1993 a 1999. (Franco et al., 2000).

Dissertação de Mestrado

Michelyne Sidney Castro Faria

27

Introdução

O aumento do número de seqüências permite um maior conhecimento da biologia do S. mansoni, o que certamente contribuirá para a elucidação de importantes questões biológicas relacionadas a esse parasito. Dentre essas questões, podemos destacar as várias estratégias utilizadas pelo parasito que permitem a sua longa sobrevivência no hospedeiro vertebrado. A compreensão dessas estratégias poderá fornecer, por exemplo, dados importantes para o descobrimento de novos alvos quimioterápicos e antígenos para a produção de vacinas. O maior conhecimento do genoma de S. mansoni já oferece de imediato, novas ferramentas que podem ser usadas no estudo mais profundo da variabilidade genética e evolução do parasito. Em 1992, no Japão, o grupo da Dra. Manami Tanaka iniciou, paralelamente à iniciativa brasileira, a construção de um mapa físico do genoma de S. mansoni a partir de uma biblioteca de DNA de cercária em YAC, que continha cerca de 3.000 clones e insertos de 358Kb em média e que cobria 2,6 equivalentes genômicos (Tanaka et. al., 1995). Elementos repetitivos, genes individuais e ESTs foram utilizados no mapeamento. Nesse trabalho, os vários clones de YAC foram ordenados a partir de sua localização em cromossomos metafásicos usando a técnica de hibridização fluorescente in situ (FISH), gerando o primeiro mapa físico de baixa resolução do S. mansoni. O grupo da Dra. Tanaka também construiu uma biblioteca genômica em cosmídio e fez a montagem de contíguos de YAC e cosmídios cromossomo-específicos para os cromossomos 3, Z e W. A visualização desses contíguos por FISH deu origem a um mapa físico de segunda geração. Hoje porém, 5 grupos detém esta pesquisa: o grupo do Dr. Phil LoVerde em Buffalo, do Dr. Ray Pearce do Institute Pasteur em Lille, do Dr. David Williams da llinois State University em Normal, EUA, do Dr. Denis Le Paslier do Genoscope na França, e do Dr. Hiro Hirai do Primate Research Centre, Kyoto University no Japão, sendo que a construção de um mapa físico do genoma do S. mansoni, é um dos objetivos do PGSM. Além do sequenciamento do genoma de S. mansoni, o PGSM inclui também um programa de descoberta gênica para o Schistosoma japonicum, e vem sendo desenvolvido na Austrália, EUA e China (Rollinson et. al., 1997), apresentando 1445 ESTs depositadas no dbEST release 041400 (http://www.ncbi.nlm.nih.gov/dbEST/dbEST_summary.html).

Dissertação de Mestrado

Michelyne Sidney Castro Faria

28

Introdução

A nossa participação no projeto genoma de S. mansoni foi no sentido de catalogar genes expressos de duas bibliotecas de cDNA de ovo de S. mansoni, utilizando a estratégia das ESTs, identificando assim os genes mais freqüentes nessa fase do seu ciclo de vida tão importante na patologia inicial da doença. Todas as seqüências geradas estão depositadas em bancos de dados públicos e se encontram disponíveis aos interessados.

Dissertação de Mestrado

Michelyne Sidney Castro Faria

29

Objetivos

OBJETIVOS

Objetivo Geral

Identificar e catalogar genes expressos na fase de ovo de Schistosoma mansoni pela identificação por similaridade utilizando a estratégia das Etiquetas de Seqüências Expressas (ESTs).

Objetivos Específicos 1 - Excisão “in vivo” de duas bibliotecas de cDNA de ovo de S. mansoni para a obtenção de clones.

2 - Sequenciamento parcial das extremidades dos clones selecionados ao acaso de duas bibliotecas de cDNA de ovo, para a obtenção das ESTs.

3 - Identificação dos genes pela comparação das ESTs com seqüências depositadas em bancos de dados, utilizando o programa BLAST do National Center for Biotechnology Information (NCBI) em Maryland, EUA.

4 - Obtenção de “clusters” de ESTs pelo programa “ICATOOLS”, a fim de identificar o número e tipos de genes expressos nesta fase do ciclo de vida do parasito.

5 - Análise da qualidade e verificação da redundância das bibliotecas de cDNA de ovo.

Dissertação de Mestrado

Michelyne Sidney Castro Faria

30

Materiais e Métodos

MATERIAIS E MÉTODOS

A seqüência de experimentos realizados para a obtenção das ESTs está representada na Figura 6 e detalhada no texto a seguir.

Schistosoma mansoni (ovo)

Biblioteca de cDNA construída em λ Zap

Extração de mRNA

1 - Excisão in vivo

2 - Seleção de clones recombinantes

2.2 - PCR das colônias

2.1 – Seleção de colônias brancas

3 – Amplificação e purificação do DNA plasmidiano

5 - Edição de seqüências

5 - Cromatograma (ESTs)

4 - Dosagem do DNA Plasmidiano

5 - Sequenciamento Automático

6 - Pesquisa de similaridade em bancos de dados

6.1 - Blast N e Blast X NR e dbEST

6.2 - “Clustering analysis” ICATOOLS

Depósito em Bancos de Dados

Confecção de Tabelas

Análise dos Resultados

Figura 6 - Diagrama dos experimentos realizados para produção das ESTs.

Dissertação de Mestrado

Michelyne Sidney Castro Faria

31

Materiais e Métodos

1 - Excisão “In vivo” dos insertos clonados em λZAP Duas bibliotecas de cDNA de ovo de S. mansoni foram utilizadas nesse trabalho. Estas estavam clonadas no vetor lambda (λ) ZAP II (Stratagene) (Figura 7 e Tabela 3). A primeira biblioteca foi construída pelo Dr. Guilherme Corrêa Oliveira, do Centro de Pesquisas René Rachou (FIOCRUZ) que utilizou a cepa brasileira LE, isolada em 1959 de um paciente de Belo Horizonte (Freitas, 1973). A segunda foi gentilmente cedida pelo Dr. Mohamed Saber, do Instituto de Pesquisa Theodore Bilharz (Cairo, Egito), que utilizou a cepa NMRI (Fletcher et al., 1981). O título de ambas era de aproximadamente 8x107 ufp. Para a liberação do vetor fagomídio pBlueScript contendo os clones de λ ZAP II foi feita a excisão in vivo da biblioteca conforme se segue: as bactérias XL1-Blue e SOLR foram incubadas a 37°C por 16h em 5ml de meio LB (1% de triptona; 0,5% de extrato de levedura; 1% de NaCl; pH 7,0), na presença de 0,2% de maltose e 1mM de MgSO4, sob agitação. Após a incubação, as células foram centrifugadas e resuspendidas em 10mM de MgSO4. A densidade ótica foi ajustada para D.O600 = 1.0. Duzentos microlitros de células XL1-Blue (D.O600

=

1.0)

foram misturados a 100µl da biblioteca de ovo de S. mansoni e a 1µl do fago helper (>1x105 partículas fágicas) e a mistura foi incubada sob agitação a 37°C por 20min. Ao final da incubação, foram adicionados 15ml de LB e essa mistura incubada por 3h a 37°C, sob agitação. Decorrido esse tempo, a cultura foi aquecida a 70°C por 20min e centrifugada por 5min a 4.000g. O sobrenadante contendo o fagomídio pBluescript empacotado como partícula filamentosa foi transferido para um novo tubo e estocado em geladeira ou utilizado em seguida. Dez microlitros desse sobrenadante foram incubados com 200µl de células SOLR por 15min a 37°C. Após incubação, 1µl, 20µl, 50µl e 100µl da cultura foram adicionados a 200µl de LB e plaqueados com o auxílio de uma alça de vidro, em placas com meio LB suplementado com ampicilina (100µg/ml), IPTG (200µg/µl) e X-gal (20µg/µl). Após o plaqueamento, as placas foram incubadas por 16h a 37°C. O sumário do processo de excisão “in vivo” está representado na Figura 8.

Dissertação de Mestrado

Michelyne Sidney Castro Faria

32

Materiais e Métodos

1 - Construção de biblioteca de DNA 2 - Seleção de clones com inserto

3 - Excisão do plasmídio pBluescript contendo inserto do DNA clonado por co-infecção com fago helper Terminador Iniciador

pBluescript SKfagomídio

Figura 7 – Excisão no vetor Lambda ZAP II. (http://www.Stratagene.com)

Dissertação de Mestrado

Michelyne Sidney Castro Faria

33

Materiais e Métodos

Tabela 3 - Características do Vetor λ ZAP. (Adaptação do catálogo da Stratagene, 1999).

Características do Vetor λ ZAP Sítios de inserção do cDNA

EcoRI e XhoI

Tamanho do inserto

0-10 Kb

Promotor T3 e T7

Presentes

Excisão “in vivo”

Sim

Triagem com anticorpo

Sim

Triagem com ácido nucleico

Sim

Triagem e expressão em eucariotos

Não

Triagem e expressão em procariotos

Sim

Seleção pela cor (Azul/Branco)

Sim

Resistência a ampicilina

Sim

Iniciadores para sequenciamento e PCR

M13 reverso; M13 (-20); T3; T7; SK e KS

Cepa de bactéria hospedeira

X-L1 Blue

Genótipo das cepas das bactérias (Adaptação do catálogo da Stratagene, 1999).

Genótipo da cepa da bactéria X-L1 Blue recA1 endA1 gyrA96 thi-1 hsdR17 supE44 relA1 lac [F'proAB lacIqZ∆M15 Tn10 (Tetr)]

Genótipo da cepa da bactéria X-L1 Blue MRF´ ∆(mcrA)183 ∆ (mcrCB-hsdSMR-mrr)173 endA1 supE44 thi-1 recA1 gyrA96 relA1 lac [F'proAB lacIqZ∆M15 r

Tn10 (Tet )]

Dissertação de Mestrado

Michelyne Sidney Castro Faria

34

Materiais e Métodos

Figura 8 – Sumário do processo da excisão “in vivo” (Catálogo da Stratagene, 1999)

Dissertação de Mestrado

Michelyne Sidney Castro Faria

35

Materiais e Métodos

2 - Seleção de clones recombinantes 2. 1- Crescimento e estocagem As colônias brancas selecionadas foram posteriormente crescidas a 37°C, sob agitação constante, em 5ml de meio LB líquido suplementado com ampicilina (100µg/ml). Parte dessa cultura (50µl) foi estocada em placas de cultura de 96 poços, ou em microtubos, juntamente com glicerol (50µl) a uma concentração final de 25% e temperatura de - 70ºC.

2. 2 - PCR das colônias Quarenta colônias brancas obtidas na excisão da biblioteca usando a cepa NMRI e a LE foram selecionadas ao acaso das placas e tiveram o DNA plasmidiano submetido à amplificação pela Reação em Cadeia da Polimerase (PCR), para verificação da presença e do tamanho dos insertos de cDNA. A PCR foi feita utilizando os seguintes iniciadores: M13 senso (Universal)

– 5’ CGA CGT TGT AAA ACG ACG GCC AGT 3’

M13 anti-senso (M13 R)

– 5’ CAG GAA ACA GCT ATG AC 3’

A reação de PCR foi feita utilizando 200µM dos dNTPs (dATP, dCTP, dGTP e dTTP), tampão para PCR contendo 1,5mM de MgCl2, 50mM de KCl e 10mM de Tris-HCl pH 8,5, 0,5U/µl de Taq DNA Polimerase (Cenbiot RS, Brasil), 0,2µM do par de oligonucleotídeos descrito acima, água destilada estéril, óleo mineral. Para tal, utilizava-se uma pequena alíquota da colônia obtida com o auxílio de palitos previamente esterelizados. O volume final da reação foi de 10µl. A reação foi feita em aparelho termociclador programável automático (MJ Research, Inc., PTC – 100). O ciclo térmico possuía as seguintes etapas: 30 ciclos (1min a 95°C, 1min a 55°C, 2min a 72°C), precedidos por uma desnaturação de 5min a 95oC e seguidos de uma extensão final de 8min a 72°C.

Dissertação de Mestrado

Michelyne Sidney Castro Faria

36

Materiais e Métodos

Após a reação, os 10µl dos produtos de amplificação foram adicionados a 10µl de tampão de amostra 2X concentrado, contendo 0,25% de azul de bromofenol, 0,25% de xilenocianol e 15% de ficol. As amostras foram submetidas a uma eletroforese em gel de agarose 1%, utilizando-se o tampão TBE (45mM de Tris-borato, 1mM de EDTA, pH 8,0) sob uma corrente constante de 70V (35mA) e 0,5µg/ml de brometo de etídio (Sambrook, 1989). O gel foi examinado em transiluminador de luz UV, para confirmação da presença e tamanho dos insertos de DNA. O tamanho dos produtos amplificados foram determinados por comparação ao padrão de peso molecular “1Kb ladder” (Gibco, BRL).

3 - Amplificação e purificação do DNA plasmidiano pelo método da lise alcalina Dois “kits” foram utilizados para a obtenção do DNA plasmidiano adaptando os protocolos originais. O “kit” comercial Promega Wizard Mini Prep foi utilizado para gerar as ESTs produzidas na UFMG, e o “kit” QIAprep Miniprep da QIAGEN para gerar as ESTs no CPqRR.

3. 1- “Kit Promega Wizard Mini Prep” As colônias de bactérias foram crescidas em 5ml de meio LB suplementado com ampicilina (100µg/ml) e incubadas por 16h a 37°C, sob agitação. Três mililitros dessa cultura foram centrifugados a 13.000g por 5min, o sobrenadante descartado e o precipitado resuspendido em 150µl da solução de ressuspensão (50mM Tris-HCl, pH 7,5; 10 mM EDTA; 100µg/ml RNAse A). Posteriormente, 150µl de solução de lise (0,2M de NaOH; 1% SDS) foram adicionados, seguido por inversão dos tubos. Foram então adicionados 150µl de solução de neutralização (1,32M de acetato de potássio, pH 4,8) seguido por inversão dos tubos até formar “grumos” brancos. Em seguida, as amostras foram centrifugadas a 13.000g por 5min. O sobrenadante foi recolhido e transferido para um novo tubo. Um mililitro de resina ligadora de DNA foi adicionado ao sobrenadante que foi então incubado por 10min a temperatura ambiente

Dissertação de Mestrado

Michelyne Sidney Castro Faria

37

Materiais e Métodos

sob lenta agitação. A mistura (sobrenadante + resina) foi aplicada à uma coluna de purificação. Em seguida, a coluna foi lavada com 2ml de solução de lavagem (200mM NaCl; 20 mM TrisHCl pH 7,5; 5mM EDTA; etanol 55%), e colocada em um microtubo de 1,5ml. A coluna foi centrifugada à 13.000g por 1min para eliminar o tampão de lavagem remanescente. Para eluir o DNA ligado à coluna, 50µl de água milli-Q a 95°C foi colocado no centro da coluna que foi incubada por 1min e posteriormente centrifugada a 13.000g por 2min. O DNA obtido foi estocado a 4°C ou a -20°C.

3. 2 – “Kit QIAprep Miniprep da QIAGEN ” Nesse protocolo, 1,5ml de meio LB suplementado com ampicilina (100µg/ml) foi utilizado para o inóculo da colônia, que foi incubado por 16h a 37°C, sob agitação. Após a incubação, a cultura foi centrifugada à 13.000g por 5min e o precipitado das células bacterianas resuspendido em 250µl de solução de resuspensão – QIAGEN (P1). Para que houvesse a lise das células, 250µl de solução de lise – QIAGEN (P2), foi adicionado aos tubos seguido por leves inversões e formação de um lisado viscoso e claro. Posteriormente, 350µl de solução de neutralização – QIAGEN (N3), foi adicionado aos tubos, seguido por inversão imediata até que houvesse a formação de “grumos”. Após a centrifugação dos tubos a 13.000g por 10min, um sedimento compacto e branco foi formado. O sobrenadante das amostras foi recolhido, aplicado nas colunas QIAprep e centrifugado a 13.000g por 30 a 60 segundos. A coluna com o DNA ligado foi lavada com 500µl de solução PB (QIAGEN) e centrifugada como descrito anteriormente. A coluna foi lavada novamente com 750µl de tampão PE (QIAGEN). O lavado foi descartado e a coluna centrifugada por mais 1min para remoção de resíduos do tampão de lavagem. As colunas foram colocadas em microtubos de 1,5ml. Para eluir o DNA, 50µl de água milli-Q esterelizada a temperatura de 95°C foi adicionada no centro da coluna, que foi incubada a temperatura ambiente por 1min, sendo posteriormente centrifugada a 13.000g por mais 1min. O DNA foi estocado a -20°C.

Dissertação de Mestrado

Michelyne Sidney Castro Faria

38

Materiais e Métodos

4 – Dosagem do DNA plasmidiano A concentração e a qualidade do DNA de cada amostra foi determinada através de eletroforese em gel de agarose seguindo o mesmo protocolo usado para verificação da presença e tamanho dos insertos no PCR das colônias. Após a corrida, o resultado foi visualizado como descrito anteriormente. A quantidade de DNA foi estimada por comparação da intensidade de fluorescência do plasmídio quando comparada a intensidade do padrão de DNA do fago lambda com concentrações conhecidas.

5 - Sequenciamento dos cDNAs e geração das ESTs Em nossos experimentos utilizamos o kit Thermo Sequenase Fluorescent Labelled Primer Cycle Sequencing (Amersham - Life Science) para fazer as reações de sequenciamento. O método utilizado foi o de Sanger (Sanger et al.,1977b). Os iniciadores utilizados foram os mesmos utilizados na PCR das colônias, no entanto, fluorescentes. O sequenciamento foi feito utilizando-se de 1µl a 5µl de DNA plasmidial contendo em torno de 500ng/tubo de reação de acordo com a dosagem previamente feita em gel de agarose. Ao DNA foi adicionado a solução de sequenciamento cíclico que continha 1µl de um dos iniciadores fluorescentes a uma concentração de 1pmol/µl, 2µl de uma solução dos didesoxinucleotídeos, dNTPs, tampão e Taq DNA polimerase completando o volume com água milli-Q esterelizada, para 8µl . Uma gota de óleo mineral foi adicionada a cada tubo. As reações foram feitas usando dois tipos de termocicladores automáticos, o MJ Research, Inc., PTC-100 (UFMG), e o GeneAmp PCR System 9.600, Perkin Elmer (CPqRR). As amostras amplificadas usando o termociclador MJ Research foram submetidas ao seguinte ciclo térmico: 34 ciclos (1min a 95°C; 36 seg a 55°C para o iniciador M13 Universal e 50°C para o iniciador M13 reverso; 1min e 24seg a 72°C) precedidos por uma desnaturação por 5min a 95°C e seguidos por uma extensão final de 10min a 72°C por 10min para garantir que

Dissertação de Mestrado

Michelyne Sidney Castro Faria

39

Materiais e Métodos

houvesse a extensão total dos fragmentos. Já as amostras amplificadas com o termociclador da Perkin Elmer seguiram um ciclo com a desnaturação inicial a 95°C por 5min, 30 ciclos a 95°C por 1min, 55°C por 1min e 72°C por mais 1min. A extensão final foi feita a 72°C por 5min. Não foi necessário usar óleo mineral sob as amostras amplificadas feitas nesse termociclador. No final das reações de sequenciamento cíclico foi adicionado 4µl de solução de paralisação (formamida deionizada e azul de dextran) em cada tubo. Os produtos foram desnaturados por 3min a 95°C e mantidos no gelo até o momento de serem submetidos a eletroforese em gel desnaturante de poliacrilamida a 6% e 8M de uréia no sequenciador de DNA automático A.L.F. (Pharmacia) por 6h a 42°C. Os resultados do sequenciamento foram armazenados na forma de cromatogramas e processados automaticamente pelo aparelho, utilizando software próprio. Os cromatogramas foram posteriormente editados manualmente para a eliminação de regiões indesejáveis de vetor, caudas de poli A e dados de baixa qualidade no final da seqüência. As ESTs que possuíam seqüências maiores que 150 nt e que continham menos de 4% de ambigüidades foram consideradas úteis para análise de dados.

6 - Pesquisa de similaridade em Bancos de dados 6.1 – Blast N e Blast X Após o processo de edição, as ESTs foram comparadas com todas as seqüências disponíveis nos bancos de dados de domínio público a fim de identificar possíveis similaridades. Para identificar as ESTs, empregamos os programas BLAST (“Basic Local Alignment Search Tool” – Astchul et al., 1990) nos sites do NCBI (National Center for Biotechnology Information) ou do HGMP (Human Genome Mapping Project). Para as análises de similaridades entre as seqüências de ácidos nucleicos, utilizamos o programa Blast N. O Blast X foi utilizado para comparações das ESTs após tradução nas 6 fases de leitura, com seqüências de proteínas. Esses programas mostram os alinhamentos, as pontuações e

Dissertação de Mestrado

Michelyne Sidney Castro Faria

40

Materiais e Métodos

probabilidades desses alinhamentos ocorrerem ao acaso quando atingem valores acima do valor de corte. Os algoritmos empregados levam em consideração o tamanho da seqüência, o nível de similaridade e a extensão da região de sobreposição. Ambos os programas (Blast N e Blast X) podem ser acessados através da “World Wide Web”, no endereço do NCBI http://www.ncbi.nlm.nih.gov,

ou

no

“Resourse

Center”

do

HGMP

ou

http://www.menu.hgmp.mrc.ac.uk. Em nosso trabalho optamos por considerar significativos todos os resultados de buscas de similaridades que atingiram uma pontuação >200 para Blast N e >100 para Blast X e um valor de E