UNIVERSIDAD DE SANTIAGO DE COMPOSTELA Departamento de Química Analítica, Nutrición y Bromatología

CARACTERIZACIÓN DE MARCADORES PEPTÍDICOS ESPECÍFICOS PARA LA IDENTIFICACIÓN DE ESPECIES DE LANGOSTINOS DE INTERÉS COMERCIAL

por Ignacio Ortea García

Tesis doctoral Santiago de Compostela 2009

D. Alberto Cepeda Sáez, Catedrático de Universidad y Director del Departamento de Química Analítica, Nutrición y Bromatología de la Universidad de Santiago de Compostela,

INFORMA:

Que D. Ignacio Ortea García ha realizado, bajo la dirección de la Dra. M. Pilar Calo Mata, perteneciente a este departamento, y los Drs. José M. Gallardo Abuín y Benito Cañas Montalvo en el Instituto de Investigaciones Marinas de Vigo (C.S.I.C.), el trabajo “Caracterización de marcadores peptídicos específicos para la identificación de especies de langostinos de interés comercial” que presenta para optar al grado de Doctor en Bioquímica.

Y para que así conste, firmo el presente informe en Santiago de Compostela, a 24 de Julio de 2009.

D. Alberto Cepeda Sáez

El Dr. José Manuel Gallardo Abuín, Profesor de Investigación del Consejo Superior de Investigacines Científicas, con destino en el Instituto de Investigaciones Marinas de Vigo, la Dra. M. Pilar Calo Mata, Profesora Contratada Doctora del Departamento de Química Analítica, Nutrición y Bromatología de la Universidad de Santiago de Copostela, y el Dr. Benito Cañas Montalvo, Profesor Contratado Doctor del Departamento de Química Analítica de la Universidad Complutense de Madrid,

INFORMAN:

Que la presente memoria, titulada “Caracterización de marcadores peptídicos específicos para la identificación de especies de langostinos de interés comercial”, que presenta el Licenciado en Bioquímica D. Ignacio Ortea García para optar al grado de Doctor en Bioquímica, ha sido realizada bajo su dirección en el Instituto de Investigaciones Marinas del CSIC de Vigo y reúne los requisitos necesarios para ser defendida ante el tribunal calificador, por lo que autorizamos su presentación en la Universidad de Santiago de Compostela.

Y para que conste a los efectos oportunos firman el presente informe en Vigo, a 24 de Julio de 2009.

Fdo. Dr. José Manuel Gallardo Abuín

Fdo. Dra. M. Pilar Calo Mata

Fdo. Dr. Benito Cañas Montalvo

El trabajo de investigación que se presenta en esta memoria se ha desarrollado en el Departamento de Tecnología de los Alimentos del Instituto de Investigaciones Marinas (IIM) de Vigo, perteneciente al Consejo Superior de Investigaciones Científicas (IIM), y ha sido financiado por los proyectos:

“Aplicación de métodos basados en la genómica y en la proteómica a la autentificación de especies comerciales de crustáceos pertenecientes al Orden Decapada”, concedido por el INIA (CAL03-030-C2-2).

“Definición de marcadores moleculares específicos en especies de langostinos de interés comercial

para

el

sector

pesquero”,

concedido

por

la

Xunta

de

Galicia

(PGIDIT04RMA261004PR).

Para la realización de este trabajo, D. Ignacio Ortea García ha sido beneficiario de una becacontrato del programa de Formación de Profesorado Universitario (FPU) del Ministerio de Educación y Ciencia.

Los resultados obtenidos de este trabajo han dado lugar hasta la fecha de su presentación a una patente y a cinco publicaciones científicas, además de otros dos artículos que se encuentran enviados: • Ortea, I., Gallardo, J.M., Medina, I., Barros, L. Procedimiento y kit para la identificación de las principales especies comerciales de langostinos y camarones. Patente de invención (nº P200930424), Consejo Superior de Investigaciones Científicas. • Ortea, I., Cañas, B., Calo-Mata, P., Barros-Velázquez, J., Gallardo, J.M. (2009). Arginine kinase peptide mass fingerprinting as a proteomic approach for species identification and taxonomic analysis of commercially-relevant shrimp species. Journal of Agricultural and Food Chemistry, 57, 5665-5672. • Ortea, I., Barros, L., Cañas, B., Calo-Mata, P., Barros-Velázquez, J., Gallardo, J.M. (2009). A method to compare MALDI-TOF MS PMF and its application in Phyloproteomics. En: S. Omatu et al. (Eds). Distributed Computing, Artificial Intelligence, Bioinformatics, Soft Computing, and Ambient Assisted Living. Lecture Notes in Computer Science 5518, pp. 1147-1153. Springer-Verlag Berlin Heidelberg. • Ortea, I., Barros, L., Gallardo, J.M. (2009). Closely related shrimp species identification by MALDI-TOF Mass Spectrometry. Journal of Aquatic Food Product Technology, 18:1, 146155. • Ortea, I., Barros, L., Gallardo, J.M. (2008). Secuenciación de novo de péptidos diferenciadores del decápodo de interés comercial Pleoticus muelleri. Proteómica, 1, 55-56.

• Ortea, I., Piñeiro, C., Barros, L., Gallardo, J.M. (2006). Definición de marcadores peptídicos específicos en especies de langostinos de interés comercial. Alimentaria, 373, 98-99. • Ortea, I., Cañas, B., Calo-Mata, P. Barros-Velázquez, J., Gallardo, J.M. Identification of commercial prawn and shrimp species of food interest by native isoelectric focusing. Food Chemistry. Enviado. • Ortea, I., Cañas, B., Gallardo, J.M. Mass Spectrometry Characterization of Species-Specific Peptides from Arginine Kinase for the Identification of Commercially Relevant Shrimp Species. Journal of Proteome Research. Enviado.

Del presente trabajo también se han derivado cinco comunicaciones orales y tres pósters que han sido presentados en diferentes congresos.

Algunos de los resultados obtenidos del presente trabajo se recogen en la página web del proyecto “Definición de marcadores moleculares específicos en especies de langostinos de interés comercial para el sector pesquero”, (PGIDIT04RMA261004PR), www.crusgenprot.org.

Agradecimientos

Han pasado cuatro años (y pico) desde que empecé este proyecto. Por eso, ahora que este período llega a su fin, es tiempo de echar la vista atrás y recordar a los que, con su ayuda, han contribuido a llevarlo a buen puerto. Seguramente me olvide de muchos, pues mi memoria ya no es la que era, y además intentaré ser breve, así que pido perdón de antemano si algún lector ávido de encontrar su nombre en estas líneas no se siente justamente recompensado. Le estoy profundamente agradecido a mi director de tesis y principal artífice de que este trabajo se haya llevado a cabo, el Dr. José Manuel Gallardo Abuín, por haberme dado la oportunidad de entrar en su proyecto, por confiar plenamente en mí, por orientarme, por enseñarme a perseverar, por motivarme, y por supuesto por su intuición. Gracias por brindarme toda tu ayuda y por enseñarme tanto. Quiero agradecer a mi director de tesis, el Dr. Benito Cañas Montalvo, por haberme enseñado desde cero qué es esto que damos en llamar “Proteómica”. Seguramente no me equivoco si digo que tengo el mejor maestro. Gracias por tu dedicación y tus consejos. Gracias por tus correcciones y tu ingenio. Y por echarme una mano cada vez que necesito tu ayuda. Agradecer también a mi otra directora, la Dra. Pilar Calo Mata, por dar una dimensión nueva a mi tesis. Gracias por tu trabajo, por tu optimismo, por tranquilizarme cuando las cosas no salen todo lo bien que esperamos, y sobre todo, gracias por tus ideas. A mi compañera de grupo Lorena, un agradecimiento especial por su ayuda con la parte experimental, por su dedicación, por enseñarme tantas técnicas, y por sus buenos consejos. A mi otra compañera de grupo, y mi otra maestra, Mónica, por enseñarme, por guiarme y por animarme continuamente. Me gustaría agradecer al Dr. Jorge Barros su disponibilidad para ayudar en todo momento. A los Dres. Isabel Medina y Santiago Aubourg, por su colaboración, su interés, y por haberme acogido en el grupo de Química de Productos Marinos. Extiendo el agradecimiento a los otros jefes del departamento, los Dres. Carmen Sotelo y Ricardo Pérez-Martín. Un agradecimiento afectuoso para la Dra. Carmen Piñeiro, además de por orientarme en mis primeros pasos, por su tesón a la hora de reclamar mi beca, sin el cual quién sabe dónde estaría yo ahora. A todos mis compañeros de laboratorio y café, los que están y los que ya se fueron: Ana, María, Jacobo, Vanesa, Rodri, Manu, Maria José, Marcos, Hugo, Gloria, Jose, Elsi, Charo, Cris, Vicky, Maribel, Salomé, Chus, Cruz, Helena, Susana, Marta, y Bea de informática, además de a todos los que han pasado de prácticas. Gracias por enriquecerme con vuestra compañía en el chollo, por las jornadas deportivas, por las salidas nocturnas, y por supuesto, ¡por los ágapes!

A todo el personal del IIM, especialmente a Juan Luís, a Marcos Villafín y a Paco. A la Dra. Concha Gil y a su grupo de la Unidad de Proteómica de la Complutense, Pilar, Montse, Antonio y María Luisa, por acogerme y enseñarme durante esos dos meses y pico de estancia, por vuestro cariño y por lo mucho que me reía en el café con las anécdotas de Antonio. A los Dres. Jesús Vázquez y Anabel Marina, del Servicio de Proteómica del C.B.M.S.O., por acogerme durante mi primera y breve estancia formativa en Madrid. Gracias a la Dra. Vanesa Díaz, antes en la Unidad de Espectrometría de Masas de la Universidad de Oviedo, por su ayuda con el MALDI-TOF. A Estefanía, del dpto. de Química Analítica de la Complutense, por su ayuda con las digestiones con ultrasonidos. A Ananías, de la USC, por su trabajo con el ADN. Y a Karola, de la USC, por compartir la búsqueda de software filoproteómico. Gracias a los de Gijón que vinieron a visitarme a Vigo: Juan y Silvia –en su luna de miel-, Omar, Manuel, Campo, Gon y Santi. Y a Víctor por ir a visitarme a Madrid. A Marco, Gon y David H., por acogerme en sus casas en Madrid en varias ocasiones. Y un millón de gracias a Eva. No solo por los geles. Gracias por tu apoyo, tu paciencia y tu cariño. Gracias por escucharme y por aguantarme. Gracias por animarme continuamente. Gracias por estar ahí.

A mis padres, sin ellos no habría llegado hasta aquí.

ÍNDICE ÍNDICE .................................................................................................................................................... 1 ABREVIATURAS ................................................................................................................................... 5

INTRODUCCIÓN ................................................................................................................................ 9 1. VISIÓN GLOBAL DEL MERCADO DE LOS PRODUCTOS PESQUEROS........................... 11 2. LANGOSTINOS Y GAMBAS ......................................................................................................... 12 2.1. Sistemática .................................................................................................................................. 12 2.2. Biología........................................................................................................................................ 13 2.3. Importancia económica ............................................................................................................. 14 3. AUTENTICIDAD Y CONTROL DE ALIMENTOS DE ORIGEN MARINO ........................... 17 4. MÉTODOS DE IDENTIFICACIÓN DE ESPECIES EN PRODUCTOS PESQUEROS......................................................................................................................................... 21 4.1. Métodos de identificación basados en el análisis del ADN ..................................................... 22 4.2. Métodos de identificación basados en el análisis de proteínas ............................................... 26 5. PROTEÓMICA ................................................................................................................................. 28 5.1. Separación de proteínas y péptidos .......................................................................................... 30 5.1.1. Técnicas electroforéticas ...................................................................................................... 30 5.1.1.1. SDS-PAGE .................................................................................................................... 30 5.1.1.2. Isoelectroenfoque .......................................................................................................... 30 5.1.1.3. 2-DE .............................................................................................................................. 31 5.1.2. Técnicas cromatográficas ..................................................................................................... 31 5.2. Espectrometría de masas........................................................................................................... 32 5.2.1. MALDI-TOF ........................................................................................................................ 34 5.2.2. ESI-IT ................................................................................................................................... 38 5.3. Espectrometría de masas en tándem (MS/MS) ....................................................................... 41 5.3.1. Secuenciación de péptidos mediante MS/MS....................................................................... 43 5.4. Identificación de proteínas y péptidos...................................................................................... 46 5.4.1. Huella peptídica (PMF) ........................................................................................................ 46 5.4.2. Fragmentación de péptidos ................................................................................................... 47 5.5. Bioinformática............................................................................................................................ 49 5.6. Proteómica y especies marinas.................................................................................................. 50

OBJETIVOS ........................................................................................................................................ 53 MATERIALES Y MÉTODOS ........................................................................................................ 57 1. Material biológico.............................................................................................................................. 59 2. Análisis taxonómico de ejemplares de referencia........................................................................... 64

1

Índice

2.1. Identificación morfológica y obtención de secuencias de referencia........................................... 64 2.2. Identificación genética ................................................................................................................. 65 3. Extracción de las proteínas sarcoplásmicas .................................................................................... 65 4. Isoelectroenfoque nativo ................................................................................................................... 66 5. Electroforesis bidimensional............................................................................................................. 67 6. Digestión de las proteínas en gel....................................................................................................... 68 7. Mapeo peptídico mediante espectrometría de masas MALDI-TOF............................................. 69 7.1. Obtención de PMF ....................................................................................................................... 69 7.2. Procesamiento de los espectros de MALDI-TOF ........................................................................ 70 8. Análisis filogenético de los espectros PMF ...................................................................................... 70 9. Análisis de ADN................................................................................................................................. 71 9.1. Extracción del ADN..................................................................................................................... 71 9.2. Amplificación del ADN ............................................................................................................... 72 9.3. Secuenciación............................................................................................................................... 73 9.4. Análisis filogenético..................................................................................................................... 73 10. Caracterización de péptidos mediante espectrometría de masas en tándem ............................. 73 10.1. LC-ESI-IT-MS/MS .................................................................................................................... 73 10.2. nESI-IT-MS/MS......................................................................................................................... 75 10.3. Procesamiento de los datos de MS/MS ...................................................................................... 75 11. Desarrollo de un procedimiento de análisis rápido por MS para la identificación de las principales especies comerciales de langostinos ....................................................................... 76 11.1. Digestión en solución tradicional............................................................................................... 76 11.2. Digestión en solución ultrarrápida con HIFU ............................................................................ 76 11.3. Separación y monitorización de péptidos mediante SMIM ....................................................... 77

RESULTADOS Y DISCUSIÓN ...................................................................................................... 79 Capítulo 1: Identificación de especies de langostinos y gambas de interés alimentario por isoelectroenfoque ................................................................................................................................ 81 Capítulo 2: Identificación de especies de langostinos próximas por MALDI-TOF MS..................................................................................................................................................... 109 Capítulo 3: Huella peptídica de arginina quinasa, enfoque proteómico para la identificación y análisis taxonómico de especies de langostinos de interés comercial............................................................ 125 Capítulo 4: Caracterización por espectrometría de masas de péptidos de arginina quinasa específicos para especies de langostinos comerciales.......................................................................................... 147 Capítulo 5: Procedimiento y kit para la identificación rápida de las principales especies comerciales de langostinos y camarones............................................................................................................... 189

DISCUSIÓN ....................................................................................................................................... 251

2

Índice

CONCLUSIONES ............................................................................................................................ 259 BIBLIOGRAFÍA .............................................................................................................................. 263

3

ABREVIATURAS 2-DE:

Electroforesis bidimensional

ACN:

Acetonitrilo

ADN:

Ácido desoxirribonucleico

ADNmt:

ADN mitocondrial

ADNn:

ADN nuclear

AFLP:

Polimorfismos de longitud de fragmentos amplificados (Amplified Fragment Lenght Polymorphism)

AK:

Arginina quinasa (Arginine Kinase)

amu:

Unidad de masa atómica (atomic mass unit)

APS:

Persulfato amónico

BLAST:

Basic Local Alignment Search Tool

BSA:

Albúmina de suero bovino

C-terminal:

Carboxilo-terminal

CHCA:

Ácido α-ciano-4-hidroxicinámico

CID:

Disociación inducida por colisión (Collision Induced dissociation)

cyt b:

Citocromo b

CZE:

Capillary Zone Electrophoresis

Da:

Dalton (unidad de masa atómica)

DHB:

Ácido 2,5-dihidroxibenzoico

dNTP:

Deoxirribonucleótido trifosfato

DTT:

Ditiotreitol

ELISA:

Enzyme-linked immunosorbent assay

ESI:

Ionización por electrospray (Electrospray Ionization)

FINS:

Forensically informative nucleotide sequencing

FWHM:

Anchura de pico a media altura (Full Width at Half Maximum)

HIFU:

Ultrasonidos focalizados de alta intensidad (High Intensity Focused Ultrasound)

HPLC:

Cromatografía líquida de alta eficacia (High Performance Liquid Chromatography)

ICR:

Resonancia ciclotrónica de iones (Ion Ciclotron Resonance)

IEF:

Isoelectroenfoque

IPG:

Gradiente inmobilizado de pH (Immobilized pH Gradient)

IT:

Trampa iónica (Ion Trap)

LC:

Cromatografía líquida (Liquid Chromatography)

LC-MS:

Cromatografía líquida acoplada a espectrometría de masas

LHICA:

Laboratorio de Higiene, Inspección y Control de Alimentos

5

Abreviaturas

LIT:

Trampa iónica lineal (Linear Ion Trap)

MALDI:

Ionización/desorción

por

láser

asistida

por

matriz

(Matriz

Assisted

Laser

Desorption/Ionization) microESI:

Microelectrospray o microspray

Mr:

Masa molecular relativa

MS:

Espectrometría de masas (Mass Spectrometry)

MS/MS:

Espectrometría de masas en tándem (Tandem Mass Spectrometry)

n

MS :

Espectrometría de masas en tándem múltiple

m/z:

Relación masa/carga

N-terminal:

Amino-terminal

NCBI:

National Center for Biotechnology Information

NCBInr:

Base de datos no redundante del NCBI

nESI:

Nanoelectrospray o nanospray

PCR:

Reacción en cadena de la polimerasa (Polimerase Chain Reaction)

PFF:

Huella de fragmentación peptídica (Peptide Fragment Fingerprinting)

pI:

Punto isoeléctrico

PMF:

Mapa o huella de masas peptídicas (Peptide Mass Fingerprinting)

PMSF:

Fluoruro de fenil-metil-sulfonilo

ppm:

Partes por millón

Q:

Cuadrupolo

RAPD:

ADN polimórfico amplificado al azar (Randomly Amplified Polymorphic DNA)

RF:

Radiofrecuencia

RFLP:

Polimorfismos de longitud de los fragmentos de restricción (Restriction Fragment Lenght Polymorphism)

RP:

Fase reversa (Reverse Phase)

SCP:

Proteína sarcoplásmica de unión a calcio (Sarcoplasmic Calcium-binding Protein)

SCX:

Intercambio catiónico fuerte (Strong Cation Exchange)

SDS:

Dodecil sulfato sódico (Sodium Dodecyl Sulfate)

SDS-PAGE:

Electroforesis en gel de poliacrilamida con SDS (SDS Polyacrylamide Gel Electrophoresis)

SMIM:

Monitorización de la fragmentación de un ión seleccionado (Selected MS/MS Ion Monitoring)

SSCP:

Polimorfismos de conformación de cadena sencilla (Single-Strand Conformational Polymorphism)

TEMED:

N’N’N’N’-tetra-metil-etilendiamina

TFA:

Ácido trifluoroacético

6

Abreviaturas

Th:

Thomson, unidad de m/z

TOF:

Tiempo de vuelo (Time of Flight)

7

INTRODUCCIÓN

Introducción

1.

VISIÓN

GLOBAL

DEL

MERCADO

DE

LOS

PRODUCTOS

PESQUEROS

Los productos de la pesca son los alimentos con mayor presencia en el mercado internacional. La producción mundial de la pesca y la acuicultura se estima en unos 143 millones de toneladas anuales (SOFIA, 2009) (Figura 1). Más de la mitad de esta producción se origina en los países en desarrollo, donde representa una importante fuente de ingresos, además de dar empleo a millones de personas. China es, con mucho, el mayor productor, con 51.5 millones de toneladas en 2006 (17.1 millones de toneladas de la pesca de captura, y 34.4 millones de toneladas de la acuicultura). Le siguen, a mucha distancia, Perú, con más de 7 millones de toneladas, y la India, con 6.9 millones de toneladas (FAO, 2006).

Figura 1. Producción mundial de la pesca y la acuicultura.

Los países desarrollados son responsables de aproximadamente el 80% del valor total de las importaciones de pescado, estimadas en más de 85.000 millones de dólares en 2006 (SOFIA, 2009). La Unión Europea, Japón y EEUU son responsables del 72% de las importaciones, por lo que dominan el mercado mundial, marcando los precios y los requisitos que imponen a los suministradores. Mientras la pesca de captura se ha ido estancando en los últimos años, la demanda de pescado y productos derivados ha ido creciendo. El consumo se ha doblado desde 1973. Este aumento en la demanda únicamente ha sido posible de compensar gracias al gran crecimiento de la acuicultura, cuya

11

Introducción

producción, estimada en unas 51.7 millones de toneladas en 2006 (el 67% de ellas, de China), representa el 36% de la producción de pescado total, frente al 3.9% que representaba en 1970 (SOFIA, 2009). En lo referente a la utilización de los productos pesqueros, de las 140 millones de toneladas obtenidas en el año 2006, el 77% fueron dedicadas al consumo humano directo, lo que equivale a un consumo per cápita aparente de unos 16.7 kg/año (SOFIA, 2009). El resto se destinó principalmente a la fabricación de harinas y aceites de pescado. El consumo medio en la Unión Europea se estimó para el período 2003-2005 en 25.7 kg/año, y para España en 42.6 kg/año.

2. LANGOSTINOS Y GAMBAS

2.1. SISTEMÁTICA

Los crustáceos (Crustacea Brünnich, 1772), un subphylum de los artrópodos, son un grupo de inmensa riqueza taxonómica y diversidad morfológica. Cuenta con unas 52.000 especies conocidas, aunque el número real podría ser 10 veces mayor (Martin y Davis, 2001; Bowman y Abele, 1982). Dentro de los crustáceos, el orden Decapoda Latreille, 1802 constituye el grupo más diversificado, comprendiendo más de 10.000 especies descritas, agrupadas en unas 120 familias y 1.200 géneros (Bowman y Abele, 1982). Los decápodos, entre los que se incluyen gambas, langostinos, cangrejos y langostas, son reconocidos como los crustáceos más típicos y de mayor valor comercial (Yamauchi, 2004). Dentro del orden Decapoda, el suborden Dendrobranchiata Bate, 1888 incluye la mayoría de las gambas y langostinos comerciales (Figura 2), siendo la superfamilia Penaeoidea Rafinesque, 1815 la de mayor importancia económica, ya que representa aproximadamente el 70% de la producción mundial, fundamentalmente debido al género Penaeus. La referencia estándar para la clasificación de este grupo de decápodos (el suborden Dendrobranchiata) es, actualmente, el estudio taxonómico de Pérez-Farfante y Kensley (1997), en el que se recogen los 56 géneros y 500 especies que lo componen. Otro grupo importante de gambas, tras las penaeoideas, son las carideas (infraorden Caridea Dana, 1852), responsables de aproximadamente otro 18% de la producción, fundamentalmente debido al género boreal Pandalus.

12

Introducción

Figura 2. Clasificación de los principales grupos de gambas y langostinos de importancia económica.

El grupo más importante, bajo el punto de vista económico (Lavery y col., 2004), es el género Penaeus sensu lato Fabricius, 1978. Este género constituye un conjunto problemático de especies, sobre las que todavía no existe consenso sobre sus relaciones filogenéticas. Los seis grupos morfológicos que anteriormente se trataban como subgéneros fueron elevados a la categoría de géneros por Pérez-Farfante y Kensley (1997) en la revisión más reciente de la taxonomía de los Penaeoidea. Este cambio, según Lavery y col. (2004), puede resultar prematuro, por lo que es necesario realizar estudios más profundos.

2.2. BIOLOGÍA

Los langostinos y gambas presentan un alto grado de diversidad en cuanto al hábitat que ocupan. Así, aunque la gran mayoría son marinos, unas pocas familias han llegado a colonizar hábitats salobres o incluso de agua dulce. En general habitan en aguas litorales a poca profundidad, distribuyéndose desde la misma playa hasta unos 100 metros de profundidad, aunque algunas especies pueden ser bastante más profundas (Sardà, 1993). El ciclo reproductivo es diverso y complejo e incluye aspectos migratorios locales entre mar abierto y zonas litorales más o menos cerradas, tales como estuarios, bahías y lagunas (Figura 3). La puesta tiene lugar en mar abierto y las larvas, entre 10 y 12 fases de vida pelágica (planctónica), se acercan a la costa. Las postlarvas, todavía de vida pelágica, penetran en las zonas lagunares o quedan cerca de la costa, donde cubren su fase juvenil para retornar al mar a finales de dicha fase o en las primeras de adulto. Los adultos son bentónicos, necesitando un sustrato fangoso o arenoso donde enterrarse durante el día. La alimentación suele ser crepuscular o nocturna, depredando sobre

13

Introducción

cualquier tipo de alimento a su alcance, normalmente sobre otros crustáceos y pequeños moluscos, como bivalvos, que capturan por rastreo del sustrato.

Figura 3. Ciclo biológico del langostino.

2.3. IMPORTANCIA ECONÓMICA

Los crustáceos, incluyendo los langostinos y gambas, han sido una fuente de alimento para los humanos desde la antigüedad. Ya se encuentran referencias a las gambas en las culturas china y japonesa antiguas. La primera referencia conocida de las gambas penaeoideas en la literatura occidental es la de la especie Mellicertus kerathurus, nombrada como “Squilla crangone” por Guillaume Rondelet en 1554 en su Libri de Piscibus Marinis (Rondelet, 1554) (Figura 4).

14

Introducción

Figura 4. Página 547 del Libri de Piscibus Marinis, en la que se recoge la primera referencia conocida a una gamba penaeoidea.

En la actualidad, dentro del mercado de los productos pesqueros, las gambas y langostinos son el producto más importante en valor económico, representando el 17% del total del mercado internacional de productos pesqueros en 2006 (SOFIA, 2009). Le siguen los salmónidos (11%), los pescados de fondo (10%, merluza, bacalao, abadejo), y los túnidos (8%). La producción mundial de langostinos y gambas en el año 2006 fue de unos 6.5 millones de toneladas, equivalentes a un valor de más de 24.000 millones de dólares. (FAO, 2006). Esta producción se ha incrementado en los últimos años, coincidiendo con la gran expansión de la acuicultura de este grupo, que ha crecido muy rápidamente desde 1997 (creció un 340% en peso y un 205% en valor en el periodo 1997-2006). En el 2006, más del 47% (unos 3.1 millones de toneladas) de la producción total de langostinos y gambas fue de acuicultura. En el año 2006, las principales especies comercializadas dentro de este grupo fueron Litopenaeus vannamei (2.133.000 t, 7.774M dolares) y Penaeus monodon (658.000 t, 3.122M dolares) en cultivo, y Pandalus borealis (388.000 t) y P. monodon (244.000 t) en captura (FIGIS FAO, 2006).

15

Introducción

España es el tercer mayor importador de langostinos y gambas del mundo, tras EEUU y Japón, y el primero de la UE, seguido por Francia. El descenso en las capturas de nuestra flota por un lado, y el incremento en la demanda y en la producción de nuestra industria de transformación por otro, han ido derivando hacia una dependencia creciente del abastecimiento exterior de materia prima (Libro Blanco de la Pesca, MAPA). Así, en 2006 España importó una cantidad record de 179.500 toneladas de gambas (Tabla 1), lo que supone un 10% en peso y un 18% en valor del total de las importaciones españolas de productos pesqueros (FISH INFOnetwork). Estas cifras suponen un aumento del 15% respecto al 2005, siguiendo la tendencia creciente de los años anteriores.

Tabla 1. Importaciones de langostinos en España en los últimos años.

Importaciones (miles de toneladas)

Importaciones (millones de euros)

2001

2002

2003

2004

2005 2006

2001

2002

2003

2004

2005

133

128

143

145

156

883

769

859

790

845

179

En los tres primeros cuartos de 2007, la cantidad de gambas importada por España ha continuado al alza, alcanzando un record de 122.000 t, un 6% más que en el mismo período del año anterior (Figura 5).

Figura 5. Importaciones de langostinos en Europa, EEUU y Japón.

16

Introducción

En los últimos años, los principales suministradores de España han sido Argentina, Ecuador y China (Figura 6), aunque los porcentajes de cuota de mercado varían de año a año debido a múltiples factores (enfermedades virales de las gambas y agotamiento de los bancos pesqueros en Argentina, regulaciones comerciales como las restricciones europeas a las importaciones chinas y el proceso antidumping en EEUU, valores de euro y dólar,…).

Figura 6. Países exportadores de langostinos a España en el año 2008, en volumen.

3. AUTENTICIDAD Y CONTROL DE ALIMENTOS DE ORIGEN MARINO

La autenticidad de alimentos es actualmente un asunto de gran preocupación para las autoridades sanitarias y alimentarias, ya que un etiquetado incorrecto supone, de entrada, un fraude comercial, especialmente cuando se produce una sustitución total o parcial de una especie por otra de menor valor comercial. La adulteración de alimentos es un problema que ha acompañado a las transacciones comerciales desde las épocas más antiguas, siendo el consumidor el perjudicado final, que en muchos casos se encuentra indefenso ante los fraudes cometidos. Hay que tener en cuenta además, que la correcta identificación de ingredientes alimentarios es importante para el consumidor no sólo por

17

Introducción

razones económicas, sino también por razones sanitarias, debido a la posible introducción inadvertida de componentes alergénicos, tóxicos o que puedan alterar los hábitos dietéticos de algún sector de la población. Hay que señalar que los crustáceos son uno de los grupos de alimentos que producen alergias alimentarias con mayor prevalencia (Sampson, 2004). Estas reacciones alérgicas pueden ser provocadas por trazas de la proteína alergénica en el alimento, y provocan alteraciones gastrointestinales, cutáneas y respiratorias, llegando a producir reacciones potencialmente mortales, como el shock anafiláctico (Sicherer y col., 2004). La adulteración de alimentos no sólo perjudica al consumidor final, sino también a la industria transformadora, que puede verse obligada a comprar materia prima de calidad inferior a la declarada, lo que conlleva pérdida económica, disminución de la calidad del producto, e insatisfacción del cliente. Por ello, la industria transformadora debe establecer los métodos más adecuados para controlar las materias primas recibidas de los proveedores. En los productos pesqueros, la identificación de las diferentes especies es de gran importancia, ya que en muchas ocasiones las características morfológicas externas han sido eliminadas. Además, cuando la relación filogenética entre las especies es muy próxima, mayor es la similitud morfológica, por lo que difícilmente se logra la identificación. La globalización del mercado de la pesca debida al desarrollo de las tecnologías de conservación, elaboración y distribución de alimentos, sumado a la entrada de nuevas especies como consecuencia de la búsqueda de nuevos caladeros, ha provocado que en la actualidad se comercialicen gran cantidad de especies provenientes de todo el mundo, lo que exige un riguroso control del origen. El correcto etiquetado de los alimentos es fundamental, ya que supone la primera información que se le ofrece al consumidor, por lo que ha de ser comprensible, preciso y verdadero. Para asegurar el control del origen frente a sustituciones de especies que puedan originar fraudes al consumidor, la UE ha establecido la directiva 2000/13/CE, relativa a la aproximación de las legislaciones de los Estados miembros en materia de etiquetado, presentación y publicidad de los productos alimenticios, que fue modificada por la Directiva 2003/89/CE, que especifica que el etiquetado de los productos alimenticios no debe inducir a error al comprador sobre sus características, en particular sobre su naturaleza, identidad, cualidades, composición, cantidad, duración, origen o procedencia y modo de fabricación u obtención. En España, el Real Decreto 1380/2002, de 20 de diciembre (modificado por el Real Decreto 1702/2004), y el Real Decreto 121/2004, de 23 de enero, regulan la identificación y el etiquetado de los productos de la pesca, la acuicultura y el marisqueo, congelados o ultracongelados el primero, y vivos, frescos, refrigerados o cocidos el segundo. En esta legislación se establece que dichos productos deberán llevar en el envase y/o embalaje correspondiente en lugar bien visible una etiqueta en la que se contemplará, en caracteres legibles e indelebles, las siguientes especificaciones: a) Denominación comercial y científica de la especie.

18

Introducción

b) Método de producción: -

Pesca extractiva o pescado.

-

Pescado en aguas dulces.

-

Criado o acuicultura.

-

Marisqueo.

c) Zona de captura (Tabla 2) o de cría. Para los productos pescados en aguas dulces y para los productos cultivados, se indicará el país donde se haya pescado o cultivado.

Tabla 2. Zonas de captura para pesca extractiva recogidas en el RD 1380/2002. Zona de captura

Definición de la zona

Atlántico Noroeste Atlántico Noreste Mar Báltico Atlántico Centro-Oeste Atlántico Centro-Este Atlántico Suroeste Atlántico Sureste Mar Mediterráneo Mar Negro Océano Índico Océano Pacífico Antártico

Zona FAO nº. 21 Zona FAO nº. 27 Zona FAO nº- 27, IIId Zona FAO nº. 31 Zona FAO nº. 34 Zona FAO nº. 41 Zona FAO nº. 47 Zona FAO nº. 37.1, 37.2 y 37.3 Zona FAO nº. 37.4 Zona FAO nº. 51 y 57 Zona FAO nº. 61, 67, 71, 77, 81 y 87 Zona FAO nº. 48, 58 y 88

Además, a los efectos de poder conocer la trazabilidad de un producto, estas especificaciones deberán estar disponibles en cada fase de comercialización del producto, desde la primera venta hasta el consumidor final, incluyendo el transporte y la distribución. La denominación comercial y científica de la especie a que se refieren dichas especificaciones, deberá ser la establecida por Resolución de la Secretaría General del Mar. La Resolución de 4 de marzo de 2009, de la Secretaría General del Mar, establece el listado de denominaciones comerciales de especies pesqueras y de acuicultura admitidas en España. En la tabla 3 se recogen las denominaciones comerciales para especies de langostinos y gambas admitidos en España según dicha Resolución.

19

Introducción

Tabla 3. Denominaciones comerciales para langostinos y gambas admitidos en España según Resolución de 4 de marzo de 2009. Nombre científico Acetes chinensis Aristaeomorpha foliacea Aristeus antennatus Aristeus spp Artemesia longinaris Chlorotocus crassicornis Crangon crangon Crangon spp Farfantepenaeus (Penaeus) aztecus Farfantepenaeus (Penaeus) brevirostris Farfantepenaeus (Penaeus) duorarum Farfantepenaeus spp Fenneropenaeus (Penaeus) merguiensis Haliporoides triarthrus Heterocarpus ensifer Heterocarpus grimaldi Heterocarpus laevigatus Hymenopaenaeus spp Leptochela gracilis Litopenaeus (Penaeus) stylirostris Litopenaeus (Penaeus) vannamei Litopenaeus spp Macrobrachium rosenbergii Melicertus (Penaeus) canaliculatus Melicertus (Penaeus) kerathurus Melicertus (Penaeus) latisulcatus Melicertus (Penaeus) longystilus Melicertus (Penaeus) plebejus Melicertus spp Metapenaeus (Penaeus) affinis Metapenaeus endeavouri Metapenaeus ensis Metapenaeus monoceros Metapenaeus spp Palaemon elegans Palaemon serratus Palaemon spp Pandalus borealis Pandalus spp Parapenaeopsis sculptilis Parapenaeopsis spp Parapenaeopsis stylifera Parapenaeus longirostris Parapenaeus spp Pasiphaea multidentata Pasiphaea sivado Penaeus brasiliensis Penaeus esculentus Penaeus indicus Penaeus japonicus Penaeus monodon

20

Nombre comercial Camarón maoxía Langostino moruno o gamba chorizo o chorizo Gamba roja del Mediterráneo Gambas rosadas o g. rojas o alistados o g. listadas Gamba argentina Camarón verde o real Camarón meridional Camarones Langostino del caribe Langostino cristal Langostino rosado Langostinos Langostino banana Gambón de Mozambique Camarón cabezudo Camarón cabezudo del alto Camarón nailón liso Gambones o langostinos australes Camarón cristal oriental o chino Langostino blanco Langostino vannamei o langostino blanco Langostinos Langostino de río Langostino tigre oriental o tigre Langostino mediterráneo Langostino marfil o banana o australiano Langostino marfil o banana o australiano Langostino marfil o banana o australiano Langostinos Langostino blanco Langostino banana o endeavouri Langostino banana Langostino banana Langostinos Camarón de poza Camarón Camarones o quisquillas Camarón boreal o nórdico Camarones Langostino tigre o langostino de Malasia Gambas Gamba kidi Gamba blanca o de altura Gambas Camarón cristal Camarón blanco Langostino del caribe Langostino tigre Langostino de la India o banana Langostino tigre Langostino jumbo

Introducción

Tabla 3. Continuación. Nombre científico Penaeus notialis Penaeus semisulcatus Penaeus spp Pleoticus muelleri Pleoticus spp Plesionika edwardsii Plesionika heterocarpus Plesionika martia Plesionika narval Plesionika spp Plesionika williansi Plesiopenaeus edwardsianus Pleuroncodes monodon Pontophilus spinosus Processa edulis Processa spp Solenocera melantho Solenocera membranacea Solenocera spp Trachypenaeus spp.

Nombre comercial Langostino blanco Langostino banana Langostinos Gambón o langostino austral Gambones o langostinos australes Camarón soldado Camarón flecha Camarón marcial Camarón narval Camarones Camarón rayado de guinea Carabinero Sastre rojo Camarón espinoso Camaroncillo Camarones cabezones Gamba cabezón Gamba del Atlántico Gambas Gambas

Se observa que existe gran diversidad de especies comerciales de langostinos y gambas, destacando que bajo los términos “langostino banana”, “langostino blanco” o “langostino tigre” se encuadran distintas especies, e incluso distintos géneros. La autenticidad alimentaria tiene actualmente gran importancia en el sector alimentario, debido a que la escasez de especies de elevado valor comercial incita a las sustituciones fraudulentas por otras de menor valor, y en mayor medida cuando se trata de productos transformados o elaborados, en los que las características externas han sido eliminadas. Por ello, es necesario disponer de metodologías analíticas adecuadas para identificar los componentes presentes en los alimentos, asegurando el cumplimiento de la legislación y de los requisitos impuestos por la industria y los consumidores.

4. MÉTODOS DE IDENTIFICACIÓN DE ESPECIES EN PRODUCTOS PESQUEROS

Farfante y Kensley (1997) proporcionan las claves para identificar morfológicamente las cerca de 500 especies de gambas penaeoideas y sergestoideas. Sin embargo, debido a la gran similitud morfológica que se observa cuando la relación filogenética entre las especies es muy próxima, llegar a una correcta identificación es en ocasiones muy complicado, y solamente taxónomos expertos son

21

Introducción

capaces de identificar estas especies mediante observación directa. Además, una vez procesado el producto, muchas de las características anatómicas son eliminadas, por lo que la identificación fenotípica se hace imposible (Civera y Parisi, 1991; Mafra y col., 2008). Por ello es necesario recurrir a técnicas basadas en el análisis molecular. Los marcadores moleculares más utilizados para la identificación de las especies pesqueras presentes en los alimentos son los ácidos nucleicos y las proteínas. Los estudios publicados utilizando el análisis de los lípidos son escasos (Medina y col., 1995; Joensen y Grahl-Nielsen, 2000; Medina y col., 2003), ya que la composición lipídica varía en función de muchos otros factores además de la especie, como son el tipo de alimentación, la etapa de crecimiento, la temperatura ambiental, la salinidad, etc. (Joensen y col., 2000). El análisis de la composición lipídica sí ha demostrado ser más útil para distinguir entre pescado salvaje y de acuicultura (Chen y col., 1995; Tritt y col., 2005).

4.1. MÉTODOS DE IDENTIFICACIÓN BASADOS EN EL ANÁLISIS DEL ADN

La identificación genética de especies se basa en la existencia de polimorfismos en el ácido desoxirribonucleico (ADN), es decir, variaciones genéticas que tienen lugar como resultado de mutaciones en el código genético. De los distintos marcadores de ADN utilizados para la identificación de especies, el ADN mitocondrial (ADNmt) tiene varias ventajas sobre el ADN nuclear (ADNn). El ADNmt es más pequeño y más simple que el ADNn (no tiene intrones, pseudogenes, ADN repetitivo ni transposones); es relativamente fácil de extraer; no presenta reorganizaciones genéticas como recombinación; al ser de herencia materna los individuos sólo tienen un alelo, evitándose ambigüedades en la secuencia debido a heterocigosis; tiene un número de copias más alto; y, finalmente, tiene una tasa de mutación más alta, por lo que se acumulan las suficiente mutaciones para discriminar incluso entre especies muy próximas. Esta última ventaja también conlleva un inconveniente, y es que el ADNmt presenta un grado de variabilidad intraespecífica que hay que tener en cuenta. Dentro del ADNmt, el gen más comúnmente utilizado en estudios de identificación de especies ha sido el del citocromo b (cyt b) (Rasmussen y Morrissey, 2008). Otros marcadores de ADNmt utilizados en identificación de especies son el gen 12S rRNA y el gen 16S rRNA. Hay además otros marcadores de ADNmt, menos empleados en la identificación de especies marinas, como la región de control mitocondrial o los genes de la citocromo oxidasa III y la citocromo oxidasa I. Para detectar estos polimorfismos genéticos especie-específicos, la mayoría de los trabajos se centran en el uso de la reacción en cadena de la polimerasa (PCR) (Mullis y col., 1986). El ADN es extraído del organismo bajo estudio, y el fragmento de ADN de interés es amplificado por PCR. Esta técnica consiste en múltiples ciclos en los que se copia una cadena de ADN que actúa como molde, a

22

Introducción

partir de oligonucleótidos sintéticos que flanquean ese ADN molde, uniéndose a él y actuando como primers o cebadores. El resultado es la síntesis de millones de copias del fragmento de ADN. Estos productos de la amplificación, o amplicones, pueden entonces ser analizados para encontrar los polimorfismos característicos utilizando gran variedad de métodos, como secuenciación con mapeo filogenético o FINS (forensically informative nucleotide sequencing), multiplex-PCR, polimorfismos de longitud de los fragmentos de restricción (RFLP), polimorfismos de conformación de cadena sencilla (SSCP), ADN polimórfico amplificado al azar (RAPD), polimorfismos de longitud de fragmentos amplificados (AFLP), PCR en tiempo real, y PCR lab-on-a-chip. En la tabla 4 se recoge un compendio de estudios de identificación de especies pesqueras en los que se han utilizado métodos genéticos. A pesar de la gran cantidad de técnicas disponibles, la mayoría de los estudios de identificación de especies pesqueras basados en ADN han sido llevados a cabo o bien utilizando RFLP o bien mediante la secuenciación de fragmentos de ADNmt (fundamentalmente del gen cyt b), previa amplificación por PCR. El gen 16S rRNA y el gen de la citocromo oxidasa I, del ADNmt, también han sido descritos como buenos marcadores entre algunas especies de crustáceos, aunque la mayoría de estos estudios se centran en estudios de poblaciones, filogeografía y relaciones filogenéticas (Maggioni y col., 2001; Baldwin y col., 1998; Quan y col., 2004; Lavery y col., 2004; Voloch y col., 2005), no en diferenciación de especies. Brzezinski (2005) ha propuesto un método basado en RFLP para la detección de ADN de crustáceos en general, pero sin diferenciar entre especies de langostinos. Más recientemente, se han propuesto tres métodos basados en el análisis del ADN para la identificación de especies de langostinos y camarones. En el primero (Khamnamtong y col., 2005) se cita un método para la identificación de especies de langostinos peneideos en base al polimorfismo del gen 16S rRNA, utilizando RFLP y SSCP, previa amplificación por PCR. En este estudio se obtuvieron patrones de bandas para la identificación de las especies Penaeus monodon, Litopenaeus vannamei y Fenneropenaeus merguiensis. Sin embargo, en el caso de otras dos especies (P. semisulcatus y Marsupenaeus japonicus) no lograron dilucidar de qué especie se trataba ya que presentaban los mismos patrones de corte. En el segundo de los estudios (Pascoal y col., 2008a) se recoge un método basado en la región de ADNmt 16S rRNA/tRNAVal, que ha sido patentado (Calo-Mata y col., Patente Nº PCT/ES2007/070212), para la identificación de especies de langostinos de la superfamilia Penaeoidea utilizando la combinación de PCR y RFLP, en el que es necesario el corte con 3 enzimas de restricción distintos para conseguir una correcta identificación de las especies. Estos mismos autores han publicado un método similar basado en el gen mitocondrial del cyt b (Pascoal y col., 2008b), para la identificación de seis especies de langostinos peneideos.

23

Introducción

Tabla 4. Resumen de los métodos genéticos utilizados en identificación de especies pesqueras. Técnica

Especies

Referencias

Primers especie-específicos y PCR multiplex

Tiburones

Shivji y col., 2002 Abercrombie y col., 2005 Clarke y col., 2006 Magnussen y col., 2007 Hsieh y col., 2004 Céspedes y col., 1999a Greig y col., 2002 Asensio y col., 2001a Asensio, 2008 Lockley y Bardsley, 2000a Bartlett y Davidson, 1992 Calo-Mata y col., 2003 Blanco y col., 2008 Jerome y col., 2003 Santaclara y col., 2006 Chapela y col., 2002 y 2003 Marko y col., 2004 Pepe y col., 2005 Ram y col., 1996 Quinteiro y col., 1998 Chow y col., 2003 Horstkotte y Rehbein, 2003 Takeyama y col., 2001 Céspedes y col., 98a,b Sotelo y col., 2001 Comesaña y col., 2003 Calo-Mata y col., 2003 Aranishi y col., 2005a,b Pepe y col., 2005 Rusell y col., 2000 Aranishi, 2005 Carrera y col., 1999 Fernández y col., 2002a Chakraborty y col., 2005 Céspedes y col., 2000 Lin y Hwang, 2007 Colombo y col., 2002 Rehbein y col., 2002 Pascoal y col., 2008a,b Khamnamtong y col., 2005 Dooley y col., 2005a Dooley y col., 2005b Rehbein y col., 1997

Secuenciación y análisis filogenético (FINS)

RFLP

Pez espada Lenguado y fletán Salmónidos Perca, mero y cherna Mero Atún y bonito Salmón, bacalao y arenque Gádidos Tiburones Sardinas Anchoas Cefalópodos Pargo rojo Gádidos y merlúcidos Escombroides

Peces planos Gádidos Salmónidos Caballa Salmón y trucha Almeja Sables Lenguado y fletán Túnidos Moluscos Anguila Langostinos RFLP+lab-on-a-chip SSCP

Salmon y trucha Pescados blancos Salmon, trucha, anguila, esturión Túnidos Peces planos Perca, mero y cherna Almejas Bacalao Merluza Langostinos

24

Rehbein y col., 1999a Weder y col., 2001 Colombo y col., 2005 Céspedes y col., 1999b Asensio y col., 2001b Fernández y col., 2002b Comi y col., 2005 Chapela y col., 2007 Khamnamtong y col., 2005

Introducción

Tabla 4. Continuación. Técnica

Especies

Referencias

RAPD

Pez gato Tilapia Mejillón Arowana asiática Pez sapo Salmónidos

Liu y col., 1998a Ahmed y col., 2004 Rego y col., 2002 Yue y col., 2002 Ramella y col., 2005 Jin y col., 2006 Yamazaki y col., 2005 Callejas y Ochando, 2001 Liu y col., 1998b Yu y Guo, 2003 Li y Guo, 2004 Young y col, 1998 Han y Ely, 2002 Zhang y Cai, 2006 Maldini y col., 2006 Sotelo y col., 2003 Trotta y col., 2005 Hird y col., 2005 López y Pardo, 2005

AFLP

PCR en tiempo real

Barbos Pez gato Ostras Trucha Atún Salmón y trucha Varias especies Bacalao Mero Eglefino Túnidos

Aunque los métodos basados en ADN tienen algunas ventajas -las moléculas de ADN son en general más termoestables que las proteínas, el ADN es igual en todos los tejidos de un organismo, y no depende de diferencias en la expresión-, también presentan inconvenientes (Lockley y Bardsley, 2000b; Rasmussen y Morrissey, 2008). Así, la secuenciación, paso necesario en algunas de estas estrategias sobre todo cuando se estudian especies que no están muy presentes en las bases de datos, como ocurre con las especies marinas-, es una técnica cara y lenta, lo que impide su utilización rutinaria en muchos laboratorios (Dooley y col., 2005a). En cuanto a la técnica de RFLP, el mayor inconveniente es la posibilidad de variaciones intraespecíficas, es decir, que en una misma especie nos encontremos patrones de restricción distintos. Además no está garantizado que cada especie produzca un patrón de restricción único, es decir, puede haber más de una especie con el mismo patrón de restricción. La técnica de SSCP requiere gran reproducibilidad en cuanto a las condiciones de los análisis, y muestras de las especies de referencia tienen que ser analizadas en el mismo gel que las muestras problema. Los RAPD presentan como mayor inconveniente la reproducibilidad del método, necesitando de condiciones muy estables para asegurar una correcta identificación de las muestras problemas. En cuanto a los AFLP, la técnica es muy laboriosa, y requiere ADN de gran calidad y elevado tamaño. Además hay que tener en cuenta que la alta sensibilidad de la PCR implica que es muy susceptible a la contaminación, y muchos compuestos presentes en alimentos pueden inhibir la amplificación del ADN (Teletchea y col., 2005).

25

Introducción

4.2. MÉTODOS DE IDENTIFICACIÓN BASADOS EN EL ANÁLISIS DE PROTEÍNAS

Como en todo músculo contráctil (Goll y col., 1977), las proteínas del músculo del abdomen (la parte comestible) de los decápodos se dividen en tres fracciones: a) Proteínas sarcoplásmicas. Se extraen con agua o soluciones salinas de baja fuerza iónica, y constituyen entre el 20 y el 35% del contenido total de proteínas del músculo. La mayoría son enzimas responsables del metabolismo de la célula. b) Proteínas miofibrilares. Constituyen entre el 65 y el 75% del total. Se extraen con soluciones salinas fuertes. Miosina y actina son las dos proteínas mayoritarias en esta fracción. c) Proteínas del tejido conectivo. Representan entre el 3 y el 10% del total de proteínas. El componente principal es el colágeno, que es insoluble en soluciones salinas en su estado nativo, por lo que para solubilizarlo hay que desnaturalizarlo mediante calentamiento o mediante soluciones ácidas o básicas. Las diferencias genéticas entre especies han mostrado estar más desarrolladas en la fracción sarcoplásmica, al ser proteínas responsables de reacciones enzimáticas muy diversificadas (Mackie, 1997), por lo que se han utilizado ampliamente en estudios de identificación de especies pesqueras. Se han utilizado gran variedad de técnicas de identificación basados en el análisis de proteínas (Mackie, 1997). Estas técnicas podrían clasificarse en 4 grandes grupos: (a) técnicas electroforéticas, que incluyen la electroforesis en geles de poliacrilamida con dodecil sulfato sódico (SDS-PAGE), el isoelectroenfoque (IEF), la electroforesis bidimensional (2-DE) y la electroforesis capilar (CZE); (b) técnicas cromatográficas, específicamente cromatografía líquida de alta eficacia (HPLC); (c) técnicas inmunológicas, que consisten generalmente en el empleo de anticuerpos policlonales o monoclonales en ensayos ELISA (Enzyme-Linked ImmunoSorbent Assay); y (d) técnicas de espectrometría de masas (MS). En la tabla 5 se recoge una revisión de las referencias que se pueden encuadrar en alguna de estas técnicas. Las técnicas electroforéticas han sido las más utilizadas, constituyendo el IEF de proteínas sarcoplásmicas la mejor técnica de identificación (Mackie, 1997), siendo adoptada por la Association of Analytical Communities (AOAC) como el único método oficial validado (AOAC, 1990), AOAC Official MethodSM 980.16.

26

Introducción

Tabla 5. Resumen de los métodos basados en proteínas utilizados en identificación de especies pesqueras. Técnica Electroforesis

SDS-PAGE

IEF

2-DE

CZE

Cromatografía

Especies

Referencias

Varios Merluzas Varios Langostinos

Cowie, 1968 Mackie y Jones, 1978 Scobbie y Mackie, 1988 An y col., 1988 Civera y Parisi, 1991 An y col., 1989a Piñeiro y col., 1999a Martínez y col., 2001 Sotelo y col., 1992 Rehbein y col., 1999b Etienne y col., 2000 Chen y Hwang, 2002 Lundstrom, 1979 An y col., 1989b Wei y col., 1990 An y col., 1989a Whitmore, 1990 Sotelo y col., 1992 Valenzuela y col., 1999 Weaver y col., 1999 Piñeiro y col., 2000 Mackie y col., 2000 Chen y col., 2003 Berrini y col., 2006 Rehbein y col., 1999b, 2000 Etienne y col., 2000 Tepedino y col., 2001 Martínez y col., 1990 Martínez y Friis, 2004 Chen y col., 2004 Valenzuela y col., 1999 Piñeiro y col., 1999b Berrini y col., 2006 Piñeiro y col., 1998 Piñeiro y col., 2001 López y col., 2002a Leblanc y col., 1994 Gallardo y col., 1995 Valenzuela y col., 1999 Larraín y col., 2002

Abadejo y merluza en surimi Varios Varios Varios Varios Varios Pez globo Varios Langostinos Abadejo y merluza en surimi Varios Varios Congrio Tiburones Gádidos Salmónidos y anguilas Pez globo Perca Varios Varios Peces planos y gádidos Varios Bacalao, bacaladilla y eglefino Pez globo Congrio Peces planos Perca Gádidos Merluzas Mejillón Bacalao y abadejo Peces planos Congrio Varios Varios Varios Gádidos Ballenas Especies de agua dulce Varios

Rehbein, 1990 Osman y col., 1987 Armstrong y Leach, 1992 Piñeiro y col., 1997 Ukishima y col., 1995 Knuutinen y Harjula, 1998 Chou y col., 2007

27

Introducción

Tabla 5. Continuación. Técnica Inmunológicas

Inmunoprecipitación y aglutinación Inmunodifusión e inmunodotting ELISA

Espectrometría de masas

Especies

Referencias

Arenques

Mairs y Sindermann, 1962

Lenguado, fletán, bacalao y anguila Sardina Salmón, trucha y palometa Mero, perca y cherna Lenguado, fletán, solla y platija Pargo rojo Pez gato Langostinos Mejillón Merluzas

Domínguez y col., 1997 Taylor y Jones, 1992 Carrera y col., 1996, 1997 Asensio y col., 2003a, b Céspedes y col., 1999c Huang y col., 1995 NcNulty y Klesius, 2005 An y col, 1990 López y col., 2002b Piñeiro y col., 2001 Carrera y col., 2006, 2007

En cuanto al grupo de los crustáceos decápodos, los estudios de identificación de especies basados en el análisis de las proteínas son escasos: un estudio utilizando SDS-PAGE (Civera y Parisi, 1991), en el que no se consiguen identificar especies próximas; y 3 estudios del grupo de An (An y col.,1988, 1989b; Wei y col., 1990), utilizando SDS-PAGE el primero e IEF los 2 últimos, en los que sólo se incluyeron 3 especies minoritarias (Penaeus duorarum, Penaeus setiferus y Sicyonia brevirostris). El mismo grupo desarrolló un anticuerpo monoclonal que reconoce una proteína específica de S. brevirostris, y probaron su especificidad para detectar únicamente esta especie y no otras (An y col., 1990). Debido a la escasez de estudios de autentificación de especies de decápodos, se hace necesario el desarrollo de nuevas herramientas capaces de conseguir la identificación de las principales especies comerciales de langostinos y gambas, de una forma rápida, fiable y sencilla. Como veremos, las metodologías proteómicas pueden contribuir a este objetivo.

5. PROTEÓMICA

La proteómica es la disciplina que comprende el conjunto de metodologías orientadas al análisis y estudio de proteínas a gran escala (Pandey y Mann, 2000). También podría definirse como el conjunto de metodologías utilizadas para el estudio de un proteoma. Del término “proteoma” pueden actualmente encontrarse diferentes definiciones, una de las más aceptadas es “el conjunto de proteínas de un organismo, una célula, un orgánulo, etc., en un determinado momento, bajo precisas y determinadas condiciones”.

28

Introducción

El esquema general de análisis de un proteoma implica una primera etapa de preparación de la muestra, una segunda de separación de los analitos, un análisis de éstos por espectrometría de masas (MS) y por último un análisis exhaustivo de los datos que se han generado. Para el estudio proteómico llevado a cabo en la presente tesis, se seguirán dos aproximaciones diferentes:

a) Aproximación clásica. Esta estrategia, la más utilizada hasta el momento, consiste en la separación electroforética de la mezcla compleja de proteínas en geles de poliacrilamida, generalmente en dos dimensiones (2-DE), aunque también puede utilizarse una única dimensión. Las proteínas separadas en el gel son visualizadas mediante distintas técnicas de tinción, y los geles son escaneados y sometidos a análisis de imagen mediante diferentes programas informáticos. Las proteínas de interés son digeridas en gel con enzimas como la tripsina, y los péptidos resultantes de la digestión son analizados mediante MS. En ocasiones, se recurre a la separación de la mezcla de péptidos mediante cromatografía líquida (LC, Liquid Chromatography) acoplada al equipo de MS. La identificación de la proteína original se lleva a cabo comparando el mapa o huella de masas peptídicas (PMF, Peptide Mass Fingerprinting), o bien el espectro de fragmentación de uno o más de los péptidos, frente a valores teóricos calculados a partir de las secuencias contenidas en las bases de datos.

b) Aproximación Shotgun o de segunda generación. Mediante esta estrategia se estudian las proteínas contenidas en una muestra a partir del análisis directo y rápido de la mezcla compleja de péptidos resultantes de su digestión enzimática (Link y col., 1999; Wu y MacCoss, 2002). Se emplean por tanto los digeridos obtenidos a partir de mezclas de proteínas, sin necesidad de una separación electroforética previa. Posteriormente, esta mezcla compleja de péptidos se separa mediante cromatrografía acoplada a un espectrómetro de masas como detector, que va fragmentando los péptidos según eluyen de la cromatografía. Típicamente esta separación cromatográfica se realiza en dos dimensiones, atendiendo a dos propiedades diferentes de los péptidos, por ejemplo una LC de intercambio catiónico fuerte y una LC en fase reversa (RP, Reverse Phase). Pero también puede realizarse en una única dimensión, normalmente una LC en RP. Finalmente se realiza la comparación bioinformática de las fragmentaciones obtenidas con las fragmentaciones virtuales de los péptidos procedentes de las proteínas presentes en las bases de datos. Esta aproximación conlleva un mayor grado de automatización y un menor tiempo de análisis.

29

Introducción

5.1. SEPARACIÓN DE PROTEÍNAS Y PÉPTIDOS

Las principales técnicas de separación de los componentes de un proteoma son las técnicas electroforéticas y las técnicas cromatográficas.

5.1.1. Técnicas electroforéticas 5.1.1.1. SDS-PAGE La separación de proteínas en geles de poliacrilamida con dodecil sulfato sódico (SDS-PAGE, Sodium Dodecyl Sulfate-Polyacrylamide Gel Electrophoresis) (Laemmli, 1970) se basa en la unión de docecil sulfato sódico (SDS) a la proteína. El SDS es un detergente aniónico que se une a las proteínas con una relación de una molécula de SDS por cada dos aminoácidos. Esto le confiere a la proteína una carga neta negativa, proporcional a su masa molecular relativa (Mr). Para la separación de proteínas se utilizan geles de poliacrilamida con distinto grado de entrecruzamiento según el tamaño de las proteínas a separar. Sometidos a una diferencia de potencial, los complejos SDS-proteína migran a través del tamiz molecular en función únicamente de la Mr, resolviéndose en bandas. Tras el revelado del gel mediante tinción, se puede estimar la Mr de una proteína problema por comparación con una mezcla de proteínas estándar de Mr conocidas, ya que la movilidad electroforética es proporcional al logaritmo del Mr . Ésta es una técnica sencilla, rápida y barata, que permite separar polipéptidos de entre 10 y 300 kDa. Sin embargo, el poder de resolución de estos geles de SDS-PAGE en una única dimensión es limitado, y así bandas que aparentemente contienen una sola proteína pueden en realidad contener varias. Por ello, la utilidad de este método de separación depende de la complejidad de la muestra, no pudiendo resolver más de 80-100 proteínas diferentes en un mismo gel (López, 2007).

5.1.1.2. Isoelectroenfoque En el isoelectroenfoque (IEF), las proteínas se separan en función de su punto isoeléctrico (pI), es decir, el pH en el cual su carga neta es cero. Esta técnica de separación se basa en la propiedad anfotérica de los aminoácidos: pueden protonarse o desprotonarse según el pH del medio. En medio básico, los grupos ácidos se cargan negativamente, y en medio ácido, los grupos básicos se cargan positivamente, siendo la carga neta de la proteína la suma de todas las cargas negativas y positivas. Al aplicar un campo eléctrico en un gradiente de pH, las proteínas cargadas migran hacia el electrodo de signo opuesto a su carga neta, así las proteínas migrarán hasta la zona con pH en el cual no presenten carga neta (el pI), donde se detendrán.

30

Introducción

El IEF puede llevarse a cabo en gel o en solución. Actualmente se comercializan geles y tiras con gradientes inmovilizados de pH (IPG, Immobilized pH Gradient) de distintos tamaños y rangos de gradientes de pH, que permiten alcanzar excelentes resoluciones (ΔpI=0,001). Tras revelado del gel mediante tinción, se puede estimar el pI de una proteína problema mediante comparación con una mezcla de proteínas estándar de pI conocidos.

5.1.1.3. 2-DE La 2-DE (O’Farrel, 1975; Klose, 1975) es, hasta el momento, la técnica que permite resolver el mayor número de proteínas en una mezcla de complejidad elevada (cientos o miles de proteínas). Consiste en combinar dos separaciones distintas, en la primera las proteínas se separan por IEF según su pI, y en la segunda las proteínas se separan según su Mr en un gel SDS-PAGE. Tras la tinción con plata, coomassie, sypro, etc., las proteínas separadas aparecen como manchas o spots. El poder de resolución y la reproducibilidad de esta técnica se incrementó notablemente con la introducción de los geles IPG para la primera dimensión. Sin embargo, esta metodología tiene algunos inconvenientes, principalmente la dificultad para realizar análisis completamente reproducibles, además de que es una técnica muy laboriosa, requiere tiempo y es difícil de automatizar. Para el análisis y comparación de los geles 2-DE se han desarrollado programas informáticos de análisis de imagen, como el PDQuest (Garrels, 1989) y el Melanie (Appel y col., 1991).

5.1.2. Técnicas cromatográficas La separación mediante cromatografía líquida (LC) permite separar tanto péptidos como proteínas en función de sus propiedades fisicoquímicas, así como concentrar la muestra y eliminar sales y detergentes. Los métodos cromatográficos más comunes en la separación de péptidos y proteínas utilizan sistemas de alta eficacia (HPLC, High Performace Liquid Chromatography). Los tipos de separación cromatográfica más utilizados son la fase reversa (RP), el intercambio iónico, la exclusión molecular y la afinidad. Actualmente, la mayoría de las separaciones cromatográficas de péptidos se realizan en equipos de HPLC con columnas capilares de RP, gracias a su gran poder de resolución, reproducibilidad y compatibilidad con los equipos de MS, a los que se pueden acoplar (LC-MS). Aunque la LC monodimensional es la más utilizada, la LC multidimensional está suponiendo una gran mejora en la resolución de mezclas complejas de péptidos. (Link y col., 1999), y constituye habitualmente la base de los estudios Shotgun. Comúnmente, la LC multidimensional consiste en dos separaciones ortogonales, siendo intercambio catiónico fuerte (SCX) y RP las más utilizadas.

31

Introducción

5.2. ESPECTROMETRÍA DE MASAS

La espectrometría de masas (MS) se ha convertido desde finales de los años 80 en el método de elección para la identificación, caracterización y cuantificación de proteínas, debido a su rapidez, sensibilidad y precisión. Esta tecnología permite producir iones en fase gaseosa a partir de moléculas orgánicas o inorgánicas, separarlos en función de su relación masa/carga (m/z) y medir su intensidad. Mediante esta técnica puede determinarse el peso molecular y la abundancia de los componentes de una mezcla. Los iones analizados pueden corresponder a moléculas enteras, aductos o fragmentos de moléculas. Además, el análisis de los fragmentos iónicos formados a partir de un determinado ión molecular o precursor, proporciona información sobre su estructura química. Un espectrómetro de masas está formado por tres partes fundamentales: la fuente de iones, el analizador

de

masas,

y

el

detector

(Figura

7).

Las

muestras

a

analizar

se

Figura 7. Representación esquemática de los principales componentes de un espectrómetro de masas.

introducen en la fuente de iones donde los componentes de la muestra son convertidos en iones en fase gaseosa. Estos iones son transferidos al analizador, donde son acelerados y separados según su relación m/z, utilizando distintos principios físicos según el tipo de analizador (Tabla 6). La fuente de ionización y el analizador de masas definen el tipo de espectrómetro de masas, existiendo diversos tipos de ambos y dando lugar a numerosas combinaciones. Los analizadores se clasifican en cuatro grupos: de sectores

32

Introducción

(eléctricos y magnéticos), de cuadrupolo (Q), de tiempo de vuelo (TOF) y de atrapamiento de iones (de resonancia ciclotrónica de iones (ICR) y trampas iónicas (IT)).

Tabla 6. Tipos de analizadores utilizados en MS. Tipo de analizador

Símbolo

Principio de separación

Sector eléctrico

E o ESA

Energía cinética

Sector magnético

B

Momento

Cuadrupolo

Q

m/z (estabilidad de trayectoria)

Trampa iónica

IT

m/z (estabilidad de trayectoria y frecuencia de resonancia)

Tiempo de vuelo

TOF

Velocidad (tiempo de vuelo)

Resonancia ciclotrónica de iones con transformada de Fourier

FT-ICR

m/z (frecuencia de resonancia ciclotrónica)

Orbitrap con transformada de Fourier

FT-OT

m/z (frecuencia de resonancia)

En cuanto a los métodos de ionización (Tabla 7) se pueden clasificar en suaves y duros, según sea la cantidad de energía que se transfiere a las moléculas analizadas. Los métodos suaves generan iones en fase gaseosa con poca energía residual, mientras que los métodos duros transfieren a los analitos un exceso

de

energía

que

origina

la

generación

de

múltiples

fragmentos

iónicos.

Tabla 7. Principales técnicas de ionización a partir de moléculas no volátiles utilizadas en MS. Evaporación e ionización por campos eléctricos Muestra Líquida o sólida Líquida

Campo eléctrico

Técnica

Débil

Plasma acoplado por inducción (ICP)

Fuerte

Desorción de campo (FD)

"

Débil

"

Fuerte

Termospray Electrospray (ESI) e ionización química a presión atmosférica (APCI) Impacto por partículas

Muestra

Partículas

Técnica

Sólida

Iones de alta energía

Desorción por plasma (PD)

"

Iones de baja energía Iones/neutro de baja energía

Espectrometría de masas de iones secundarios (SIMS)

Líquida

Bombardeo con átomos o iones acelerados (FAB, LSIMS) Desorción por láser

Ionización/desorción por láser asistida por matriz (MALDI)

33

Introducción

La aparición a finales de los años 80 de la ionización por electrospray (ESI) (Fenn y col., 1989) y la ionización/desorción por láser asistida por matriz (MALDI) (Karas y Hillenkamp, 1988; Tanaka y col., 1988) permitieron el estudio mediante MS de moléculas que resultaban hasta entonces difíciles de ionizar y volatilizar sin que fueran destruidas o deterioradas debido a su gran tamaño y polaridad. Estas técnicas de ionización suave permiten la generación de iones a partir de analitos no volátiles y de elevado peso molecular, como las proteínas y péptidos, sin una fragmentación significativa. Además, la formación de iones multicargados a partir de péptidos y proteínas en la ionización por ESI permite su detección y fragmentación en aparatos con un rango de masas limitado, como los cuadrupolos y las trampas iónicas, dando lugar a patrones de fragmentación fácilmente interpretables. Debido a su eficiencia, estas dos técnicas son las preferidas en la actualidad para el análisis de proteínas y péptidos, habiendo reemplazado a la secuenciación de Edman como método de identificación y caracterización. En 2002 se concedió el Premio Nobel en Química a John Fenn y Koichi Tanaka por el desarrollo del ESI y la base para el posterior desarrollo del MALDI, respectivamente. En este trabajo utilizaremos métodos de espectrometría de masas combinando ionización por MALDI y analizador de TOF, e ionización por ESI y analizador de IT, por lo que estos dos sistemas se describen más detalladamente a continuación.

5.2.1. MALDI-TOF En la técnica de ionización por MALDI (Karas y Hillenkamp, 1988; Tanaka y col., 1988) se utilizan pulsos de luz láser de nanosegundos en la frecuencia del ultravioleta (nitrógeno a 337 nm es el más utilizado) o del infrarrojo lejano para desorber e ionizar una muestra previamente cristalizada en una placa junto a un compuesto denominado matriz. La matriz tiene varias funciones: incorporar y dispersar las moléculas de analito, preservarlas de recibir una excesiva cantidad de energía, y absorber la energía del láser para conseguir una transferencia controlada y eficaz de ésta. El progreso de la técnica MALDI ha sido fundamentalmente experimental, ya que los procesos fisicoquímicos en los que se basa están todavía sujetos a debate. Los principales hechos empíricos encontrados han sido: -

el espectro se caracteriza por una escasa fragmentación.

-

prácticamente solo se observan iones monocargados.

-

se pueden detectar iones positivos o negativos dependiendo de la polaridad que se elija en el campo de extracción.

Uno de los mecanismos más aceptados para explicar la ionización por MALDI es un proceso fotoquímico, según el cual la radiación láser es absorbida por las moléculas de la matriz generándose una nube en la que hay iones, moléculas neutras y agrupamientos de estas. Los iones de los analitos se

34

Introducción

formarían por protonación, desprotonación, o cationización tras el choque con iones de la matriz en la fase gaseosa (Figura 8). Se producen así iones monocargados estables, aunque también se observan iones con dos o más cargas en el caso de proteínas con pesos moleculares superiores a 5 kDa. Con esta técnica pueden detectarse proteínas de más de 300 kDa.

Figura 8. Esquema de la ionización MALDI.

En la tabla 8 se muestran algunas de las matrices más utilizadas actualmente y los compuestos para los que se recomiendan. La mayor parte de ellas tienen grupos aromáticos, para absorber la radiación láser, y un grupo hidroxilo (-OH) en posición orto respecto a un grupo carbonilo (-COOH, CO, -CONH2), para facilitar la transferencia protónica. Las matrices más utilizadas para el análisis de proteínas y péptidos son el α–ciano-4-hidroxicinámico (CHCA), el ácido 2,5-dihidroxibenzoico (DHB) y el ácico sinapínico. La ionización MALDI es relativamente menos sensible a la contaminación por sales, tampones, detergentes y otros contaminantes que otros tipos de ionización, lo que es una ventaja cuando se analizan extractos de proteínas o péptidos obtenidos de muestras procedentes de alimentos.

35

Introducción

Tabla 8. Matrices empleadas para MALDI. Matriz

Estructura

Campo de aplicación

Ácido sinapínico (SA)

Péptidos y proteínas > 10.000 u

Ácido α–ciano-4hidroxicinámico (α-ciano o CHCA)

Péptidos y proteínas < 10.000 u

Ácido 3-hidroxipicolínico (3HPA)

Oligonucléotidos > 3.500 u

2,4,6-trihidroxiacetofenona (THAP)

Oligonucleótidos < 3.500 u

Ácido 2,5-dihidroxibenzoico (DHB)

Péptidos, carbohidratos neutros o básicos, moléculas pequeñas, polímeros sintéticos polares

Ditranol

Polímeros sintéticos aromáticos no polares

Ácido trans-3-indoleacrílico (IAA)

Polímeros sintéticos apolares

Tradicionalmente, la fuente de ionización MALDI se suele acoplar con analizadores de tiempo de vuelo (TOF), constituyendo este sistema (MALDI-TOF) un método estándar para el análisis de péptidos y proteínas, caracterizándose por su alta sensibilidad, robustez, sencillez de manejo y capacidad de automatización, así como por su alta tolerancia a contaminantes. En un espectrómetro MALDI-TOF los iones formados en la fuente se aceleran mediante la aplicación de un campo eléctrico para, a continuación, ser separados en un tubo de vuelo a alto vacío, en el que se desplazan libremente sin ser sometidos a ningún campo eléctrico o magnético, gracias a la energía cinética que adquirieron en la fuente (Figura 9). Estos iones adquieren la misma energía cinética durante la aceleración, pero su velocidad, y por tanto el tiempo que tardan en atravesar el tubo de vuelo, varía. Este tiempo depende de su relación m/z y de su energía cinética. Como la energía cinética es constante para un voltaje de

36

Introducción

aceleración dado, la medida del tiempo de vuelo de un ión permite determinar de forma muy precisa su m/z. Hay que tener en cuenta que los iones generados en la fuente MALDI no surgen de una fuente puntual, por lo que aparecen discrepancias entre las energías cinéticas de iones de la misma masa en el momento de entrar en el TOF, siendo esto responsable de la baja resolución de los analizadores TOF lineales. Los analizadores modernos han compensado este problema recurriendo a la estrategia denominada de extracción retardada (Delay Extraction), en la que la desorción y la aceleración de los iones se separan unas décimas de microsegundo, y a la utilización de tubos de vuelo provistos de un espejo de iones o reflectrón. Este último dispositivo genera un campo electrostático donde los iones de mayor energía cinética penetran más profundamente que los de menos energía antes de ser rebotados hacia el detector, consiguiendo así que todos los iones de igual m/z lo alcancen al mismo tiempo. Utilizando reflectrón y extracción retardada, pueden conseguirse resoluciones del orden de 25.000 FWHM y caracterizar la masa de los péptidos con un error menor de 25 ppm.

Figura 9. Representación esquemática de un espectrómetro de masas MALDI-TOF.

37

Introducción

5.2.2. ESI-IT El ESI (Fenn y col., 1989) es una técnica de ionización a presión atmosférica en la que una disolución de la muestra es nebulizada a la salida de un tubo capilar por la acción de un fuerte campo eléctrico (Figura 10). De esta forma, la disolución se dispersa en forma de un spray muy fino, formado por pequeñas gotas cargadas que contienen los iones de los analitos. Estos iones pueden pasar a fase gaseosa bien a través de procesos de desolvatación de la gota, bien por desorción directa de los iones desde la gota debido a la alta tensión electrostática en su interior. Este proceso de evaporación puede ser ayudado por calor y/o por un flujo de gas (N2). Este tipo de ionización es extremadamente suave, permitiendo no solo generar iones de la molécula intacta (sin fragmentar la molécula), sino también de complejos formados a través de interacciones no covalentes.

Figura 10. Esquema de una fuente de ionización por electrospray.

La ionización por ESI produce característicamente iones multicargados, y tanto el tipo como el número de iones producidos reflejan el equilibrio ácido-base que existe en la disolución. El grado de carga de un determinado ión depende de su estructura (presencia de grupos ácidos o básicos) y del disolvente utilizado. En el caso de péptidos y proteínas, el número de cargas depende de su longitud y del número de residuos básicos de la molécula (His, Arg, Lys y el extremo amino-terminal (Nterminal)), que son los candidatos a protonarse. Dado que al aumentar el tamaño de un péptido aumenta también el número de residuos capaces de adquirir carga, la relación m/z de los iones producidos a partir de péptidos y proteínas suelen encontrarse en el rango de 700 a 2000 Th, independientemente de la masa

38

Introducción

(Figura 11). Esto permite el análisis de iones de compuestos con pesos moleculares muy superiores al límite de barrido de analizadores como los cuadrupolos o las trampas iónicas, cuyos límites no superan unos pocos miles de Th.

m/z = M + n n Figura 11. Ecuación que describe la distribución de las señales iónicas observadas por MS derivadas de una molécula de masa M que puede tomar n protones para generar iones con n cargas.

Al ionizar por ESI péptidos procedentes de digestiones con tripsina, muy frecuente en estudios de proteómica, los iones que suelen predominar son los de carga +2, aunque también se pueden generar iones con carga +1, +3 o superiores. Dado que la tripsina rompe los enlaces peptídicos por el extremo carboxilo-terminal (C-terminal) de las Lys y Arg, estos péptidos presentan al menos dos sitios básicos susceptibles de protonarse, el extremo N-terminal y la cadena lateral de la Lys o Arg, con lo que tendrían carga +2. Además, pueden generarse péptidos con más de 2 cargas, debido al contenido interno de residuos de His, Arg, y/o Lys. Las fuentes actuales, denominadas de microspray (microESI) (Emmett y Caprioli, 1994), son fuentes con un capilar muy fino (75 μm) y en las que el flujo es muy pequeño (del orden de μL/min). A este tipo de fuentes suele acoplarse una separación cromatográfica previa, con dos objetivos: eliminar las sales de las muestras proteicas (ya que las sales disminuyen la sensibilidad del análisis); y separar los péptidos o proteínas contenidos en la muestra. Una última versión, las fuentes de nanospray (nESI) (Wilm y Mann, 1996), opera de forma similar a la de microESI, pero trabajando a flujo más bajo aún (5-10 nL/min) y con un diámetro de capilar o aguja mucho menor (1-10 μm). Debido a estas características, el spray estará formado por gotas mucho más pequeñas (menos de 200 nm de diámetro), por lo que aumenta la eficiencia en la ionización y el número de iones que entran hacia el analizador, aumentando la sensibilidad hasta un límite de detección del orden de 50 attomoles. Además, el nESI presenta otras ventajas, como un menor consumo de muestra, aumentando el tiempo de análisis. Con relación a las fuentes de microESI, el nESI es más tolerante con la composición y el pH del medio, aunque es recomendable un desalado previo de la muestra. Las fuentes de ESI se pueden combinar con diferentes analizadores. Para los análisis de péptidos realizados en la presente tesis se utilizó un analizador de trampa iónica acoplado a fuentes de micro y nanoelectrospray, ya que esta combinación es una de las más sensibles y eficaces para ese propósito.

39

Introducción

El analizador de trampa iónica (Paul y Steinwedel, 1953; Stafford y col., 1984) es el análogo tridimensional del analizador de cuadrupolo. Su desarrollo le valió a Paul el premio Nobel de Física en 1989. Consiste en un recinto definido por tres electrodos: un electrodo anular (ring electrode) y dos electrodos de superficie hiperbólica denominados electrodos de cierre (endcap electrode) situados a modo de tapaderas a cada lado del electrodo anular, formando una cavidad en la cual es posible almacenar y analizar los iones (Figura 12). Estos electrodos de cierre tienen en el centro una pequeña apertura que permite a los iones entrar o salir de la cavidad.

Figura 12. Esquema de una trampa iónica tridimensional.

La aplicación de un voltaje de radiofrecuencias (RF) al electrodo anular produce un campo eléctrico tridimensional pulsante, que es el responsable del atrapamiento de los iones dentro de la trampa. Los iones oscilan en órbitas estables que pueden mantenerlos confinados en el interior de la trampa durante un cierto tiempo, y la presencia de un gas inerte (He) “enfría” los iones a través de procesos de colisión, ayudando a estabilizar sus órbitas. Posteriormente, la intensidad de la corriente de RF puede aumentarse de modo que los iones adquieren secuencialmente trayectorias inestables en relación directa a su m/z, siendo expulsados desde la trampa hacia el detector. Los iones son expulsados secuencialmente en función de su m/z, primero salen los iones de menor m/z y luego los de mayor. Así, a partir del potencial necesario para la expulsión de un determinado ión puede determinarse de forma muy precisa su valor m/z.

40

Introducción

Una reciente mejora son las trampas iónicas lineales (LIT), o trampas iónicas 2D, en las que los iones quedan atrapados en el interior de un cuadrupolo por la acción combinada de un campo de RF y otro creado por un voltaje de corriente continua. Estas trampas ofrecen mayor eficiencia en el atrapamiento de iones y mayor sensibilidad. Otro tipo de analizador que funcina atrapando iones es el recientemente desarrollado orbitrap. En su interior, los iones son atrapados radialmente, entre un electrodo externo con forma de barril y un electrodo interno central en forma de huso (Figura 13). Ambos electrodos forman un campo electrostático en cuyo interior los iones oscilan alrededor del electrodo central, de forma que el valor m/z de cada ión se calcula en función de su frecuencia de oscilación armónica. Este analizador proporciona una alta resolución y una gran exactitud en la determinación de las masas de los iones (2-5 ppm de error).

Figura 13. Esquema de un analizador tipo Orbitrap.

5.3. ESPECTROMETRÍA DE MASAS EN TÁNDEM (MS/MS)

Para obtener información sobre la secuencia de los péptidos o proteínas analizadas, es necesario recurrir a la espectrometría de masas en tándem (MS/MS). Mediante esta técnica, un ión específico generado en la fuente de ionización (ión precursor) es aislado en el interior del espectrómetro de masas y, posteriormente, fragmentado (McLafferty, 1981). Del análisis de las m/z de los iones fragmento producidos, se deriva la información estructural de la molécula. Este procedimiento puede llevarse a cabo de dos formas: separando las operaciones de selección del ión precursor y de análisis de los fragmentos en el espacio, o separándolas en el tiempo. El primer procedimiento (separación en el espacio) implica la utilización de dos analizadores de masas dispuestos en serie, entre los que se intercala una celda o cámara de colisión. El ión precursor se selecciona en el primer analizador y se fragmenta mediante procesos de colisión en la cámara de colisión.

41

Introducción

Posteriormente, los iones fragmento son separados en el segundo analizador. Como ejemplo de estos instrumentos se pueden destacar el triple cuadrupolo, el q-TOF y el TOF-TOF. El segundo procedimiento (separación en el tiempo) utiliza un único analizador de masas donde tienen lugar las 3 etapas -selección del ión precursor, fragmentación y análisis de los fragmentos- pero secuencialmente, en momentos diferentes. Las trampas iónicas funcionan de esta manera. El ión precursor se aísla mediante la aplicación de voltajes que desestabilizan y expulsan al resto de iones. Los iones aislados se fragmentan y, una vez formados los iones fragmento, se realiza un barrido de RF en el que estos iones fragmento van siendo expulsados secuencialmente en función de su m/z y son detectados. El mecanismo de fragmentación más utilizado en proteómica es la disociación inducida por colisión (CID). Durante este proceso, el ión seleccionado es activado por colisiones con las moléculas de un gas neutro (He, N2, Ar) que se encuentra en la celda de colisión, convirtiéndose una parte de su energía cinética en energía interna. Esto da lugar a una reacción unimolecular que termina con la fragmentación del ión, principalmente por sus enlaces peptídicos. De esta forma, el patrón de fragmentación de un péptido analizado mediante MS/MS depende de la energía de colisión, de la presión y el tipo de gas de colisión, y de la carga del péptido. Ese patrón es además característico de la secuencia aminoacídica específica del péptido, de forma que ésta puede deducirse del análisis del correspondiente espectro MS/MS. Una de las características más interesantes de la trampa iónica es su capacidad para llevar a cabo fragmentaciones sucesivas (MSn, espectrometría de masas en tándem múltiple). El proceso de aislamiento, excitación y expulsión de los iones puede ser repetido n veces, seleccionando cada vez un ión precursor entre los iones producidos en la fragmentación anterior (Figura 14). Este método es muy

Figura 14. Proceso de masas en tándem en una trampa iónica.

42

Introducción

específico y proporciona información estructural muy valiosa para la secuenciación de péptidos.

5.3.1. Secuenciación de péptidos mediante MS/MS Durante el análisis MS/MS, los péptidos pueden fragmentarse por cualquiera de los enlaces de la cadena lineal, generando fragmentos de diferentes tipos (Figura 15). Las series de fragmentos de tipo a, b y c contienen el extremo N-terminal, mientras que las de tipo x, y y z contienen el C-terminal (Roepstorff y Fohlman, 1984). Para nombrar los distintos fragmentos se utilizan los símbolos anteriores con un subíndice que indica el número de aminoácidos que contienen.

Figura 15. Esquema de la fragmentación de péptidos mediante MS/MS.

La fragmentación mediante colisiones de baja energía solo es capaz de romper los enlaces más débiles de la cadena lineal del péptido, predominando en este caso los iones y y b. Cuando el ión fragmentado es monocargado, uno de los fragmentos (y o b) retiene ese carga formando un ión y siendo detectado por el espectrómetro de masas, mientras el otro fragmento queda sin carga y por lo tanto no es detectado. Los iones producidos por ESI pueden llevar más de una carga, lo que permite que ambos fragmentos (y y b) reciban alguna carga y por tanto se detecten simultáneamente en un mismo evento de fragmentación. Dentro de cada serie (y o b), las rupturas dan lugar a fragmentos cuyas m/z difieren en masas que se corresponden con los residuos de los aminoácidos. Se entiende como masas de residuo (Tabla 9) la correspondiente a la masa de un aminoácido menos la de la molécula de agua que se pierde al formarse el enlace peptídico.

43

Introducción

Tabla 9. Residuos de cada uno de los aminoácidos. Masa monoisotópica (Da)

Ión imonio (Da)

Alanina (Ala, A)

71,03711

44

Arginina (Arg, R)

156,10111

129

GV

Asparagina (Asn, N)

114,04293

87

GG

Aspártico (Asp, D)

115,02694

88

Esterificación Hidroxilación

Cisteína (Cys, C)

103,00919

76

Oxidación Reducción

Fenilalanina (Phe, F)

147,06841

120

Glicina (Gly, G)

57,02146

30

Glutámico (Glu, E)

129,04258

102

Glutamina (Gln, Q)

128,05858

72

Histidina (His, H)

137,05891

110

Isoleucina (Ile, I)

113,08406

86

L

Leucina (Leu, L)

113,08406

57

I

Aminoácido

44

Estructura

Aa isobárico

Modificación frecuente

Deamidación

Esterificación Piroglutámico

K, GA

Deamidación

Oxidación

Introducción

Tabla 9. Continuación. Masa monoisotópica (Da)

Ión imonio (Da)

Aa isobárico

Modificación frecuente

Lisina (Lys, K)

128,09496

72

Q, GA

Acilación Hidroxilación

Metionina (Met, M)

131,04049

104

Oxidación

Prolina (Pro, P)

97,05276

70

Hidroxilación

Serina (Ser, S)

87,03203

60

Fosforilación Sulfonación

Tirosina (Tyr, Y)

163,06333

136

Fosforilación Sulfonación

Treonina (Thr, T)

101,04768

74

Fosforilación Sulfonación

Triptófano (Trp, W)

186,07931

159

Valina (Val, V)

99,06841

72

Aminoácido

Estructura

GE, AD, SV

hidroxilación

Pueden formarse también fragmentos iónicos derivados de la rotura de dos enlaces, denominados fragmentos internos. Los más frecuentes son los iones imonio, que contienen un solo aminoácido (Figura 15). Estos iones imonio son característicos de cada aminoácido, por lo que permiten un análisis cualitativo de la composición del péptido estudiando la zona de baja m/z del espectro.

45

Introducción

En instrumentos donde pueden llevarse a cabo colisiones de alta energía (como los de sectores y los TOF-TOF), el perfil de fragmentación es diferente, produciéndose también roturas en otros lugares de la cadena lineal (dando lugar a iones a, x, c y z).

5.4. IDENTIFICACIÓN DE PROTEÍNAS Y PÉPTIDOS

Tradicionalmente, las proteínas se han identificado mediante diferentes procedimientos, como la secuenciación del extremo N-terminal (degradación secuencial de Edman), detección con anticuerpos específicos, deleción de genes, etc. Estas técnicas son lentas, laboriosas y caras. A partir de los años 80 comienza a utilizarse la MS para identificar proteínas, a raíz de la implantación de las nuevas técnicas de ionización suave. Hoy en día la MS se ha convertido en el método de elección para la identificación, caracterización y cuantificación de proteínas, debido a su rapidez, elevada capacidad de análisis y alta sensibilidad y precisión. Existen dos aproximaciones para identificar proteínas y péptidos utilizando MS:

5.4.1. Huella peptídica (PMF) La técnica más utilizada, por su rapidez y sencillez, es la identificación de proteínas mediante huella peptídica (PMF, Peptide Mass Fingerprinting), utilizando instrumentos de MS tipo MALDI-TOF (Henzel y col., 1993; Pappin y col., 1993). A partir de la digestión en gel de un spot o banda de interés con proteasas específicas como la tripsina, se obtiene una mezcla de péptidos, específicos y reproducibles para cada proteína, que es directamente analizada mediante MALDI-TOF. Las enzimas proteolíticas actúan sobre enlaces específicos, así la tripsina corta el enlace peptídico después de un residuo de Lys o Arg (excepto cuando estos aminoácidos van seguidos de un residuo de Pro). Como las proteínas presentan por término medio un residuo de Lys o Arg por cada 10 aminoácidos, los péptidos obtenidos en la digestión tríptica tendrán, en su mayoría, masas comprendidas entre los 800 y 2000 Da. El espectro de MALDI-TOF del digerido proporciona las masas de una serie de péptidos procedentes de dicha proteína, y en condiciones óptimas es específico, permitiendo su identificación inequívoca. Los espectros obtenidos experimentalmente se contrastan con los millones de espectros teóricos generados por la digestión virtual de las secuencias contenidas en las bases de datos, mediante diversos programas informáticos como MASCOT (Perkins y col., 1999) (Figura 16). A cada uno de los resultados se le asigna un valor probabilístico, teniendo en cuenta principalmente el número de péptidos que coinciden entre nuestro espectro experimental y el espectro virtual obtenido de la base de datos.

46

Introducción

Figura 16. Mapa peptídico e identificación de una proteína. El espectro de masas de los péptidos trípticos (A), obtenido por MALDI-TOF, se contrasta con una base de datos de proteínas. (B) Representación gráfica de un resultado de la búsqueda, con las secuencias de los péptidos coincidentes en rojo.

5.4.2. Fragmentación de péptidos La identificación se lleva a cabo a partir del espectro MS/MS de uno o más péptidos obtenidos por digestión enzimática, generalmente con tripsina, de la proteína de interés, siguiendo una de estas aproximaciones: -

Huella de fragmentación peptídica (PFF, Peptide Fragmentation Fingerprint). Se basa en la comparación del espectro de fragmentación sin interpretar con los espectros teóricos de los péptidos producidos por digestión virtual de las proteínas contenidas en las bases de datos (Figura 17), con la ayuda de programas bioinformáticos como MASCOT (Perkins y col., 1999) y SEQUEST (Eng y col., 1994).

-

Etiqueta de secuencia (Peptide Sequence Tag). Se basa en la identificación del péptido mediante búsqueda en las bases de datos a partir de la interpretación parcial de una pequeña secuencia de aminoácidos, de la masa del péptido y de las masas de los fragmentos que bordean a la secuencia parcial (Mann y Wilm, 1994).

47

Introducción

Figura 17. Visión general del proceso de huella de fragmentación peptídica. El espectro MS/MS obtenido experimentalmente se compara con los espectros teóricos de los péptidos producidos por digestión virtual de las proteínas contenidas en las bases de datos.

En los casos en los que la búsqueda en las bases de datos no proporciona resultados, se hace necesaria la interpretación de novo del espectro para obtener la secuencia peptídica. Esta secuenciación de novo de péptidos consiste en la determinación de la secuencia de aminoácidos que lo forman, a partir de la interpretación directa del espectro de fragmentación (Figura 18), basándose para ello en una serie de reglas que cumplen los iones peptídicos cuando son fragmentados, comúnmente mediante CID. La precisión de la secuencia deducida está limitada por las características del equipo de MS y por la calidad de la fragmentación obtenida. Este método es independiente de las bases de datos, por lo que es el procedimiento más adecuado a la hora de identificar y caracterizar proteínas cuyas secuencias no estén descritas en dichas bases de datos. La secuenciación de novo también permite estudiar mejor aquellas asignaciones que mediante los anteriores motores de búsqueda han dado resultados dudosos. Por otra parte, hay que tener en cuenta que la secuenciación de novo de péptidos a partir de su espectro de fragmentación es un procedimiento laborioso, que exige experiencia por parte del usuario, y que puede

48

Introducción

llevar entre media hora y dos días (Liebler, 2002), aunque se han desarrollado programas informáticos que proporcionan secuencias candidatas que posteriormente habría que verificar manualmente.

Figura 18. Secuenciación de novo mediante interpretación manual de las series iónicas b (en azul) e y (en rojo) del espectro MS/MS de un ión de m/z 565.8, correspondiente a un péptido de secuencia LTNAVNEIEK.

Si la secuencia interpretada es suficientemente grande, puede hacerse una búsqueda por homología utilizando BLAST (Basic Local Alignment Search Tool), una herramienta que compara la secuencia interpretada con las secuencias presentes en las bases de datos (Altschul y col., 1990).

5.5. BIOINFORMÁTICA

Una vez generados los datos, hay que gestionarlos y analizarlos. Por ello surge una nueva disciplina, la Bioinformática, que consiste en la aplicación de tecnología de computadores al almacenamiento, análisis e integración de los datos. La información obtenida a partir de las técnicas de MS, se procesa utilizando distintos programas bioinformáticos para conseguir la secuenciación de péptidos y la identificación de proteínas. Así, las proteínas pueden identificarse a partir de los datos de su huella peptídica (PMF) gracias a programas como MASCOT, ProFound, MS-FIT, PepSea, ALDENTE, o bien a partir de la búsqueda de secuencias utilizando los datos generados por MS/MS utilizando programas como MASCOT y SEQUEST. Los resultados de estos programas dependen básicamente de la calidad de los datos obtenidos, del algoritmo

49

Introducción

de búsqueda y de los parámetros utilizados para la búsqueda. Frecuentemente es necesaria una verificación manual de los espectros MS/MS para asegurar que la asignación dada es correcta. Por otro lado, la bioinformática también permite la secuenciación de novo a partir de espectros MS/MS mediante la utilización de programas como DeNovoX (Thermo Fisher Scientific), PEAKS (Ma y col., 2003), PepNovo (Frank y Pevzner, 2005) y SeqMS. La bioinformática también ha propiciado la generación de programas de comparación automática entre geles bidimensionales, destacando programas comerciales como PDQuest, Melanie, ImageMaster 2D y otros.

5.6. PROTEÓMICA Y ESPECIES MARINAS

La investigación en proteómica marina se centra actualmente en tres aspectos: estudios medioambientales, estudios en microorganismos marinos, y estudios de interés alimentario (Tabla 10). Dentro de estos últimos, las aplicaciones proteómicas podrían dividirse en tres grupos (Piñeiro y col., 2003): aspectos nutricionales, seguridad alimentaria, y autentificación de especies.

Tabla 10. Resumen de las áreas de aplicación de la proteómica marina. Área de aplicación Medioambiental

Microorganismos marinos

Temática

Referencias

Cangrejos como biomarcadores de contaminación Estrés medioambiental en salmón Utilización de mejillón como biomonitorización de contaminación por petróleo Biomarcadores de contaminación en mejillón Revisión Adaptación ecológica de patógenos

Gomiero y col., 2006

Ecología microbiana Indicadores de contaminación marina Proteínas con actividad patógena Descripción de subproteomas Alimentos de origen marino

Aspectos nutricionales Seguridad y calidad alimentaria

Autentificación de especies

50

Provan y col., 2006 Mi y col., 2007 Knigge y col., 2004 Apraiz y col., 2006 Schweder y col., 2008 Tunsjø y col., 2007 Thomas y col., 2007 Pedrós-Alió, 2006 Devereux y col., 2006 Evans y col., 2007 Redeby y col., 2006 Barnes y Kim, 2004 Kvasnicka, 2003 Erickson, 2005 Booy y col., 2005 Piñeiro y col., 1998, 2001 López y col., 2002a, b Martínez y Friis, 2004 Carrera y col., 2006, 2007

Introducción

La identificación de proteínas mediante técnicas de proteómica está íntimamente relacionada con la comparación de los datos obtenidos experimentalmente con las secuencias proteicas disponibles en las bases de datos. La mayoría de la información de estas bases de datos es producto de la traducción de la secuenciación de genomas, completos o parciales, de distintos organismos. Sin embargo, el genoma de muchos organismos todavía no ha sido secuenciado, por lo que el registro proteico en las bases de datos de numerosas plantas, microorganismos y especies marinas es mínimo. Al hacer una búsqueda en la base de datos UniProtKB (www.ebi.ac.uk/trembl, consultado en julio 2009), puede comprobarse que el número de proteínas anotadas para el orden Decapoda es muy pequeño (Figura 19), 6.600 secuencias frente a las más de 550.000 anotadas para vertebrados.

Figura 19. Proteínas disponibles en la base de datos UniProtKB para decápodos y para vertebrados. Fuente: UniProtKB, Julio 2009.

En estos casos, se hace necesario recurrir a la secuenciación de novo de los espectros de fragmentación, obteniendo tags de secuencia que por análisis de homología nos proporcionen información sobre el posible origen de la proteína.

51

OBJETIVOS

OBJETIVOS El objetivo general de la presente Tesis Doctoral es la descripción de nuevos procedimientos de autentificación de las principales especies comerciales de langostinos del orden Decapoda, basados en el análisis de proteínas y péptidos por electroforesis, cromatografía y espectrometría de masas, los cuales supongan una mejora en términos de sensibilidad, especificidad, sencillez y rapidez frente a las metodologías disponibles hasta la fecha. Este objetivo general puede desglosarse en los siguientes objetivos específicos: •

Identificar patrones de bandas obtenidos por IEF que resulten específicos para las principales especies comerciales de langostinos.



Identificar las proteínas cuyas movilidades electroforéticas (Mr y/o pI), obtenidas por electroforesis bidimensional, sean diferenciales para las principales especies comerciales de langostinos.



Identificar mediante espectrometría de masas tipo MALDI-TOF las variaciones en las huellas peptídicas de las proteínas diferenciales anteriormente identificadas, con la finalidad de determinar los picos específicos que permitan la diferenciación de las distintas especies de langostinos. Desarrollar un nuevo método de identificación de las principales especies comerciales de langostinos, mediante la comparación matemática de los espectros de huella peptídica de las proteínas diferenciales previamente identificadas.



Identificar mediante espectrometría de masas tipo ESI-IT variaciones en la secuencia aminoacídica de los péptidos trípticos de las proteínas diferenciales anteriormente identificadas, y caracterizar los péptidos diferenciales utilizando espectrometría de masas en tándem, mediante ESI-IT o nESI-IT. La determinación de la secuencia de los péptidos específicos, tanto por identificación mediante búsqueda en bases de datos proteicas como por secuenciación de novo, permitirá la consideración de los mismos como péptidos biomarcadores para la identificación inequívoca de las distintas especies de langostinos.



Desarrollar un nuevo procedimiento de identificación rápida de las principales especies comerciales de langostinos, mediante la monitorización, mediante cromatrografía en fase reversa acoplada a espectrometría de masas, de los distintos péptidos específicos caracterizados en el objetivo anterior.

55

MATERIALES Y MÉTODOS

Materiales y métodos

1. MATERIAL BIOLÓGICO

En la adquisición de los especímenes se contó con la colaboración del Centro Tecnológico del Mar (CETMAR, Vigo) y de diversas empresas armadoras. Todos los ejemplares capturados fueron congelados a bordo a -20ºC, teniendo especial cuidado en mantener íntegros sus caracteres morfológicos, y transportados por vía aérea hasta Vigo. Además, se adquirieron muestras en centros de distribución y supermercados. En la Tabla 11 se recoge la información referente a las especies consideradas. Se adoptó la clasificación taxonómica propuesta por Pérez-Farfante y Kensley (1997).

Tabla 11. Especies consideradas.

Penaeidae

Familia

Nombre científico

Código FAO

Langostino jumbo

Índico-Pacífico Oeste e Índico Oeste

GIT

Farfantepenaeus notialis

Langostino blanco

Atlántico Este

SOP

Fenneropenaeus merguiensis

Langostino banana

Pacífico Central Oeste

PBA

Fenneropenaeus indicus

Langostino de la India o banana

Índico Oeste

PNI

Litopenaeus vannamei

Langostino blanco

Pacífico Este

PNV

Atlántico Este

DPS

Índico-Pacífico Oeste

KUP

Marsupenaeus japonicus

Gamba blanca o de altura Langostino tigre

Farfantepenaeus aztecus

Langostino del Caribe

Atlántico Oeste

ABS

Penaeus semisulcatus

Langostino banana Langostino marfil o banana o australiano Langostino cristal Gambón o langostino austral

Índico-Pacífico Oeste

TIP

Índico-Pacífico Oeste

WKP

Pacífico Este

CSP

Atlántico Sudoeste

LAA

Parapenaeus longirostris

Farfantepenaeus brevirostris Soleno_ ceridae

Origen

Penaeus monodon

Melicertus latisulcatus

Pandalidae

Nombre comercial

Pleoticus muelleri Solenocera agassizii

Langostino colibrí

Pacífico Este

SOK

Pandalus borealis

Camarón boreal o nórdico

Atlántico Norte

PRA

A continuación se detallan las características más importantes de cada una de ellas (Holthuis, 1980; FAO SIDP):

59

Materiales y métodos

Farfantepenaeus aztecus (Ives, 1891)

De nombre común camarón café norteño, y nombre comercial langostino del caribe, F. aztecus está muy restringido a la zona del Atlántico Oeste que va de Estados Unidos a México. Se distribuye en un rango de profundidad de 4 a 160 m, ocupando los fondos fangosos. Los machos alcanzan los 195 mm de longitud, y las hembras los 236 mm. Es de gran importancia en Estados Unidos, en los estados de Texas y Carolina del Norte.

Farfantepenaeus brevirostris (Kingsley, 1878)

La distribución geográfica de esta especie, conocida como langostino cristal, está restringida a la costa del Pacífico Este, desde México hasta el norte de Perú y las Islas Galápagos. Ocupa los fondos lodosos y arenosos, en un rango de profundidades entre los 36 y los 120 m. El tamaño máximo que alcanza es de 150 mm en los machos, y de 170 mm en las hembras. Esta especie tiene una considerable importancia comercial en México, y también es capturada en Panamá y Ecuador.

Farfantepenaeus notialis (Pérez-Farfante, 1967)

Esta especie, de nombre común camarón rosado sureño, y nombre comercial langostino blanco, se distribuye en el Atlántico, tanto en las costas africanas (de Mauritania a Angola) como en las costas de Centro y Sudamérica (de México a Brasil). Habita en los fondos arenosos a profundidades entre 3 y 100 metros. Constituye una pesquería muy importante para Nigeria y Senegal.

Fenneropenaeus indicus (H. Milne Edwards, 1837)

El langostino blanco de la india, de nombre comercial langostino banana, está distribuido en el Océano Índico y Pacífico Oeste, del este y sudeste de África al sudeste asiático y norte de Australia.

60

Materiales y métodos

Ocupa los fondos fangosos y arenosos de entre 2 y 90 m de profundidad. Alcanza longitudes máximas de 184 mm (machos) y 228 mm (hembras). Es la especie pesquera de mayor importancia en Mozambique, Kenia, Somalia y la India, y también Malasia y Tailandia la explotan comercialmente.

Fenneropenaeus merguiensis (De Man, 1888)

Esta especie, de nombre común langostino banana, se distribuye en los fondos fangosos del Océano Índico y Pacífico Oeste, desde el Golfo Pérsico hasta Tailandia, Indonesia y el norte de Australia. Vive a profundidades de entre 10 y 45 m. Es muy importante económicamente para Indonesia y Tailandia, y frecuentemente se confunde con F. indicus.

Litopenaeus vannamei (Boone, 1931)

Esta especie, de nombre común camarón patiblanco y nombre comercial langostino blanco, habita en el Pacífico Este, de México al norte de Perú. Se encuentra en los fondos fangosos de 0 a 72 m de profundidad. Alcanza una longitud máxima de 230 mm. Tiene gran importancia económica en Ecuador, Costa Rica y Colombia, y algo menor en México. Es el langostino de más importancia económica en acuicultura, con 2.133.000 t de producción en el año 2006.

Marsupenaeus japonicus (Bate, 1888)

Esta especie, de nombre común langostino japonés, y nombre comercial langostino tigre, se encuentra en el Océano Índico y Pacífico Oeste, desde el Mar Rojo y el sudeste de África hasta Corea, Japón y el archipiélago malayo. Además se encuentra en el Mediterráneo oriental, alcanzando la costa sur de Turquía, a donde llegó a través del Canal de Suez. Ocupa fondos arenosos y fangosos, de profundidades entre 0 y 90 m. El tamaño máximo llega a los 190 mm del macho y los 225 mm de la hembra. La pesca de esta especie es de gran importancia en Japón, donde tiene gran valor comercial. También se captura en el este y sudeste de África, aunque aquí tiene una menor importancia. Actualmente también se obtiene por acuicultura en Japón, Corea y Taiwán.

61

Materiales y métodos

Melicertus latisulcatus (Kishinouye, 1896)

Esta especie, de nombre común camarón real, y nombre comercial langostino marfil, banana o australiano, se distribuye por el Océano Índico y Pacífico Oeste: desde el Mar Rojo y el Sudeste de África, hasta Corea, Japón, Malasia y Australia. Ocupa costas arenosas o rocosas, entre los 0 y los 80 m de profundidad. Alcanza una longitud máxima de 137 mm (macho). Es explotada comercialmente en Australia, donde tiene gran valor comercial, en el sudeste africano y en la India. Además, se cultiva en Tailandia.

Pandalus borealis Krøyer, 1838

El camarón boreal o nórdico se distribuye por el Atlántico Norte, desde el Mar del Norte a Massachussets pasando por Groenlandia. Ocupa fondos arcillosos entre los 20 y los 1.380 m de profundidad. Alcanza longitudes de 120 mm (machos) y 165 mm (hembras). Es el principal producto de las pesquerías de decápodos del Atlántico Noroeste, capturándose intensivamente en Groenlandia, Islandia y Noruega. Es una de las principales especies en cuanto a producción por captura (388.000 t en el año 2006).

Parapenaeus longirostris (Lucas, 1846)

Conocido como gamba blanca o de altura, P. longirostris se distribuye en el Atlántico Este (de Portugal a Angola), en el Mar Mediterráneo y en el Atlántico Oeste, del estado de Massachussets a la Guayana Francesa. Se encuentra a partir de 20 m de profundidad, llegando hasta los 700 m, aunque normalmente habita entre 150 y 400 m, en los fondos fangosos y arenosos. Normalmente no pasa de 140 mm (macho) y 160 mm (hembra) de longitud. El mayor número de capturas se produce en las costas Mediterráneas de España, Italia y Francia, países en los que es muy apreciada.

62

Materiales y métodos

Penaeus monodon Fabricius, 1798

Esta especie, conocida como langostino jumbo o langostino tigre, se distribuye por las costas de los Océanos Índico y Pacífico Oeste, del sudeste de África hasta Malasia, Japón y norte de Australia. Habita los fondos fangosos y arenosos hasta profundidades de 110 metros. Alcanza longitudes de 336 mm y pesos de hasta 130 g. Debido a su gran tamaño, tiene gran importancia económica, destacando Indonesia, Malasia e India entre los países que la explotan comercialmente. Es uno de los langostinos con mayor producción, tanto por acuicultura como por captura.

Penaeus semisulcatus De Haan, 1844

Esta especie, de nombre común camarón tigre verde, pero nombre comercial langostino banana, se confunde frecuentemente con P. monodon. P. semisulcatus se encuentra en el Océano Índico y Pacífico Oeste, del Mar Rojo y sudeste de África a Japón, Corea, Malasia y norte de Australia. Además ha alcanzado el Mediterráneo oriental a través del Canal de Suez, encontrándose en la actualidad en las costas de Egipto, Israel, Líbano, Siria y sur de Turquía. Ocupa los fondos fangosos y arenosos, en profundidades de 2 a 130 m. Los machos alcanzan una longitud de 180 mm, y las hembras de 228 mm. Esta especie tiene una moderada importancia económica en el sudeste africano (Madagascar, Mozambique y Somalia), Mar Rojo, Golfo Pérsico, Paquistán y Japón. También tiene relevancia en el sudeste asiático, y su cultivo es importante en el delta del Ganges y en Tailandia.

Pleoticus muelleri (Bate, 1888)

Esta especie, conocida como langostino argentino o austral, se encuentra en el Atlántico Sudoeste, principalmente en las costas de Argentina, aunque también en Brasil y Uruguay, en los fondos fangosos

63

Materiales y métodos

y arenosos a profundidades entre 2 y 100 m. Alcanza longitudes de hasta 190 mm, aunque la media está en torno a los 100 mm. Es el crustáceo más importante comercialmente para Argentina.

Solenocera agassizii Faxon, 1893

Se conoce como langostino colibrí o chupaflor, y habita en aguas del Pacífico Este, de Costa Rica a Ecuador y probablemente también en la costa norte de Perú. Su hábitat se sitúa entre los 280 y los 384 m de profundidad. Alcanza una longitud media de 149 mm (hembras). Esta especie es explotada comercialmente por Costa Rica, Panamá y Nicaragua.

2. ANÁLISIS TAXONÓMICO DE EJEMPLARES DE REFERENCIA

En este tipo de estudios es imprescindible contar con especímenes de referencia, clasificados perfectamente, de cada una de las especies objeto de estudio. Por ello fue necesario realizar previamente un análisis taxonómico a todos los individuos susceptibles de ser material de referencia, para cada una de las especies comprendidas en esta tesis. Al no disponer en el momento de inicio de esta tesis de marcadores moleculares de las especies del orden Decapoda que permitan la autentificación taxonómica de los individuos adquiridos, fue necesaria una primera etapa de obtención de secuencias de referencia para cada una de las especies, con las que posteriormente se compararon los especímenes que se estudiarían por técnicas proteómicas.

2.1. IDENTIFICACIÓN MORFOLÓGICA Y OBTENCIÓN DE SECUENCIAS DE REFERENCIA

A su llegada al laboratorio, al menos 2 individuos pertenecientes a cada una de las potenciales especies de langostinos fueron examinados y clasificados por taxónomos expertos, atendiendo a diversos caracteres anatómicos y/o morfológicos. De la misma manera, la localización geográfica del buque en el momento de la captura fue considerada como una información primordial para el mismo propósito. Una vez perfectamente clasificados estos individuos, se tomó una muestra de músculo blanco abdominal – limpio de restos de hemolinfa, vísceras y cutícula- de cada uno de ellos y se envió al Laboratorio de

64

Materiales y métodos

Higiene, Inspección y Control de Alimentos (LHICA) de la Universidad de Santiago de Compostela, a efectos de establecer secuencias de ADN de referencia para cada especie.

2.2. IDENTIFICACIÓN GENÉTICA

Con el fin de asegurar la identificación taxonómica inequívoca de los especímenes a estudiar, cada uno de ellos fue sometido a autentificación genética por comparación con las secuencias de ADN de referencia establecidas previamente. Así, de cada ejemplar a estudiar se tomó una muestra de músculo blanco limpio y se envió al LHICA para establecer genéticamente la identidad de cada espécimen.

3. EXTRACCIÓN DE LAS PROTEÍNAS SARCOPLÁSMICAS

La extracción de las proteínas sarcoplásmicas de cada uno de los especímenes objeto de estudio se realizó en base a la característica de este grupo de proteínas de ser solubles en agua y en soluciones salinas de baja fuerza iónica. El extracto se obtuvo a partir de 1 g de músculo blanco de la parte comestible (cola o abdomen) de cada individuo. El trozo de tejido, limpio de restos de exoesqueleto, cutícula, vísceras y hemolinfa, se cortó y trituró con un bisturí y una espátula, y se introdujo en tubos de ensayo de 10 mL, a los que se añadió 2 mL de agua milliQ con PMSF 5 mM (fluoruro de fenil-metilsulfonilo, un inhibidor de proteasas). La muestra se homogenizó con un Ultra-Turrax (IKA-Werke, Staufen, Alemania) a velocidad media, durante 2 ciclos de 15 s y a 4ºC (para evitar proteolisis). Posteriormente, el homogenizado se centrifugó a 30.000 g durante 10 min a 4ºC (J221-M centrifugue; Beckman, 16 Palo Alto, CA, EEUU) y el sobrenadante, conteniendo las proteínas sarcoplásmicas, se repartió en tubos eppendorf para almacenarlo a -80ºC hasta su utilización. La concentración de las proteínas solubilizadas se cuantificó mediante el método colorimétrico del ácido bicinconínico (BCA, Sigma-Aldrich Co. St. Louis, EEUU). Para la elaboración del patrón de proteínas se utilizaron disoluciones de albúmina de suero bovino (BSA), con un rango de concentraciones conocidas entre 0,05 mg/mL y 1 mg/mL.

65

Materiales y métodos

4. ISOELECTROENFOQUE NATIVO

El isoelectroenfoque (IEF) se realizó en geles de poliacrilamida comerciales (Ampholine PAGplate IEF, GE Healthcare, Uppsala, Suecia) en dos rangos de pH diferentes (Tabla 12). Los geles (5% T, 3% C; dimensiones 250 x 110 x 1 mm) se procesaron a 10ºC en un equipo de electroforesis horizontal Multiphor II (GE Healthcare) acoplado a un sistema de refrigeración MultiTemp III (GE Healthcare). Los electrolitos del cátodo y del ánodo (Tabla 12) se aplicaron en dos tiras de papel de filtro (IEF Electrode Strips, GE Healthcare) en ambos extremos del gel. Las muestras, 15 μL de cada uno de los extractos de proteínas sarcoplásmicas a una concentración de 4 mg/mL, se aplicaron en pequeñas piezas de papel de filtro (Sample Application Pieces, GE Healthcare) dispuestas a una distancia de 1 cm del cátodo.

Tabla 12. Composición de las soluciones electrolíticas para los geles de IEF en función del gradiente utilizado.

Rango de pH

Solución anódica

Solución catódica

4,0-6,5 4,0-5,0

Ácido glutámico 0,1 M en H3PO4 0,5 M H3PO4 1 M

β-alanina 0,1 M Glicina 1 M

Como patrones de punto isoeléctrico (pI) se utilizaron para todos los gradientes de pH dos posibles mezclas de estándares proteicos de rango de pI amplio, Broad pI kit (GE Healthcare) o IEF Markers 3-10 (Invitrogen, Carlsbad, EEUU), en función de su disponibilidad en el mercado, cuya composición y pI para cada proteína se muestra en la Tabla 13. Al menos 2 calles de patrones de pI

Tabla 13. Composición de los patrones de punto isoeléctrico utilizados.

66

pI

Broad pI kit

pI

IEF Markers 3-10

9,30 8,65 8,45 8,15 7,35 6,85 6,55 5,85 5,20 4,55 3,50

Tripsinógeno Lectina Lectina Lectina Mioglobina Mioglobina Anhidrasa carbónica B humana Anhidrasa carbónica B bovina Lactoglobulina A Inhibidor de tripsina Amiloglucosidasa

10,7 9,5 8,3 8,0 7,8 7,4 6,9 6,0 5,3 5,2 4,5 4,2 3,5

Citocromo C Ribonucleasa A Lectina Lectina Lectina Mioglobina Mioglobina Anhidrasa carbónica β-lactoglobulina β-lactoglobulina Inhibidor de tripsina Glucosa oxidasa Amiloglucosidasa

Materiales y métodos

fueron incluidas en cada gel en posiciones distintas para compensar posibles distorsiones entre calles de un mismo gel. Las condiciones de desarrollo de los geles para los diferentes rangos se muestran en la Tabla 14.

Tabla 14. Condiciones de desarrollo de los geles de IEF para los diferentes rangos.

Rango de pH

Voltaje (V)

Intensidad (mA)

Potencia (W)

4,0-6,5 4,0-5,0

2.000 1.400

25 50

25 30

La electroforesis se dejó correr hasta alcanzar unos 4.000 Vh, tras lo que los geles se mantuvieron en solución fijadora con ácido sulfosalicílico al 3,5% (p/v) y ácido tricloroacético al 11,5% (p/v), se lavaron dos veces durante 5 min en solución desteñidora con etanol:ácido acético:agua (25:8:67) y se tiñeron a 60ºC durante 5 min con azul brillante de Coomassie (CBB) R-350 (PhastGel Blue R, GE Healthcare) al 0,04% (p/v) en solución desteñidora. A continuación, los geles fueron decolorados mediante sucesivos lavados en solución desteñidora hasta conseguir un fondo transparente. Finalmente, los geles fueron preservados por fijación con glicerol 10% (v/v), empaquetados con una membrana de celofán y dejados secar a temperatura ambiente. Los geles fueron escaneados y analizados mediante el programa LabImage 1D L340 versión 4.1 (Kapelan GmbH, Leipzig, Alemania), utilizando un método de ajuste lineal en base a los patrones de pI.

5. ELECTROFORESIS BIDIMENSIONAL

La primera dimensión se realizó en geles de poliacrilamida comerciales de rango medio, pH 4,06,5 (Ampholine PAGplate, GE Healthcare), tal y como se describe en el apartado anterior, con las siguientes modificaciones. En un mismo gel se cargaron por duplicado las distintas muestras a analizar, cada una de ellas en cada una de las dos mitades del gel. En una de las mitades, la mitad analítica, se cargaron 15 μL de cada uno de los extractos, y en la otra mitad, la mitad preparativa, se cargaron 30 μL, siempre previo ajuste de la concentración proteica de los extractos a 4 mg/mL. Finalizada la electroforesis, la mitad analítica fue teñida con CBB R-350 (GE Healthcare) y la mitad preparativa fue recortada en tiras correspondientes a cada una de las muestras, las cuales fueron almacenadas a -80ºC hasta su posterior utilización.

67

Materiales y métodos

Las tiras de gel provenientes de la primera dimensión fueron equilibradas a temperatura ambiente durante 10 min con tampón de muestra para electroforesis (Laemmli, 1970) sustituyendo el β– mercaptoetanol por ditiotreitol (DTT) al 0,75% (p/v), y a continuación durante otros 10 min con un tampón similar al anterior pero sustituyendo el DTT por iodoacetamida al 4,5% y trazas de azul de bromofenol. El DTT rompe los puentes disulfuro que existen en las proteínas, y la iodoacetamida estabiliza los grupos –SH formados en el paso anterior para evitar que se formen de nuevo. Una vez equilibradas las tiras, se realizó la segunda dimensión utilizando geles verticales (14 x 13,5 x 1,5 cm) de SDS-PAGE (7,5% T y 3% C) en tampón Tris-tricina (Schägger y von Jagow, 1987). El crosslinker o agente entrecruzante fue N’N’-bis-metilen-acrilamida, y los agentes aceleradores de la reacción, persulfato amónico (APS) al 10% (p/v) y N’N’N’N’-tetra-metil-etilendiamina (TEMED) al 0,05% (v/v). Los geles se desarrollaron en un sistema vertical (Hoefer SE600, Pharmacia Biotech Inc., San Francisco, CA, EEUU) a temperatura controlada de 15ºC por medio de un sistema de refrigeración MultiTemp III (GE Healthcare). En cada gel se incluyeron patrones proteicos de baja masa molecular (Low Molecular Weight, GE Healthcare). La electroforesis se desarrolló a una intensidad constante de 40 mA por gel, 100 V y 150 W durante 12-14 horas, utilizando como tampón para el cátodo Tris 0,1 M, Tricina 0,1 M, SDS 0,1%, pH 8,25 y para el ánodo Tris 0,2 M, pH 8,9. Finalizada la electroforesis, los geles se revelaron mediante tinción con CBB R-350 (GE Healthcare) al 0,04 % (p/v) disuelto en disolución desteñidora compuesta por etanol 25%, ácido acético 8% y agua 67%. A continuación, los geles fueron decolorados mediante sucesivos lavados en solución desteñidora hasta conseguir un fondo transparente. Los geles fueron escaneados y se analizaron mediante el programa de análisis de imagen de geles bidimensionales PDQuest versión 7.1.0 (Bio-Rad Laboratories, Hercules, CA, EEUU). Tras ello, los spots de interés fueron recortados para su posterior análisis mediante espectrometría de masas (apartado 6). Finalmente, los geles fueron preservados por fijación con glicerol 10% (v/v), empaquetados con una membrana de celofán y dejados secar a temperatura ambiente.

6. DIGESTIÓN DE LAS PROTEÍNAS EN GEL

Los spots de interés fueron recortados en condiciones estériles de los geles 2-DE, maximizando la relación proteína/gel, de manera que la zona recortada fue la región más intensa de cada spot. Los spots fueron digeridos en gel con tripsina (Sequencing Grade; Roche Diagnostics GmbH, Mannheim, Alemania), siguiendo el protocolo descrito por Jensen y col. (1999) con pequeñas modificaciones. Así, la pieza de gel, cortada en piezas menores, se lavó 2 veces con 50 μL de agua MilliQ durante 10 min en

68

Materiales y métodos

agitación. Tras ello, se deshidrató 2 veces con 40 μL de acetonitrilo (ACN) durante 10 min con agitación, y se rehidrató con 30 μL de bicarbonato amónico 25 mM durante 5 min en agitación. Tras la rehidratación, se adicionaron sobre el bicarbonato amónico 30 μL de ACN y se incubó la muestra durante 15 min en agitación. Seguidamente, la muestra se secó en un concentrador de vacío speed-vac RVC-2-18/Alpha 1-2 (Christ, Osterode am Harz, Alemania) y se rehidrató de nuevo con 20 μL de una disolución de tripsina 12,5 ng/μL en bicarbonato amónico 25 mM pH 8. La muestra se mantuvo en hielo durante al menos 45 min para que la tripsina penetrase en el gel, tras lo que se retiró la disolución de tripsina que no fue absorbida. Se adicionaron 25 μL de bicarbonato amónico 12,5 mM pH 8, y se incubó durante al menos 14 horas a 37ºC.

7. MAPEO PEPTÍDICO MEDIANTE ESPECTROMETRÍA DE MASAS MALDI-TOF

7.1. OBTENCIÓN DE PMF

El análisis mediante espectrometría de masas tipo MALDI-TOF de los péptidos trípticos se llevó a cabo en un espectrómetro de masas Voyager DE STR (Applied Biosystems, Foster City, CA, EEUU) operando en modo reflectrón, extracción retardada e ión-positivo. Después de la digestión tríptica de los spots, la disolución peptídica se secó en un concentrador de vacío y se acidificó mediante 5 μL de ácido trifluoroacético (TFA) 0,1%. Como soporte para la ionización MALDI se utilizaron placas de acero inoxidable de 100 pocillos (Applied Biosystems), en las que se depositaron 0,8 μL del extracto peptídico que se dejaron secar a temperatura ambiente. Una vez seco, se depositaron sobre él 0,8 μL de la solución de matriz, consistente en una disolución saturada de ácido α–ciano-4-hidroxicinámico (CHCA) en ACN al 50% (v/v) con TFA al 0,1% (v/v), y también se dejo secar a temperatura ambiente. Los valores de los parámetros del espectrómetro de masas fueron: low mass gate, m/z 500 Da; tiempo de retardo, 350 ns; voltaje de aceleración, 20.000 V; voltaje de rejilla (grid voltage), 68,5%. Se utilizó una intensidad del láser justo sobre el umbral de la generación de iones. Los espectros fueron adquiridos promediando 150 disparos del láser, en el rango de m/z de 850 a 3500. Los espectros se calibraron externamente utilizando una mezcla estándar de péptidos compuesta por péptidos sintéticos (Calibration Mixture 2 del Sequazyme Peptide Mass Standards Kit; Applied Biosystems): angiotensina I (MH+ 1.296,69), ACTH 1-17 (MH+ 2.093,09), ACTH 18-39 (MH+ 2.465,20), ACTH 7-38 (MH+ 3.657,93), Insulina (MH+ 5.730,61). Para asegurar la mayor precisión, estos calibrantes se añadieron a la placa en posiciones adyacentes a las muestras. Además, los espectros se calibraron internamente

69

Materiales y métodos

utilizando los picos de los péptidos resultantes de la autodigestión de la tripsina (MH+ 1.153,57, 2.163.06, 2.273,16 y 2.289,16).

7.2. PROCESAMIENTO DE LOS ESPECTROS DE MALDI-TOF

Los espectros de masas obtenidos por MALDI-TOF se procesaron con el software del instrumento (Data Explores, version 4.0.0.0; Applied Biosystems). Se corrigió la línea base, se eliminaron los picos no monoisotópicos, y se extrajeron los valores de m/z monoisotópicos con intensidades mayores al 5% en el rango de m/z de 920 a 3500. Las listas de picos obtenidas se analizaron visualmente para eliminar todas aquellas masas procedentes de la autodigestión de la tripsina, de la matriz, y de otras proteínas contaminantes, como ciertas queratinas. Las listas de picos se utilizaron para la identificación de proteínas y péptidos mediante búsqueda en bases de datos por PMF (Peptide Mass Fingerprinting). Para ello se utilizó el motor de búsqueda MASCOT (http://www.matrixscience.com) y la base de datos no redundante del NCBI (NCBInr) (http://www.ncbi.nih.gov; NCBI Resources, NIH, Bethseda, MD, EEUU), utilizando los siguientes parámetros: masas monoisotópicas y protonadas, hasta 2 sitos de corte de la tripsina fallidos, tolerancia de masa del péptido de 100 ppm, y tres modificaciones variables: acetilación del extremo N-terminal, cisteína carbamidometilada, y metionina sulfóxido.

8. ANÁLISIS FILOGENÉTICO DE LOS ESPECTROS PMF

Se compararon los espectros MALDI-TOF de varios individuos mediante análisis cluster. Para ello, se extrajeron de los espectros MALDI-TOF los valores de m/z monoisotópicos con intensidades mayores al 5% en el rango de m/z de 920 a 3000. La lista de picos de cada individuo se integró en una matriz de picos con 2 posibles valores: presencia del pico (valor “1”) o ausencia del pico (valor “0”). Cuando la diferencia de masa entre el pico mi en la lista de picos del individuo i y el pico mj en la lista de picos del individuo j era menor de 200 ppm, los dos picos se supusieron el mismo péptido, permitiendo este error en la medida exacta de las masas. A partir de la matriz de presencia/ausencia de picos, se generó una matriz de distancias, para lo que se utilizó el software Windist (del paquete Winboot, disponible en www.irri.org), empleando el coeficiente de similitud de Ochiai (Ochiai, 1957). Según este coeficiente, la medida de la similitud, Si,j, entre la lista de picos del individuo i y la lista de picos del individuo j se define como (1):

70

Materiales y métodos

Si , j = aij n in j

(1)

donde ni y nj son el número total de picos de cada lista individual de picos, y aij es el número de picos en común entre las dos listas de picos, i y j. En la matriz de distancias se recogió no el coeficiente de similitud, sino el coeficiente de distancia, di,j, que se calcula sustrayendo el coeficiente de similitud Si,j de 1 (2).

di,j = 1 - Si,j

(2)

El valor de di,j está por tanto limitado al rango 0 ≤ di,j ≤ 1. Cuando las listas de picos i y j son indistinguibles, di,j = 0; cuando las listas de picos son completamente distintas, di,j = 1. La matriz de distancias entre listas de picos se representó como un dendrograma utilizando el software MEGA (Tamura y col., 2007), empleando el algoritmo neighbor-joining (Saitou y Nei, 1987). Para evaluar el soporte estadístico de la topología obtenida se realizó un bootstrap con 1000 réplicas.

9. ANÁLISIS DE ADN

9.1. EXTRACCIÓN DEL ADN

La extracción del ADN de las muestras se llevó a cabo mediante un método comercial de extracción de ADN a partir de tejidos, el DNeasy Tissue kit (Qiagen, Hilden, Alemania). Se homogenizaron 250 mg de músculo de cada individuo a analizar, utilizando bisturí y pinzas, y se dejó incubando con tampón de lisis durante toda la noche a 55ºC. Una vez completada la lisis celular, el ADN se purificó utilizando las columnas incluidas en el DNeasy Tissue kit, siguiendo las indicaciones del fabricante. Resumidamente, consiste en pasar la muestra por pequeñas columnas, tras lo que se lavan las columnas con distintos buffers incluidos en el kit, para finalmente eluir el ADN con un buffer de elución. En cada uno de los pasos –ligado del ADN, 2 etapas de lavado de la columna, y elución del ADN- se centrifugaron las columnas a 8.000 rpm durante 1 min –excepto en la segunda etapa de lavado,

71

Materiales y métodos

que se centrifugaron a 13.000 rpm durante 3 min- utilizando una microcentrífuga modelo 5415 D (Eppendorf, Hamburgo, Alemania). El ADN extraído se cuantificó por el método de Downs y Wilfinger (1983), que consiste en la determinación de la fluorescencia obtenida al mezclar un volumen conocido del extracto de ADN con el reactivo Hoechst 33258 (Sigma, St. Louis, MO, EEUU). Este reactivo está compuesto por bisbenzimida, que se intercala entre las moléculas de ADN y tiene unas longitudes de onda de excitación y de emisión de 356 nm y 458 nm, respectivamente. Las medidas se llevaron a cabo en un fluorímetro LS 50 (Perkin Elmer, Waltham, MA, EEUU).

9.2. AMPLIFICACIÓN DEL ADN

Una vez purificado el ADN, se procedió a amplificar mediante PCR una zona del ADNmt, concretamente en la región 16S rRNA-tRNAVal. La amplificación del ADN se llevó a cabo en el termociclador GeneAmp PCR System 2700 (Applied Biosystems), utilizando los cebadores o primers 16ScruC3

(5′-CGTTGAGAAGTTCGTTGTGCA-3′)

y

16ScruC4

(5′-

AATATGGCTGTTTTTAAGCCTAATTCA-3′) (Pascoal y col., 2008a). La mezcla de la reacción de PCR consistió en: - 100 ng de ADN molde. - 25 μL de una mezcla de reacción comercial (BioMix, Bioline, Londres, Reino Unido), que incluye el buffer de la reacción, los deoxirribonucleótidos trifosfato (dNTPs), cloruro de magnesio y la Taq DNA polimerasa. - 25 pmol de cada cebador. - agua PCR (Genaxis, Montigny le Bretonneaux, Francia) hasta alcanzar un volumen de reacción de 50 μL. Las condiciones de la amplificación fueron: - desnaturalización inicial a 94ºC durante 90 s. - 35 ciclos de desnaturalización (94ºC durante 20s), anillamiento (51-55ºC durante 20 s) y extensión (72ºC durante 30 s). - extensión final a 72ºC durante 15 min.

72

Materiales y métodos

9.3. SECUENCIACIÓN

Previamente a la secuenciación, los productos de PCR amplificados fueron purificados mediante el kit ExoSAP-IT (GE Healthcare) con el fin de eliminar componentes de la reacción que pudieran interferir en la reacción de secuenciación. La secuenciación directa de los amplicones purificados se realizó mediante el método comercial BigDye Terminator v3.1 Cycle Sequencing Kit (Applied Biosystems). Para llevar a cabo las reacciones de secuenciación, se emplearon los mismos cebadores utilizados en la PCR, realizándose la secuenciación de las dos hebras de ADN. Las reacciones de secuenciación se analizaron en un secuenciador capilar ABI 3730XL DNA Analyzer (Applied Biosystems).

9.4. ANÁLISIS FILOGENÉTICO

Los cromatogramas de las muestras secuenciadas se revisaron visualmente mediante el software CHROMAS versión 1.45 (Technelysium Pty, Tewantin, Australia). La secuencias en formato FASTA se alinearon con el programa ClustalX versión 1.83 (Thompson y col., 1997), y a partir de estas secuencias se realizó el análisis filogenético utilizando el programa MEGA versión 4.0 (Tamura y col., 2007). El árbol filogenético se obtuvo empleando el algoritmo neighbor-joining, realizando un bootstrap con 1000 réplicas para evaluar el soporte estadístico de la topología obtenida.

10. CARACTERIZACIÓN DE PÉPTIDOS MEDIANTE ESPECTROMETRÍA DE MASAS EN TÁNDEM

Los digeridos proteicos fueron analizados bien online mediante LC-ESI-IT-MS/MS, o bien offline mediante nESI-IT-MS/MS, con objeto de identificar los péptidos obteniendo sus espectros de fragmentación.

10.1. LC-ESI-IT-MS/MS

El análisis online se realizó mediante LC-ESI-IT-MS/MS, utilizando un sistema de HPLC modelo SpectraSystem P4000 (Thermo Fisher Scientific, San José, CA, EEUU) acoplado a un equipo de MS de

73

Materiales y métodos

trampa iónica tridimensional modelo LCQ Deca XP Plus (Thermo Fisher Scientific), con fuente de ionización de tipo microspray. El extracto peptídico obtenido de la digestión se retiró de las piezas de gel y se secó a vacío en un speed-vac (Christ). Posteriormente, se resuspendió la muestra en 10 μL de ácido acético al 5%, se sonicó en un baño de ultrasonidos 5 min y se inyectaron 5 μL en el equipo LC-MS. La separación cromatrográfica fue realizada en una columna de fase reversa tipo BioBasic C18 (0,18 mm x 150 mm) (Thermo Fisher Scientific), utilizando un gradiente lineal del 5% al 60% del componente B de la fase móvil durante 90 minutos, a un flujo de trabajo de 1,5-1,8 μL/min (fase móvil A: 0,5% de ácido acético (v/v); fase móvil B: 80% ACN (v/v) en 0,5% ácido acético (v/v)). Para la electronebulización se estableció una diferencia de potencial de 3,5 kV entre la salida del capilar y la entrada del espectrómetro de masas, aplicándose un flujo de N2 de 10 unidades arbitrarias para favorecer la ionización. La temperatura del capilar se fijó en 200ºC. Los péptidos fueron detectados y analizados realizando el seguimiento denominado Triple Play (Figura 20), que consiste en la sucesión de los siguientes tres eventos: 1) un barrido completo (Full Scan) de 300 a 1300 amu (3 μscans), en el que, mediante el modo de trabajo “Data-dependent”, se seleccionaron los iones de mayor intensidad a los que se les realizó, 2) un barrido de alta resolución (Zoom Scan) (5 μscans), y 3) un evento de MS/MS (5 μscans), utilizando una ventana de aislamiento de 3 amu y una energía de colisión normalizada del 35%. Los picos elegidos para ser fragmentados fueron excluidos de una posible nueva fragmentación durante 3 min, utilizando el procedimiento de exclusión dinámica. Los iones monocargados fueron descartados para sus posterior análisis mediante MS/MS.

Figura 20. Esquema del modo de trabajo Triple Play.

74

Materiales y métodos

10.2. nESI-IT-MS/MS

El análisis offline se realizó utilizando un espectrómetro de masas con trampa iónica tridimensional modelo LCQ Deca XP Plus (Thermo Fisher Scientific), equipado con una fuente de ionización por nanospray. El digerido peptídico fue sometido previamente a un proceso de limpieza, desalado y concentración, utilizando microcolumnas C18 tipo ZipTip (Millipore Co., Bedford, MA, EEUU). Los péptidos se eluyeron con 10 μL de 70% MeOH/0,5% CH3COOH. 3 μL de esta disolución se cargaron en un nanocapilar de borosilicato (PicoTips, New Objective, Woburn, MA, EEUU), con un diámetro de salida de 1 μm. Los parámetros del instrumento se fueron ajustando durante el análisis, utilizando un voltaje de spray entre 0,7 y 1,3 kV y una temperatura del capilar de desolvatación de 150ºC. Para la fragmentación de los péptidos, la anchura de la ventana de selección del ión precursor fue de 3 amu, y la energía de colisión se ajustó entre el 35% y el 45% en función del estado de carga del ión precursor. Para cada péptido estudiado se obtuvo un barrido de alta resolución (ZoomScan) y otro de fragmentación (MS/MS), promediando la señal alrededor de 1 min.

10.3. PROCESAMIENTO DE LOS DATOS DE MS/MS

Los espectros de fragmentación obtenidos se analizaron mediante el motor de búsqueda SEQUEST (Bioworks Browser 3.1 package, Thermo Fisher Scientific), frente a la base de datos no redundante NCBInr. Los parámetros introducidos para la realización de las búsquedas fueron: masas monoisotópicas, hasta dos sitios de corte consecutivos de la enzima fallidos, tolerancia de masa del ión precursor de ±1,5 Da y de los iones fragmento de ±0,8 Da, y dos posibles modificaciones, C* (cisteína carbamidometilada) y Mox (metionina sulfóxido). Además se indicó que el enzima utilizado fue tripsina. Los espectros obtenidos fueron confirmados manualmente para evitar falsos positivos. Cuando no se consiguió una adecuada identificación del péptido, bien porque el espectro era de calidad insuficiente para ser comparado por SEQUEST, o bien porque el péptido no se encontraba descrito en las bases de datos, se procedió a su secuenciación de novo mediante interpretación manual de las series de iones fragmento, con ayuda del software PEAKS Studio 4.2 (Bioinformatics Solutions, Waterloo, Ontario, Canadá). Las secuencias obtenidas fueron analizadas mediante el programa BLAST: protein blast, http://www.ncbi.nlm.nih.gov/BLAST (Altschul y col., 1990), utilizando la base de datos NCBInr, con objeto de encontrar secuencias homólogas en proteínas descritas previamente.

75

Materiales y métodos

11. DESARROLLO DE UN PROCEDIMIENTO DE ANÁLISIS RÁPIDO POR MS PARA LA IDENTIFICACIÓN DE LAS PRINCIPALES ESPECIES COMERCIALES DE LANGOSTINOS

Una vez identificados y caracterizados los péptidos que nos permiten diferenciar entre las distintas especies de langostinos, se desarrolló un método rápido para detectar la presencia en una muestra de dichos péptidos. Se procedió a digerir directamente el extracto proteico, con el fin de evitar la electroforesis bidimensional, que es una etapa que consume mucho tiempo. Se realizaron 2 tipos de digestiones en solución del extracto proteico sarcoplásmico, bien una digestión tradicional, o bien una digestión ultrarrápida utilizando ultrasonidos focalizados de alta intensidad (HIFU). Así mismo, para la monitorización de los péptidos trípticos resultantes de la digestión se utilizó el método de barrido “monitorización de la fragmentación de un ión seleccionado” (Selected MS/MS Ion Monitoring, SMIM) en el espectrómetro de masas, previa separación de los péptidos en un HPLC acoplado online.

11.1. DIGESTIÓN EN SOLUCIÓN TRADICIONAL

Se secaron a vacío en un speed-vac 100 μg de proteínas del extracto sarcoplásmico, y se desnaturalizaron las proteínas por adición de 25 μL de urea 8 M en bicarbonato amónico pH 8,0. Tras sonicar la muestra en un baño de ultrasonidos, se añadieron 3 μL de DTT, de modo que su concentración final fuese 10 mM, y se incubó a 37ºC durante 1 h. A continuación se añadió iodoacetamida a una concentración final de 50 mM, y se incubó en oscuridad a temperatura ambiente durante 1 h. Transcurrido este tiempo, la mezcla se diluyó 4 veces con bicarbonato amónico 25 mM con el fin de reducir la concentración de urea presente en la muestra, y se digirió durante al menos 16 horas a 37ºC con tripsina (Sequencing Grade; Roche Diagnostics GmbH) a una relación de 1:50 tripsina:proteína.

11.2. DIGESTIÓN EN SOLUCIÓN ULTRARRÁPIDA CON HIFU

100 μg del extracto sarcoplásmico se digirieron enzimáticamente con tripsina en un volumen final de 104 μL, aplicando simultáneamente HIFU (López-Ferrer y col., 2005). Para ello se añadió a la muestra tripsina (Sequencing Grade; Roche Diagnostics GmbH) en una relación 1:25 tripsina:proteína, y se introdujo una sonda de ultrasonidos (calibre de 2 mm, intensidad 50%, Sonics & Materials modelo Vibra Cell CV 18, Newtown, CT, EEUU) durante 1 min.

76

Materiales y métodos

11.3. SEPARACIÓN Y MONITORIZACIÓN DE PÉPTIDOS MEDIANTE SMIM

Como etapa recomendable, pero opcional, los péptidos resultantes de la digestión se purificaron y desalaron a través de columnas de fase reversa C18 tipo ZipTip (Millipore Co.), eluyendo los péptidos en 10 μL de 0,1% ácido fórmico/70% ACN. Una vez eliminado el ACN mediante evaporación, se inyectaron 5 μL del eluído conteniendo los péptidos trípticos en un sistema HPLC (Thermo Fisher Scientific), acoplado online a un espectrómetro de masas con una fuente de ionización microspray y con una trampa iónica como analizador (LCQ Deca XP, Thermo Fisher Scientific). La separación se realizó a través de una columna tipo fase reversa (0,18 mm x 150 mm) (Thermo Fisher Scientific), a un flujo de 1,5-2 µL/min. Los péptidos fueron eluidos en un gradiente de 65 min del 5% al 45% de solvente B (Solvente A: 0,5% ácido acético (v/v); solvente B: 0,5% ácido acético (v/v), 80% ACN (v/v)). A medida que los péptidos iban eluyendo de la columna cromatográfica, el espectrómetro de masas configurado en modo SMIM realizó una continua monitorización de la fragmentación de los iones doblemente cargados de cada uno de los péptidos específicos descritos en el texto (capítulo 5). Para la electronebulización, se estableció una diferencia de potencial de 3,5 kV y un flujo de N2 de 10 unidades arbitrarias. La temperatura del capilar se fijó en 200ºC y los eventos de fragmentación se realizaron con una energía de colisión normalizada del 35% y una apertura de la ventana de aislamiento del ión precursor de 3 amu. Para cada ión precursor se representó el cromatrograma “virtual” de uno de los iones fragmento (masa del ión precursor→masa del ión fragmento), utilizando el software QualBrowser (Thermo Fisher Scientific).

77

RESULTADOS Y DISCUSIÓN

CAPÍTULO 1 IDENTIFICACIÓN DE ESPECIES DE LANGOSTINOS Y GAMBAS DE INTERÉS ALIMENTARIO POR ISOELECTROENFOQUE

Capítulo 1: Identificación de especies de langostinos y gambas de interés alimentario por isoelectroenfoque.

Comentario

Aunque los métodos moleculares o las técnicas proteómicas son cada vez más frecuentemente utilizados en los laboratorios de control de productos marinos, los métodos electroforéticos clásicos como el IEF, que separa proteínas en función de su punto isoeléctrico, han demostrado ser una técnica barata, rápida y fácil de aplicar. Es más, la identificación de especies utilizando IEF de la fracción proteica sarcoplásmica es el único método oficial validado. Sin embargo, no existen trabajos que apliquen esta técnica a la identificación de las principales especies comerciales de langostinos. Por ello, es conveniente el desarrollo de un estudio que incluya un número importante de estas especies.

En este trabajo se describen los patrones de bandas que resultan de someter a IEF a las fracciones proteicas sarcoplásmicas de 14 especies de langostinos y camarones de interés comercial. Estos perfiles electroforéticos resultaron ser especie-específicos, permitiendo la inequívoca diferenciación de cada una de las especies consideradas. Las bandas más características fueron analizadas por espectrometría de masas, identificándose como isoformas de una proteína conocida como Sarcoplasmic Calcium-binding Protein (SCP), perteneciente a la misma familia que las parvalbúminas, proteínas presentes en pescado y descritas como especie-específicas y termoestables.

Estos resultados demuestran que los perfiles electroforéticos diferenciales, debidos a la presencia de isoformas de SCPs, permiten una rápida y efectiva identificación de las especies de decápodos consideradas.

83

PUBLICACIÓN

85

Elsevier Editorial System(tm) for Food Chemistry Manuscript Draft

Manuscript Number: FOODCHEM-D-09-00690 Title: Identification of commercial prawn and shrimp species of food interest by native isoelectric focusing Article Type: Research Article Keywords: IEF; shrimps; species identification; SCP; MS/MS Corresponding Author: Mr Ignacio Ortea, Corresponding Author's Institution: Instituto de Investigaciones Marinas First Author: Ignacio Ortea Order of Authors: Ignacio Ortea; Benito Cañas; Pilar Calo-Mata; Jorge Barros-Velázquez; José M Gallardo Abstract: Native isoelectric focusing (IEF) of water-soluble sarcoplasmic proteins was applied to the identification of 14 shrimp species of food interest belonging to the order Decapoda. These species have different commercial values, but due to their phenotypic similarities and carapace removal in their industrial processing, incorrect food labelling and deliberate or inadvertent adulteration can occur. Each of the 14 tested species showed species-specific protein band profiles and intraspecific polymorphism was low, not preventing the correct identification of the species. Therefore, IEF of water-soluble sarcoplasmic proteins allowed the differentiation of the 14 species considered. In addition, sarcoplasmic calcium-binding proteins (SCPs) were identified by tandem mass spectrometry (MS/MS) as the major species-specific proteins in these species, opening the way to further studies focusing on their potential use as specific biomarkers.

87

Identification of commercial prawn and shrimp species of food interest by native isoelectric focusing Ignacio Orteaa,*, Benito Cañasb, Pilar Calo-Matac, Jorge BarrosVelázquezc and José M. Gallardoa a

Instituto de Investigaciones Marinas, Consejo Superior de Investigaciones Científicas (CSIC), Eduardo Cabello 6, E-36208 Vigo, Spain

b

Department of Analytical Chemistry; School of Chemistry, Complutense University of Madrid. E-28040 Madrid, Spain c

Department of Analytical Chemistry, Nutrition and Food Science; School of

Veterinary Sciences, University of Santiago de Compostela. E-27002 Lugo, Spain

* Corresponding author. Tel.: +34-986-231-930; fax: +34-986-292-762. E-mail address: [email protected] (I. Ortea).

Running title: Shrimp species identification by IEF.

88

Abstract

Native isoelectric focusing (IEF) of water-soluble sarcoplasmic proteins was applied to the identification of 14 shrimp species of food interest belonging to the order Decapoda. These species have different commercial values, but due to their phenotypic similarities and carapace removal in their industrial processing, incorrect food labeling and deliberate or inadvertent adulteration can occur. Each of the 14 tested species showed species-specific protein band profiles and intra-specific polymorphism was low, not preventing the correct identification of the species. Therefore, IEF of water-soluble sarcoplasmic proteins allowed the differentiation of the 14 species considered. In addition, sarcoplasmic calcium-binding proteins (SCPs) were identified by tandem mass spectrometry (MS/MS) as the major species-specific proteins in these species, opening the way to further studies focusing on their potential use as specific biomarkers.

Keywords: IEF, shrimps, species identification, SCP, MS/MS.

1. Introduction Seafood products include a wide variety of species with a significant importance for food industry. Among them, crustaceans belonging to the order Decapoda, comprising prawns, shrimps, lobsters, crayfish, crabs and hermit crabs, are of remarkable commercial interest. This order includes the superfamily Penaeoidea, the penaeid shrimps, which are the most important economic resource in the world’s crustacean fishery and aquafarming industry (Dall, Hill, Rothlisberg & Staples, 1990; Holthius, 1980; Pérez-Farfante & Kensley, 1997).

89

Food authentication is a major concern not only for the prevention of commercial fraud, but also for the assessment of safety risks derived from the inadvertent introduction of any food ingredient that might be harmful to human health (Brzezinski, 2005; Civera, 2003; Lockley & Bardsley, 2000). Thus, identification of marine species is an issue of capital relevance for the seafood industry, because of commercial requirements concerning labelling and traceability. In response to consumer concern, global regulations have been implemented to assure complete and correct information, guaranteeing market transparency and avoiding substitution of certain fish species by others of less commercial value (Council Regulation, 2000; Royal Decree, 2004). Anatomical characters are particularly difficult to use for penaeid shrimps species differentiation due to their phenotypic similarities and to the fact that in their processing the external carapace is often removed. This may lead to mislabelled and/or adulterated products, so unintentional fraud may occur. Therefore, the increasing demand of crustaceans in general, and of high quality penaeid shrimps in particular, may be compromised by deliberate or inadvertent adulteration along the food chain by the substitution of higher quality species by others of lower commercial quality. Therefore, it is highly recommendable the development of the necessary analytical tools to make possible distinguishing among closely related species. Methods based on protein analysis, including sodium dodecyl sulphatepolyacrylamide gel electrophoresis (SDS-PAGE), isoelectric focusing electrophoresis (IEF) (Berrini, Tepedino, Borromeo & Secchi, 2006; Chen, Shiau, Noguchi, Wei & Hwang, 2003; Etienne et al., 2001; Mackie et al., 2000; Piñeiro et al., 1999a) and twodimensional gel electrophoresis (2-DE) (Piñeiro, Barros-Velázquez, Sotelo & Gallardo, 1999b) have been extensively used for fish species identification. Immunoassay (Asensio, González, García & Martín, 2008) and, more recently, mass spectrometry

90

(MS) methodologies (Carrera, Cañas, Piñeiro, Vázquez & Gallardo, 2006; Mazzeo et al., 2008) have also been used for species identification. Molecular biological methods as mitochondrial DNA (mtDNA) analysis has been used in polymerase chain reaction (PCR) based studies for fish species identification (Rasmussen & Morrissey, 2008). Among the mtDNA targets, the 16S rRNA gene and the cytochrome oxidase I gene have been reported to serve as good interspecific markers in some crustacean species, although most of these studies were focused not on species identification, but on population structures, phylogeography and phylogenetic relationships (Baldwin, Bass, Bowen & Clark, 1998; Lavery, Chan, Tam & Chu, 2004; Maggioni, Rogers, Maclean & Incao, 2001; Quan, Zhuang, Deng, Dai & Zhang, 2004; Voloch, Freire & Russo, 2005). More recently, two PCR-restriction fragment length polymorphism (RFLP) methods for the detection of crustaceans (Brzezinski, 2005) and penaeid shrimps (Pascoal, Barros-Velázquez, Cepeda, Gallardo & Calo-Mata, 2008) have been proposed. Although the molecular methods or the proteomic technologies will be the future in the seafood control laboratories, the classic electrophoretic methods such as IEF, which separates proteins based on their differences in isoelectric point (pI), has revealed as a cheaper, faster, easy to apply by the control laboratories and less sophisticated technology than the DNA-based techniques for species identification purposes (Piñeiro et al., 1999a). In this context, little effort has been made to elucidate differences among closely related shrimp species using these protein-based methodologies. Related previous reports described a SDS-PAGE study which was not able to discriminate among close related species (Civera & Parisi, 1991), and two urea IEF studies including only 3 shrimp species (An, Marshall, Otwell & Wei, 1989; Wei, Chen & Marshall, 1990).

91

In this study, we used native IEF for the unequivocal identification of 14 shrimp species of commercial interest for the food industry worldwide.

2. Materials and methods 2.1. Fish material 14 different prawn and shrimp species of commercial interest were considered (Table 1), 13 species belonging to the superfamily Penaeoidea and one species –the northern shrimp Pandalus borealis- to the superfamily Pandaloidea. Specimens were collected using extractive fishing practices or from aquaculture facilities in different continents worldwide. Shrimps were frozen on board and shipped to our laboratory for the analyses. Six individuals from each species were analyzed. When required, specimens were classified in their respective taxons according to their anatomical external features with the help of a marine biologist from the Marine Sciences Institute (Mediterranean Centre for Marine and Environmental Research, Higher Council for Scientific Research, CMIMA-CSIC, Barcelona, Spain) with expertise in penaeid shrimp taxonomy. 2.2. Extraction of sarcoplasmic proteins Extraction of the sarcoplasmic proteins was performed by homogenizing 1 g of raw white muscle from each individual in two volumes of milliQ water, using an UltraTurrax blender for 3x15 s–with interruptions of 45 s to avoid warming the samples. The extracts were then centrifuged at 30 000g for 15 min at 4ºC (J25 centrifuge; Beckman, Palo Alto, USA), and the supernatants were maintained at -80ºC until the electrophoretic analysis. Protein concentration in the extracts was determined by the bicinchoninic acid method (Sigma-Aldrich, St. Louis, USA). 2.3. IEF

92

Native IEF was conducted by using Ampholine PAGplate precast polyacrylamide gels in two different pH ranges (pH 4.0-6.5, pH 4.0-5.0; GE Healthcare, Uppsala, Sweden), and was performed at 10ºC in a Multiphor II electrophoresis unit (Amersham Biosciences, Sweden) with a thermostatic circulator. Most of the specific bands described for other fish species are in the pH range 4.0-7.0 (Piñeiro et al., 1999b), so narrow acidic pH ranges were chosen. IEF electrode strips were soaked in 0.1 M glutamic acid in 0.5 M H3PO4 for anode and 0.1 M β–alanine for cathode (4.0-6.5 pH range); and 1 M H3PO4 for anode and 1 M glycine for cathode (4.0-5.0 pH range). 40 μg of total proteins were loaded near the cathode using sample application pieces (GE Healthcare). Two lanes of protein standards in the 3.5-10.7 pH range (IEF Markers 310, Invitrogen, Carlsbad, USA) were included in each gel. The running conditions were 1500 V – 50 mA – 30 W, until 4000 V·h was reached, with 30 min prefocusing. 60 minutes after the initiation of electrophoresis, the application pieces were removed to avoid any smearing of proteins on the gel. Following electrophoresis, proteins were fixed for 30 minutes and gels were stained with Coomassie Brilliant Blue (GE Healthcare) equilibrated in 23% ethanol and 8% acetic acid, and dried in air between sheets of cellophane. 2.4. Analysis of patterns IEF gels were scanned and the acquired images were analyzed using the LabImage 1D software (version 4.1, Kapelan GmbH, Leipzig, Germany). Intra-gel distortions between lines were compensated by aligning the band position of the two lines of standards loaded at different positions on the gel. Different gels were normalized for differences in running conditions by comparing the pattern of pI standard proteins separated in the gel to be analyzed with the pI standard pattern chosen as a database standard.

93

2.5. Protein identification of characteristic bands Major characteristic bands were separated in a closer pH range (pH 4.0-5.0) for identification by means of MS analysis. They were excised from gel and subjected to ingel digestion with trypsin (Roche Diagnostics GmbH, Mannheim, Germany), performed overnight at 37 ºC as described elsewhere (Jensen, Wilm, Shevchenko & Mann, 1999). Final digestion solution was dried under vacuum and resuspended in 5 % acetic acid. The produced peptides were subjected to tandem mass spectrometry (MS/MS) analysis, using an ion trap mass spectrometer model LCQ Deca XP Plus (Thermo-Finnigan, San Jose, USA). Peptides were fragmented, obtaining MS/MS spectra; these spectra were then used for database searching against the nr.fasta database (NCBI Resources, NiH, Bethseda, USA) using SEQUEST (Bioworks 3.1 package, Thermo-Finnigan).

3. Results and discussion 3.1. Native IEF Native IEF profiles of sarcoplasmic proteins, extracted from the muscle of 14 shrimp species, were obtained and the patterns analyzed for species identification. Most of the specific bands described for fish species are in the pH range 4.0-7.0 (Piñeiro et al., 1999b), so a narrow acidic pH range (4.0-6.5) was chosen for the analysis. Six specimens of each of the species were analyzed, in either the same or different gels. Figure 1 represents the fourteen different protein patterns from the shrimp species. Each protein fingerprint is composed of a series of protein bands, which are characteristic for each species, allowing an easy discrimination. IEF patterns exhibited many speciesspecific bands over a pI range of 4.0-6.5, with most of the bands in the 4.2-5.0 range. Band patterns were scanned, the characteristic bands identified and their pI calculated. Table 2 reports a schematic diagram of the patterns showing the average pI (±RSD)

94

values of characteristic bands determined using the LabImage 1D software according to the procedure described in the section 2.4. Firstly, the pIs were determined for each gel, and then the average pI values and RSD for each band were calculated. The RSD values varied between 0.0 and 2.3, indicating the good precision for this method. The band patterns were consistent for the six specimens analyzed for each of the species under study. Low intra-specific polymorphism was found, only in 3 of the species: a sample of F. notialis showed a significant band at pI 5.22 which was not visible in the other five; two samples of P. semisulcatus showed a substitution of a band at pI 4.74 by a band at pI 5.07; and two samples of P. monodon showed a triplet where other four samples had a unique band (pI 4.95). However, the presence of these changes did not prevent correct identification of the species. It might be necessary to test larger number of individuals from each species to detect intra-specific differences. However, in the analytical conditions used in this work, the inter-specific band variation is much greater than the intra-specific variation and good enough for correct species identification. 3.2. Protein identification of major characteristic bands Major characteristic bands were in-gel digested with trypsin and subjected to MS/MS analysis. To achieve an unequivocal identification of the proteins presented in the specific bands, an optimal separation of the possible marker proteins was needed, so preparative native IEF was performed using an even closer pH range (pH 4.0-5.0). The following bands were selected for mass spectrometry characterization (Figure 2): band 1, pI 4.96; band 2, pI 4.76; band 3, pI 4.93; band 4, pI 4.53; band 5, pI 4.49; and band 6, pI 4.86. Several peptides (between 4 and 10) were produced after tryptic digestion of each of these bands, and all of them matched with some of the five Decapoda Sarcoplasmic Calcium-binding Proteins (SCPs) described in databases (Table 3): SCP α chain from Penaeus sp. (accession P02636), SCP β chain from Penaeus sp. (P02635),

95

SCP from Procambarus clarkii (ABB58783), SCP I from Pontastacus leptodactylus (P05946), and SCP αB from Fenneropenaeus orientalis (1006232A). In Figure 3, several fragmentation spectra as examples of the SCP peptides found are shown, together with the mass-to-charge ratio (m/z) of the precursor ions. Therefore, all the bands studied were identified by MS/MS as isoforms of the SCP, a soluble protein found in invertebrate muscle, and constituent, like parvalbumins, of the EF-hand-type family of the calcium-binding proteins. These proteins, previously described as speciesspecific proteins (Piñeiro et al., 1999b; Rehbein, 1995), belong to a group of acidic and heat-stable proteins, which accounts for the majority of the water extractable proteins from fish sarcoplasma. Recently, SCPs have also been established as crustacean allergens (Shiomi, Sato, Hamamoto, Mita & Shimakura, 2008), and interspecific variability in their amino acid sequences has been described as the cause of differences in IgE reactivity to SCP in sensitized individuals.

4. Conclusions To the best of our knowledge, the results reported here are representative of the most complete electrophoretic method described to date for the identification of penaeid shrimp species of commercial interest. The specific patterns allowed the unambiguous differentiation of all the 14 tested species. Therefore, this simple and fast technique could be usable by fisheries and related industries as a good tool for preventing mislabelling and fraudulent practices, providing a rapid and effective identification and guaranteeing market transparency. SCPs exhibited extensive polymorphism between species, a very useful property for electrophoretic species identification, as described previously (Rehbein, 1995). Inter-specific variability in the pI of SCPs isomers suggest

96

the potential presence of aminoacid substitutions in their sequences, opening the way to further studies focusing on their potential use as specific biomarkers.

Acknowledgements We thank Ms Lorena Barros for her excellent technical assistance. We also acknowledge members from CETMAR for their helpful collaboration in the collection of specimens for this study. This work was supported by the National Food Program of the INIA (Spanish Ministry for Education and Science) (Project CAL-03-030-C2-2) and by

the

PGIDIT

Research

Program

in

Marine

Resources

(Project

PGIDIT04RMA261004PR) of the Xunta de Galicia (Galician Council for Industry, Commerce and Innovation). I.O. is supported by the FPU program (AP-2004-5826) and B.C. is supported by the RyC program, under the auspices of the Spanish MICINN.

Abbreviations used 2-DE, two-dimensional gel electrophoresis; IEF, isoelectric focusing; MS, mass spectrometry; MS/MS, tandem mass spectrometry; mtDNA, mitochondrial DNA; m/z, mass-to-charge ratio; PCR, polymerase chain reaction; pI, isoelectric point; RFLP, restriction fragment length polymorphism; RSD, relative standard deviation; SCP, sarcoplasmic calcium-binding protein; SDS-PAGE, sodium dodecyl sulphatepolyacrylamide gel electrophoresis.

References An, H., Marshall, M. R., Otwell, W. S., & Wei, C. I. (1989). Species identification of raw and boiled shrimp by a urea gel isoelectric focusing technique. Journal of Food Science, 54(2), 233-236.

97

Asensio, L., González, I., García, T., & Martín, R. (2008). Determination of food authenticity by enzyme-linked immunosorbent assay (ELISA). Food Control, 19(1), 1-8. Baldwin, J. D., Bass, A. L., Bowen, B. W., & Clark, W. H. (1998). Molecular phylogeny and biogeography of the marine shrimp Penaeus. Molecular Phylogenetics and Evolution, 10, 399-407. Berrini, A., Tepedino, V., Borromeo, V., & Secchi, C. (2006). Identification of freshwater fish commercially labelled "perch" by isoelectric focusing and twodimensional electrophoresis. Food chemistry, 96(1), 163-168. Brzezinski, J. L. (2005). Detection of crustacean DNA and species identification using a PCR-restriction fragment length polymorphism method. Journal of Food Protection, 68, 1866-1873. Carrera, M., Cañas, B., Piñeiro, C., Vázquez, J., & Gallardo, J. M. (2006). Identification of commercial hake and grenadier species by proteomic analysis of the parvalbumin fraction. Proteomics, 6(19), 5278-5287. Civera, T. (2003). Species identification and safety of fish products. Veterinary Research Communications, 27, 481-489. Civera, T., & Parisi, E. (1991). The use of sodium dodecyl sulfate polyacrylamide gel electrophoresis for the identification of raw and cooked shrimps and crabs. Italian Journal of Food Science, 3(2), 9. Council Regulation (2000). Council Regulation (EC) No. 104/2000 of 17 December 1999 on the common organization of the markets in fishery and aquaculture products. Official Journal of the European Communities L 17/22.

98

Chen, T.-Y., Shiau, C.-Y., Noguchi, T., Wei, C.-i., & Hwang, D.-F. (2003). Identification of puffer fish species by native isoelectric focusing technique. Food chemistry, 83(3), 475-479. Dall, W., Hill, B. J., Rothlisberg, P. C., & Staples, D. J. (1990). The biology of Penaeidae. Advances in Marine Biology, 27, 1-484. Etienne, M., Jérôme, M., Fleurence, J., Rehbein, H., Kündiger, R., Mendes, R., Costa, H., & Martínez, I. (2001). Species identification of formed fishery products and high pressure-treated fish by electrophoresis: a collaborative study. Food chemistry, 72(1), 105-112. Holthius, L. B. (1980). FAO species catalogue. Volume 1. Shrimps and prawns of the world. An annotated catalogue of species of interest to fisheries. FAO Fisheries Synopsis, 125(1), 1-271. Jensen, O. N., Wilm, M., Shevchenko, A., & Mann, M. (1999). Sample preparation methods for mass spectrometric peptide mapping directly from 2-DE gels. In: A. J. Link, 2-D proteome analysis protocols (pp. 513-530). Totowa, NJ: Humana Press. Lavery, S., Chan, T. Y., Tam, Y. K., & Chu, K. H. (2004). Phylogenetic relationships and evolutionary history of the shrimp genus Penaeus s.l. derived from mitochondrial DNA. Molecular Phylogenetics and Evolution, 31(1), 39-49. Lockley, A. K., & Bardsley, R. G. (2000). DNA-based methods for food authentication. Trends in Food Science & Technology, 11(2), 67-77. Mackie, I., Craig, A., Etienne, M., Jérôme, M., Fleurence, J., Jessen, F., Smelt, A., Kruijt, A., Malmheden Yman, I., Ferm, M., Martinez, I., Pérez-Martín, R., Piñeiro, C., Rehbein, H., & Kündiger, R. (2000). Species identification of smoked and gravad fish products by sodium dodecylsulphate polyacrylamide gel electrophoresis,

99

urea isoelectric focusing and native isoelectric focusing: a collaborative study. Food chemistry, 71(1), 1-7. Maggioni, R., Rogers, A. D., Maclean, N., & Incao, F. (2001). Molecular phylogeny of western Atlantic Farfantepenaeus and Litopenaeus shrimp based on mitochondrial 16S partial sequences. Molecular Phylogenetics and Evolution, 18, 66-73. Mazzeo, M. F., Giulio, B. D., Guerriero, G., Ciarcia, G., Malorni, A., Russo, G. L., & Siciliano, R. A. (2008). Fish authentication by MALDI-TOF mass spectrometry. Journal of Agricultural and Food Chemistry, 56(23), 11071-11076. Pascoal, A., Barros-Velázquez, J., Cepeda, A., Gallardo, J. M., & Calo-Mata, P. (2008). A polymerase chain reaction-restriction fragment length polymorphism method based on the analysis of a 16S rRNA/tRNAVal mitochondrial region for species identification of commercial penaeid shrimps (Crustacea: Decapoda: Penaeoidea) of food interest. Electrophoresis, 29(2), 499-509. Pérez-Farfante, I., & Kensley, B. (1997). Penaeoid and sergestoid shrimps and prawns of the world. Keys and diagnoses for the families and genera. Paris: Éditions du Muséum National d’Histoire Naturelle. Piñeiro, C., Barros-Velázquez, J., Pérez-Martín, R. I., Martínez, I., Jacobsen, T., Rehbein, H., Kündiger, R., Mendes, R., Etienne, M., Jerome, M., Craig, A., Mackie, I. M., & Jessen, F. (1999a). Development of a sodium dodecyl sulfatepolyacrylamide gel electrophoresis reference method for the analysis and identification of fish species in raw and heat-processed samples: A collaborative study. Electrophoresis, 20(7), 1425-1432. Piñeiro, C., Barros-Velázquez, J., Sotelo, C. G., & Gallardo, J. M. (1999b). The use of two-dimensional electrophoresis in the characterization of the water-soluble protein

100

fraction of commercial flat fish species. Zeitschrift für Lebensmitteluntersuchung und -Forschung A, 208(5), 342-348. Quan, J., Zhuang, Z., Deng, J., Dai, J., & Zhang, Y.-p. (2004). Phylogenetic relationships of 12 Penaeoidea shrimp species deduced from mitochondrial DNA sequences. Biochemical Genetics, 42(9), 331-345. Rasmussen, R. S., & Morrissey, M. T. (2008). DNA-based methods for the identification of commercial fish and seafood species. Comprehensive Reviews in Food Science and Food Safety, 7(3), 280-295. Rehbein, H. (1995). Food control by applied biochemistry of marine organisms: Comparison of proteins and metabolites from fish and invertebrate muscle. Helgoland Marine Research, 49(1), 747-757. Royal Decree (2004). Royal Decree 121/2004 of 23 January 2004 related to the identification of live, fresh or refrigerated fish and fishery products. Ministry of Agriculture, Fisheries and Food, Spain. BOE number 31, of 5 February 2004. Shiomi, K., Sato, Y., Hamamoto, S., Mita, H., & Shimakura, K. (2008). Sarcoplasmic calcium-binding protein: identification as a new allergen of the black tiger shrimp Penaeus monodon. International Archives of Allergy and Immunology, 146(2), 9198. Voloch, C. M., Freire, P. R., & Russo, C. A. M. (2005). Molecular phylogeny of penaeid shrimps inferred from two mitochondrial markers. Genetics and Molecular Research, 4(4), 668-674. Wei, C.-I., Chen, H. A. J.-S., & Marshall, M. R. (1990). Use of a modified urea gel isoelectric focusing method for species identification of raw or boiled white, pink, and rock shrimp. Journal of Food Biochemistry, 14(2), 91-102.

101

Figure captions

Fig. 1. Native IEF patterns (pH range 4.0-6.5) of water-soluble sarcoplasmic proteins representative of the 14 shrimp species tested.

Fig. 2. IEF in polyacrylamide gel (pH range 4.0-5.0) of water-soluble sarcoplasmic proteins of four shrimp species, showing bands selected for MS/MS analysis.

Fig. 3. Ion-trap MS/MS spectrum of the SCPs peptides a) DGEVTVDEFK, present in all bands analyzed; b) VFIANQFK, present in bands 1, 2 ,3, 4 and 6; and c) YM*YDIDNDGFLDK, present in bands 1, 2, 4, 5 and 6. M*, methionine sulfoxide.

102

Tables

Table 1. Shrimp and prawn species considered in this study Scientific namea

Commercial name

Codeb

Origin

Penaeus monodon

Giant tiger prawn

Indo West Pacific

MPN

Farfantepenaeus notialis

Southern pink shrimp

Eastern Atlantic

SOP

Fenneropenaeus merguiensis

Banana prawn

Western Central

PBA

Pacific Fenneropenaeus indicus

Indian white prawn

Western Indian

PNI

Litopenaeus vannamei

Pacific white shrimp

Eastern Pacific

PNV

Pleoticus muelleri

Argentine red shrimp

South West Atlantic

LAA

Pandalus borealis

Northern shrimp

Northern Atlantic

PRA

Solenocera agassizii

Kolibri shrimp

Eastern Pacific

SOK

Parapenaeus longirostris

Deepwater rose

Eastern Atlantic

DPS

shrimp Marsupenaeus japonicus

Kuruma prawn

Indo West Pacific

KUP

Farfantepenaeus aztecus

Brown shrimp

Western Atlantic

ABS

Penaeus semisulcatus

Green tiger prawn

Indo West Pacific

TIP

Melicertus latisulcatus

Western king prawn

Indo West Pacific

WKP

Farfantepenaues brevirostris

Crystal shrimp

Eastern Pacific

CSP

a

The taxonomic classification proposed by Pérez-Farfante et al. (1997) was adopted.

b

The three initial letters correspond to the FAO codes.

103

Table 2. Species-specific band patterns of water-soluble shrimp proteins. Mean pI ±RSD (%) were calculated from the patterns of the six shrimps of each species analyzed. The RSD values varied between 0.0 and 2.3. MPN

SOP

PBA

PNI

PNV

LAA

PRA

SOK

DPS

KUP

ABS

TIP

WKP

CSP

6.28 6.22 6.13

6.10

6.05

6.04

6.11 5.88

5.83

5.79 5.68

5.65 5.60 5.52

5.60

5.63

5.56

5.57

5.65 5.57 5.50

5.52 5.34 5.19

5.17

5.21

5.23

5.14 5.10

5.10

5.09

5.07 5.04 5.00

5.00

4.95

4.95

4.93

4.86

4.87

4.88

5.04

5.03

4.96

4.93

4.86

4.84 4.74

4.74

4.72

4.99

5.02

4.94

4.94

4.86

4.88

4.89

4.86

4.81

4.80

4.93

4.91 4.87

4.89

4.82

4.84

4.86

4.82

4.80 4.75

5.08

4.97

5.00 4.91

5.07

4.76

4.74

4.73

4.72

4.74

4.85 4.79

4.74

4.74

4.88

4.77

4.75

4.61

4.62

4.53

4.53

4.72 4.70

4.64

4.66

4.64 4.62

4.61 4.59

4.60 4.57

4.57

4.60

4.60

4.60

4.59

4.58

4.57

4.58

4.56

4.50

4.51

4.60

4.59

4.55

4.54 4.52 4.48

4.49

4.51

4.53 4.49

4.51 4.48 4.42

4.44 4.22

104

Table 3. Sequences found that matched with Decapoda Sarcoplasmic Calcium-binding Protein peptides. sequence

100% matched with proteina

Found in band no.

NLWNEIAELADFNK

P02636, P02635, ABB58783, P05946,

1, 2, 6

1006232A DGEVTVDEFK

P02636, P02635, 1006232A

1, 2, 3, 4, 5, 6

VFIANQFK

P02636, P05946, 1006232A

1, 2, 3, 4, 6

NDFECLAVR

P02636, P02635, 1006232A

1, 2

VGLDEYR

P02636, 1006232A

1, 2, 3, 6

EIDDAYNK

P02636, 1006232A

1, 2

AGGLTLER

P02636, 1006232A

2, 3

GEFSAADYANNQK

P02636, 1006232A

3, 6

YMYDIDNDGFLDK

P02635

1, 2, 4, 6

YM*YDIDNDGFLDK

P02635

1, 2, 4, 5, 6

SAFADVK

P02635

1, 2, 6

AGGINLAR

P02635

5

VTLIEGR

P02635

5

YM*YDIDNNGFLDK

ABB58783, P05946

3, 4, 6

a

P02636, SCP alpha chain; P02635, SCP beta chain; ABB58783, SCP (Procambarus

clarkii); P05946, SCP I; 1006232A, SCP αB.

105

FIGURES.

106

107

108

CAPÍTULO 2 IDENTIFICACIÓN DE ESPECIES DE LANGOSTINOS PRÓXIMAS POR MALDI-TOF MS

Capítulo 2: Identificación de especies de langostinos próximas por MALDITOF MS.

Comentario

Una de las metodologías proteómicas más frecuentemente utilizada es la caracterización de proteínas mediante huella peptídica, peptide mass fingerprinting (PMF) en la terminología inglesa. A partir de la digestión con una proteasa de una proteína previamente aislada, se obtiene una mezcla de péptidos que se analiza mediante MALDI-TOF. El espectro de masas obtenido, o mapa peptídico, es específico para esa proteína.

En este trabajo se demostró la capacidad de esta metodología para diferenciar entre dos especies de langostinos muy próximos, tanto filogenética y morfológicamente, como en distribución geográfica. Las especies consideradas fueron dos de las de mayor importancia económica, Penaeus monodon y Fenneropenaeus indicus, que algunos autores incluyen en el mismo género Penaeus, y que, como se ha indicado anteriormente, comparten distribución geográfica y hábitat, además de tener caracteres morfológicos muy similares.

Los resultados obtenidos demuestran que los espectros de masas de los péptidos provenientes de la digestión tríptica de la proteína arginina quinasa nos permiten diferenciar de forma precisa entre las dos especies consideradas.

111

PUBLICACIÓN

113

Journal of Aquatic Food Product Technology, 18:146–155, 2009 Copyright © Taylor & Francis Group, LLC ISSN: 1049-8850 print/1547-0636 online DOI: 10.1080/10498850802584280

Closely Related Shrimp Species Identification by MALDI-ToF Mass Spectrometry

WAFP Journal 1049-8850 1547-0636 of Aquatic Food Product Technology, Technology Vol. 18, No. 1-2, February 2009: pp. 1–18

IGNACIO ORTEA, LORENA BARROS, and JOSÉ M. GALLARDO

Shrimp I. Ortea Species et al. Identification by MALDI-ToF MS

Department of Marine Product Chemistry, Marine Research Institute, CSIC, Vigo, Spain

Tiger prawn, Penaeus monodon, and banana white prawn, Fenneropenaeus indicus—two of the most important commercial shrimp species—share world distribution, habitat, and similar morphometric characters. Because of commercial regulations about labeling and traceability requirements, species authentication methods are of great interest to fisheries and seafood industries. In this study, peptide mass fingerprints of both species are compared, using Matrix Assisted Laser Desorption Ionization– Time of Flight Mass Spectrometry (MALDI-TOF MS) after trypsin digestion of a protein resolved by two-dimensional gel electrophoresis. Though low variability among these species is observed, two peptides of mass 1077.6 and 1205.7 Da are found to be useful to differentiate them. KEYWORDS shrimp, species authentication, peptide mass fingerprint, MALDI-TOF MS

INTRODUCTION Identification of marine species is a matter of capital importance in the seafood industry because of commercial requirements about labeling and

This work was supported by Instituto Nacional de Investigaciones Agrarias project No. CAL03-030-C2-2 “Aplicación de técnicas de genómica y proteómica a la identificación de especies de crustáceos comerciales pertenecientes al Orden Decapoda” and by PGIDIT Research Program in Marine Resources Project No. PGIDIT04RMA261004PR of the Xunta de Galicia. I. O. is supported by the FPU program (AP-2004-5826) under the auspices of the Spanish Ministry of Education and Science. Address correspondence to Ignacio Ortea, Department of Marine Product Chemistry, Marine Research Institute, Consejo Superior de Investigaciones Científicas, Eduardo Cabello 6, 36208 Vigo, Spain. E-mail: [email protected] 146

115

Shrimp Species Identification by MALDI-ToF MS

147

traceability. Global regulations have been implemented to assure complete and correct information, guarantee market transparency, and avoid substitution of certain fish species by others of less commercial value (MAPA, 2004). The handling of fillets or minced fish instead of whole specimens as raw material is gaining importance in the manufacturing industry. This complicates the identification of fish species, which has been traditionally based on the analysis of external anatomical and morphological features. Tiger prawn, Penaeus monodon (Fabricius, 1798), and Indian white prawn, Fenneropenaeus indicus (H. Milne Edwards, 1837), are two of the most economically important crustacean species (Lavery et al., 2004). Both of them are distributed in the Indo-West Pacific region, from East Africa to Southeast Asia and Australia, and they share habitat and similar morphometric characters (Pérez Farfante and Kensley, 1997). This, added to the increasing use of filleted or minced material mentioned above, makes species authentication methods of great interest to fisheries and seafood industries. The amplification of selected DNA sequences by polymerase chain reaction (PCR) has been applied to the identification of certain groups of fish species (Rasmussen and Morrissey, 2008). Among DNA targets, mitochondrial DNA (mtDNA), and more specifically the 16S rRNA gene and the cytochrome oxidase I (COI) gene, have been reported to serve as good interspecific markers in some crustacean species, although most of these studies were focused on population structures, phylogeography, and phylogenetic relationships (Lavery et al., 2004; Baldwin et al., 1998; Quan et al., 2004; Maggioni et al., 2001; Voloch et al., 2005), not on species identification. RFLP (Restriction Fragment Length Polymorphism) analyses of PCR products have been extensively used for species discrimination, but there are only a few studies dealing with RFLP-based species identification and crustaceans. A method for the detection of crustacean DNA based on a PCR-RFLP approach has been proposed, but it did not allow shrimp species identification, although it did permit their generic detection and differentiation with respect to crab, lobster, and crawfish species (Brzezinski, 2005). More recently, a PCR-RFLP protocol has been proposed (Pascoal et al., 2008) that does allow the differentiation of several penaeid shrimp species, including P. monodon and F. indicus, although RFLP patterns described for these two species are similar and may lead to ambiguous identification. RFLP method has the drawback that incomplete digestion may occasionally occur, and intraspecific variation could delete or create additional restriction sites (Lockley and Bardsley, 2000) due to the high degree of intraspecific variability of mtDNA. In addition, the need for specific probe sequences and the associated DNA sequencing when the species under study are not present in databases makes genotypic methods for species identification technically demanding, time consuming, and expensive. Protein-based methodologies (Mackie, 1997; Gallardo et al., 1995; Armstrong et al., 1992) have been used for authentication purposes in seafood products. Recently, proteomic tools have been applied to the identification of

116

148

I. Ortea et al.

species (Martínez and Friis, 2004; Piñeiro et al., 1998), but little effort has been made to elucidate differences among closely related seafood species using mass spectrometry (MS; Carrera et al., 2006; Piñeiro et al., 2001). With the advent of proteomics, one of the important areas of interest is the characterization of proteins through peptide mass fingerprinting (PMF). The Matrix Assisted Laser Desorption Ionization–Time of Flight Mass Spectrometry (MALDI-TOF MS) is an effective method for the analysis of proteins and peptides. This approach is highly advantageous due to its relatively low cost, simplicity in design, and sensitivity. In this work, we applied MALDI-TOF MS to the identification of species-specific peptides within the sarcoplasmic protein fraction. Peptides detected allow a highly specific identification of individuals belonging to the P. monodon taxonomic form, when compared to those belonging to F. indicus.

MATERIALS AND METHODS Materials Black tiger prawns (Penaeus monodon) and banana white prawns (Fenneropenaeus indicus) were acquired by the Centro Tecnológico del Mar (Vigo, Spain). Shrimps were frozen onboard and shipped to our laboratory for the analyses. Three specimens of P. monodon (samples mon1, mon2, and mon3), corresponding to three different populations (one from the coasts of Malaysia and two from Mozambique); and three specimens of F. indicus (samples indi1, indi2, and indi3), corresponding to another three populations (all from the coasts of Mozambique), were evaluated in the study. Tail muscle of these specimens was subjected to two-dimensional gel electrophoresis (2-DE) and MS analysis.

Extraction of Sarcoplasmic Proteins Extraction of the sarcoplasmic proteins was performed by homogenizing 1 g of raw white muscle from each individual in two volumes of milliQ water, in an Ultra-Turrax blender for 3 × 15 s—with interruptions of 45 s to avoid warming the samples. The extracts were then centrifuged at 30,000 g for 15 min at 4ºC (J25 centrifuge; Beckman, Palo Alto, CA), and the supernatants were maintained at −80ºC until the electrophoretic analysis. Protein concentration in the extracts was determined by the bicinchoninic acid (BCA) method (Sigma Chemical Co., USA).

Two-Dimension Electrophoresis First-dimension native IEF was performed at 10ºC in a Multiphor II electrophoresis unit (Amersham Biosciences, Sweden) as described elsewhere

117

Shrimp Species Identification by MALDI-ToF MS

149

(Carrera et al., 2006). Briefly, protein extracts (4 mg/mL) were loaded on IEF precast polyacrylamide gels (Ampholine PAGplate pH 4.0–6.5, GE Healthcare, Uppsala, Sweden) and run under 1500 V–50 mA–30 W conditions, until 4000 V·h were reached. IEF strips corresponding to individual lanes were cut after the run was completed and kept at −80ºC until seconddimension electrophoresis analysis. Equilibration of pH 4–6.5 IEF gel strips was carried out at room temperature as described previously (Piñeiro et al., 1998). Preparative second dimension electrophoresis for MS analysis were performed using vertical sodium dodecyl sulphate (SDS) polyacrylamide gel electrophoresis (PAGE; 7.5% T and 3% C) gels with Tris-tricine buffer and stained with Coomassie Brilliant Blue (CBB; GE Healthcare) according to the manufacturer’s instructions.

In-Gel Digestion One major spot, presented in all gels, was selected. This spot was excised from each gel, and subjected to in-gel digestion with trypsin (Roche Diagnostics GmbH, Mannheim, Germany), performed overnight at 37ºC, according to Jensen et al. (1999). Final digestion solution was dried under vacuum and resuspended in 0.1% trifluoroacetic acid.

Spectra Acquisition and Processing A 1 µL aliquot of the final sample solution was manually deposited onto a stainless steel MALDI probe and allowed to dry at room temperature. Then, 0.8 µL of matrix solution (saturated a-cyano-4 hydroxycinnamic acid in 50% aqueous acetonitrile and 0.1% trifluoroacetic acid) was added and again allowed to dry at room temperature. All mass spectra were acquired with a Voyager DE STR MALDI-TOF MS (Applied Biosystems, Foster City, USA) operating in the reflector, delay extraction, positive-ion mode. The laser intensity was set just above the ion generation threshold. The low mass gate was set to m/z 500 Da, the delay time was 350 ns, the accelerating voltage was 20,000 V, and the grid voltage was set to 68.5%. Mass spectra were acquired by accumulating 150 laser shots in the m/z range from 850 to 3500. External close calibration with the Calibration Mixture 2 of the Sequazyme Peptide Mass Standards Kit (Applied Biosystems) was used. Mass spectra were baseline corrected, and data lists containing monoisotopic m/z values were extracted from mass spectral data with the specific software of the instrument (Data Explorer, version 4.0.0.0). Signals with relative intensities greater than 4% were included in the lists. Species-specific biomarkers were extracted by visual comparison of the peak lists obtained. Mass lists were also used for protein and peptide identification using MASCOT Peptide Mass Fingerprint (Perkins et al., 1999). Search

118

150

I. Ortea et al.

FIGURE 1 MALDI-TOF MS peptide mass maps obtained from the analysis of mon1 (A), mon2 (B), mon3 (C), indi1 (D), indi2 (E), and indi3 (F). P. monodon specific biomarkers are indicated by dots.

parameters were—database: NCBInr; allow up to 2 missed cleavages; peptide tolerance: 100 parts per million (ppm), and monoisotopic and MH+ mass values.

RESULTS AND DISCUSSION The MALDI-TOF analysis gave mass fingerprints (Figure 1) containing a different number of peaks for each individual, and the number of peaks ranged from 25 to 44 (Table 1). Three peaks existed in all the individuals belonging to P. monodon but were not detected in the individuals belonging to F. indicus, corresponding to peaks at m/z 1077.6, 1205.7, and 1415.8. The peak at m/z 1415.8 was discarded as a P. monodon biomarker after a detailed observation of spectra. It is present in the peptide mass map derived from sample indi1, but with relative intensity lower than 4%, which is why it is not extracted by Data Explorer when using a threshold of 4% base peak intensity. No peaks were detected as present in all three F. indicus and absent in all three P. monodon. Spot selected in 2-DE for MALDI-TOF analysis, corresponding to a mass of 40 kDa and an isoelectric point near 6.0, was identified as arginine kinase by MASCOT database search (Table 2). Protein analyzed from P. monodon samples was identified as Penaeus monodon allergen Pen m2, described before as arginine kinase (Yu et al., 2003). Protein analyzed from F. indicus samples was identified as Litopenaus vannamei arginine kinase. F. indicus arginine kinase is not described in databases, so a homology search result is provided by database search. Differential peptides, corresponding to

119

151

Shrimp Species Identification by MALDI-ToF MS TABLE 1 Monoisotopic m/z Peaks Obtained from the Analysis of the Six Individualsa mon1

mon2

mon3

indi1

indi2

indi3 850.238

855.039 861.043 864.254

864.208 877.027

1008.503 1050.517 1077.597

1008.501 1050.525 1077.575

1008.499 1050.515 1077.567

1147.624

1147.597

1147.597

1205.691 1259.698

1164.595 1205.675 1259.711

1164.594 1205.671 1259.690

1415.799

1415.790

1415.790

1503.817 1507.725 1518.821 1525.784

1438.768 1503.795 1507.726 1518.835 1525.792 1527.839

1003.490 1008.500 1050.522 1147.627 1149.613

1008.500 1050.516

1008.499 1050.517

1133.619 1147.613

1133.586

1164.597 1259.694 1272.703 1428.790

1603.816 1604.806 1606.814 1622.803 1631.902 1651.831 1657.832 1667.818 1683.807

1604.804

1631.876 1651.845 1657.841

1503.799 1507.702 1518.821 1525.796 1603.824 1604.807

1631.888 1651.840 1657.838 1667.806 1683.798

1503.804 1507.692 1518.810 1558.825 1603.822 1604.807 1606.817 1619.806 1622.849 1651.840 1657.835 1667.795 1683.785

1503.809 1507.728 1518.830 1525.781

1503.806 1507.706 1518.828 1525.779

1603.851 1604.814

1603.849 1604.815 1606.837

1631.903 1651.849 1657.855

1651.855 1657.834

1683.827 1719.784

1754.920 1774.942 1775.977 1796.923 1807.909 1839.894 1875.868 2015.940 2031.980 2033.953 2190.032 2284.938 2301.253

1775.984

1775.973

1775.991

1775.972

1796.924

1796.938 1807.883

1796.945

2015.962 2031.976 2033.952 2190.000

1796.932 1807.922 1810.946 1839.885 1875.876 2015.947 2031.972 2033.949 2190.021

2301.239

2301.240

2015.943 2033.927

1875.886 2015.960 2031.971 2033.946 2190.031

1775.985 1791.607 1796.962 1807.903 1810.918 2015.950 2033.939

(Continued )

120

152

I. Ortea et al.

TABLE 1 (Continued ) mon1

mon2

2346.120

mon3

2599.230

2472.172 2520.259 2548.240 2580.198 2597.146 2599.260 2619.000 2619.989 2623.115 2636.263 2701.219

a

indi2

indi3

2426.150

2426.123

2599.206 2600.314 2619.049

2599.250

2599.243

2636.295

2636.246

2636.249

3290.474

3290.582

2346.114

2520.265

3420.544

indi1

3403.593 3420.587

Specific biomarkers are indicated by boldface type.

TABLE 2 Mascot Top Score Protein Matches for each Sample Sample mon1 mon2 mon3 indi1 indi2 indi3

Protein

Accession No.

Mascot Score

allergen Pen m2 [Penaeus monodon] allergen Pen m2 [Penaeus monodon] allergen Pen m2 [Penaeus monodon] arginine kinase [Litopenaeus vannamei] arginine kinase [Litopenaeus vannamei] arginine kinase [Litopenaeus vannamei]

27463265 27463265 27463265 115492980 115492980 115492980

196 248 274 159 226 152

m/z 1077.6 and 1205.7, were identified as AVFDQLKEK and AVFDQLKEKK, respectively (Table 3).

CONCLUSIONS Proteomics methodology, using peptide mass fingerprint generation and fast protein identification by MALDI-TOF MS analysis, after 2-DE and trypsin digestion, was used to find differences within a sarcoplasmic protein from two different species. The capacity of this methodology to discriminate between seafood species was ascertained by analyzing the closely related decapod species, P. monodon and F. indicus. Some authors include both species in the same genus, Penaeus (Lavery et al., 2004), indicating that the two species selected for this study are very closely related to each other. This approach is highly advantageous due to its relatively low cost, simplicity in design and sensitivity, which avoids technically demanding and

121

Shrimp Species Identification by MALDI-ToF MS

153

TABLE 3 Set of Tryptic Peptides Identified by Mascot and Generated from Sample Mon1 that led to the Identification of Allergen Pen m2a [M+H]+ Obs. 1503.817 1631.902 1077.597 1205.692 1147.624 1604.806 1507.725 1050.517 1657.832 1651.831 1667.818 1683.807 1807.909 1839.894 1415.799 1259.698 1008.503 1775.977 1518.822 2033.953 2190.032 1875.868 2031.980 a

Calc.

Pos.

Sequence

1503.805 1631.900 1077.594 1205.689 1147.615 1604.807 1507.707 1050.515 1657.833 1651.829 1667.824 1683.819 1807.931 1839.920 1515.796 1259.695 1008.501 1775.965 1518.827 2033.952 2190.053 1875.883 2031.984

2−15 2−16 34-42 34-43 181−189 181−193 190−202 194−202 217−229 230−244 230−244 230−244 230−245 230−245 245−256 246−256 257−264 295−309 297−309 310−328 310−329 313−329 313−330

ADAAVIEKLEAGFK Acetyl (Protein N-term) ADAAVIEKLEAGFKK Acetyl (Protein N-term) AVFDQLKEK AVFDQLKEKK LIDDHFLFK LIDDHFLFKEGDR EGDRFLQAANACR Carbamidomethyl (C) FLQAANACR Carbamidomethyl (C) TFLVWVNEEDHLR IISMQMGGDLGQVFR IISMQMGGDLGQVFR Oxidation (M) IISMQMGGDLGQVFR 2 Oxidation (M) IISMQMGGDLGQVFR IISMQMGGDLGQVFRR 2 Oxidation (M) RLTSAVNEIEKR LTSAVNEIEKR IPFSHHDR EKLEEVAGKYNLQVR LEEVAGKYNLQVR GTRGEHTEAEGGIYDISNK GTRGEHTEAEGGIYDISNKR GEHTEAEGGIYDISNKR GEHTEAEGGIYDISNKRR

P. monodon specific sequences are indicated by boldface type.

expensive genotypic methods. Once potential peptide markers are identified, MS may be used as a routine technique for fast and highly accurate species discrimination. Proteomic techniques should be automated, obtaining fast, reproducible and sensitive results, and allowing high-throughput analysis of foodstuffs. In addition, this methodology should be applied to species that are poorly characterized at the genomic and proteomic levels in the databases, avoiding disadvantages of DNA sequencing. Results presented here may also be used to develop antipeptide antibodies, which could be introduced in immunoassay kits to detect the presence of proteins containing the specific peptides in crude tissue extracts, thus making species identification much faster. Furthermore, these results have immunological and food safety implications, due to the allergenic character of this protein.

REFERENCES Armstrong, S. G., Leach D. N., and Wyllie S. G. 1992. The use of HPLC protein profiles in fish species identification. Food Chem. 44(2): 147–155.

122

154

I. Ortea et al.

Baldwin, J. D., Bass, A. L., Bowen, B. W., and Clark, W. H. 1998. Molecular phylogeny and biogeography of the marine shrimp Penaeus. Mol. Phylogenet. Evol. 10(3): 399–407. Brzezinski, J. L. 2005. Detection of crustacean DNA and species identification using a PCR–restriction fragment length polymorphism method. J. Food Prot. 68(9): 1866–1873. Carrera, M., Cañas, B., Piñeiro, C., Vázquez, J., and Gallardo, J. M. 2006. Identification of commercial hake and grenadier species by proteomic analysis of the parvalbumin fraction. Proteomics 6(19): 5278–5287. Gallardo, J. M., Sotelo, C. G., Piñeiro, C., and Pérez-Martín, R. I. 1995. Use of capillary zone electrophoresis for fish species identification. Differentiation of flatfish species. J. Agric. Food Chem. 43: 1238–1244. Jensen, O. N., Wilm, M., Shevchenko, A., and Mann, M. 1999. Sample preparation methods for mass spectrometric peptide mapping directly from 2-DE gels. In: 2-D Proteome Analysis Protocols. Link, A. J. (Ed.). Totowa, NJ: Humana Press. pp. 513–530. Lavery, S., Chan, T. Y., Tam, Y. K., and Chu, K. H. 2004. Phylogenetic relationships and evolutionary history of the shrimp genus Penaeus s.l. derived from mitochondrial DNA. Mol. Phylogenet. Evol. 31: 39–49. Lockley, A. K., and Bardsley, R. G. 2000. DNA-based methods for food authentication. Trends Food Sci. Tech. 11: 67–77. Mackie, I. M. 1997. Methods of identifying species of raw and processed fish. In: Fish Processing Technology. Hall, G. M. (Ed.). London: Chapman & Hall. pp. 160–199. Maggioni, R., Rogers, A. D., Maclean, N., and D’Incao, F. 2001. Molecular phylogeny of Western Atlantic Farfantepenaeus and Litopenaeus shrimp based on mitochondrial 16S partial sequences. Mol. Phylogenet. Evol. 18: 66–73. MAPA. 2004. Real Decreto 121/2004, de 23 de enero, sobre la identificación de los productos de la pesca, de la acuicultura y del marisqueo vivos, frescos, refrigerados o cocidos. (Royal Decree 121/2004, 23 January, About identification of products from fisheries, aquaculture and shellfish gathering.) Ministerio de Agricultura, Pesca y Alimentación, Spain. Martínez, I., and Friis, T. J. 2004. Application of proteome analysis to seafood authentication. Proteomics 4: 347–354. Pascoal, A., Barros-Velázquez, J., Cepeda, A., Gallardo, J. M., and Calo-Mata, P. 2008. A polymerase chain reaction-restriction fragment length polymorphism method based on the analysis of a 16S rRNA/tRNAVal mitochondrial region for species identification of commercial penaeid shrimps (Crustacea: Decapoda: Penaeoidea) of food interest. Electrophoresis 29: 499–509. Perez Farfante, I., and Kensley, B. 1997. Penaeoid and Sergestoid Shrimps and Prawns of the World: Keys and Diagnoses for the Families and Genera. Paris, France: Éditions du Muséum. Perkins, D. N., Pappin, D. J. C., Creasy, D. M., and Cottrell, J. S. 1999. Probabilitybased protein identification by searching sequence databases using mass spectrometry data. Electrophoresis 20: 3551–3567. Piñeiro, C., Barros-Velazquez, J., Sotelo, C. G., Perez-Martin, R. I., and Gallardo, J. M.1998. Two-dimensional electrophoretic study of the water-soluble protein

123

Shrimp Species Identification by MALDI-ToF MS

155

fraction in white muscle of gadoid fish species. J. Agric. Food Chem. 46(10): 3991–3997. Piñeiro, C., Vázquez, J., Marina, A. I., Barros-Velázquez, J., and Gallardo J. M. 2001. Characterization and partial sequencing of species-specific sarcoplasmic polypeptides from commercial hake species by mass spectrometry following two-dimensional electrophoresis. Electrophoresis 22(8): 1545–1552. Quan, J., Zhuang, Z., Deng, J., Dai, J., and Zang, Y. P. 2004. Phylogenetic relationships of 12 Penaeoidea shrimp species deduced from mitochondrial DNA sequences. Biochem. Genet. 42: 331–345. Rasmussen, R. S., and Morrissey, M. T. 2008. DNA-based methods for the identification of commercial fish and seafood species. Compr. Rev. Food Sci. Food Saf. 7: 280–295. Voloch, C. M., Freire, P. R., and Russo, C. A. M. 2005. Molecular phylogeny of penaeid shrimps inferred from two mitochondrial markers. Genet. Mol. Res. 4: 668–674. Yu, C. J., Lin,Y. F., Chiang, B. L., and Chow, L. P. 2003. Proteomics and immunological analysis of a novel shrimp allergen, Pen m 2. J. Immunol. 170(1): 445–453.

124

CAPÍTULO 3 HUELLA PEPTÍDICA DE ARGININA QUINASA, ENFOQUE PROTEÓMICO PARA LA IDENTIFICACIÓN Y ANÁLISIS TAXONÓMICO DE ESPECIES DE LANGOSTINOS DE INTERÉS COMERCIAL

Capítulo 3: Huella peptídica de arginina quinasa. Enfoque proteómico para la identificación y análisis taxonómico de especies de langostinos de interés comercial.

Comentario Una vez demostrado que la comparación de los espectros de huella peptídica de la arginina quinasa nos permite diferenciar entre dos especies de langostinos muy próximas filogenéticamente, en un segundo estudio se comprobó la idoneidad de la aproximación proteómica, combinando 2-DE y PMF, para discriminar entre seis de las principales especies comerciales de langostinos y camarones. Los resultados del análisis de 2-DE mostraron que el spot correspondiente a la proteína arginina quinasa presentaba variaciones inter-específicas en su punto isoeléctrico, lo que concordaba con los estudios previos en los que se había descrito variabilidad en la secuencia de esta proteína entre las especies de Decápodos. Para efectuar la comparación entre los espectros de huella peptídica de las distintas especies, se desarrolló un método matemático que nos proporciona un valor numérico objetivo de la similitud entre los espectros. Además, a partir de estos valores de similitud se elaboró un diagrama de datos en forma de árbol o dendrograma. Los resultados obtenidos demuestran la capacidad de la metodología de huella peptídica de la arginina quinasa para diferenciar entre las seis especies consideradas y su utilidad en la identificación de especies. Además, el dendrograma elaborado a partir de los valores de similitud entre los espectros PMF resultó ser consistente con los árboles filogenéticos construidos con datos de secuencias de ADN de las mismas especies, por lo que este método podría ser utilizado para inferir relaciones filogenéticas.

127

PUBLICACIÓN

129

J. Agric. Food Chem. 2009, 57, 5665–5672

5665

DOI:10.1021/jf900520h

Arginine Kinase Peptide Mass Fingerprinting as a Proteomic Approach for Species Identification and Taxonomic Analysis of Commercially Relevant Shrimp Species IGNACIO ORTEA,*,† BENITO CAN˜AS,‡ PILAR CALO-MATA,§ JORGE BARROS-VELA´ZQUEZ,§ † AND JOSE´ M. GALLARDO † Instituto de Investigaciones Marinas, Consejo Superior de Investigaciones Cientı´ ficas (CSIC), Eduardo Cabello 6, E-36208 Vigo, Spain, ‡Analytical Chemistry Department, Universidad Complutense de Madrid, E-28040 Madrid, Spain, and §Analytical Chemistry, Nutrition and Food Science Department, School of Veterinary Sciences, University of Santiago de Compostela, E-27002 Lugo, Spain

A proteomic approach aimed at species identification and taxonomic analysis of shrimp species of commercial interest is presented. Six different species belonging to the order Decapoda were considered. Preliminary, two-dimensional gel electrophoresis (2-DE) analysis of the sarcoplasmic proteome revealed interspecific variability in the isoelectric point (pI) of arginine kinase. For this reason, arginine kinase spot was selected as a potential molecular marker and subjected to tryptic digestion followed by matrix-assisted laser desorption/ionization time-of-flight (MALDI-TOF) peptide mass fingerprinting (PMF) analysis. Arginine kinase PMF allowed the differentiation of the six species studied. Four samples of commercial origin obtained in local markets were analyzed to validate the methodology. The PMF cluster analysis also provided information about the phylogenetic relationships in these species. The application of this methodology may be of interest for the differentiation and taxonomic analysis of shrimp species complementing DNA-based phylogenetic studies. KEYWORDS: Species identification; shrimp; MALDI-TOF MS; PMF; arginine kinase; proteomics

1.

INTRODUCTION

Crustaceans belonging to the order Decapoda are of notable commercial interest. This order includes the superfamily Penaeoidea, which is the most important economic resource in the world’s crustacean fishery and aquafarming industry (1, 2). Identification of marine species is an issue of capital relevance for the seafood industry because of global commercial requirements concerning labeling and traceability (3, 4), not only for the prevention of commercial fraud but also for the assessment of safety risks derived from the inadvertent introduction of any food ingredient that might be harmful to human health (5). Anatomical characters are particularly difficult to use for shrimp species differentiation because of their phenotypic similarities and because of the fact that in their processing the external carapace is often removed. Therefore, fast and reliable analytical tools are necessary for distinguishing between these closely related species. Methods for species identification are currently based on DNA or protein analysis. Mitochondrial DNA (mtDNA) has been extensively used in PCR-based studies for fish species identification (6). Among the mtDNA targets, the 16S rRNA gene and the cytochrome oxidase I gene have been reported to serve as good interspecific markers in some crustacean species, although most of these studies were focused on population structures, *Corresponding author. Tel: 0034-986-231-930. Fax: 0034-986-292762. E-mail: [email protected]

© 2009 American Chemical Society

phylogeography, and phylogenetic relationships (7-11), and not on species identification. More recently, several PCR-RFLPbased methods for the detection of crustacean (12) and penaeid shrimps (13) DNA have been proposed. Protein-based methodologies have also been used for authentication purposes. Recently, proteomic tools have been applied to the identification of species in seafood products (14, 15), but little effort has been made to elucidate differences among closely related seafood species using mass spectrometry (MS) (16-18), and only electrophoretic and immunological assays have been reported to date for the detection and differentiation of decapod crustaceans (19-21). Proteomics is concerned with identifying and determining the structure, expression, localization, interactions, and cellular roles of proteins. Though great advances have been made in this field in the past decade, there are but only a few papers dealing specifically with taxonomic studies and proteomics (22). Thus, with the emergence of molecular and bioinformatics analyses of whole genomes, selection at the molecular level is measured almost exclusively by analysis of DNA sequence variation. However, proteins are responsible for the phenotype, and selection acts on the structures that proteins build; therefore, analyses based on protein sequences have capital relevance and complement DNAbased methods (23). Matrix-assisted laser desorption/ionization-time-of-flight (MALDI-TOF) is one of the MS systems most extensively applied to proteomic studies. This technology, though limited

Published on Web 06/03/2009

pubs.acs.org/JAFC

131

5666

J. Agric. Food Chem., Vol. 57, No. 13, 2009

Ortea et al.

Table 1. Penaeid Shrimp Populations Considered in This Study scientific namea

commercial name

originb

codec

accession number

MPN-A MPN-B/C MPN-D MPN-E/F PNV-A/B/C PNI-A/B PNI-C/D PNI-E SOP-1/2A SOP-2C LAA-1/2A LAA-2B/D/E LAA-F/G PRA-A/B/C PRA-D

EF589684 EF589682/EF589685 EF589683 FJ744153/FJ744154 EF589702/EF589703/EF589688/EF589689 EF589690/EF589687 EF589686 EF589698/EF589697 EF589696 EF589718/EF589717 EF589716/-/-/EU548069/EU548070/-

Penaeus monodon Penaeus monodon

giant tiger prawn giant tiger prawn

IWP (Commercial) IWP (Malaysia)

Penaeus monodon Litopenaeus vannamei Fenneropenaeus indicus

giant tiger prawn Pacific white shrimp Indian white prawn

WI (Mozambique) EP (Costa Rica) WI (Mozambique)

Farfantepenaeus notialis

Southern pink shrimp

EA (Senegal)

Pleoticus muelleri

Argentine red shrimp

SWA (Argentina)

Pleoticus muelleri Pandalus borealis Pandalus borealis

Argentine red shrimp Northern shrimp Northern shrimp

SWA (Commercial) NA (Greenland) NA (Commercial)

a The taxonomic classification proposed by Pe´rez-Farfante and Kensley (2) was adopted. b Origin abbreviations: IWP, Indo-West Pacific ocean; WI, Western Indian ocean; EP, Eastern Pacific ocean; WCP, Western Central Pacific ocean; EA, Eastern Atlantic ocean; SWA, Southern West Atlantic ocean; NA, Northern Atlantic ocean. c The three initial letters correspond to the FAO codes. Different letters and numbers after the FAO code indicate different individuals.

due to the need for relatively pure samples, is highly advantageous due to its relatively low cost, simplicity, and sensitivity. MALDITOF MS methodologies have been used in the protein profile fingerprint-based studies for species differentiation and phylogenetic relationships of microorganisms belonging to different genera and species (24-26). Moreover, the term phyloproteomics was introduced for the development and application of proteomics methodology to phylogenetic and evolutionary studies (24). The other main application of MALDI-TOF MS is peptide mass fingerprinting (PMF), for the identification of proteins by comparing the obtained spectra with a database (27). One of the advantages over protein profiling is that PMF, because of previous tryptic digestion, allows the identification of both protein and peptides, directly by database searching of the PMF spectra, and may be followed by peptide MS/MS fragmentation if results are conclusive enough. On the contrary, protein profiling does not identify any of the constituent proteins but simply provides their masses. In addition, peptide mass values can be assigned with higher precision because of the peak isotopic resolution possible for the low range (50 are shown. MPN, P. monodon; PNV, L. vannamei; SOP, F. notialis; PNI, F. indicus; LAA, P. muelleri; PRA, P. borealis; as referred to in Table 1.

sulfate-polyacrylamide gel electrophoresis; TFA, trifluoroacetic acid; Tris, tris(hydroxymethyl)aminomethane. ACKNOWLEDGMENT

We thank Lorena Barros for her excellent technical assistance and Dr. Vanesa Dı´ az for her helpful assistance. We also acknowledge members from CETMAR for their helpful collaboration in the collection of specimens for this study. The manuscript benefited from critical comments by three anonymous reviewers. Supporting Information Available: pI of the analyzed spot, calculated from the 2-DE patterns of all the individuals of each species studied; complete peaks lists obtained from arginine kinase PMF of all specimens analyzed in this study; complete information of the MALDI-TOF analysis showing Decapoda arginine kinase matching peptide sequences; and matrix of peaks presence (1 = present; 0 = absent) of all different specimens. This material is available free of charge via the Internet at http://pubs.acs.org. LITERATURE CITED (1) Holthuis, L. B. FAO Species Catalogue: Shrimps and Prawns of the World. An Annotated Catalogue of Species of Interest to Fisheries; FAO Fish. Synop. (125); FAO: Rome, Italy, 1980; Vol. 1, pp 1-271. (2) Pe´ rez-Farfante, I., Kensley, B. Penaeoid and Sergestoid Shrimps and Prawns of the World. Keys and Diagnoses for the Families and  Genera; Editions du Muse´ um National d’Histoire Naturelle: Paris, France, 1997. (3) Council Regulation (EC) No. 104/2000 of the European Parliament of Dec. 17, 1999 on the common organization of the markets in fishery and aquaculture products. (4) Royal Decree 121/2004 of Jan. Twenty-three (BOE No. 31, Feb. 5, 2004) from Ministry of Agriculture, Fisheries and Food, Spain. (5) Civera, T. Species identification and safety of fish products. Vet. Res. Commun. 2003, 27, 481–489.

(6) Rasmussen, R. S.; Morrissey, M. T. DNA-based methods for the identification of commercial fish and seafood species. Compr. Rev. Food Sci. Food Saf. 2008, 7, 280–295. (7) Maggioni, R.; Rogers, A. D.; Maclean, N.; Incao, F. Molecular phylogeny of Western Atlantic Farfantepenaeus and Litopenaeus shrimp based on mitochondrial 16S partial sequences. Mol. Phylogenet. Evol. 2001, 18, 66–73. (8) Baldwin, J. D.; Bass, A. L.; Bowen, B. W.; Clark, W. H. Molecular phylogeny and biogeography of the marine shrimp Penaeus. Mol. Phylogenet. Evol. 1998, 10, 399–407. (9) Quan, J.; Zhuang, Z.; Deng, J.; Dai, J.; Zhang, Y.-p. Phylogenetic relationships of 12 Penaeoidea shrimp species deduced from mitochondrial DNA sequences. Biochem. Genet. 2004, 42, 331–345. (10) Lavery, S.; Chan, T. Y.; Tam, Y. K.; Chu, K. H. Phylogenetic relationships and evolutionary history of the shrimp genus Penaeus s. l. derived from mitochondrial DNA. Mol. Phylogenet. Evol. 2004, 31, 39–49. (11) Voloch, C. M.; Freire, P. R.; Russo, C. A. M. Molecular phylogeny of penaeid shrimps inferred from two mitochondrial markers. Genet. Mol. Res. 2005, 4, 668–674. (12) Brzezinski, J. L. Detection of crustacean DNA and species identification using a PCR-restriction fragment length polymorphism method. J. Food Prot. 2005, 68, 1866–1873. (13) Pascoal, A.; Barros-Vela´zquez, J.; Cepeda, A.; Gallardo, J. M.; Calo-Mata, P. A polymerase chain reaction-restriction fragment length polymorphism method based on the analysis of a 16S rRNA/ tRNAVal mitochondrial region for species identification of commercial penaeid shrimps (Crustacea: Decapoda: Penaeoidea) of food interest. Electrophoresis 2008, 29, 499–509. (14) Pin˜eiro, C.; Barros-Vela´zquez, J.; Va´zquez, J.; Figueras, A.; Gallardo, J. M. Proteomics as a tool for the investigation of seafood and other marine products. J. Proteome Res. 2003, 2, 127–135. (15) Martı´ nez, I.; Friis, T. J. Application of proteome analysis to seafood authentication. Proteomics 2004, 4, 347–354.  (16) Lopez, J. L.; Marina, A.; Alvarez, G.; Va´zquez, J. Application of proteomics for fast identification of species-specific peptides from marine species. Proteomics 2002, 2, 1658–1665.

137

5672

J. Agric. Food Chem., Vol. 57, No. 13, 2009

(17) Carrera, M.; Can˜as, B.; Pin˜eiro, C.; Va´zquez, J.; Gallardo, J. M. Identification of commercial hake and grenadier species by proteomic analysis of the parvalbumin fraction. Proteomics 2006, 6, 5278–5287. (18) Carrera, M.; Can˜as, B.; Pin˜eiro, C.; Va´zquez, J.; Gallardo, J. M. De novo mass spectrometry sequencing and characterization of speciesspecific peptides from nucleoside diphosphate kinase B for the classification of commercial fish species belonging to the family Merlucciidae. J. Proteome Res. 2007, 6, 3070–3080. (19) An, H.; Wei, C. I.; Zhao, J.; Marshall, M. R.; Lee, C. M. Electrophoretic identification of fish species used in surimi products. J. Food Sci. 1989, 54, 253–257. (20) Civera, T.; Parisi, E. The use of sodium dodecyl sulphate polyacrylamide gel electrophoresis for the identification of raw and cooked shrimps and crabs. Ital. J. Food Sci. 1991, 3, 149–157. (21) Shanti, K. N.; Martin, B. M.; Nagpal, S.; Metcalfe, D. D.; Subba Rao, P. V. Identification of tropomyosin as the major shrimp allergen and characterization of its IgE-binding epitopes. J. Immunol. 1993, 151, 5354–5363. (22) Navas, A.; Albar, J. P. Application of proteomics in phylogenetic and evolutionary studies. Proteomics 2004, 4, 299–302. (23) Karr, T. L. Application of proteomics to ecology and population biology. Heredity 2008, 100, 200–206. (24) Conway, G. C.; Smole, S. C.; Sarracino, D. A.; Arbeit, R. D.; Leopold, P. E. Phyloproteomics: species identification of Enterobacteriaceae using matrix-assisted laser desorption/ionization timeof-flight mass spectrometry. J. Mol. Microbiol. Biotechnol. 2001, 3, 103–112. (25) Dickinson, D. N.; La Duc, M. T.; Haskins, W. E.; Gornushkin, I.; Winefordner, J. D.; Powell, D. H.; Venkateswaran, K. Species differentiation of a diverse suite of Bacillus spores by mass spectrometry-based protein profiling. Appl. Environ. Microbiol. 2004, 70, 475–482. (26) Mazzeo, M. F.; Sorrentino, A.; Gaita, M.; Cacace, G.; Di Stasio, M.; Facchiano, A.; Comi, G.; Malorni, A.; Siciliano, R. A. Matrixassisted laser desorption ionization-time of flight mass spectrometry for the discrimination of food-borne microorganisms. Appl. Environ. Microbiol. 2006, 72, 1180–1189. (27) Perkins, D. N.; Pappin, D. J. C.; Creasy, D. M.; Cottrell, J. S. Probability-based protein identification by searching sequence

138

Ortea et al.

(28)

(29)

(30)

(31)

(32) (33)

(34)

(35)

databases using mass spectrometry data. Electrophoresis 1999, 20, 3551–3567. Pin˜eiro, C.; Barros-Velazquez, J.; Sotelo, C. G.; Perez-Martin, R. I.; Gallardo, J. M. Two-dimensional electrophoretic study of the watersoluble protein fraction in white muscle of Gadoid fish species. J. Agric. Food Chem. 1998, 46, 3991–3997. Jensen, O. N.; Wilm, M.; Shevchenko, A.; Mann, M. Sample Preparation Methods for Mass Spectrometric Peptide Mapping Directly from 2-DE Gels. In 2-D Proteome Analysis Protocols; Link, A. J., Ed.; Humana Press: Totowa, NJ, 1999; pp 513-530. Ochiai, A. Zoogeographical studies on the Soleoid fishes found in Japan and its neighbouring regions. Bull. Jpn. Soc. Sci. Fish. 1957, 22, 526–530. Tamura, K.; Dudley, J.; Nei, M.; Kumar, S. MEGA4: molecular evolutionary genetics analysis (MEGA) software version 4.0. Mol. Biol. Evol. 2007, 24, 1596–1599. Saitou, N.; Nei, M. The neighbor-joining method: a new method for reconstructing phylogenetic trees. Mol. Biol. Evol. 1987, 4, 406–425. Efron, B. The Jackknife, the Bootstrap and Other Resampling Plans. CBMS-NSF Regional Conference Series in Applied Mathematics, Monograph 38, SIAM: Philadelphia, PA, 1982. Thompson, J. D.; Higgins, D. G.; Gibson, T. J. CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, positions-specific gap penalties and weight matrix choice. Nucleic Acids Res. 1994, 22, 4673–4680. Yu, C.-J.; Lin, Y.-F.; Chiang, B.-L.; Chow, L.-P. Proteomics and immunological analysis of a novel shrimp allergen, Pen m 2. J. Immunol. 2003, 170, 445–453.

Received February 13, 2009. Revised manuscript received May 12, 2009. Accepted May 15, 2009. This work was supported by the National Food Program of the INIA (Spanish Ministry for Education and Science) (Project CAL-03-030-C2-2) and by the PGIDIT Research Program in Marine Resources (Project PGIDIT04RMA261004PR) of the Xunta de Galicia (Galician Council for Industry, Commerce and Innovation). I.O. is supported by the FPU program (AP-2004-5826) and B.C. is supported by the RyC program, under the auspices of the Spanish MICINN.

1 SUPPORTING INFORMATION:

RESULTS AND DISCUSSION

2-DE

Table S-1. Mean pI of the analyzed spot, calculated from the 2-DE patterns of all individuals analysed of each species. species Penaeus monodon Litopenaeus vannamei Fenneropenaeus indicus Farfantepenaeus notialis Pleoticus muelleri Pandalus borealis

pI ± RSD 4.99 ± 0.6 4.98 ± 0.8 5.18 ± 0.3 5.22 ± 0.6 5.25 ± 1.1 4.68 ± 1.6

139

2 MALDI-TOF MS analysis Table S-2. Complete peak lists obtained from arginine kinase PMF of 28 specimens. MPN C

MPN D

MPN E

MPN F

PNV A

PNV C

PNI A

PNI B

PNI E

PNI C

920.53

977.56

1008.50

1008.50

1008.49

1008.50

1008.48

948.50

1008.49

1008.50

1008.50

1050.47

1008.50

977.56

1008.50

1050.52

1050.51

1050.51

1050.51

1050.50

958.52

1050.51

1050.52

1050.52

1133.58

1050.52

1008.50

1050.52

1077.59

1077.59

1077.58

1077.57

1147.59

1003.50

1147.61

1147.61

1147.63

1476.66

1259.69

1050.521

1070.43

1147.62

1147.61

1147.60

1147.60

1149.59

1008.50

1149.61

1259.70

1259.69

1503.80

1503.81

1077.58

1077.57

1149.60

1205.69

1149.63

1164.59

1164.59

1050.51

1164.59

1503.81

1503.80

1518.83

1507.70

1147.62

1147.60

1164.59

1259.70

1259.69

1205.67

1259.69

1147.61

1259.70

1507.71

1507.69

1603.82

1518.82

1149.63

1164.59

1259.69

1296.69

1503.80

1259.69

1369.75

1149.58

1296.64

1518.84

1518.81

1604.81

1525.77

1205.69

1205.67

1438.74

1415.81

1507.70

1415.79

1415.79

1164.59

1366.69

1525.83

1558.82

1651.83

1603.82

1259.70

1259.71

1503.82

1503.81

1518.82

1503.80

1438.76

1259.67

1369.76

1603.83

1603.82

1657.83

1604.81

1296.64

1415.79

1507.72

1507.73

1525.78

1507.70

1507.70

1415.74

1409.72

1604.82

1604.81

1683.83

1651.84

1399.77

1438.77

1518.81

1518.84

1604.80

1518.82

1513.84

1438.72

1415.79

1619.81

1606.82

1775.97

1657.83

1415.80

1503.79

1525.76

1525.79

1631.88

1603.82

1531.82

1507.69

1438.76

1622.89

1619.81

1791.58

1775.98

1476.68

1507.73

1603.81

1604.82

1651.84

1604.81

1553.81

1531.83

1476.67

1651.83

1622.85

1796.94

1796.94

1503.81

1518.83

1604.81

1631.90

1657.84

1631.89

1604.81

1553.75

1507.70

1657.83

1651.84

1807.92

1807.91

1518.83

1525.79

1631.90

1651.86

1683.79

1651.84

1651.84

1558.88

1513.83

1667.78

1657.83

1810.91

2015.94

1527.85

1527.84

1651.84

1657.85

1775.98

1657.84

1657.84

1603.77

1518.83

1683.77

1667.79

2033.95

2033.94

1541.77

1604.80

1657.83

1683.79

1796.93

1667.80

1667.83

1604.80

1531.83

1775.99

1683.78

2107.06

2599.24

1603.84

1631.88

1776.01

1775.98

1807.91

1683.80

1683.82

1606.83

1576.79

1796.92

1775.99

2284.92

2619.93

1604.81

1651.84

1796.93

1796.92

1810.93

1775.97

1761.95

1622.85

1603.83

1810.91

1796.94

2301.27

2636.26

1631.89

1657.84

1807.90

1875.87

2015.94

1796.93

1791.86

1651.83

1604.81

1839.86

2015.94

2346.15

1651.84

1775.98

1875.88

2015.95

2031.97

1807.92

1796.93

1657.83

1622.78

1875.89

2033.93

2426.18

1657.84

1796.92

2015.97

2031.97

2033.94

1810.94

1807.93

1683.84

1651.84

2015.95

2599.20

2520.30

1689.82

2015.96

2033.99

2033.94

2190.01

1839.88

1823.89

1761.96

1657.84

2033.96

2619.99

2599.28

1775.97

2031.98

2190.10

2093.04

2284.97

1875.87

1839.89

1796.95

1667.82

2599.21

2636.29

2620.00

1796.92

2033.95

2301.33

2190.00

2301.24

2015.95

1875.87

1807.91

1683.81

2619.97

2636.29

1807.91

2190.00

2599.54

2301.22

2346.11

2031.97

2015.94

2015.99

1761.95

2636.19

2770.01

1875.87

2285.02

2346.08

2472.15

2033.95

2031.98

2033.99

1778.88

2031.98

2301.24

2599.19

2520.26

2190.02

2033.95

2190.15

1796.93

2033.95

2346.07

2636.17

2190.03

2599.23

MPN A

MPN B

PNV B

2599.30

2301.24

2135.10

2270.98

1807.92

2619.95

2346.11

2190.03

2287.38

1823.91

2301.24

2623.14

2472.17

2247.08

2599.56

1839.89

2346.12

2636.28

2520.26

2270.97

2636.53

1875.87

2599.22

2701.25

2548.24

2287.23

2015.94

2631.24

2599.26

2329.82

2031.97

3420.59

2619.00

2346.12

2033.95

2623.11

2431.13

2112.00

2636.26

2548.28

2114.02

2701.22

2599.24

2190.03

2620.04

2270.92

2636.25

2287.23

2786.38

2329.85 2346.12 2431.12 2548.33 2559.19 2599.24 2619.96 2636.27

140

2786.42

3 Table S-2 (Continued). PNI D

SOP 1

SOP 2A

SOP 2C

LAA 2A

LAA 2B

PRA A

PARA B

1008.50

1008.50

1008.50

1008.50

946.25

977.54

1050.53

994.48

948.49

994.48

994.48

1196.49

1141.53

1050.52

1050.53

1050.51

1014.62

994.49

994.48

1263.67

1050.51

959.51

1050.51

1050.50

1228.47

1158.56

1133.59

1147.61

1147.60

1050.52

1050.53

1050.53

1424.75

1133.62

994.48

1263.70

1263.62

1634.74

1194.56

1503.80

1259.72

1164.60

1133.66

1133.64

1133.61

1476.66

1263.69

1050.52

1286.72

1286.70

1638.74

1196.58

1518.83

1415.80

1259.69

1147.60

1147.61

1147.58

1503.77

1286.70

1147.62

1503.80

1442.76

1650.74

1634.82

1603.85

1476.81

1415.79

1164.60

1263.70

1150.56

1532.85

1424.74

1150.58

1532.85

1503.74

1666.73

1666.81

1604.81

1503.81

1503.79

1169.60

1286.71

1263.66

1560.82

1442.81

1263.69

1604.82

1532.84

1690.81

1690.88

1606.84

1507.74

1507.70

1259.70

1357.60

1286.70

1603.85

1503.80

1286.70

1622.92

1604.80

1757.78

1757.85

1651.85

1603.82

1603.83

1415.79

1366.69

1366.68

1604.81

1507.71

1424.76

1651.84

1623.14

1758.79

1766.91

1657.83

1604.81

1604.81

1471.82

1442.80

1424.74

1651.83

1525.79

1442.80

1667.82

1683.76

1766.85

1775.87

1775.98

1631.90

1622.83

1476.80

1476.67

1442.78

1667.79

1532.84

1503.80

1683.81

1718.78

1775.81

1812.83

1796.96

1651.83

1631.89

1503.79

1503.80

1503.77

1683.78

1541.85

1507.72

1718.80

1789.99

1812.76

1828.81

1807.90

1657.83

1651.84

1507.71

1532.83

1507.71

1718.79

1603.82

1525.79

1789.99

1796.92

1828.76

2080.85

1810.92

1667.81

1657.83

1525.78

1541.78

1525.80

1789.97

1604.81

1532.84

1796.94

1875.89

1844.76

2126.04

2015.95

1673.86

1667.80

1603.83

1560.87

1532.84

1796.92

1622.80

1541.83

1857.88

2015.95

2080.94

2142.02

2033.93

1683.81

1683.79

1604.81

1603.81

1541.85

1807.90

1631.89

1604.81

1875.87

2033.95

2126.01

2350.26

2426.12

1719.93

1719.93

1606.81

1604.80

1603.83

1823.87

1651.83

1622.79

2033.94

2190.07

2142.00

2531.28

2599.24

1796.93

1778.93

1631.88

1606.81

1604.80

1839.85

1667.83

1651.82

2426.15

2636.36

2350.26

2636.25

1807.92

1796.94

1651.83

1631.89

1651.82

1841.86

1683.82

1683.79

2636.25

2644.29

2563.28

1810.95

1807.92

1657.83

1651.82

1683.78

2015.91

1718.79

1718.78

2644.17

1839.89

1810.93

1667.80

1667.81

1718.80

2031.97

1789.98

1778.85

1875.88

1823.89

1683.81

1683.81

1790.01

2033.95

1796.93

1790.01

2015.95

1839.88

1719.94

1718.79

1796.96

2064.02

1807.92

1796.93

2031.98

1875.87

1741.87

1789.98

1839.86

2107.05

1839.91

1839.85

2033.95

2015.96

1796.94

1796.92

2015.94

2135.06

1841.90

2015.94

2190.03

2031.98

1807.91

1807.90

2031.99

2190.02

1875.87

2031.98

2346.11

2033.95

1810.94

1841.88

2033.95

2238.07

2015.94

2033.95

2442.16

2190.03

1875.87

1875.88

2315.28

2315.25

2031.98

2620.04

2520.26

2346.12

2015.95

2015.94

2346.07

2346.10

2033.95

2644.31

2548.23

2442.14

2031.98

2031.99

2644.24

2426.13

2135.08

2564.23

2520.23

2033.95

2033.95

2520.23

2190.04

2599.23

2548.19

2055.87

2107.05

2620.06

2298.96

2636.26

2599.25

2190.02

2135.06

2623.08

2315.28

2655.08

2620.00

2346.11

2190.02

2636.25

2329.78

2670.19

2636.24

2520.26

2298.93

2640.15

2346.15

2640.15

2599.25

2315.29

2644.16

2520.28

2687.17

2619.97

2329.79

2671.13

2619.99

2636.26

2346.13

2772.29

2636.37

2687.21

LAA 1

LAA D

2426.13

2644.24

2520.26

2756.09

2619.99

2772.40

LAA E

LAA F

LAA G

2623.19 2636.34

.

2644.20 2772.36

141

4 Table S-2 (Continued). PRA C

PRA D

1141.59

1141.69

1196.64

1158.71

1634.85

1194.71

1638.84

1196.73

1666.84

1382.87

1690.90

1634.88

1757.88

1690.94

1758.87

1757.91

1766.94

1766.96

1775.89

1775.91

1812.84

1812.86

1828.82

1828.86

1966.89

1966.90

1987.89

2126.05

2080.93

2350.24

2126.03

2531.23

2142.02

2616.22

2350.24 2563.22

142

5 Table S-3. Complete information of the MALDI-TOF analysis showing Decapoda arginine kinase matching peptide sequences. O. massa 946.504 958.519 977.546 994.485 1008.500 1014.617 1050.519 1077.593 1147.603 1150.559 1164.595 1169.601 1205.678 1259.689 1296.641 1366.698 1369.761 1399.769 1415.791 1471.821 1476.804 1503.799 1507.739 1513.860 1518.810 1525.800 1527.838 1541.848 1604.823 1619.806 1622.849 1631.894 1651.856 1657.835 1667.813 1673.858 1683.814 1689.806 1718.803 1719.932 1741.868 1761.963 1775.983 1778.857 1790.006 1796.962 1807.915 1810.943 1823.914 1839.911 1841.905 1857.878 1875.886 2015.962 2031.982 2033.964 2055.871 2064.041 2190.100 2238.068 2271.049 2426.123 2431.137 2442.125 2472.204 2548.257 2559.187 2564.260 2599.230 2619.935 2623.136 2631.238 2636.249 2640.150 2644.243 2655.076 2670.193 2671.130

Mr exp.a 945.497 957.511 976.539 993.478 1007.492 1013.610 1049.512 1076.586 1146.596 1149.552 1163.588 1168.594 1204.671 1258.681 1295.633 1365.691 1368.754 1398.762 1414.784 1470.813 1475.796 1502.792 1506.732 1512.853 1517.803 1524.792 1526.831 1540.841 1603.816 1618.799 1621.842 1630.887 1650.848 1656.828 1666.805 1672.850 1682.806 1688.799 1717.795 1718.924 1740.861 1760.956 1774.976 1777.850 1788.999 1795.954 1806.908 1809.936 1822.907 1838.904 1840.898 1856.871 1874.879 2014.955 2030.975 2032.957 2054.864 2063.034 2189.093 2237.060 2270.041 2425.115 2430.129 2441.117 2471.197 2547.250 2558.180 2563.252 2598.223 2618.928 2622.129 2630.231 2635.242 2639.142 2643.236 2654.069 2669.186 2670.123

Mr calc.a 945.464 957.503 976.582 993.478 1007.494 1013.600 1049.508 1076.587 1146.607 1149.568 1163.595 1168.589 1204.681 1258.688 1295.583 1365.730 1368.765 1398.794 1414.789 1470.733 1475.802 1502.798 1506.700 1512.826 1517.820 1524.780 1526.842 1540.797 1603.799 1618.857 1621.850 1630.893 1650.822 1656.826 1666.817 1672.804 1682.812 1688.799 1717.788 1718.775 1740.757 1760.890 1774.958 1777.928 1788.862 1795.929 1806.923 1809.873 1822.918 1838.913 1840.977 1856.972 1874.876 2014.842 2030.977 2032.945 2054.927 2063.053 2189.046 2237.055 2270.153 2425.255 2430.215 2441.186 2471.197 2547.278 2558.294 2563.273 2598.261 2619.094 2622.144 2630.133 2635.296 2639.123 2643.164 2654.134 2669.145 2670.129

ppmb 34 9 -44 0 -2 10 4 -1 -10 -14 -6 4 -9 -5 39 -29 -8 -23 -4 55 -4 -4 21 18 -11 8 -7 28 10 -36 -5 -4 16 1 -7 28 -3 0 4 87 60 38 10 -44 77 14 -8 35 -6 -5 -43 -55 2 56 -1 6 -31 -9 21 3 -49 -58 -35 -28 0 -11 -45 -8 -15 -63 -6 37 -21 7 27 -24 16 -2

Peptide QTDKHPAK GIFHNDKK FVISTRVR VPFSHHDR IPFSHHDR ASVHIKLPK FLQAANACR AVFDQLKEK LIDDHFLFK YLSKDIFDK RIPFSHHDR LIDDHFLFK AVFDQLKEKK LTSAVNEIEKR GQYYPLTGMTK YVISTRVRCGR YLSKDIFDKLK RLVSAVNDIEKR RLTSAVNEIEKR ADAATIAKLDEGFK LEAATDCKSLLKK ADAAVIEKLEAGFK EGDRFLQAANACR LAANRDKLEEVAGK LEEVAGKYNLQVR ADAAVIEKLEAGFK LAANREKLEEVAGK LEEVAGRYSLQVR LIDDHFLFKEGDR ADAATIAKLDEGFKK LQAGFKKLEAATDCK ADAAVIEKLEAGFKK IISMQMGGDLGQVFR TFLVWVNEEDHLR IISMQMGGDLGQVFR IISMQMGGDLGQVFR IISMQMGGDLGQVFR IISMQMGGDLGQVFR TFLVWCNEEDHLR GEHTEAEGGIYDISNK GEHTEAEGGIYDISNK LGFLTFCPTNLGTTVR EKLEEVAGKYNLQVR MADAAVIEKLEAGFKK KTFLVWCNEEDHLR LGFLTFCPTNLGTTVR IISMQMGGDLGQVFRR FLQAANACRYWPTGR IISMQMGGDLGQVFRR IISMQMGGDLGQVFRR LEEVAAKYSLQVRGTR LEEVASKYSLQVRGTR GEHTEAEGGIYDISNKR SMEGYPFNPCLTEAQYK GEHTEAEGGIYDISNKRR GTRGEHTEAEGGIYDISNK GTRGEHTEAEGGIYDISNK EMQDGILELIKIEKEMI GTRGEHTEAEGGIYDISNKR EGDRFLQAANACRYWPAGR LTSAVNEIEKRIPFSHHDR LGFLTFCPTNLGTTARASVHIK MGLTEFQAVKEMQDGILELIK DFGDVNSFVNVDPEGKFVISTR DFGDVNTFVNVDPEGKYVISTR VSSTLSSLEGELKGTYYPLTGMSK VSSTLSGLEGELKGQYYPLTGMTK VSSTLSSLEGELKGTYYPLTGMSK GIYHNDNKTFLVWVNEEDHLR SMEGYPFNPCLTEAQYKEMEAK SMEGYPFNPCLTEAQYKEMEAK VRCGRSMEGYPFNPCLTEDQYK LIDDHFLFKEGDRFLQAANACR SMEGYPFNPCLTEAQYKEMEEK VRCGRSMEGYPFNPCLTEAQYK SMEGYPFNPCLTEAQYKEMEAK SMQGYPFNPCLTESQYKEMEAK SMEGYPFNPCLTEAQYKEMESK

Protein gi|585342 gi|171473157 gi|115492980 gi|25453073 gi|27463265 gi|27463265 gi|27463265 gi|27463265 gi|27463265 gi|1708615 gi|27463265 gi|27463265 gi|27463265 gi|27463265 gi|171473139 gi|27463265 gi|1708615 gi|585342 gi|27463265 gi|25453073 gi|27463265 gi|27463265 gi|27463265 gi|1708615 gi|27463265 gi|27463265 gi|27463265 gi|25453073 gi|27463265 gi|25453073 gi|1708615 gi|27463265 gi|27463265 gi|27463265 gi|27463265 gi|27463265 gi|27463265 gi|27463265 gi|25453073 gi|27463265 gi|27463265 gi|115492980 gi|27463265 gi|27463265 gi|171473157 gi|115492980 gi|27463265 gi|171473143 gi|27463265 gi|27463265 gi|171473157 gi|171473139 gi|27463265 gi|27463265 gi|27463265 gi|27463265 gi|27463265 gi|169260101 gi|27463265 gi|27463265 gi|27463265 gi|27463265 gi|27463265 gi|115492980 gi|27463265 gi|27463265 gi|171473139 gi|27463265 gi|27463265 gi|27463265 gi|27463265 gi|56182374 gi|27463265 gi|585342 gi|27463265 gi|27463265 gi|169260101 gi|25453073

Position 95-102 81-88 119-126 257-264 257-264 281-289 194-202 34-42 181-189 29-37 256-264 181-189 34-43 246-256 37-47 119-129 29-39 245-256 245-256 2-15 17-29 2-15 190-202 289-302 297-309 2-15 290-303 297-309 181-193 2-16 9-23 2-16 230-244 217-229 230-244 230-244 230-244 230-244 217-229 313-328 313-328 265-280 295-309 1-16 88-101 265-280 230-245 66-80 230-245 230-245 169-184 169-184 313-329 130-146 313-330 310-328 310-328 341-357 310-329 190-208 246-264 265-286 331-351 103-124 103-124 152-175 24-47 152-175 209-229 130-151 130-151 125-146 181-202 130-151 125-146 130-151 130-151 130-151

Modification Na

Na CysCAM

Na Na

Na; MSO CysCAM

Na CysCAM ACET CysCAM

ACET; Na Na ACET ACET

MSO Na 2 MSO Na; MSO CysCAM Na Na ACET; MSO CysCAM CysCAM MSO 2 MSO Na Na Na; MSO

Na 2 MSO CysCAM Na CysCAM; Na Na; MSO

MSO Na; 2 MSO CysCAM Na; MSO CysCAM MSO CysCAM; Na; MSO CysCAM; 2 MSO CysCAM; 2 MSO CysCAM; 2 MSO

143

6 2687.269 2701.352 2770.178 2772.403

2686.262 2700.345 2769.171 2771.395

2686.259 2700.359 2769.208 2771.397

1 -5 -13 0

FLQAANACRYWPAGRGIYHNDNK IPFSHHDRLGFLTFCPTNLGTTAR RSMEGYPFNPCLTEAQYKEMESK VPFSHHDRLGFLTFCPTNLGTTVR

gi|27463265 gi|27463265 gi|171473143 gi|25453073

194-216 257-280 1-23 257-280

Na 2 MSO CysCAM

O.mass (observed mass, MH+), Mr exp. (neutral observed mass) and Mr calc. (neutral calculated mass); a: peaks represent monoisotopic mass in Da. b: Mr exp-Mr calc in Da. Na: adduct sodium; MSO: methionine sulphoxide; ACET: acetyl N-terminal; CysCAM: carboxamidomethylated cysteine.

Table S-4. Matrix of peaks presence (1 = Present; 0 = Absent) of all different specimens 1

2

3

4

0

0

0

0

PRA A

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

PRA B

0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

PRA C

0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

PRA D

0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

MPN A 0 0 0 0 0 1 0 0 1 0 1 1 1 0 0 1 0 0 0 1 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 1 1 0 1 1 1 0 0 MPN B 0 0 0 0 0 0 0 0 1 0 1 0 1 0 0 1 0 0 0 0 0 0 0 1 0 1 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 1 1 0 1 1 0 0 0 MPN C 0 0 0 0 0 0 0 0 1 0 1 0 1 0 0 1 1 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 1 1 0 0 0 MPN D 0 0 0 0 0 0 0 0 1 0 1 0 1 0 0 1 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0

MPN E 0 0 0 0 0 0 0 0 1 0 1 0 1 0 0 1 0 0 0 1 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 1 0 1 0 0 0 0 MPN F

1 0 0 0 0 1 0 0 1 0 1 0 1 0 0 1 1 0 0 0 0 0 0 1 0 1 0 0 1 0 0 0 0 1 0 1 0 0 0 0 1 1 0 0 1 0 1 0 0

PNV A

0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 1 1 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1 0 1 0 0 0 0 1 1 0 0 0 1 0

PNV B

0 0 1 1 0 0 0 1 1 0 1 0 0 0 0 1 1 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 1 0 0 0 0 1 0

PNV C

0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 1 1 0 0 1 0 0 0 0 0 1 0 0 1 0 1 1 0 0 1 1 0 1 0 0 1 0 1 1 1 0 0 1 0

PNI A

0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 1 0 0 0 0

PNI B

0 0 0 0 0 0 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0

PNI C

0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0

PNI D

0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0

PNI E

0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0

SOP A

0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 1 1 0 0 0 0 0 0

SOP B

0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 1 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 0 0

SOP C

0 0 0 0 0 0 0 0 1 1 1 0 0 1 0 1 0 0 0 1 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 1 1 0 0 1 0 0 0

LAA A

0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 1

LAA B

0 0 0 0 0 1 1 0 0 0 1 0 0 1 0 1 0 1 0 0 0 0 0 0 0 0 1 1 0 0 1 0 0 0 0 0 1 0 1 0 0 1 1 0 0 1 0 0 1

LAA C

0 1 0 0 0 0 1 0 0 0 1 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 1 0 1 1 0 0 0 0 0 0 1

LAA D

0 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 1 0 1 0 0 1 1 0 0 1 0 0 1

LAA E

0 0 1 0 1 0 1 0 0 0 1 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 1 0 1 0 0 1 1 0 0 1 0 0 1

LAA F

0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1

LAA G

0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 1

144

7 Table S-4 (Continued).

PRA A

5

6

7

8

9

0

0

0

0

0

0 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 1 0 0 0 0 1 0 0 0 1 1 0 1 1 0 0 0 0 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0

PRA B

0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 1 1 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0

PRA C

0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 1 0 0 0 0 1 0 0 0 1 1 0 1 1 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 1 0 0 0

PRA D

0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 1 1 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 0 0 0

MPN A 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 MPN B 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1 1 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 1 1 1 MPN C 0 0 0 0 0 1 1 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 0 0 1 0 1 MPN D 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1 1 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 1 1 1 MPN E 0 0 0 0 0 1 1 0 0 0 1 0 0 0 1 1 0 1 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 1 0 0 0 1 0 0 0 1 0 0 1 1 1 MPN F

1 0 0 0 0 1 1 0 0 0 1 0 0 0 1 1 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 0 0 0 1 1

PNV A

0 1 0 0 0 0 1 0 0 0 0 0 0 0 1 1 0 1 0 1 0 0 0 0 0 0 0 1 0 0 0 0 1 1 1 0 0 1 0 1 0 0 0 1 0 0 1 1 1

PNV B

0 1 1 0 0 1 1 1 0 1 0 0 0 0 1 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 0 1

PNV C

0 0 0 0 1 1 1 0 0 1 0 0 0 0 1 1 0 1 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 1 1 0 0 1 0 1 0 0 0 1 0 0 1 1 1

PNI A

0 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1

PNI B

0 0 0 0 0 1 1 1 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 1 0 1

PNI C

0 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 0 1

PNI D

0 0 1 0 0 1 1 1 1 1 0 0 0 0 1 1 0 1 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1

PNI E

0 0 0 0 0 1 1 0 1 1 0 0 0 0 1 1 0 1 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 1 0 0 0 1 0 0 0 1 0 0 1 0 1

SOP A

0 0 0 0 0 1 1 0 0 0 1 0 0 0 1 1 0 1 1 1 0 0 0 1 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 1 0 0 0 1 0 0 1 1 1

SOP B

0 0 0 0 0 1 1 0 0 1 1 0 0 0 1 1 0 1 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0 1 1 1 0 1 0 1 0 0 0 1 0 0 1 1 1

SOP C

0 0 0 0 0 1 1 1 0 0 1 0 0 0 1 1 0 1 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 1 0 0 1 1 1

LAA A

0 0 0 1 0 1 1 0 0 0 0 0 0 0 1 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 1 1 0 0 1 0 1 1 0 0 0 0 0 1 1 1

LAA B

1 0 0 0 0 1 1 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 0 0 0 0 0 1 1 1

LAA C

1 0 0 1 0 1 1 1 0 0 1 0 0 0 1 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 1 1 0 0 0 0 0 1 0 0 1 0 0 1 1 1

LAA D

1 0 0 0 0 1 1 0 0 1 1 0 0 0 1 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 1 1 0 0 0 0 1 1 0 0 1 0 0 1 1 1

LAA E

1 0 0 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 1 0 0 0 0 0 0 1 1 1

LAA F

0 0 0 0 0 0 1 0 0 1 0 0 0 0 1 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 1

LAA G

0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 1 0 0 1 0 1

145

8 Table S-4 (Continued).

PRA A

1

1

1

1

1

0

1

2

3

4

0

0

0

0

0

0 0 1 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

PRA B

0 0 1 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

PRA C

0 0 1 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

PRA D

0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

MPN A 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 MPN B 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 MPN C 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 MPN D 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 1 0 0 0 0 1 1 0 0 0 0 0 1 0 1 1 0 1 0 0 0 0 0 0 1 0 0 0 0 MPN E 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 1 0 0 0 0 1 1 0 1 0 0 0 1 0 1 1 0 1 0 0 0 0 0 0 1 0 0 0 0 MPN F

0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0

PNV A

0 0 0 0 0 0 0 0 1 0 1 0 1 1 0 1 0 0 0 1 1 0 0 1 0 0 0 0 1 0 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 1

PNV B

0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0

PNV C

0 0 0 0 0 1 1 0 0 0 1 0 0 1 0 1 0 0 0 1 1 0 0 1 0 0 0 0 1 1 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0

PNI A

0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 1 0 0 0 1 0 0 0 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 1

PNI B

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0

PNI C

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0

PNI D

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0

PNI E

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0

SOP A

0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 1 0 1 0 0 1 1 0 0 0 0 1 0 0 1 1 0 1 0 0 0 0 0

SOP B

0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 1 0 1 0 0 0 1 0 1 0 0 1 1 0 0 0 0 1 0 0 0 0 0

SOP C

1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0

LAA A

0 1 0 0 1 0 0 0 1 0 1 1 0 0 0 0 0 0 1 0 1 0 1 0 0 0 1 0 0 0 0 0 0 0 1 1 0 1 1 1 0 0 1 0 0 0 0 1 0

LAA B

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0

LAA C

0 0 0 0 1 0 0 0 1 0 1 0 0 0 0 0 1 0 1 1 1 0 1 0 0 0 1 0 0 0 0 0 0 0 1 1 0 1 0 1 0 0 0 0 0 0 0 1 0

LAA D

0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 1 1 1 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 1 0 0 0 0 0 1 0 1 0

LAA E

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0

LAA F

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0

LAA G

0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0

146

CAPÍTULO 4 CARACTERIZACIÓN POR ESPECTROMETRÍA DE MASAS DE PÉPTIDOS DE ARGININA QUINASA ESPECÍFICOS PARA ESPECIES DE LANGOSTINOS COMERCIALES

Capítulo 4: Caracterización por espectrometría de masas de péptidos de arginina quinasa específicos para especies de langostinos comerciales.

Comentario

Tras demostrarse la posibilidad de diferenciar las especies de langostinos estudiadas utilizando la huella peptídica de la arginina quinasa, el siguiente paso consistió en identificar y caracterizar los péptidos diferenciadores.

Este trabajo consistió en una aproximación proteómica combinando 2-DE, digestión tríptica en gel, MALDI-TOF MS y análisis ESI-MS/MS (Figura 21) a partir de los extractos proteicos sarcoplásmicos de siete especies de langostinos de interés comercial. En una primera etapa se realizó un estudio exhaustivo de los mapas peptídicos de la arginina quinasa, estableciendo los picos diferenciales.

Figura 21. Etapas consideradas y herramientas proteómicas utilizadas para la identificación y caracterización de péptidos específicos en langostinos.

149

Capítulo 4: Caracterización por espectrometría de masas de péptidos (…)

En una segunda etapa, se obtuvieron los espectros de fragmentación del mayor número posible de péptidos de la arginina quinasa, mediante ESI-IT-MS, con objeto de caracterizar sus secuencias, prestando especial atención a aquellos péptidos especie-específicos o diferenciales que pudieran ser utilizados para autentificación de especies. Al disponer de pocas secuencias en las bases de datos genómicas y proteómicas de los miembros del orden Decapoda, fue necesario recurrir a la secuenciación de novo de muchos de los espectros.

Los resultados obtenidos demuestran que, aunque se encontró un alto grado de homología entre las secuencias de arginina quinasa, las diferencias descritas nos permiten la inequívoca diferenciación de estas especies.

150

PUBLICACIÓN

151

Journal of Proteome Research

                       

     

R UQDO! -      DQ VFUW"! U#$$%$$&&' DQ VFUW(H! UWFOH "DWH )PWWH)WKH #' O#$$%  WKRU! RPOHWH*VWRI WKRUV! +UWHD,QDFR-....,QVWW WRHQHVWDFRQHVDUQDV DQDV,/HQWR-RPO WHQVH0QHUVWRIDU,QDOWFDO KHPVWU 1DOODUR,RVH-....,QVWW WRHQHVWDFRQHVDUQDV- ....,QVWW WRHQHVWDFRQHVDUQDV

ACS Paragon Plus Environment

153

Journal of Proteome Research

Mass Spectrometry Characterization of SpeciesSpecific Peptides from Arginine Kinase for the Identification of Commercially Relevant Shrimp Species Ignacio Ortea1*, Benito Cañas2, and José M. Gallardo1 AUTHORS ADDRESS 1

Instituto de Investigaciones Marinas, Consejo Superior de Investigaciones Científicas

(CSIC), Eduardo Cabello 6, E-36208 Vigo, Spain. 2

Analytical Chemistry Department, Universidad Complutense de Madrid. E-28040

Madrid, Spain.

TITLE RUNNING HEAD. Shrimp species identification by MS/MS.

* CORRESPONDING AUTHOR (telephone: 0034-986-231-930); fax: 0034-986-292762; e-mail: [email protected]).

ACS Paragon Plus Environment

154

Journal of Proteome Research

ABSTRACT

The identification of commercial shrimp species is a relevant issue to ensure correct labelling, maintain consumer confidence and enhance the knowledge of the captured species, benefiting both, fisheries and manufacturers. A proteomic approach, based on 2DE, tryptic in-gel digestion, MALDI-TOF MS, and ESI-MS/MS analyses, is proposed for the identification of shrimp species with commercial interest. MALDI-TOF peptide mass fingerprint from arginine kinase tryptic digests were used for the identification of seven commercial, closely related species of Decapoda shrimps. Further identification and characterization of these peptides was performed by CID on an ESI-IT instrument, database search and de novo sequence interpretation, paying special attention to differential, species-specific, peptides. Fisheries and manufacturers may take advantage of this methodology as a tool for a rapid and effective seafood product identification and authentication, providing and guaranteeing the quality and safety of the foodstuffs to consumers.

KEYWORDS. Arginine kinase, MS/MS, proteomics, shrimps, species identification.

ACS Paragon Plus Environment

155

Journal of Proteome Research

Introduction Sea food products include an extense variety of species widely used for human nutrition, having a significant impact in food industry. Among them, crustaceans belonging to the order of Decapoda are of remarkable commercial interest. This order includes the Superfamily Penaeoidea, which is one of the most important economic resources in fishery and aquafarming industry.1,2 The identification of marine species is of primary relevance for the seafood industry, due to the global commercial demands concerning labelling and traceability3,4 for the prevention of commercial fraud, and to avoid the safety risks derived from the inadvertent introduction of food ingredients which might be harmful for human health.5 Anatomical characters are particularly difficult to be used in penaeid shrimp species differentiation due to their phenotypic similarities and to removal of the external carapace, which is very frequent during the manufacturing process. Therefore, it is highly recommendable to develop the analytical tools necessary to make possible the distinction between these closely related species, preventing the inadvertent or deliberate mislabelling and adulteration of these products. Methods for species identification are currently based on DNA or protein analysis. Among the DNA targets, the mitochondrial genes 16S rRNA and cytochrome oxidase I have been used as interspecific markers for several crustacean species, although most of the studies focused on phylogeography and phylogenetic relationships,6-10 but not on species identification. More recently, two PCR-RFLP-based methods for the detection of crustacean

11

and penaeid shrimps

12

DNA have been proposed. Protein-based

methodologies have also been used with authentication purposes. Proteomics tools have been applied to the identification of species in seafood products, 13, 14 but little effort has been made to elucidate differences among closely related species using mass spectrometry (MS).15-17 Some electrophoretic and immunological assays have been

ACS Paragon Plus Environment

156

Journal of Proteome Research

reported for the detection and differentiation of decapod crustaceans, 18-20 but only one MS-based method has been used for the authentication of shrimp species.21 Arginine kinase (EC 2.7.3.3) is a monomeric phosphagen-ATP phosphotransferase, widely distributed in invertebrates22 and functionally analogous to the, more thoroughly studied, creatine kinase from vertebrates.23 Arginine kinase (AK) catalyzes the reversible phosphorylation of arginine using ATP: Mg ATP + L-arginine  MgADP + L-arginine phosphate + H+ A comparison of AK amino acid content in two types of shrimp, Penaeus aztecus and Penaeus japonicus, revealed that, although nearly identical, some slight differences appeared, even in these closely-related species.24 Inter-specific variability was also reported for the AK derived from four Decapoda species.25 In a previous work, AK proteins proved to be a potential molecular marker for shrimp species identification, showing marked differences in the MALDI-TOF MS spectra from tryptic digests.21 Now, using a combination of preparative 2-DE, MALDI-TOF MS, and sequencing by ESI-IT MS/MS, we have characterized the AK proteins from seven closely related species of commercial relevance, belonging to the order Decapoda. Efforts were made in peptide de novo sequencing, as genomes from members belonging to the order Decapoda still await sequencing. Particular attention was focused on the identification and characterization of several species-specific peptides for each of the species analyzed, which may be used as a tool for seafood product authentication. Materials and Methods Shrimp Species and Populations Considered. Specimens analyzed are shown in Table 1. They were collected using either, extractive fishing practices, or from aquaculture facilities in different continents worldwide. Seven different shrimp species from the order Decapoda were considered in this study, being five of them from the

ACS Paragon Plus Environment

157

Journal of Proteome Research

Penaeidae family –Penaeus monodon, Litopenaeus vannamei, Fenneropenaeus indicus, Fenneropenaeus merguiensis, Farfantepenaeus notialis-, one from the Solenoceridae family –Pleoticus muelleri-, and one from the Pandalidae family –Pandalus borealis. Penaeidae and Solenoceridae families belong to the superfamily Penaeoidea, and Pandalidae family belongs to the superfamily Pandaloidea. Shrimps, whole animals, were frozen on board and shipped to our laboratory for the analyses. Special care was taken in keeping their morphological characteristics in good shape. At least six individuals of each species were analyzed. Specimens were classified in their respective taxons according to their anatomical external features with the help of a marine biologist from the Marine Sciences Institute (Mediterranean Centre for Marine and Environmental Research, Higher Council for Scientific Research, CMIMA-CSIC, Barcelona, Spain) with expertise in penaeid shrimp taxonomy. Extraction of Sarcoplasmic Proteins. Approximately 1 g of raw white muscle from each of the individuals studied were homogenized in two volumes of milliQ water using an Ultra-Turrax blender for 3x15 s with interruptions of 45 s to avoid warming the samples. Sarcoplasmic protein extracts were then centrifuged at 30000g for 15 min at 4ºC (J25 centrifuge; Beckman, Palo Alto, CA), and the supernatants were frozen at 80ºC until the electrophoretic analysis. Protein concentration in the extracts was determined by the bicinchoninic acid method (Sigma Chemical Co., USA). 2-DE. Isoelectric focusing (IEF) was performed at 10 ºC in a Multiphor II electrophoresis unit (Amersham Biosciences, Sweden) as described elsewhere.16 Briefly, protein extracts (4 mg/mL, 100-120 μg of protein) were loaded in duplicate on IEF precast polyacrylamide gels with a narrow range of pH (Ampholine PAGplate pH 4.0-6.5; GE Healthcare, Uppsala, Sweden), using a sample applicator paper, and run at 1500 V, 50 mA, 30 W until 4000 Vh were reached. To avoid overlapping of proteins,

ACS Paragon Plus Environment

158

Journal of Proteome Research

strips with a narrow pH range (pH 4.0-6.5) were chosen. IEF strips corresponding to individual lanes were cut after the run was completed and kept at -80 ºC until second dimension electrophoresis analysis was performed. Equilibration of pH 4-6.5 IEF gel strips was carried out at room temperature as described previously.26 Briefly, the strips were placed for 10 min in sample buffer containing 0.75 % DTT followed by 10 min incubation in sample buffer containing 4.5 % iodoacetamide. Preparative second dimension SDS-PAGE for further MS analysis were performed at 15 °C in the Multiphor II electrophoresis unit (Amersham Biosciences, Sweden), using vertical gels (7.5%T and 3%C) with Tris-tricine buffer. Running conditions were: 100 V, 40 mA per gel, and 150 W. Gels were stained with Coomassie Brilliant Blue (CBB) (GE Healthcare), which is very compatible with sample preparation for MS analysis, according to the manufacturer’s instructions. PDQuest 2-D Analysis Software Version 7.1.0 (Bio-Rad Laboratories, Hercules, CA) was used for the image analysis. Peptide Sample Preparation for MS and MS/MS Analysis. AK spots were localized based on the data (pI and Mr) obtained by previous work, 21 and excised from the gel taking care in maximizing the protein-to-gel ratio. Only the most intensely stained region at the centre of the spot was excised to avoid extracting an excess of gel matrix. Excised pieces were subjected to in-gel digestion with trypsin (Roche Diagnostics GmbH, Mannheim, Germany) as described elsewhere.27 Prior to nESI-IT MS analysis, the tryptic peptide samples were desalted and concentrated using in-tip reverse-phase resins (ZipTip C18, Millipore, Bedford, MA), according to the manufacturer’s recommendations. Peptide Mapping. Peptide digests were acidified with TFA and 0.8 μL aliquots were manually deposited onto the stainless steel MALDI probe and allowed to dry at room

ACS Paragon Plus Environment

159

Journal of Proteome Research

temperature. Matrix solution (0.8 μL of saturated CHCA in 50% aqueous ACN and 0.1 % TFA) was added and again allowed to dry at room temperature. Mass spectra were obtained using a Voyager DE STR MALDI-TOF mass spectrometer (Applied Biosystems, Foster City, CA) operating in the reflector, delay extraction, and positive-ion mode. Laser intensity was set just above the ion generation threshold. The values for the MS parameters were: low mass gate, m/z 500 Da; delay time, 350 ns; accelerating voltage, 20,000 V; and grid voltage, 68.5 %. Mass spectra were acquired by accumulating 150 laser shots in the m/z range from 850 to 3500. External close calibration with the Calibration Mixture 2 of the Sequazyme Peptide Mass Standards Kit (Applied Biosystems) was used. Mass spectra were baseline corrected and data lists containing monoisotopic m/z values were extracted from mass spectral data with the specific software of the instrument (Data Explorer, version 4.0.0.0). Signals within the 920 to 3500 m/z range, with relative intensities greater than 5% were included in the lists. Database searches were performed against the NCBI nonredundant protein sequence database (http://www.ncbi.nih.gov) using the MASCOT Peptide Mass Fingerprint search program (http://matrixscience.com). Search parameters were: monoisotopic and protonated masses, two missed cleavages allowed, 100 ppm mass tolerance, and three potential variable modifications: ACET sites (acetyl Nterminal), CysCAM (carbamidomethylcysteine) and MSO (methionine sulfoxide). Peptide Sequencing by ESI-IT MS/MS. Peptide digests were analyzed online by LC-ESI-IT-MS/MS using a LC system model SpectraSystem P4000 (Thermo-Finnigan, San Jose, CA) coupled to an IT mass spectrometer model LCQ Deca XP Plus (ThermoFinnigan). The separation was performed on a 0.18 mm × 150 mm BioBasic-18 RP column (ThermoHypersil-Keystone) using 0.5% acetic acid in water and 0.5% acetic acid in ACN as mobile phases A and B, respectively. A 90 min linear gradient from 5 to

ACS Paragon Plus Environment

160

Journal of Proteome Research

60% B, at a flow rate of 1.4-1.7 μL /min, was used. Peptides were detected using survey scans from 400 to 1600 amu (3 μscans), followed by a data-dependent ZoomScan (5 μscans) and MS/MS scan (5 μscans), using an isolation width of 3 amu and a normalized collision energy of 35%. Fragmented masses were set in dynamic exclusion for 3 min after the fragmentation event and singly charged ions were excluded from MS/MS analysis. Off-line analyses by nESI-IT were performed using an ion trap mass spectrometer, model LCQ Deca XP Plus (Thermo-Finnigan) equipped with a nanospray interface. Peptides were previously desalted by micro-columns ZipTip C18 eluted with 10 μL of 70% MeOH/ 0.5%CH3COOH. PicoTips borosilicate glass needles with 1 μm orifice (New Objective, Woburn, MA) were filled with 3-5 μL of sample and used as emitters. MS/MS spectra were searched using SEQUEST (Bioworks 3.1 package, thermoFinnigan) against the nr.fasta database (NCBI Resources, NIH, Bethseda MD). The following constraints were used for the searches: tryptic cleavage after Arg and Lys, up to two missed cleavage sites, and tolerances ±1.5 Da for precursor ions and ±0.8 Da for MS/MS fragment ions. The variable modifications allowed were methionine oxidation, carbamidomethylation of Cys, and acetylation of the N-terminus. De novo sequencing was performed by manual interpretation of the ion series in the spectra. BLAST program was used for homology searches between de novo obtained sequences and those in the nr-NCBI database. Results and Discussion 2-DE. Sarcoplasmic protein extracts from 6 individuals for each of the 7 species under study were subjected to 2-DE. Gels were Coomassie stained and analyzed with the image software. To ensure reproducibility of the experiments, 3 gels were run per individual. In accordance with previously reported data, 21 arginine kinase isoforms run

ACS Paragon Plus Environment

161

Journal of Proteome Research

at 40 kDa with an isoelectric point (pI) between 4.68 and 5.25. The 2-DE patterns for the different AKs are shown in Figure S-1 in the Supporting Information and pIs for all the AK spots studied are compiled in Table S-1 in the Supporting Information. Differences in the AK spots pIs pointed to the presence of amino acid substitutions in their sequences; consequently, characterization of each of the AK isoforms was performed by mass spectrometry. MALDI-TOF MS Analysis of AK Spots. After preparative 2-DE, AK spots were in gel digested with trypsin, and the peptides analyzed by MALDI-TOF MS. The complete list of the peaks detected can be found in Table S-2 in the Supporting Information. Mass coincidences between experimental data and in silico produced tryptic digests from the AKs present in protein databases were apparent: 24 peak masses were coincident with theoretical peptides from the P. monodon allergen Pen m 2 (gi|27463265), seven with peptides from an AK found in L. vannamei (gi|115492980), another seven with peptides from Marsupenaeus japonicus AK (gi|1708615); four more peaks matched peptides from Galapaganus conwayensis (gi|209402936); two peaks were present in the AK from Solenopsis invicta (gi|192337578); other two were present in the AK from Chasmagnathus granulata (gi|7243761) and one was contained in the AK sequences from Periplaneta americana (gi|50428904), Cimberis pilosa (gi|228014712), Apis mellifera

(gi|58585146),

Homarus

gammarus

(gi|585342),

Lepidophthalmus

louisianensis (gi|171473157), Artemia franciscana (gi|25453072), Pterapion sp. (gi|228014764), Cancer antennarius (gi|171473177), and Hemigrapsus oregonensis (gi|171473159). MALDI-TOF MS peptide maps containing specific peaks are shown in figure 1. Highlighted are those used for the definition and differentiation of the species studied. According to the results presented in table S-2, eleven peaks with an m/z of 1050.51

ACS Paragon Plus Environment

162

Journal of Proteome Research

(Figure 1a), 1507.73, 1604.81, 1683.82, 1796.95, 1807.92, 2015.98, 2031.99, 2033.98, 2190.05, and 2636.32 were present in all the species of the superfamily Penaeoidea. Several differences were also obtained among the Penaeoidea species, which may allow the classification of shrimps into two groups (Figure 1b, c, d): the family Penaeidae, presenting four specific peaks at m/z 1008.49, 1259.63, 1657.85, and 2599.31 Da, and the family Solenoceridae, with other twelve specific peaks at 994.45, 1263.62, 1286.63, 1424.68, 1442.73, 1532.78, 1541.89, 1718.85, 1789.89, 2315.25, 2644.36, and 2772.53 Da. Within the Penaeidae family, species-specific peaks were found (Figure 1e,f): one peak with an m/z of 1077.54 was specific to P. monodon; other peak with an m/z of 1463.75 was specific to F. notialis; while two peaks at 2285.06 and 2472.38 Da were specific for F. merguiensis. 17 specific peaks were found for P. borealis, making the pattern very different from those found in the other species, and therefore to the family Pandalidae (e.g. peak at 1634.82 Da in Figure 1d). In addition, intra-species variations, depending on the origin of the population considered, were found in L. vannamei and F. indicus: peaks with m/z 1148.53, 1369.71, 1513.78, 1531.75 (Figure 1g), 1761.92, 2271.18, 2287.23, 2431.23, 2548.35, and 3379.73 were found in L. vannamei from Costa Rica, while peaks with m/z 1503.71, 1631.90, 1775.89, 2301.21, and 3390.74 were found L. vannamei from Argentina, being the last one an specific marker found only in this L. vannamei population. Differential peaks were found as well for two populations of F. indicus: 1133.58 (Figure 1h), 2301.21 and 2426.31 Da in the specimens coming from Mozambique, while 1622.80, and 2619.97 in those from Madagascar. The information provided by these specific peaks and the combination of the presence or absence of other peaks in the different groups of these species (Table S2) is enough to clearly differentiate between the two superfamilies, the three families and the seven species studied. Furthermore, intra-specific differences described for L.

ACS Paragon Plus Environment

163

Journal of Proteome Research

vannamei and F. indicus may be used to differentiate populations from these two species. MS/MS Characterization of Peptides from AK. Tryptic digests were further analyzed by MS/MS using a combination of LC-ESI-IT and nESI-IT. The spectra produced were used for database search and for manual de novo amino acid sequence interpretation. Results of the sequencing efforts are shown in tables 2 and S-3; in the most extended, presented in the supplementary information, a summary of the 131 peptide sequences obtained is presented, being table 2 a concise summary with the masses and sequences used for shrimp species identification. Peaks with coincident molecular weight were previously found by MALDI-TOF MS analysis for 54 peptides and 35 were previously assigned by PMF. Several peptides were found to be specific for each of the superfamilies. Those with Mr 1147.60, 1050.52, 1667.82, 1683.82, 1796.94, 792.43, 2033.94, 1719.77, 1139.58, and 1304.68 Da were specific to the superfamily Penaeoidea. Specific peptides were found for each of the families included in this superfamily: peptides at 2599.26 and 1657.82 Da for the Penaeidae family, and peptides at 1397.76, 1403.67, 1718.80, 1442.80, 1130.59, 1286.70, 2772.40, 1016.55, 1789.97, and 1532.83 Da for the Solenoceridae family. Within the Penaeidae family, species-specific peptides were also found. Examples are peptides at 3057.50, 3073.50, 3089.49, 3105.49, and 1984.93 Da for P. monodon; 1205.68 Da for F. merguiensis; 2639.15 Da for F. notialis. As previously revealed using MALDI-TOF spectra, intra-species differences were found for L. vannamei and F. indicus: peptides at 1531.83, 1659.92, 1201.58, 1513.82 and 1761.94 Da, were specific for L. vannamei from Costa Rica; 1383.78 and 3390.66 Da for L. vannamei from Argentina; 1215.60 and 1231.60 Da, for F. indicus from

ACS Paragon Plus Environment

164

Journal of Proteome Research

Mozambique; and 1063.57 Da, was specific for F. indicus from Madagascar. Another pair of isobaric peptides, with a Mr of 1369.76 Da and sequences YLSKDIFDKLK and YLSKEVFDQLK were found specific for L. vannamei from Costa Rica, and to F. indicus from Mozambique, respectively. Several examples of the fragmentation spectra from species-specific peptides, together with the m/z of the precursor ions, are shown in Figures 2, 3, and 4. The peak with m/z 525.59 (charge 2+) was chosen because it corresponds to one of the ten peptides specific for the Penaeoidea superfamily (Figure 2). A pair of homologous peptides serves to differentiate the Penaeidae and Solenoceridae families: the peak at m/z 829.26 (2+), which is only present in Penaeidae, corresponds to the sequence TFLVWVNEEDHLR (Figure 3a), whereas the peak at 860.09 (2+), only present in Solenoceridae, corresponds to TFLC*WVNEEDHLR (Figure 3b). Both are absent in the Pandalidae family. A substitution of Val for Cys in the sequence is responsible for the difference in the mass of the precursors and for the presence of different fragmentation diagnostic peaks at m/z 1011.3, 1197.4 (for the 829.26 precursor) and 1072.3, 1258.4 (for the 860.09 precursor). Only one P. borealis specific peptide could be completely characterized by manual de novo sequencing: SFLVWVNEEDQLR, with a Mr of 1634.81 Da. This peak was chosen because it was only found in the Pandalidae family species (Figure 3c). This sequence has two substitutions with respect to that present in the Penaeidae species: a Thr for a Ser, and a His for a Gln. The peak with a Mr of 1077.58 Da was found in P. monodon and F. merguiensis samples, but it happened to be a mixture of two isobaric peptides, with specific sequences for each of the species: AVFDQLKEK and ALFDQLKDK, respectively. There are a Val and a Glu for P. monodon and a Leu and an Asp for F. merguiensis, in

ACS Paragon Plus Environment

165

Journal of Proteome Research

positions 2 and 8. Fragmentation spectra are shown in Figure 4; as expected, these two substitutions are responsible for the different diagnostic fragmentation peaks at m/z 454.3, 760.3, 907.3 for P. monodon (Figure 4a) and at m/z 447.1, 746.1, 893.1 for F. indicus (Figure 4b). As the MS/MS fragmentation patterns are different for each sequence, these peptides can be used in a multiple reaction monitoring (MRM) experiment to differentiate both shrimp species. In addition to species-specific peptides, there are others which are always present in several species, being always absent in others. Combining the presence or absence in the samples of carefully selected peptides among those shown in Table 2, unequivocal shrimp species differentiation is clearly possible. Figure 5 presents one of the possible schematic flow diagrams which can be used for the systematic discrimination among the seven species studied and even, among the different geographical populations for L. vannamei and F. indicus. The AK amino acid sequences from the different shrimp considered, as deduced from MS/MS data, were aligned together with the sequence Pen m 2 from P. monodon,25 accessible in the protein databases, which presents the highest homology with those found in the present work (Figure 6). As AKs are highly conserved, only small differences are observed, but these differences may be used to distribute the species into different groups. Conclusions Proteomics methodology was used to find sequence similarities and differences among the arginine kinases from seven different shrimp species belonging to the order Decapoda. A high degree of homology was found among the AK sequences, but the sequence variations found are very useful to distinguish the different members of these species, providing (i) a selective differentiation between the superfamilies Penaeoidea

ACS Paragon Plus Environment

166

Journal of Proteome Research

and Pandaloidea and between the families Penaeidae, Solenoceridae, and Pandalidae; and (ii) an unequivocal identification of several shrimp species. Due to AK interspecific variability and the high concentration at which it is present in the muscle from shrimp, we can forecast that they could be used as a good biomarker for species identification. The identification and characterization of specific peptides, as done by this work, is the first step toward the designing of fast and cheap detection analyses. Identified species-specific peptides can be used to prepare antibody-based, easy-to-use kits for the sensitive detection of each of the species. Acknowledgement. We thank Lorena Barros and Eva María Rodríguez for their excellent technical assistance. We also acknowledge members from CETMAR for their helpful collaboration in the collection of specimens for this study. This work was supported by the INIA National Food Program; Spanish Ministry for Education and Science (Project CAL-03-030-C2-2) and by the PGIDIT Research Program in Marine Resources (Project PGIDIT04RMA261004PR), Xunta de Galicia. Supporting Information Available. Results and Discussion, including Figure S-1, and Tables S-1, S-2 and S-3. This material is available free at http://pubs.acs.org.

Conflict of interest statement All authors declare there are no financial/commercial conflicts of interest.

ACS Paragon Plus Environment

167

Journal of Proteome Research

Figure captions Figure 1. Regions of the MALDI-TOF MS peptide maps from AK trypsin digested spots, showing peaks specific to (a) superfamily Penaeoidea (1050.51 Da); (b, c, d) family Penaeidae (1008.49, 1259.63, and 1657.85 Da), family Solenoceridae (994.45, 1263.62, and 1286.63 Da) or family Pandalidae (1634.82 Da); (e) P. monodon (1077.54 Da); (f) F. notialis (1463.75 Da); (g) L. vannamei from Costa Rica (1531.75 Da); (h) F. indicus from Mozambique (1133.58 Da). Populations from: (1) Costa Rica; (2) Argentina; (3) Mozambique and (4) Madagascar. Figure 2. MS/MS spectrum of the AK peptide FLQAANAC*R. This peptide is present in all the species belonging to the superfamily Penaeoidea. C* carboxymethylated cysteine. Figure 3. MS/MS spectra of the AK differential peptides: (a) TFLVWVNEEDHLR, (b) TFLVWVC*NEEDHLR, and (c) SFLVWVNEEDQLR, which are present in the Penaeidae, Solenoceridae and Pandalidae families, respectively. C* carboxymethylated cysteine. Figure 4. MS/MS spectra of the isobaric peptides (a) AVFDQLKEK and (b) ALFDQLKDK, which are present in AK from P. monodon and F. merguiensis, respectively. Figure 5. Flow diagram showing the systematic identification of shrimp species using nine differential peptides from AK. m/z of the doubly charged ions were: 525.6, 817.8, 829.3, 759.8, 675.2, 539.2, 766.2, 603.3, and 616.1. “Y” denotes the presence and “N” the absence of a particular peptide. Figure 6. Alignment of the AK amino acid sequences, as obtained by MS/MS analysis, for all the shrimp species studied. The sequences were aligned with the allergen Pen m 2 sequence from P. monodon (accession number gi|27463265), which presents the

ACS Paragon Plus Environment

168

Journal of Proteome Research

highest degree of homology with them. () not determined amino acid. (1) Costa Rica; (2) Argentina; (3) Mozambique and (4) Madagascar populations.

ACS Paragon Plus Environment

169

Journal of Proteome Research

Table 1. Penaeid shrimp species considered in the study Scientific namea

a

Originb

Commercial name

Penaeus monodon

Giant tiger prawn

IWP and WI

Litopenaeus vannamei

Pacific white shrimp

EP

Fenneropenaeus indicus

Indian white prawn

WI

Fenneropenaeus merguiensis

Banana prawn

WCP

Farfantepenaeus notialis

Southern pink shrimp

EA

Pleoticus muelleri

Argentine red shrimp

SWA

Pandalus borealils

Northern shrimp

NA

The taxonomic classification proposed by Pérez-Farfante and Kensley [2]) was adopted.bOrigin

abbreviations: IWP, Indo-West Pacific Ocean; WI, Western Indian Ocean; EP, Eastern Pacific Ocean; WCP, Western Central Pacific Ocean; EA, Eastern Atlantic Ocean; SWA, Southern West Atlantic Ocean.; NA, Northern Atlantic Ocean.

ACS Paragon Plus Environment

170

171

ADAAVIEKLEAGFK VDAAVIEKLEAGFK VSSTLSGLEGELK VSSTLSSLEGELK YLSKDIFDKLK YLSKEVFDQLK YLTKEVFDKLK YLTKEIFDQLK AVFDQLKDK AVFDQLKEK ALFDQLKDK ALFDQLKDKK GTYFPLTGMSK GTYFPLTGMTK GTYYPLTGMSK FLQAANACR SFLVWVNEEDQLR TFLVWVNEEDHLR TFLVWCNEEDHLR LEEVAGKYNLQVR LEEIAGKYNLQVR

Peptide Sequence

CysCAM

MSO MSO MSO CysCAM

N-Acyl N-Acyl

Modification 2-15 2-15 152-164 152-164 30-40 30-40 30-40 30-40 34-42 34-42 34-42 34-43 165-175 165-175 165-175 194-202 217-229 217-229 217-229 297-309 297-309

Position

Y (PMF) Y Y (PMF) Y (PMF) Y (PMF) Y

Y (PMF) Y Y

Y (PMF) Y

Y (PMF) Y

MALDI observed SOP

PRA

GIT

PNV (1)

PNV (2)

PNI (3)

PNI (4) PBA

LAA

ACS Paragon Plus Environment

merguiensis; LAA, Pleoticus muelleri. (1) Costa Rica population; (2) Argentina population; (3) Mozambique population; (4) Madagascar population.

terminal. SOP, F. notialis; PRA, Pandalus borealis, GIT, Penaeus monodon; PNV, Litopenaeus vannamei; PNI, Fenneropenaeus indicus; PBA, Fenneropenaeus

databases. () denotes the presence of a peptide, and ( ) the absence. CysCAM, carboxymethylated cysteine; MSO, methionine sufoxide; N-Acyl, acetyl N-

m/z: mass/charge. MALDI observed; (Y): peptide found by MALDI-TOF MS; (PMF): peptide matched by peptide mass fingerprint with an AK entry in protein

1503.798 1531.83 1319.69 1349.71 1369.76 1369.73 1383.78 1397.76 1063.57 1077.58 1077.58 1205.68 1217.59 1231.60 1233.58 1050.52 1634.81 1657.82 1718.80 1518.82 1532.83

752.30 (2+) 766.22 (2+) 660.20 (2+) 675.22 (2+) 685.20 (2+); 457.07 (3+); 343.23 (4+) 685.25 (2+); 457.14 (3+) 692.33 (2+) 699.20 (2+); 466.43 (3+) 532.18 (2+) 539.16(2+) 539.14 (2+) 603.26 (2+) 601.18 (2+) 616.09 (2+) 617.11 (2+) 525.59 (2+) 817.76 (2+) 829.26 (2+); 553.14 (3+) 860.09 (2+)/ 573.71 (3+) 759.85 (2+); 506.73 (3+) 766.80 (2+)

+

(M+H) matched

m/z (z) observed

identification.

Table 2. Concise summary of peptide sequence data obtained by MS/MS for AKs from the shrimp species studied useful for species

Journal of Proteome Research

Journal of Proteome Research

References (1)

Holthius, L. B., FAO Species Catalogue: Shrimps and Prawns of the World. An Annotated Catalogue of Species of Interest to Fisheries; FAO Fish. Synop. (125); FAO: Rome, Italy, 1980; Vol. 1, pp 1-271.

(2)

Pérez-Farfante, I.; Kensley, B., Penaeoid and Sergestoid Shrimps and Prawns of the World. Keys and Diagnoses for the Families and Genera. Éditions du Muséum National d’Histoire Naturelle: Paris, France, 1997.

(3)

Council Regulation (EC) No. 104/2000 of the European Parliament of Dec. 17, 1999 on the common organization of the markets in fishery and aquaculture products.

(4)

Royal Decree 121/2004 of Jan. Twenty-three (BOE No. 31, Feb. 5, 2004) from Ministry of Agriculture, Fisheries and Food, Spain.

(5)

Civera, T., Species identification and safety of fish products. Vet. Res. Commun. 2003, 27, 481-489.

(6)

Maggioni, R.; Rogers, A. D.; Maclean, N.; Incao, F., Molecular phylogeny of Western

Atlantic

Farfantepenaeus

and

Litopenaeus

shrimp

based

on

mitochondrial 16S partial sequences. Mol. Phylogenet. Evol. 2001, 18, 66-73. (7)

Baldwin, J. D.; Bass, A. L.; Bowen, B. W.; Clark, W. H., Molecular phylogeny and biogeography of the marine shrimp Penaeus. Mol. Phylogenet. Evol. 1998, 10, 399-407.

(8)

Quan, J.; Zhuang, Z.; Deng, J.; Dai, J.; Zhang, Y. -p., Phylogenetic relationships of 12 Penaeoidea shrimp species deduced from mitochondrial DNA sequences. Biochem. Genet. 2004, 42, 331-345.

(9)

Lavery, S.; Chan, T. Y.; Tam, Y. K.; Chu, K. H., Phylogenetic relationships and evolutionary history of the shrimp genus Penaeus s.l. derived from mitochondrial DNA. Mol. Phylogenet. Evol. 2004, 31, 39-49.

(10) Voloch, C. M.; Freire, P. R.; Russo, C. A. M., Molecular phylogeny of penaeid shrimps inferred from two mitochondrial markers. Genet. Mol. Res. 2005, 4, 668674. (11) Brzezinski, J. L., Detection of crustacean DNA and species identification using a PCR-restriction fragment length polymorphism method. J. Food Prot. 2005, 68, 1866-1873. (12) Pascoal, A.; Barros-Velázquez, J.; Cepeda, A.; Gallardo, J. M.; Calo-Mata, P., A polymerase chain reaction-restriction fragment length polymorphism method

ACS Paragon Plus Environment

172

Journal of Proteome Research

based on the analysis of a 16S rRNA/tRNAVal mitochondrial region for species identification

of

commercial

penaeid

shrimps

(Crustacea:

Decapoda:

Penaeoidea) of food interest. Electrophoresis 2008, 29, 499-509. (13) Piñeiro, C.; Barros-Velázquez, J.; Vázquez, J.; Figueras, A.; Gallardo, M., Proteomics as a tool for the investigation of seafood and other marine products. J. Proteome Res. 2003, 2, 127-135. (14) Martinez, I.; Friis, T. J., Application of proteome analysis to seafood authentication. Proteomics 2004, 4, 347-354. (15) López, J. L.; Marina, A.; Álvarez, G.; Vázquez, J., Application of proteomics for fast identification of species-specific peptides from marine species. Proteomics 2002, 2, 1658-1665. (16) Carrera, M.; Cañas, B.; Piñeiro, C.; Vázquez, J.; Gallardo, J. M., Identification of commercial hake and grenadier species by proteomic analysis of the parvalbumin fraction. Proteomics 2006, 6, 5278-5287. (17) Carrera, M.; Canas, B.; Pineiro, C.; Vazquez, J.; Gallardo, J. M., De novo mass spectrometry sequencing and characterization of species-specific peptides from nucleoside diphosphate kinase B for the classification of commercial fish species belonging to the family Merlucciidae. J. Proteome Res. 2007, 6, 3070-3080. (18) An, H.; Marshall, M. R.; Otwell, W. S.; Wei, C. I., Species identification of raw and boiled shrimp by a urea gel isoelectric focusing technique. J. Food Sci. 1989, 54, 233-236. (19) Civera, T.; Parisi, E., The use of sodium dodecyl sulfate polyacrylamide gel electrophoresis for the identification of raw and cooked shrimps and crabs. Ital. J. Food Sci. 1991, 3, 149-157. (20) Shanti, K. N.; Martin, B. M.; Nagpal, S.; Metcalfe, D. D.; Rao, P. V., Identification of tropomyosin as the major shrimp allergen and characterization of its IgE-binding epitopes. J. Immunol. 1993, 151, 5354-5363. (21) Ortea, I.; Cañas, B.; Calo-Mata, P.; Barros-Velázquez, J.; Gallardo, J. M., Arginine kinase peptide mass fingerprinting as a proteomic approach for species identification and taxonomic analysis of commercially relevant shrimp species. J. Agric. Food Chem. 2009, 57, 5665-5672. (22) Morrison, J. F., Arginine kinase and other invertebrate guanidine kinases. In The Enzymes, 3rd ed.; Boyer, P. D., Ed.; Academic Press: New York, 1973; Vol. 8, pp 457-486.

ACS Paragon Plus Environment

173

Journal of Proteome Research

(23) Watts,

D.

C.,

Creatine

kinase

(adenosine

5'-triphosphate

creatine

phosphotransferase. In The Enzymes, 3rd ed.; Boyer, P. D., Ed.; Academic Press: New York, 1973; Vol. 8, pp 383-455. (24) France, R. M.; Sellers, D. S.; Grossman, S. H., Purification, characterization, and hydrodynamic properties of arginine kinase from Gulf shrimp (Penaeus aztecus). Arch. Biochem. Biophys. 1997, 345, 73-78. (25) Yu, C.-J.; Lin, Y.-F.; Chiang, B.-L.; Chow, L.-P., Proteomics and immunological analysis of a novel shrimp allergen, Pen m 2. J. Immunol. 2003, 170, 445-453. (26) Piñeiro, C.; Barros-Velázquez, J.; Sotelo, C. G.; Pérez-Martín, R. I.; Gallardo, J. M., Two-dimensional electrophoretic study of the water-soluble protein fraction in white muscle of gadoid fish species. J. Agric. Food Chem. 1998, 46, 3991-3997. (27) Jensen, O. N.; Wilm, M.; Shevchenko, A.; Mann, M., Sample preparation methods for mass spectrometric peptide mapping directly from 2-DE gels. In 2-D Proteome Analysis Protocols, Link, A. J., Ed.; Humana Press: Totowa, NJ, 1999; pp 513530.

Synopsis TOC.

The identification of commercial shrimp species is a relevant issue to ensure correct labelling, maintain consumer confidence and enhance the knowledge of the captured species, benefiting both, fisheries and manufacturers. A proteomic approach, based on 2DE, tryptic in-gel digestion, MALDI-TOF MS, and ESI-MS/MS analyses, paying special attention to de novo sequence interpretation of differential species-specific peptides, is proposed for the identification of shrimp species with commercial interest.

ACS Paragon Plus Environment

174

Journal of Proteome Research

5HRQVRIWKH*"(+2HWHPDVIURPWUVQHVWHVRWV,VKR3QHD4VVHFIF WR5D6V HUIDPO3HQDHRHD57$8$.87"D6-5),F,6IDPO3HQDHDH57$$9.:%,7#8%.&',DQ 7&8;.98"D6,IDPOROHQRFHUDH5%%:.:8,7#&'.&#,DQ7#9&.&'"D6RUIDPO3DQDODH 57&':.9#"D6-5H63.PRQRRQ57$;;.8:"D6-5I62.QRWDOV57:&'.;8"D6-56*.DQQDPHIURP RVWD5FD578'7.;8"D6-5K62.QF VIURPRDP)< H577''.89"D6.3R ODWRQVIURP!576 RVWD5FD-5#6UHQWQD-5'6RDP)< HDQ5:6DDDVFDU. #8:=7%$PP5%&=%&"36

ACS Paragon Plus Environment

175

Journal of Proteome Research

 



 

>VHFWU PRIWKHHWH2*?@A5.(KVHWHVUHVHQWQDOOWKHVHFHV )HORQQWRWKHV HUIDPO3HQDHRHD.AFDU)R=PHWKODWHFVWHQH. #8:=7%$PP5%&=%&"36

ACS Paragon Plus Environment

176

Journal of Proteome Research

>VHFWUDRIWKHIIHUHQWDOHWHV!5D6(2*[email protected]"E*5,5)6(2*BCB[email protected]"E*5,DQ 5F62*[email protected]"?*5,3KFKDUHUHVHQWQWKH3HQDHDH,ROHQRFHUDHDQ3DQDODHIDPOHV, UHVHFWHO.AFDU)R=PHWKODWHFVWHQH. #8:=7%$PP5%&=%&"36

ACS Paragon Plus Environment

177

Journal of Proteome Research

>VHFWUDRIWKHVR)DUFHWHV5D6B2"?*DDQ5)6*2"?*",3KFKDUHUHVHQWQ IURP3.PRQRRQDQ2.PHU HQVV,UHVHFWHO. #8:=7%$PP5%&=%&"36

ACS Paragon Plus Environment

178

Journal of Proteome Research

2OR3DUDPVKR3QWKHVVWHPDWFHQWIFDWRQRIVKUPVHFHV VQQQHIIHUHQWDOHWHV IURP.P>RIWKHR )OFKDUHRQV3HUH!8#8.&,97;.9,9#%.',;8%.9,&;8.#,8'%.#,;&&.#, &$'.',DQ&7&.7.FGHHQRWHVWKHUHVHQFHDQ[email protected]WKHD)VHQFHRIDDUWF ODUHWH. #8:=7%$PP5%&=%&"36

ACS Paragon Plus Environment

179

Journal of Proteome Research

OQPHQWRIWKHDPQRDFVH< HQFHV,DVR)WDQH)>DQDOVV,IRUDOOWKHVKUP VHFHVVW H.(KHVH< HQFHV3HUHDOQH3WKWKHDOOHUHQ3HQP#VH< HQFHIURP3.PRQRRQ 5DFFHVVRQQ P)HUI#;:&'#&86,3KFKUHVHQWVWKHKKHVWHUHHRIKRPROR3WKWKHP.5J6 QRWHWHUPQHDPQRDF.576RVWD5FD-5#6UHQWQD-5'6RDP)< HDQ5:6DDDVFDU R ODWRQV. #8:=7%$PP5%&=%&"36

ACS Paragon Plus Environment

180

1 SUPPORTING INFORMATION: RESULTS AND DISCUSSION

2-DE

Figure S-1. Cropped regions of representative 2-DE gels showing the separated arginine kinase from all shrimps studied. Pen, Penaeus; Far, Farfantepenaeus, Lit, Litopenaeus; Fen, Fenneropenaeus; Ple, Pleoticus; Pan, Pandalus.

Table S-1. Mean pI of the analyzed spot, calculated from the 2-DE patterns of all individuals analysed of each species. species Penaeus monodon Farfantepenaeus notialis Litopenaeus vannamei Fenneropenaeus indicus Fenneropenaeus merguiensis Pleoticus muelleri Pandalus borealis

pI ± RSD 4.99 ± 0.6 5.22 ± 0.6 4.98 ± 0.8 5.18 ± 0.3 5.16 ± 1.0 5.25 ± 1.1 4.68 ± 1.6

MALDI-TOF MS analysis

181

182

1634.824 1638.826 1651.839 1657.851 1666.815 1667.81 1683.816 1690.872

1442.727 1463.751 1503.715 1507.731 1513.781 1518.732 1525.779 1531.753 1532.782 1541.891 1604.814 1606.776 1622.799 1631.899

1148.534 1149.568 1158.583 1164.651 1196.634 1205.667 1259.63 1263.618 1286.634 1369.71 1415.777 1424.679 1438.708

994.4523 1008.49 1050.506 1077.544 1133.576 1141.561 1147.597

exp mass

1650.822 1656.826

1666.817 1682.812

1650.832 1656.843

1666.802 1682.809

1621.85 1630.893

1621.792 1630.892

1437.74

1437.701

1531.836 1540.857 1603.8

1368.765 1414.789

1368.702 1414.769

1531.774 1540.884 1603.806

1204.682 1258.688

1204.66 1258.623

1441.764 1462.837 1502.798 1506.7 1512.826 1517.82 1524.855

1163.595

1163.644

1441.719 1462.743 1502.708 1506.723 1512.774 1517.724 1524.772

1148.619

1146.607

1146.589

1148.561

993.4781 1007.494 1049.508 1076.587

calc mr

993.445 1007.482 1049.499 1076.537

exp mr

-0.01 -0.01

0.01 0.02

-0.06 -0.01

-0.06 0.03 0.01

-0.04 -0.09 -0.09 0.02 -0.05 -0.10 -0.08

-0.04

-0.06 -0.02

-0.02 -0.07

0.04

-0.06

-0.02

-0.03 -0.01 -0.01 -0.05

delta

IISMQMGGDLGQVFR IISMQMGGDLGQVFR

IISMQMGGDLGQVFR TFLVWVNEEDHLR

LQAGFKKLEAATDCK ADAAVIEKLEAGFKK

LEEVAAKYNLQVR LAANREKLEEVAAK LIDDHFLFKEGDR

LKGTFYPLTGMSK RLVHAVNEIEKR ADAAVIEKLEAGFK EGDRFLQAANACR LAANRDKLEEVAGK LEEVAGKYNLQVR KYLTKEIFDQLK

RRMGLTEYDAVK

YLSKDIFDKLK RLTSAVNEIEKR

AVFDQLKEKK LTSAVNEIEKR

RIPFSHHDR

EIFDQLKTR

LIDDHFLFK

VPFSHHDR IPFSHHDR FLQAANACR AVFDQLKEK

peptide

MSO 2 MSO

N-Acyl

N-Acyl CysCAM

CysCAM

modification

113-125 244-255 2-15 190-202 289-302 297-309 28-39 229-241 290-303 181-193 9-23 2-16

Cimberis pilosa Apis mellifera Penaeus monodon Penaeus monodon Marsupenaeus japonicus Penaeus monodon Solenopsis invicta Galapaganus conwayensis Homarus gammarus Penaeus monodon Marsupenaeus japonicus Penaeus monodon

230-244 230-244

329-340

Periplaneta americana

Litopenaeus vannamei Penaeus monodon

29-39 245-256

Marsupenaeus japonicus Penaeus monodon

230-244 217-229

34-43 246-256

Penaeus monodon Penaeus monodon

Penaeus monodon Penaeus monodon

256-264

Litopenaeus vannamei

181-189

Penaeus monodon 33-41

189-196 257-264 194-202 34-42

Galapaganus conwayensis Penaeus monodon Penaeus monodon Penaeus monodon

Solenopsis invicta

Position

Organism

SOP

PRA

GIT

(1)

(2)

(1)

(1)

(2)

(1)

(1) (1)

PNV

(4)

(3)

PNI

PBA

LAA

Table S-2. Complete information of the MALDI-TOF MS analysis of arginine kinase spots in the seven shrimp species considered.

2

183

2345.173

2430.134 2471.197

2547.355 2598.262 2619.199

2345.156

2430.219 2471.369

2547.34 2598.303 2618.964

2635.308 2643.356 2771.524 2785.376 3378.724 3389.731 3419.668

2636.316 2644.363 2772.532 2786.384 3379.732 3390.738 3420.675

2635.297 2643.118 2771.397 2785.412 3378.612 3389.579 3419.589

2189.046

2189.045

1838.913 1874.876 2014.946 2030.977 2032.945

1838.957 1874.91 2014.976 2030.989 2032.975

1774.958 1788.862

1774.884 1788.887

1795.929 1806.923 1809.873

1760.942

1760.91

1795.942 1806.913 1809.843

1717.788 1718.775

calc mr

1717.843 1718.834

exp mr

2190.052 2271.181 2285.058 2287.228 2315.253 2346.164 2350.241 2426.309 2431.226 2472.377 2531.266 2548.347 2599.311 2619.972

1796.95 1807.92 1810.85 1812.826 1828.812 1839.965 1875.918 2015.983 2031.996 2033.982 2080.958 2126.042 2142.023

1718.85 1719.841 1758.86 1761.917 1766.903 1775.891 1789.895

exp mass

Table S-2. Continued.

0.01 0.24 0.13 -0.04 0.12 0.15 0.08

-0.02 0.04 -0.23

0.08 0.17

-0.02

-0.01

0.04 0.03 0.03 0.01 0.03

0.01 -0.01 -0.03

-0.07 0.03

-0.03

0.05 0.06

delta

LIDDHFLFKEGDRFLQAANACR SMEGYPFNPCLTETQYKEMESK VPFSHHDRLGFLTFCPTNLGTTVR IPFSHHDRLGFLTFCPTNLGTTVR QTDKHPNKDFGDVSSFVNVDPEGQYVISTR YWPAGRGIYHNDNKTFLVWCNEEDHLR YWPTGRGIYHNDNKTFLVWCNEEDHLR

RMGLTEFQAVKEMQDGILQLIK GIYHNDNKTFLVWVNEEDHLR SLQGYPFNPCLTESQYKEMEAK

DFGDVSSFVNVDPEGQYVISTR DFGDVNTFVNVDPEGKYVISTR

DHLRIISMQMGGDLGEVYRR

GTRGEHTEAEGGIYDISNKR

IISMQMGGDLGQVFRR GEHTEAEGGIYDISNKR SLQGYPFNPCLTEAQYK GEHTEAEGGIYDISNKRR GTRGEHTEAEGGIYDISNK

LGFLTFCPTNLGTTVR IISMQMGGDLGQVFRR FLQAANACRYWPTGR

EKLEEVAGKYNLQVR KTFLVWCNEEDHLR

DKLEEVAGKYNLQVR

TFLVWCNEEDHLR GEHTEAEGGIYDISNK

peptide

CysCAM CysCAM

CysCAM 2 MSO CysCAM CysCAM

CysCAM

CysCAM

2 MSO

CysCAM

CysCAM

CysCAM

modification

Position 149-161 313-328 294-308 295-309 88-101 265-280 230-245 194-208

230-245 313-329 130-146 313-330 310-328

310-329

64-83

102-123 103-124 329-350 209-229 130-151 181-202 130-151 189-212 257-280 94-123 75-101 203-229

Organism Galapaganus conwayensis Litopenaeus vannamei Marsupenaeus japonicus Penaeus monodon Lepidophthalmus louisianensis Litopenaeus vannamei Penaeus monodon Chasmagnathus granulata

Litopenaeus vannamei Penaeus monodon Artemia franciscana Penaeus monodon Penaeus monodon

Penaeus monodon

Pterapion sp.

Marsupenaeus japonicus Penaeus monodon Marsupenaeus japonicus Penaeus monodon Litopenaeus vannamei Penaeus monodon Cancer antennarius Galapaganus conwayensis Litopenaeus vannamei Marsupenaeus japonicus Hemigrapsus oregonensis Chasmagnathus granulata

SOP

PRA

GIT

(1) (2)

(1)

(1)

(1)

(1)

(2)

(1)

PNV

(4)

(3)

PNI

PBA

LAA

3

184

MS/MS Characterization of Peptides from AK.

population.

Fenneropenaeus merguiensis; LAA, Pleoticus muelleri. (1) Costa Rica population; (2) Argentina population; (3) Mozambique population; (4) Madagascar

terminal. SOP, F. notialis; PRA, Pandalus borealis, GIT, Penaeus monodon; PNV, Litopenaeus vannamei; PNI, Fenneropenaeus indicus; PBA,

calc Mr; ; (■) denotes the presence of a peak, and () the absence. CysCAM, carboxymethylated cysteine; MSO, methionine sufoxide; N-Acyl, acetyl N-

exp mass, observed protonated monoisotopic masses in Da; exp Mr, observed neutral masses in Da; calc Mr, calculated neutral masses in Da; delta, exp Mr-

4

185

1659.92 2520.29 1680.86 1035.51 1369.76 1369.73 1383.78 1397.76 820.45 834.46 1063.57 1077.58 1077.58 1191.66

1205.68 1230.72 2701.27 3379.61 3390.66 3420.67 1738.78 1752.80 2431.13 2442.18 2472.19 1403.67 2424.04 2031.95

2033.91 2034.89 2049.90 2050.89 2639.15 2655.14

830.39 (2+) 840.70 (3+) 840.72 (2+) 518.10 (2+) 685.20 (2+); 457.07 (3+); 343.23 (4+) 685.25 (2+); 457.14 (3+) 692.33 (2+) 699.20 (2+); 466.43 (3+) 410.48 (2+) 417.52 (2+) 532.18 (2+) 539.16(2+) 539.14 (2+) 596.14 (2+)

603.26 (2+) 615.99 (2+) 901.02 (3+); 676.12 (4+) 1127.09 (3+) 848.33 (4+) 855.90 (4+) 869.70 (2+) 876.77 (2+) 1216.22 (2+); 811.14 (3+) 814.75 (3+) 824.71 (3+) 702.48 (2+) 808.78 (3+) 1016.43 (2+)

1017.30 (2+); 678.47 (3+) 1017.77 (2+) 1025.25 (2+); 683.96 (3+) 1025.85 (2+); 684.30 (3+) 880.39 (3+) 885.69 (3+)

886.48 1503.798 1531.83 1631.89

858.45

443.38 (2+) 752.30 (2+) 766.22 (2+) 816.37 (2+); 544.49 (3+)

1636.86

429.49 (2+)

(M+H)+ matched

546.08 (3+)

m/z (z) observed

SMQGYPFNPCLTEAQYK SMEGYPFNPCLTEAQYK SMQGYPFNPCLTEAQYK SMEGYPFNPCLTEAQYK SMEGYPFNPCLTEAQYKEMEAK SMEGYPFNPCLTEAQYKEMESK

ALFDQLKDKK TSLGATLLDVIK QTDKHPNKDFGDVNTFVNVDPEGK QTDKHPNKDFGDVSSFVNVDPEGQYVISTR QTDKHPNKDFGDVNSFVNVDPEGKFVISTR QTDKHPNKDFGDVNTFVNVDPEGKYVISTR DFGDVNSFVNVDPEGK DFGDVNTFVNVDPEGK DFGDVSSFVNVDPEGQYVISTR DFGDVNSFVNVDPEGKFVISTR DFGDVNTFVNVDPEGKYVISTR DVNAFVNVDPEGK CGRSMEGYPFNPCLTEAQYK SLQGYPFNPCLTESQYK

VDAAVIEKLEAGFKK ADAAVIEKLEAGFKKLEAATDCK LEAGFKKLEAATDCK KLEAATDCK YLSKDIFDKLK YLSKEVFDQLK YLTKEVFDKLK YLTKEIFDQLK AVFDQIK ALFDQLK AVFDQLKDK AVFDQLKEK ALFDQLKDK DIFDKLKGQK

VDAAVIEK ADAAVIEKLEAGFK VDAAVIEKLEAGFK ADAAVIEKLEAGFKK

ADAAVIEK

MVDAAVLEKLEAGFK

Peptide Sequence

CysCAM CysCAM MSO;CysCAM MSO;CysCAM CysCAM;MSO148 MSO131;CysCAM

CysCAM127;MSO;CysCAM139 CysCAM

N-Acyl N-Acyl;CysCAM CysCAM CysCAM

N-Acyl N-Acyl N-Acyl N-Acyl

N-Acyl

MSO

Modification

130-146 130-146 130-146 130-146 130-151 130-151

34-43 44-55 95-118 95-124 95-124 95-124 103-118 103-118 103-124 103-124 103-124 106-118 127-146 130-146

2-16 2-24 10-24 16-24 30-40 30-40 30-40 30-40 34-40 34-40 34-42 34-42 34-42 34-43

2-9 2-15 2-15 2-16

2-9

1-15

Position

Y

Y

Y (PMF)

Y (PMF)

Y (PMF) Y Y

Y

Y (PMF) Y

Y (PMF) Y

Y (PMF) Y Y (PMF)

MALDI observed SOP

PRA

GIT

PNV (1)

PNV (2)

Table S-3. Complete information of peptide sequence data obtained by MS/MS for AKs from the shrimp species studied PNI (3)

PNI (4) PBA

LAA

5

186

2671.14 1965.97 1981.96 1319.69 1349.71 2532.28

2548.29 2548.29 2564.28 3160.61 3176.60 1201.58 1215.60 1217.59 1217.58 1231.60 1233.58 1758.80 1147.60 1604.80

2636.30 1507.71 1050.52 960.44 2599.26 1634.81 1657.82 1718.80 1651.82 1667.82 1683.82 1807.93 1839.92 1095.53

948.48 1415.79 1442.80 1103.58 1130.59 1259.68 1286.70 1008.49

850.12 (3+) 850.15 (3+) 1282.73 (2+); 855.33 (3+) 1054.03 (3+); 790.92 (4+) 1059.47 (3+); 794.86 (4+) 601.18 (2+) 608.15 (2+) 608.99 (2+) 609.06 (2+) 616.09 (2+) 617.11 (2+) 879.92 (2+) 574.20 (2+); 383.12 (3+) 802.82 (2+); 401.91 (4+)

879.46 (3+); 659.83 (4+) 754.29 (2+); 503.14 (3+) 525.59 (2+) 480.64 (2+) 867.03 (3+); 650.62 (4+) 817.76 (2+) 829.26 (2+); 553.14 (3+) 860.09 (2+)/ 573.71 (3+) 826.29 (2+); 551.13 (3+) 834.49 (2+); 556.47 (3+) 842.25 (2+); 561.82 (3+) 603.25 (3+) 613.80 (3+) 548.16(2+)

474.64 (2+) 472.52 (2+); 472.53 (3+) 481.54 (3+) 552.10 (2+) 565.79 (2+) 630.24 (2+); 420.43 (3+) 643.86 (2+); 429.42 (3+) 504.65 (2+); 336.76 (3+)

(M+H)+ matched

891.27 (3+) 983.35 (2+); 655.810(3+) 991.33 (2+); 661.15 (3+) 660.20 (2+) 675.22 (2+) 844.87 (3+)

m/z (z) observed

Table S-3. Continued

GGDLGQVFR RLTSAVNEIEKR RLTNAVNEIEKR LTSAVNEIEK LTNAVNEIEK LTSAVNEIEKR LTNAVNEIEKR IPFSHHDR

LIDDHFLFKEGDRFLQAANACR EGDRFLQAANACR FLQAANACR GIYHNDNK GIYHNDNKTFLVWVNEEDHLR SFLVWVNEEDQLR TFLVWVNEEDHLR TFLVWCNEEDHLR IISMQMGGDLGQVFR IISMQMGGDLGQVFR IISMQMGGDLGQVFR IISMQMGGDLGQVFRR IISMQMGGDLGQVFRR MGGDLGQVFR

VSSTLSSLEGELKGTYFPLTGMSK VSSTLSSLEGELKGTYYPLTGMSK VSSTLSSLEGELKGTYYPLTGMSK VSSTLSSLEGELKGTYFPLTGMSKEVQQK VSSTLSSLEGELKGTYYPLTGMSKEVQQK GTYFPLTGMSK GTYFPLTGMTK GTYFPLTGMSK GTYYPLTGMSK GTYFPLTGMTK GTYYPLTGMSK (-)LVDDHFLFVSGDR LIDDHFLFK LIDDHFLFKEGDR

SMEGYPFNPCLTEAQYKEMESK EMEEKVSSTLSGLEGELK EMEEKVSSTLSGLEGELK VSSTLSGLEGELK VSSTLSSLEGELK VSSTLSSLEGELKGTYFPLTGMSK

Peptide Sequence

MSO233;MSO235 MSO

MSO233 or MSO235 MSO233;MSO235

CysCAM

CysCAM CysCAM CysCAM

MSO MSO

MSO

MSO MSO MSO

MSO

MSO

MSO131;CysCAM;MSO148

Modification

236-244 245-256 245-256 246-255 246-255 246-256 246-256 257-264

181-202 190-202 194-202 209-216 209-229 217-229 217-229 217-229 230-244 230-244 230-244 230-245 230-245 235-244

152-175 152-175 152-175 152-180 152-180 165-175 165-175 165-175 165-175 165-175 165-175 179-193 181-189 181-193

130-151 147-164 147-164 152-164 152-164 152-175

Position

Y (PMF) Y Y (PMF)

Y (PMF) Y

Y (PMF) Y Y (PMF) Y (PMF) Y (PMF) Y (PMF) Y (PMF) Y (PMF) Y (PMF)

Y (PMF) Y (PMF) Y (PMF)

Y Y (PMF) Y (PMF)

Y Y

MALDI observed SOP

PRA

GIT

PNV (1)

PNV (2)

PNI (3)

PNI (4) PBA

LAA

6

187

2772.40 2786.42 1440.72 1796.94 992.61 1513.82

1527.84 2287.24 2301.26 1002.54 988.52 1016.55 1761.94 1775.95 1789.97 1518.82 1532.83 792.43 2033.94 2190.04

2346.14 1719.77 1875.87 2031.98 1279.67 1295.68 2581.34 1123.57 1139.58 2393.24 2409.23 2425.24 2763.46 2779.45

2795.46 3023.55 3039.55

3055.54 3057.50 3071.54

3073.50

509.97(3+) 572.60 (3+); 572.39 (4+) 767.70 (3+); 576.04 (4+) 501.65 (2+); 334.89 (3+) 494.58 (2+) 508.66 (2+) 587.80 (3+) 888.42 (2+); 592.62 (3+) 597.36 (3+) 759.85 (2+); 506.73 (3+) 766.80 (2+) 396.53 (2+) 1017.19 (2+); 678.49 (3+); 509.24 (4+) 548.18 (4+)

587.34 (4+); 469.91 (5+) 860.32 (2+); 573.94 (3+) 625.92 (3+); 469.66 (4+) 508.77 (4+) 427.00 (3+) 432.55 (3+) 645.98 (4+) 562.15 (2+) 570.16 (2+) 1197.10 (2+); 798.42 (3+) 1205.19 (2+); 803.64 (3+) 1213.06 (2+); 809.01 (3+) 691.75 (4+) 695.45 (4+)

699.51 (4+) 1008.49 (3+); 756.66 (4+) 1013.82 (3+); 760.61 (4+)

1019.05 (3+); 764.50 (4+) 765.14 (4+) 1024.50 (3+); 768.79 (4+)

1025.14 (3+); 769.09 (4+)

(M+H)+ matched

924.77 (3+) 929.45 (3+); 697.37 (4+) 720.96 (2+) 898.85 (2+) 496.79 (2+); 331.38 (3+) 505.07 (3+)

m/z (z) observed

Table S-3. Continued

MGLTEFQAVKEMQDGILELIKMEKEM

MGLTEFQAVKEMQDGILELIKIEKEM MGLTEFQAVKEMQDGILELIKMEKEM MGLTEFQAVKEMQDGILELIKIEKEM

MGLTEFQAVKEMQDGILELIKIEK MGLTEFQAVKEMQDGILELIKIEKEM MGLTEFQAVKEMQDGILELIKIEKEM

GTRGEHTEAEGGIYDISNKRR GEHTEAEGGIYDISNK GEHTEAEGGIYDISNKR GEHTEAEGGIYDISNKRR RMGLTEFQAVK RMGLTEFQAVK RMGLTEFQAVKEMQDGILELIK MGLTEFQAVK MGLTEFQAVK MGLTEFQAVKEMQDGILELIK MGLTEFQAVKEMQDGILELIK MGLTEFQAVKEMQDGILELIK MGLTEFQAVKEMQDGILELIKIEK MGLTEFQAVKEMQDGILELIKIEK

LAANREKLEEVAGK LAANRDKLEEVAGKYNLQVR LAANREKLEEVAGKYNLQVR EKLEEVAGK DKLEEVAGK EKLEEIAGK DKLEEVAGKYNLQVR EKLEEVAGKYNLQVR EKLEEIAGKYNLQVR LEEVAGKYNLQVR LEEIAGKYNLQVR YNLQVR GTRGEHTEAEGGIYDISNK GTRGEHTEAEGGIYDISNKR

VPFSHHDRLGFLTFCPTNLGTTVR IPFSHHDRLGFLTFCPTNLGTTVR LGFLTFCPTNLGT LGFLTFCPTNLGTTVR ASVHIKLPK LAANRDKLEEVAGK

Peptide Sequence

MSO331 or MSO342 or MSO356 two of MSO331 or MSO342 or MSO356 MSO331 or MSO342 or MSO356 MSO331;MSO342;MSO356 MSO331 or MSO342 or MSO352;MSO356

MSO331;MSO342

MSO331

MSO331 or MSO342 MSO331;MSO342

MSO

MSO MSO331;MSO342

CysCAM CysCAM CysCAM CysCAM

Modification

331-356

331-356 331-356 331-356

331-354 331-356 331-356

310-330 313-328 313-329 313-330 330-340 330-340 330-351 331-340 331-340 331-351 331-351 331-351 331-354 331-354

290-303 290-309 290-309 295-303 295-303 295-303 295-309 295-309 295-309 297-309 297-309 304-309 310-328 310-329

257-280 257-280 265-277 265-280 281-289 290-303

Position

Y Y (PMF) Y (PMF) Y (PMF)

Y (PMF) Y (PMF)

Y Y (PMF) Y

Y (PMF) Y (PMF)

Y Y

Y (PMF)

Y (PMF)

Y (PMF) Y (PMF)

MALDI observed SOP

PRA

GIT

PNV (1)

PNV (2)

PNI (3)

PNI (4) PBA

LAA

7

188

1950.98 1984.93

975.86 (2+); 650.88 (3+) 662.22 (3+)

EMQDGILELIKIEKEM EMQDGILELIKMEKEM

MGLTEFQAVKEMQDGILELIKMEKEM MGLTEFQAVKEMQDGILELIKMEKEM EMQDGILELIK EMQDGILELIK EMQDGILELIKIEK EMQDGILELIKIEKEM

Peptide Sequence

MSO342;MSO356 MSO342;MSO352;MSO356

MSO MSO

MSO331;MSO342;MSO352;MSO356

MSO331 or MSO342;MSO352;MSO356

Modification

341-356 341-356

331-356 331-356 341-351 341-351 341-354 341-356

Position

MALDI observed SOP

PRA

GIT

PNV (1)

PNV (2)

PNI (3)

PNI (4) PBA

LAA

Costa Rica population; (2) Argentina population; (3) Mozambique population; (4) Madagascar population.

Pandalus borealis, GIT, Penaeus monodon; PNV, Litopenaeus vannamei; PNI, Fenneropenaeus indicus; PBA, Fenneropenaeus merguiensis; LAA, Pleoticus muelleri. (1)

denotes the presence of a peptide, and () the absence. CysCAM, carboxymethylated cysteine; MSO, methionine sufoxide; N-Acyl, acetyl N-terminal. SOP, F. notialis; PRA,

m/z: mass/charge. MALDI observed; (Y): peptide found by MALDI-TOF MS; (PMF): peptide matched by peptide mass fingerprint with an AK entry in protein databases. (■)

3089.49 3105.49 1288.67 1304.68 1674.90 1918.98

(M+H)+ matched

1030.56 (3+) 1035.39 (3+); 777.03 (4+) 644.66 (2+) 652.71 (2+) 558.82 (3+) 640.22 (3+)

m/z (z) observed

Table S-3. Continued

8

CAPÍTULO 5 PROCEDIMIENTO Y KIT PARA LA IDENTIFICACIÓN RÁPIDA DE LAS PRINCIPALES ESPECIES COMERCIALES DE LANGOSTINOS Y CAMARONES

Capítulo 5: Procedimiento y kit para la identificación rápida de las principales especies comerciales de langostinos y camarones.

Comentario

Una vez caracterizados los péptidos diferenciales, la siguiente etapa consistió en aplicar todo el conocimiento adquirido al diseño de un método que permitiera realizar un análisis de identificación de especies robusto, sencillo y de gran rapidez.

En este trabajo se desarrolló una metodología de monitorización de los péptidos diferenciadores diana, utilizando un espectrómetro de masas de trampa iónica trabajando en modo SMIM, acoplado online a una separación por RP-HPLC. Para acelerar el procedimiento, la digestión tríptica clásica se realizó mediante la aplicación de ultrasonidos focalizados de alta intensidad, con lo que el tiempo necesario para la digestión se redujo de varias horas a un minuto.

Los resultados obtenidos demuestran que, combinando la digestión ultrarrápida con la monitorización de péptidos diana utilizando la técnica SMIM, se consigue la identificación inequívoca de las especies consideradas en un tiempo total de 91 minutos, lo que supone un gran avance respecto a cualquier otro método disponible en la actualidad para la autentificación de especies de langostinos y camarones, ya sean métodos electroforéticos o genéticos.

En el presente capitulo se describe la patente desarrollada en este estudio. La invención se refiere a un método de identificación de las principales especies extractivas y de acuicultura de langostinos comerciales. La metodología desarrollada (Figura 22), basada en la monitorización por espectrometría de masas de los péptidos diferenciales, permite identificar siete especies de relevancia comercial en productos y subproductos frescos, refrigerados, congelados y/o elaborados.

191

Capítulo 5: Procedimiento y kit para la identificación rápida de las principales especies (…)

Figura 22. Representación esquemática de las etapas del procedimiento de identificación desarrollado.

192

PUBLICACIÓN

193

                                                  !    "##$#%# &      !      

'   (      )              *+#,  -! 

      .) **/*012  34     $# .                # 33   .)  $  '

      #

5(      6

$3440,4+3+

7     6

48   3440 *,691 :;

"    6 <  6 <  6 5(     6 $6 =  6

B    6

"$% %  

# 

7-;$=*#  :* #>

# 



 #