1
ANÁLISIS GENÓMICO COMPARATIVO DE LAS CEPAS DE Helicobacter pylori:
EVIDENCIA EVOLUTIVA DE SU PATOGENICIDAD
AURA MARÍA RODRÍGUEZ GUZMÁN
Trabajo de grado como requisito parcial para optar al título de Biólogo
Director
CARLOS FERNANDO PRADA QUIROGA PhD en Genética
Codirector
DANIEL ALFONSO URREA MONTES PhD en Biología
UNIVERSIDAD DEL TOLIMA FACULTAD DE CIENCIAS PROGRAMA DE BIOLOGÍA
IBAGUÉ - TOLIMA 2020
2
3
4
AGRADECIMIENTOS
Extiendo mis agradecimientos principalmente a Dios y a mi familia, quienes me han brindado su amor y apoyo incondicional, durante cada semestre de mi pregrado. Sin ustedes no hubiese tenido la fortaleza de emprender este gran sueño, que día tras día, me instruyó tanto académicamente como en mi formación profesional; aplicando mis valores y ética en esta ardua investigación que he venido desarrollando durante este tiempo.
De igual manera, quiero expresar mis agradecimientos a mis directores de tesis Carlos Fernando Prada Quiroga y Daniel Alfonso Urrea Montes, los cuales me incentivaron a desenvolverme en esta línea de investigación, acompañándome en el transcurso de este proyecto, aportando su conocimiento, espacio, tiempo y dedicación; con el objetivo de contribuir al campo de la bioinformática, así mismo dar las gracias al Grupo de Investigación Biología y Ecología de Artrópodos, a la Unidad de bioinformática, y a la Facultad de Ciencias de la Universidad de Tolima, por brindarme las herramientas de trabajo necesarias para la culminación de esta tesis.
Por supuesto, un caluroso sentimiento de reciprocidad a mis amigos y compañeros de estudio, quienes han sido un cimiento en este trabajo, que de manera desinteresada me apoyaron y me animaron a no rendirme ante las adversidades, y fueron testigos del arduo desempeño que requiere esta investigación.
Sin personas como ustedes, lograr esta meta sería aún más complejo. Espero poder contribuir al campo de la bioinformática, a las futuras investigaciones científicas y retribuirles a cada uno de ustedes todo aquello que me han aportado durante este tiempo.
Dedicada a:
Jesús Arturo Rodríguez Cortes Adriana Lucía Guzmán Molano
4
CONTENIDO
Pág.
INTRODUCCIÓN ... 11
1. JUSTIFICACIÓN ... 14
2. OBJETIVOS ... 16
2.1. OBJETIVO GENERAL ... 16
2.2. OBJETIVOS ESPECÍFICOS ... 16
3. MARCO TEÓRICO Y ANTECEDENTES ... 17
3.1. ANTECEDENTES HISTÓRICOS ... 17
3.2. TAXONOMÍA Y MORFOLOGÍA ... 18
3.3. MECANISMO DE ACCIÓN ... 19
3.4. FACTORES DE VIRULENCIA ... 23
3.5. FILOGEOGRAFÍA ... 27
4. METODOLOGÍA ... 29
4.1. OBTENCIÓN DE SECUENCIAS ... 29
4.2. OBTENCIÓN DE LOS GENES - FACTORES DE VIRULENCIA ... 32
4.3. REVISIÓN DE ANOTACIÓN DE LOS FACTORES DE VIRULENCIA ... 35
4.4. POSICIÓN ... 35
4.5. NÚMERO DE COPIAS ... 36
4.6. TAMAÑO ... 37
4.7. SIMILITUD ... 37
5. RESULTADOS Y DISCUSIÓN ... 39
5.1. REVISIÓN DE ANOTACIÓN DE LOS FACTORES DE VIRULENCIA ... 39
5.2. POSICIÓN ... 42
5.3. NÚMERO DE COPIAS ... 47
5
5.4. TAMAÑO ... 55
5.5. SIMILITUD ... 57
6. CONCLUSIONES ... 59
RECOMENDACIONES ... 61
REFERENCIAS BIBLIOGRÁFICAS ... 62
ANEXOS ... 76
6
LISTA DE TABLAS
Pág.
Tabla 1. Listado de las cepas de Helicobacter pylori ... 29
Tabla 2. Factores de virulencia y genes relacionados con su respectiva función metabólica ... 33
Tabla 3. Total de datos obtenidos en la revisión de las anotaciones ... 39
Tabla 4. Genes encontrados con duplicación génica en genomas de H. pylori ... 47
Tabla 5. Total de datos obtenidos ... 48
Tabla 6. Genes conservados en las cepas de Helicobacter pylori ... 48
7
LISTA DE FIGURAS
Pág.
Figura 1. Morfología de Helicobacter pylori ... 18
Figura 2. Desarrollo de la infección por Helicobacter pylori ... 19
Figura 3. Enfermedades asociadas a Helicobacter pylori ... 20
Figura 4. Desarrollo de úlcera péptica desde la colonización de H. pylori ... 21
Figura 5. Proceso de carcinogénesis por H. pylori ... 23
Figura 6. Mecanismo de acción de las ureasas ... 24
Figura 7. Filogeografía de Helicobacter pylori ... 28
Figura 8. Evidencia de errores de anotación en la base de datos NCBI en el formato GenBank ... 40
Figura 9. Patrón comparativo de la reorganización de los factores de virulencia ... 43
Figura 10. Dendrograma de 66 genomas de Helicobacter pylori asociadas a la reorganización en Adhesinas ... 45
Figura 11. Dendrograma del número de copias encontradas en los genomas de Helicobacter pylori ... 52
Figura 12. Fisión génica del gen iceA en las cepas 26695, B8 y BM013A de Helicobacter pylori ... 54
Figura 13. Histograma de longitud de los genes de factores de virulencia ... 56
Figura 14. Dendrograma de identidad de los factores de virulencia en las cepas de Helicobacter pylori ... 58
8 RESUMEN
Helicobacter pylori es una bacteria patogénica que coloniza el tracto gastrointestinal del estómago humano; causante de enfermedades como gastritis, úlcera péptica, linfoma gástrico (MALT) y cáncer gástrico, con mayor prevalencia en países subdesarrollados.
Su gran diversidad genética es causada por una alta tasa de mutaciones, observándose variaciones en los factores de virulencia en los diferentes linajes filogeográficos. Este proyecto tuvo como objetivo, postular los eventos de evolución en los genes asociados a factores de virulencia presentes en las cepas de Helicobacter pylori, con el fin de identificar la relación de estos genes con su origen filogeográfico. Se analizaron por medio de herramientas bioinformáticas, los genomas completos de 135 cepas disponibles en NCBI, de diferentes orígenes poblacionales, identificando eventos de reorganización génica en 87 genes de factores de virulencia, divididos en 7 grupos funcionales, para así, determinar cambios en la posición, número de copias, identidad nucleotídica y tamaño, contrastándolos con su linaje geográfico y fenotipo patogénico.
Como resultado se demuestran que no hay una relación directa entre el nivel de reorganización con el linaje geográfico. Sin embargo, si se puede evidenciar una relación en el fenotipo patogénico demostrada en el análisis de número de copias, tamaño y similitud al dividirse las cepas que poseen y no las citotoxinas cagPAI teniendo mayor riesgo de desarrollar gastritis y úlcera péptica. Estudios evidencian el impacto funcional y patogénico de las reorganizaciones en cepas de bacterias patogénicas, pero solo en algunos factores de virulencia de mayor interés como cag y vacA.
Palabras claves: Bioinformática, Helicobacter pylori, patogenicidad, factores de virulencia, filogeografía.
9
ABSTRACT
Helicobacter pylori is a pathogenic bacteria that colonizes the gastrointestinal tract from human stomachs and causes diseases including gastritis, peptic ulcers, gastric lymphoma (MALT) and gastric cancer, with higher prevalence in developing countries. Its high genetic diversity among strains is caused by a high mutation rate, observing virulence factors' variations in different geographic lineages. This project aimed to postulate the evolution events in the genes associated with virulence factors present in the Helicobacter pylori strains, in order to identify the relationship of these genes with their phylogeographic origin. The complete genomes of 135 strains available in NCBI, from different population origins, were analyzed using bioinformatics tools, identifying gene reorganization events in 87 virulence factor genes, divided into 7 functional groups, to determine changes in position, number of copies, nucleotide identity and size, contrasting them with their geographical lineage and pathogenic phenotype. As a result, it was shown that there's not a direct relationship between the reorganization level and geographic lineage. However, it can be evidenced a relation with respect to the pathogenic phenotype demonstrated in the analysis of number of copies, size and similarity when dividing the strains that possess and not the cytotoxins cagPAI having a higher risk of developing gastritis and peptic ulcer. Studies show the functional and pathogenic impact of reorganizations in strains of pathogenic bacteria, but just in a few interest virulence factors as cag and vacA.
Keywords: Bioinformatics, Helicobacter pylori, pathogenicity, virulence factors, phylogeography.
10
INTRODUCCIÓN
Helicobacter pylori es una especie de bacteria patogénica, microaerofílica gram- negativa, curvada en forma de espiral y flagelada. Infecta el revestimiento epitelial del estómago, pero no es invasiva (Mendoza-Elizalde et al., 2016). La gran diversidad genética de H. pylori es causada por una alta tasa de mutaciones, estimándose en 1,4×10-6 (aislados en serie) a 4,5×10-6 (aislados familiares) por nucleótido por año y que así mismo se introducen tres veces más sustituciones por recombinación que por mutación (Morelli et al., 2010). De igual forma, su capacidad para formar reordenamientos genómicos aberrantes e incorporar ADN no homólogo, mejora aún más la diversidad genética facilitando la adquisición y pérdida de genes. Todos estos mecanismos dan como resultado una notable diversidad, incluso dentro de un único huésped (Linz et al., 2013; Betancor et al., 2008; Kuo et al., 1999).
La estrategia más usada por la comunidad científica para conocer los procesos de patogénesis, es la genómica comparativa que permite encontrar relaciones entre genomas, ya sean distantes o cercanos a partir de los genomas secuenciados; con el fin de identificar componentes útiles para entender las relaciones bioquímicas, funcionales y patogénicas de los microorganismos (Brosch et al., 2001). Cabe resaltar que uno de los grandes desafíos de la genómica es la anotación de genes; esta tarea consiste en encontrar los genes existentes en una determinada secuencia de ADN para asignarles características biológicas. La anotación de genes debe ser lo más exacta y fiable posible, pues al extraer o incluir una anotación errónea en una base de datos, este error puede ser propagado a futuras anotaciones (Xavier & Abad, 2011).
La genómica comparativa ha llevado a avances en los campos de la biología evolutiva, uno de ellos es la reconstrucción filogenética que, basados en genes evolutivamente conservados, han permitido establecer relaciones entre estas cepas (Arenas et al., 2010). Sin embargo, parte de estás reorganizaciones, permiten resaltar mecanismos de acción genético donde la generación de nuevos genes en el genoma es desencadenada
11
por eventos de duplicación, a menudo dentro de grandes grupos funcionales que quizás tienen predisposición a tales eventos. La restricción evolutiva en los genes duplicados proporciona una oportunidad única para la neofuncionalización que involucra la adquisición de nuevas características por uno o ambos genes duplicados, siendo evolutivamente más ventajosa (Vallender et al., 2008).
H. pylori es una de las bacterias más antiguas del microbioma humano que coevoluciona con el Homo sapiens desde su origen y durante sus migraciones fuera de África (Linz et al., 2007). De igual forma, existen evidencias que presenta patrón filogeográfico y étnico definido; es decir, es cosmopolita, con cepas específicas para las áreas continentales y, además, patrones geográficos de diversidad genética paralelos a la diversidad humana, existiendo una relación íntima entre el huésped y el patógeno, haciendo que sea más o menos virulenta la cepa dependiendo de su distribución geográfica (Thorell et al., 2017;
Guevara et al., 2016; Kumar et al., 2014).
H. pylori al ser una bacteria altamente patogénica, que involucra exclusivamente una relación entre el humano y la especie, en la que una de las partes que se relacionan resulta afectada. Al tener este mecanismo de acción se clasifica dentro de las bacterias patogénicas primarias o clásicas, ya que, son aquéllas que intrínsecamente portan factores moleculares que invariablemente ocasionan deterioro en la salud de su hospedero (Vidal-Granel, 2003). Para causar el daño, el patógeno bacteriano debe de ejecutar un mecanismo de virulencia que le va a permitir sobrevivir, multiplicarse, diseminarse dentro del huésped; secretando una o más toxinas (Parra & Carballo, 1998;
Vidal-Granel, 2003).
Estudios epidemiológicos han demostrado que esta bacteria es exclusiva del estómago humano, infectando a más del 50% de la población mundial; y es descrita como la causa más frecuente de úlcera gástrica y duodenal (Warren & Marshall, 1983). Este patógeno contribuye en un 20% al desarrollo de enfermedades de inflamación gástrica (Haley &
Gaddy, 2015), y solo una pequeña fracción (<1%) desarrolla adenocarcinoma gástrico,
12
que representa el 10% de la mortalidad total relacionada con el cáncer en todo el mundo, donde en los hombres, la tasa de incidencia duplica la de las mujeres (Jemal et al., 2011).
Su principal vía de transmisión ocurre de persona a persona variando según las áreas geográficas, y se calcula que la frecuencia de infección en países desarrollados oscila entre el 20-40%, mientras que en países en vías de desarrollo presentan frecuencias entre el 70-90% (García et al., 2014). En Estados Unidos y Australia, por ejemplo, la tasa de infección oscila entre 19- 57%, y en otros países como China, Tailandia e India la prevalencia puede llegar al 90% (Erzin et al., 2008). Debido a todos estos factores de importancia epidemiologia, esta bacteria ha sido el albo de decenas de estudios, la mayoría genéticos, que expliquen su comportamiento patogénico; y cómo sus genes están adaptados para sobrevivir y desarrollar en algunos casos cuadros infecciosos con diversas consecuencias para la salud humana.
13
1. JUSTIFICACIÓN
Diversos estudios genéticos, han identificado alrededor de 87 genes asociados a factores de virulencia en H. pylori (Wroblewski et al., 2010). Por ejemplo, las diferencias geográficas en el desarrollo de cáncer gástrico se pueden explicar, al menos en parte, por la presencia de diferentes tipos de factores de virulencia, especialmente los genes CagA, VacA y OipA; asociados con la organización en el genoma, que hace que la bacteria sea patogénica (Yamaoka, 2010). Algunos autores como Devi et al. (2006) y Kalali et al. (2014), han determinado previamente que las cepas de H. pylori altamente virulentas albergan la isla de patogenicidad de genes asociados a la citotoxina (cag PAI), algunas conservadas y otras no. En contraste con estos factores de virulencia, que según los informes se asocian con un mayor riesgo de úlcera péptica y carcinoma gástrico, dupA fue el primer factor de virulencia de H. pylori que se correlacionó con una diferencial susceptibilidad a úlcera péptica, y siendo descrito como marcador de virulencia (Šterbenc et al., 2019); sin embargo, no se ha estudiado de forma completa el por qué la patogenicidad de H. pylori aumenta o disminuye dependiendo de su distribución geográfica.
En la última década, varios grupos de investigación se han enfocado en la secuenciación completa del genoma de H. pylori, lo que se ha traducido en la obtención de más de 200 genomas completos de cepas reportadas en las bases de datos; además de la secuenciación en el genoma de otras especies del mismo género (Cao et al., 2016). A partir de estos genomas, han sido desarrollados análisis evolutivos de genes, especialmente de factores de virulencia (Torres, 2010; Fischer et al., 2010; Mendoza- Elizalde et al., 2016; Delahay et al., 2018) y hasta se ha postulado una filogeografía que indica cuál fue el origen y distribución de cada una de las cepas en el mundo (Falush et al., 2003; Devi et al., 2006; De Sablet et al., 2011; Mendoza-Elizalde et al., 2016;
Miftahussurur & Yamaoka, 2016; Muñoz-Ramírez et al., 2017), mas no se tiene claro cuáles fueron los factores que conllevaron a que esta especie tenga su capacidad de
14
virulencia diferencial en cada linaje y la evolución de tanta variedad de cepas a nivel genómico.
Es por esto que, por medio de este análisis de genómica comparativa y al alto grado de sensibilidad de la anotación semi-manual con programas bioinformáticos, podría ser uno de los primeros de referencia para la identificación de cepas con mayor tendencia patogénica y la posible postulación de las reorganizaciones que sucedieron en cada linaje geográfico, además de una verificación de la presencia de los genes relacionados a factores de virulencia que en investigaciones previas han concluido como ausentes.
De igual forma, este trabajo pretendió aportar información específica para futuras investigaciones médicas aplicadas; permitiendo así mismo, conocer cuáles fueron las reorganizaciones asociadas a factores de virulencia (duplicaciones, deleciones, translocaciones, inserciones e inversiones) de H. pylori que conllevaron a la alta diversidad de cepas presentes, postulando finalmente una filogenia de rearreglos.
Por consiguiente, este proyecto planteó la siguiente pregunta de investigación: ¿Existen factores de virulencia, asociados a reorganizaciones en el genoma de Helicobacter pylori, presentes de forma exclusiva en cada linaje biogeográfico de la bacteria?
15
2. OBJETIVOS
2.1 OBJETIVO GENERAL
Postular los eventos de evolución en los genes asociados a factores de virulencia presentes en las cepas de Helicobacter pylori, con el fin de identificar la relación de estos genes asociados a factores de virulencia con su origen filogeográfico.
2.2 OBJETIVOS ESPECÍFICOS
Identificar mediante herramientas bioinformáticas reorganizaciones en los genes, asociados a factores de virulencia presentes en las 135 cepas de Helicobacter pylori disponibles en la base de datos de NCBI.
Plantear una filogenia a partir de las reorganizaciones de los genes de factores de virulencia de Helicobacter pylori, para contrastar con la filogeografía y fenotipo patogénico de las cepas analizadas.
16
3. MARCO TEÓRICO Y ANTECEDENTES
3.1. ANTECEDENTES HISTÓRICOS
La visualización de las bacterias espirales en el estómago no era algo nuevo. Las primeras descripciones se remontan a finales del siglo XIX, descritas en estómagos de perros y gatos (Pena, 2010). En el año de 1893, en la ciudad de Turín, Italia, Giulio Bizzorezo observó espiroquetas Gram-negativas, no identificadas, en muestras histológicas de las células parietales y de glándulas gástricas de caninos (Marshall, 2001).
La gran mayoría de las infecciones bacterianas del Homo sapiens se describieron a comienzos del siglo XX, pero el descubrimiento de Helicobacter pylori como bacteria de importancia médica, se torna hasta 1983 por John Robin Warren y Barry Marshall, que dispuesto a confirmar que una bacteria era la causante de las úlceras estomacales y que, así mismo, era un microorganismo que se podía combatir por medio de antibióticos.
Marshall se inoculó a sí mismo Helicobacter pylori para comprobar por él mismo los efectos patogénicos de esta bacteria; tras este cultivo de mucosa gástrica, se obtuvo un microorganismo helicoidal en el 98% de las gastritis crónicas y en el 80% de los pacientes con úlcera gástrica. Inicialmente esta bacteria fue denominada Campilobacter pyloridis, posteriormente se realizó una redescripción a Campilobacter pylori y finalmente, tras investigaciones fue clasificada dentro del género Helicobacter, nombrada Helicobacter pylori (Goodwin et al., 1989; Vallejos et al., 2003).
El primer genoma analizado y secuenciado de manera completa fue la cepa 26695 de Helicobacter pylori, aislada antes de 1987 de un paciente con gastritis en Reino Unido y publicado en agosto de 1997, por el Instituto para la Investigación Genómica, tomándola como el genoma de referencia, dentro de las demás cepas (Ge & Taylor, 1998). Años después, en 1994 se secuenció el genoma de un segundo aislamiento clínico de H. pylori la cepa J99, extraída de un paciente en Estados Unidos con úlcera duodenal; el análisis
17
de sus proteínas y los genes que las codifican sugieren que estas dos cepas son muy similares y sus genes se encuentran relativamente conservados en la localización de sus respectivos cromosomas (Tomb et al., 1997).
3.2. TAXONOMIA Y MORFOLOGÍA
Figura 1. Morfología de Helicobacter pylori.
Fuente: (Pittelli, 2017)
La especie Helicobacter pylori pertenece al orden Campylobacterales y de la familia Helicobacteraceae; su nombre se debe a que posee una morfología en espiral y pylori hace referencia al píloro, correspondiente a la apertura circular del estómago que conduce al duodeno (Goodwin et al., 1989). H. pylori es una bacteria gramnegativa y microaerofílica, donde requiere entre 3 y 5 días de crecimiento a 37°C, aunque puede desarrollarse en un rango de 35 a 39°C. Se encuentra en la mucosa gástrica del estómago humano clasificándose como una bacteria no invasiva, ya que no cruza la barrera epitelial, aunque se desarrolla en un ambiente neutro o levemente alcalino (pH 7 a 8) (Mendoza-Elizalde et al., 2016). Presenta un tamaño de 0,5 a 1,0 µm de ancho y de 2,5 a 4,0 µm de longitud. Posee de 2 a 6 flagelos monopolares, fundamentales para su movilidad, y están recubiertos por una vaina de estructura lipídica, igual que la membrana externa, protegiendo a los flagelos de su degradación del medio ácido (Amieva & El–
Omar, 2008).
18 3.3. MECANISMO DE ACCIÓN
Helicobacter pylori está asociada con enfermedades gastroduodenales como gastritis severa, úlcera péptica activa, linfoma gástrico tipo MALT de bajo grado de malignidad y cáncer gástrico (Kersulyte et al., 2000) (Figura 2). El desarrollo de estas enfermedades puede ser explicada debido a que, H. pylori en cada persona no actúa de la misma manera, estando determinada por la interacción de los factores patogénicos o de virulencia de la bacteria; la respuesta inmunológica del huésped (condicionada además por la susceptibilidad genética); o la convergencia de ambos factores. Esta convergencia puede ser influenciada por condiciones ambientales tales como: la infección temprana en la vida, desnutrición, ingesta de compuestos nitrosos, déficit en vitamina C, tabaquismo, entre otros factores (Figura 3) (Valenzuela, 2004; Cave, 1997; Axon, 1997).
La infección podría asociarse con mecanismos de transmisión directa o indirectas con la higiene ambiental, que pueden ser por vía oral-oral, gastro-oral y fecal-oral;
características que hace que se presente con mayor prevalencia en países en desarrollo que en países industrializados, lo que se ha asociado con el nivel sociocultural y económico de la población (Cave, 1997).
Figura 2. Desarrollo de la infección por Helicobacter pylori.
Fuente: (Cervantes, 2016)
19
Figura 3. Enfermedades asociadas a Helicobacter pylori.
Fuente: (Conteduca et al., 2013)
3.3.1. Gastritis. Se origina después de la infección por H. pylori, puede desarrollarse sin manifestaciones clínicas o con expresión propia de gastritis aguda (dolor epigástrico, náuseas y vómitos); es un diagnóstico poco frecuente y su duración es de 7 a 10 días evolucionando hasta la eliminación espontánea de H. pylori, o continuando y desarrollándose en gastritis crónica, la cual evoluciona hacia la atrofia que afecta al antro y se extiende en dirección al cuerpo. La colonización permanente de la mucosa gastroduodenal por H. pylori, causa inflamación induciendo a la apoptosis del epitelio gástrico (Pérez, 2014), esto con un infiltrado mixto en el que predominan los leucocitos polimorfonucleares, linfocitos y células plasmáticas. La bacteria puede ser identificada en biopsias gástricas mediante tinción de Giemsa y en presencia de varias bacterias incluso con hematoxilina-eosina. Después de la erradicación del microorganismo, la gastritis histológica mejora lentamente pero no desaparece totalmente hasta seis meses o un año después de la finalización del tratamiento (Ballesta, 2016; Miranda, 2018).
20
3.3.2. Úlcera péptica. La asociación de H. pylori con la úlcera duodenal es la más estudiada, ya que un 90-95% de los pacientes con esta patología, presentan el microorganismo en su sistema y se curan en su gran mayoría al erradicar la bacteria. La presencia de la bacteria en el duodeno, favorece la formación de úlceras mediante la acción de las células dendríticas y la subsiguiente activación de la respuesta inmune (Pérez, 2014). Con respecto a la úlcera gástrica, también existe una clara relación, (aunque sólo un 70%) de este tipo de úlceras con la presencia de H. pylori; el resto se asocian al consumo de antiinflamatorios no esteroideos (Ballesta, 2016). La sintomatología ulcerosa puede acompañarse de vómitos, anorexia, adelgazamiento y aunque con menos frecuencia la úlcera puede dar lugar a hemorragia digestiva (Figura 4) (Miranda, 2018).
Figura 4. Desarrollo de úlcera péptica desde la colonización de H. pylori.
Fuente: (Sierra, 1994)
3.3.3. Linfoma gástrico (tipo MALT). Este tipo de linfoma se localiza en el antro del estómago, ya que es la zona donde existe más tejido linfoide. Estos tipos de linfomas gástricos son consecuencia de un estímulo autoinmune antigénico crónico, en presencia de H pylori, se originan de linfocitos B y son calificados como de bajo y alto grado, de
21
acuerdo a su extensión y morfología (Guarner & Mohar, 2000). Varios estudios clínicos apoyan la asociación de H. pylori con esta enfermedad, puesto que tras la erradicación de la bacteria se ha observado la regresión del linfoma de bajo grado; observándose que el 90% de los pacientes con linfoma MALT son positivos para esta bacteria (Ballesta, 2016).
3.3.4. Adenocarcinoma gástrico. En 1994, la Agencia Internacional para la Investigación en Cáncer de la Organización Mundial de la Salud (IARC), incluyó a H. pylori como agente biológico carcinogénico para el hombre (tipo 1); basándose en evidencias epidemiológicas asociadas a cáncer gástrico, en el mismo grupo de la hepatitis viral para el cáncer de hígado (Ballesta, 2016). Por otra parte, el papel de H. pylori en el cáncer gástrico, ya que la gastritis crónica es un factor de riesgo para el desarrollo de este tipo de cáncer (Miranda, 2018).
El cáncer gástrico, o cáncer de estómago, se consideraba antes como una sola entidad.
Ahora, los científicos dividen este cáncer en dos clases principales: cáncer gástrico del cardias (cáncer de la pulgada superior del estómago, donde se une al esófago) y cáncer gástrico no del cardias (cáncer en todas las otras zonas del estómago) (Kusters et al., 2006).
La prevalencia de desarrollar adenocarcinoma gástrico en pacientes es del 70%, siendo positivos para H. pylori, teniendo una mortalidad de 737.419 individuos cada año en el mundo, con una incidencia más frecuente en hombres que en mujeres (Ferlay et al., 2010). Dicho cáncer es menos común en los Estados Unidos y en otros países occidentales que en países asiáticos y sudamericanos (Anderson et al., 2010).
22 Figura 5. Proceso de carcinogénesis por H. pylori.
Fuente: (Sierra, 1994)
3.4. FACTORES DE VIRULENCIA
Los factores de virulencia son productos bacterianos o estrategias que contribuyen a la patogenicidad, le permiten a Helicobacter pylori adaptarse al medio; produciendo sustancias que neutralizan los ácidos y formando una especie de nube protectora a su alrededor, haciendo que la bacteria se disemine dentro del estómago hasta encontrar un sitio para adherirse y producir su efecto patógeno (Cervantes, 2016). Existe gran variedad genética entre cepas de Helicobacter pylori, lo que le confiere diferencias en su potencial patogénico. La mayoría de las cepas expresan factores de virulencia que afectan diferentes rutas de señalización del huésped. Tras la colonización, libera sustancias tóxicas que estimulan la respuesta inmunológica local en la que fundamentalmente participan los neutrófilos. Después se produce una amplificación de la respuesta inflamatoria por la interacción de linfocitos, neutrófilos, macrófagos, células mastoides y células no inmunes que liberan gran cantidad de mediadores químicos (Allen, 2008).
23
3.4.1. Ureasas. Es la enzima más abundante producida por H. pylori y su actividad depende del pH alrededor de la bacteria, protegiendo al microorganismo de los ácidos del estómago (Labigne et al., 1991). Ésta cataliza la hidrólisis de la urea del jugo gástrico, formando dióxido de carbono (CO2) y amonio (NH4+) (Figura 3). El amonio producido aumenta el pH, elevándolo hasta 6 o 7 en su entorno y neutralizando el ácido clorhídrico del estómago, lo que ocasiona un pH gástrico neutro; esto le propicia un microambiente a H. pylori, permitiéndole sobrevivir mientras llega al epitelio gástrico (Clayton et al., 1990; Cussac et al., 1992).
Figura 6. Mecanismo de acción de las ureasas.
Fuente: (Cervantes, 2016)
3.4.2. Adhesinas. Las proteínas de membrana externa (PME) son otro factor de virulencia importante, H. pylori se une a las células receptoras del epitelio gástrico del huésped, por medio de un elevado número de adhesinas utilizando múltiples receptores asegurando su unión. Por esto, una sola clase de anticuerpos no inhiben por completo la adhesión de la bacteria a las células (Cover, 2006; Magalhaes & Reis, 2010). Por lo tanto, estas adhesinas se han relacionado con la presencia de patologías gástricas, ya que contribuyen a la inflamación y el daño epitelial (Kusters et al., 2006).
3.4.3. Antígenos de Lewis. El lipopolisacárido es un factor de virulencia de baja toxicidad comparada con otras bacterias Gram negativas; posee en su antígeno O, los
24
carbohidratos de Lewis (Lex y/o Ley), cuyo papel fundamental en la patogénesis es evadir la respuesta inmune durante la colonización del epitelio gástrico, favoreciendo la persistencia bacteriana en el microambiente ayudando a la bacteria a adaptarse a su nicho ecológico (Reyes et al., 2009), y equilibrando la acción de inducir la respuesta autoinmune del hospedero contra sus propias células gástricas (Nilsson et al., 2006).
Durante el proceso de infección de H. pylori, el pH de la mucosa gástrica puede afectar la glicosilación de la cadena del antígeno O (Moran et al., 2002; Nilsson et al., 2006). La variación de fase del antígeno O de H. pylori se ha atribuido a tres genes: futC que codifica una α-1,2fucosiltransferasa, futA y futB que codifican una α-3fucosiltransferasa de especificidad diferente (Wang et al., 1999; Appelmelk et al., 1999; Appelmelk et al., 2000).
3.4.4. Modulador inmune (proinflamatorias). La proteína NAP, codificada por el gen napA;
identificada como una proteína que participa en la activación de los neutrófilos CD11b/CD18 y la adherencia de estos a células endoteliales (Cava & Cobas, 2003), además esta proteína presenta homología con proteínas de la familia bacterioferritina teniendo como función captar iones ferrosos libres intracelulares que pueden dañar el DNA de H. pylori, protegiéndola del estrés oxidativo. Puede actuar como adhesina cuando se secreta o se expresa en la superficie bacteriana pues tiene afinidad por las ceramidas presentes en las membranas plasmáticas celulares (Long et al., 2009).
Por otro lado, se encuentra el gen oipA (HopH) (proteína de membrana externa inflamatoria), la cual, según estudios previos, todas las cepas de H. pylori la poseen, pero sólo algunas la expresan. Fue identificada inicialmente como una proteína de respuesta proinflamatoria, cuya función principal es la adhesión. Su expresión está asociada al desarrollo de inflamación gástrica y a una mayor producción de interleucina 8 (IL-8).
Además, está asociada a la dinámica de la actina y rearreglo del citoesqueleto a través de la fosforilación de múltiples señales que interactúan con la vía relacionada a cagPAI (Yamaoka et al., 2000).
25
3.4.5. Flagelos. La movilidad de la bacteria es fundamental para colonizar la mucosa gástrica y escapar del ácido que la rodea. Cada flagelo está compuesto por dos flagelinas importantes: FlaA (exterior del flagelo) y FlaB (base del flagelo) (Josenhans et al., 1995).
Para que los flagelos puedan ejercer su actividad correctamente, es necesario que se encuentren con un nivel alto de glicosilación (Kao et al., 2016).
3.4.6. Citotoxinas. La isla de patogenicidad cagPAI, es uno de los factores de virulencia más relevantes para la patogénesis de Helicobacter pylori, por lo que es ampliamente estudiado. Estas islas de patogenicidad son segmentos de DNA que contienen más de un gen de virulencia con la peculiaridad de que una simple deleción lleva a la pérdida de al menos dos genes de virulencia con segmentos de DNA de más de 30 Kb (Tegtmeyer et al., 2011). La isla tiene 27 marcos de lectura abiertos, entre los que se encuentran el gen cagA (Olbermann et al., 2010) y el gen virB11, que proviene de un complejo virB/D (Selbach et al., 2002). Cabe resaltar que en este proyecto se tomó como referencia la cepa de Helicobacter pylori B8, la cual presenta cuatro alelos diferentes para el gen virB11 (virB111, virB112, virB113 y virB114) (Blaser et al., 1995).
Otro de los factores de virulencia asociados a las citotoxinas, es la proteína VacA, siendo una toxina codificada por el gen vacA, que induce vacuolización en las células epiteliales, la muerte celular y la destrucción de la integridad epitelial (Rhead et al., 2007). El gen codificante vacA presenta polimorfismos, compuesto por tres regiones variables: región señal (s), región media (m) y región intermedia (i). Tanto la región s como la m presentan dos alelos diferentes, s1, s2 y m1, m2, respectivamente (Mora, 2009). Para este estudio de investigación, se tuvo como referencia la cepa de Helicobacter pylori 908, la cual presenta cuatro alelos diferentes para el gen vacA, (vacA1, vacA2, vacA3 y vacA4), sin embargo, no se tuvo en cuenta la posición de la región variable.
3.4.7. Zonas de plasticidad. Estudios comparativos de los genomas de las cepas de H.
pylori secuenciadas indican que cerca de la mitad de los genes de cepas específicas están localizados en regiones denominadas «zonas de plasticidad». Los genes más estudiados en estas zonas son el gen asociado al desarrollo de la úlcera duodenal dupA,
26
que puede ser otro nuevo marcador de virulencia (Shiota et al., 2013); y el gen IceA, donde una serie de estudios mostró que presenta dos variantes alélicas, iceA1 e iceA2 de las cuales no se tiene muy claro su función, pero si tiene una asociación significativa con el desarrollo de úlcera péptica (Peek et al., 1998). IceA es un gen dependiente del genotipo vacA, babA y cagA, y su expresión es regulada por el contacto entre H. pylori y el epitelio del hospedero, por lo cual se considera corregulado indirectamente por algunas proteínas de membrana externa (Yamaoka et al., 1999; Vidal et al., 2015).
3.5. FILOGEOGRAFÍA
Según John Avise (2000), la filogeografía “es el campo de estudio relacionado con los principios y procesos que gobiernan la distribución geográfica de linajes de genes, sobre todo aquello entre y dentro de especies cercanamente relacionadas”. La filogeografía trabaja con los componentes históricos y filogenéticos de la distribución espacial de linajes de genes, y considera como ejes el tiempo y el espacio, en los cuales se mapean las genealogías de estudio.
Para Helicobacter pylori se describen varias formas de distribución filogeografía, pero hasta la fecha, se han descrito siete poblaciones principales de H. pylori, específicas de África (3), Asia (2), Sahul (1) y Europa (1) (Falush et al., 2003; Linz et al., 2007). Tomando como referencia el estudio de identificación genética, en grupos humanos étnicos y de diferentes continentes, realizado por Falush et al. (2003), donde divide sus poblaciones de estudio en, hpEurope (aislado de Europa, Oriente Medio, India e Irán), hpNEAfrica (aislado en el noreste de África), hpAfrica1 (aislado de países de África occidental y Sudáfrica) dividido en las subpoblaciones hspWAfrica (África occidental) y hspSAfrica (sur de África); hpAfrica2 (hasta ahora solo aislado de Sudáfrica), hpAsia2 (aislado del norte de India, Bangladesh, Tailandia y Malasia), hpSahul (aborígenes australianos y papúes de Nueva Guinea) y, el grupo hpEastAsia, que se encuentra subdividido en tres genotipos: hspMaori (de aborígenes taiwaneses, melanesios y polinesios), hspAmerind (nativos americanos) y hspEAsia (asiáticos orientales) (Breurec et al., 2011).
27
Comparando con el estudio realizado por Miftahussurur & Yamaoka en 2016 (Figura 7) y el mencionado anteriormente; para este trabajo de investigación, la distribución geográfica para Helicobacter pylori se clasificó tanto en poblaciones (Hp) como subpoblaciones (hsp), de la siguiente forma:
HpEurope
HpEastAsia
hspEAsia
hspAmerind
hspMaori
HpAsia2
HpAfrica1
hspSAfrica
hspWAfrica
HpAfrica2
HpNEAfrica
HpSahul
Figura 7. Filogeografía de Helicobacter pylori.
Fuente: (Miftahussurur & Yamaoka 2016)
28
4. METODOLOGÍA
4.1. OBTENCIÓN DE SECUENCIAS
Se utilizaron los genomas completos de 135 cepas de Helicobacter pylori, de 1.100 que estaban disponibles hasta el año 2018 en la base de datos del “National Center for Biotechnology Information” (NBCI) (Wheeler et al., 2006), tanto en formato Fasta como en Genbank, realizando así, una base de datos propia por línea de comandos. Del mismo modo, se generó una tabla en Excel con la clasificación del origen filogeográfico según diferentes autores (Falush et al., 2003; Devi et al., 2006; De Sablet et al., 2011; Mendoza- Elizalde et al., 2016; Miftahussurur & Yamaoka, 2016; Muñoz-Ramírez et al., 2017), y el fenotipo patogénico u origen clínico de cada uno de los genomas, dividiéndola en 4 categorías: Gastritis, Úlcera péptica, Linfoma gástrico (MALT) y Adenocarcinoma gástrico (Cover & Blaser, 2009; Ahmed et al., 2009) (Tabla 1). Esta clasificación patogénica se estableció en distintos artículos científicos, resumidos en la base de datos PATRIC (The Pathosystems Resource Integration Center) (Wattam et al., 2013) y en las anotaciones que cada cepa tenía en Genbank.
Tabla 1. Listado de las cepas de Helicobacter pylori.
GENOMA N° ACCESO LINAJE
GEOGRÁFICO FENOTIPO PATOGÉNICO
BM013A NZ_CP007604 HpSahul ----
BM012B NZ_CP007605 HpSahul ----
BM013B NZ_CP007606 HpSahul ----
Hp238 NZ_CP010013 hspEAsia Linfoma gástrico
26695-1MET NZ_CP010436 hspAmerind ----
29CaP NZ_CP012907 hspAmerind Gastritis/Adenocarcinoma gástrico
7C NZ_CP012905 hspAmerind Gastritis
L7 NZ_CP011482 HpAsia2 ----
DU15 NZ_CP011483 hspEAsia ----
29 GENOMA N° ACCESO LINAJE
GEOGRÁFICO FENOTIPO PATOGÉNICO
CC33C NZ_CP011484 hspSAfrica ----
ausabrJ05 NZ_CP011485 HpSahul ----
K26A1 NZ_CP011486 hspSAfrica ----
PNG84A NZ_CP011487 HpSahul ----
G272 NZ_CP022409 hspEAsia Gastritis
HPJP26 NZ_CP023448 hspAmerind ----
dRdM1 CP026325 hspAmerind ----
26695- dRdM1dM2
CP026323 hspAmerind ----
26695-dR CP026326 hspAmerind ----
26695-dRdM2 CP026324 hspAmerind ----
7.13_R1c CP024073 hspAmerind ----
7.13_R3a CP024077 hspAmerind ----
7.13_R2b CP024075 hspAmerind ----
7.13_R1a CP024071 hspAmerind ----
dRdM2addM2 CP026515 hspAmerind ----
HE171/09 LT635474 HpEurope ----
HE143/09 LT635458 HpEurope ----
HE178/09 LT635460 HpEurope ----
HE132/09 LT635459 HpEurope ----
HE134/09 LT635476 HpEurope ----
HE141/09 LT635471 HpEurope ----
HE136/09 LT635473 HpEurope ----
HE101/09 LT635456 HpEurope ----
HE142/09 LT635478 HpEurope ----
HE170/09 LT635472 HpEurope ----
HE147/09 LT635477 HpEurope ----
BCM-300 LT837687 HpEurope ----
30 GENOMA N° ACCESO LINAJE
GEOGRÁFICO FENOTIPO PATOGÉNICO
HE93/10_v1 LT838273 HpEurope ----
MKM5 NZ_AP017360 hspEAsia ----
F28 NZ_AP017339 hspEAsia ----
F38 NZ_AP017341 hspEAsia ----
F63 NZ_AP017346 hspEAsia ----
F51 NZ_AP017343 hspEAsia ----
F78 NZ_AP017352 hspEAsia ----
F13 NZ_AP017329 hspEAsia ----
F17 NZ_AP017330 hspEAsia ----
F18 NZ_AP017331 hspEAsia ----
F209 NZ_AP017332 hspEAsia ----
F20 NZ_AP017333 hspEAsia ----
F210 NZ_AP017334 hspEAsia ----
F211 NZ_AP017335 hspEAsia ----
F21 NZ_AP017336 hspEAsia ----
F23 NZ_AP017337 hspEAsia ----
F24 NZ_AP017338 hspEAsia ----
F55 NZ_AP017345 hspEAsia ----
F67 NZ_AP017348 hspEAsia ----
F70 NZ_AP017349 hspEAsia ----
F72 NZ_AP017350 hspEAsia ----
F75 NZ_AP017351 hspEAsia ----
F90 NZ_AP017354 hspEAsia ----
F94 NZ_AP017355 hspEAsia ----
MKF10 NZ_AP017356 hspEAsia ----
MKF3 NZ_AP017357 hspEAsia ----
MKF8 NZ_AP017358 hspEAsia ----
MKM1 NZ_AP017359 hspEAsia ----
31 GENOMA N° ACCESO LINAJE
GEOGRÁFICO FENOTIPO PATOGÉNICO
MKM6 NZ_AP017362 hspEAsia ----
ML1 AP014710 hspEAsia Linfoma gástrico
ML2 AP014711 hspEAsia Linfoma gástrico
ML3 AP014712 hspEAsia Linfoma gástrico
2017 NC_017374 hspWAfrica ----
2018 NC_017381 hspWAfrica ----
26695 NC_000915 HpEurope Gastritis/ Úlcera péptica
26695-1 NZ_CP010435 hspAmerind ----
26695-1CH NZ_AP013355 hspEAsia ----
26695-1CL NZ_AP013356 hspEAsia ----
35A NC_017360 hspEAsia Gastritis/ Úlcera péptica 51 NC_017382 hspEAsia Gastritis/ Úlcera péptica
52 NC_017354 hspEAsia Adenocarcinoma gástrico
83 NC_017375 hspEAsia Gastritis/ Úlcera péptica
908 NC_017357 hspWAfrica ----
Aklavik117 NC_019560 hspAmerind Gastritis
Aklavik86 NC_019563 hspAmerind Gastritis
B38 NC_012973 HpEurope Úlcera péptica
B8 NC_014256 HpEurope Úlcera péptica
BM012A NC_022886 HpSahul Gastritis
BM012S NC_022911 HpSahul Gastritis
Cuz20 NC_017358 hspAmerind ----
ELS37 NC_017063 hspAmerind Adenocarcinoma gástrico
F16 NC_017368 hspEAsia ----
F30 NC_017365 hspEAsia ----
F32 NC_017366 hspEAsia ----
F57 NC_017367 hspEAsia ----
G27 NC_011333 HpEurope Úlcera péptica
32 GENOMA N° ACCESO LINAJE
GEOGRÁFICO FENOTIPO PATOGÉNICO
Gambia94/24 NC_017371 hspWAfrica ----
HPAG1 NC_008086 HpEurope Gastritis/ Úlcera péptica
HUP-B14 NC_017733 HpEurope ----
India7 NC_017372 HpAsia2 ----
J166 NZ_CP007603 HpEurope ----
J99 NC_000921 hspWAfrica Gastritis/ Úlcera péptica
Lithuania75 NC_017362 HpEurope ----
NY40 NZ_AP014523 hspEAsia ----
OK113 NC_020508 hspEAsia ----
OK310 NC_020509 hspEAsia ----
P12 NC_011498 HpEurope Úlcera péptica
PMSS1 NZ_CP018823 HpSahul Úlcera péptica
PeCan18 NC_017742 hspAmerind Adenocarcinoma gástrico PeCan4 NC_014555 hspAmerind Adenocarcinoma gástrico
Puno120 NC_017378 hspAmerind Gastritis
Puno135 NC_017379 hspAmerind Gastritis
Rif1 NC_018937 HpEurope ----
Rif2 NC_018938 HpEurope ----
SJM180 NC_014560 hspAmerind Gastritis
SNT49 NC_017376 HpAsia2 ----
SS1 NZ_CP009259 HpSahul ----
Sat464 NC_017359 hspAmerind ----
Shi112 NC_017741 hspAmerind Gastritis
Shi169 NC_017740 hspAmerind Gastritis
Shi417 NC_017739 hspAmerind Gastritis
Shi470 NC_010698 hspAmerind Gastritis/ Úlcera péptica
SouthAfrica20 CP006691 HpAfrica2 ----
SouthAfrica7 NC_017361 HpAfrica2 ----
33 GENOMA N° ACCESO LINAJE
GEOGRÁFICO FENOTIPO PATOGÉNICO
UM032 NC_021215 hspEAsia ----
UM037 NC_021217 hspEAsia ----
UM066 NC_021218 hspEAsia ----
UM298 NC_021882 hspEAsia ----
UM299 NC_021216 hspEAsia ----
XZ274 CP003419 hspEAsia Adenocarcinoma gástrico
oki102 NZ_CP006820 hspEAsia Gastritis/ Atrofia gástrica oki112 NZ_CP006821 hspEAsia Gastritis/ Atrofia gástrica oki128 NZ_CP006822 hspEAsia Gastritis/ Atrofia gástrica oki154 NZ_CP006823 hspEAsia Gastritis/ Atrofia gástrica oki422 NZ_CP006824 hspEAsia Gastritis/ Atrofia gástrica
oki673 NZ_CP006825 hspEAsia Úlcera péptica
oki828 NZ_CP006826 hspEAsia Úlcera péptica
oki898 NZ_CP006827 hspEAsia Úlcera péptica
v225d NC_017355 hspAmerind Gastritis
4.2. OBTENCIÓN DE LOS GENES - FACTORES DE VIRULENCIA
Se realizó una búsqueda en las diferentes bases de datos y artículos científicos, tomando como referencia la lista de “Virulence factors database (VFDB)” (Chen et al., 2005);
seleccionando 87 genes asociados a factores de virulencia, descritos en Helicobacter pylori. Posteriormente, se clasificaron según la función metabólica que cumplen en la bacteria en 7 grupos, teniendo en cuenta bases de datos y literatura ya revisada (Tabla 2); igualmente, se descargaron los genes según su genoma de referencia (Anexo 1) de la base de datos NCBI (Wheeler et al., 2006) en formato Fasta, construyendo una base de datos propia de los factores de virulencia por línea de comandos.
34
Tabla 2. Factores de virulencia y genes relacionados con su respectiva función metabólica.
FACTORES DE
VIRULENCIA FUNCIÓN METABÓLICA GENES
RELACIONADOS
UREASAS Resistencia ácida ureA
ureB ureI ureE ureF ureG ureH/ ureD ADHESINAS Adherencia a la célula
hospedadora
alpA/hopC alpB/hopB babA/hopS babB/hopT
hpaA hopZ horB sabA/hopP sabB/hopO ANTÍGENOS DE LEWIS Evasión de la respuesta
autoinmune
futA futB futC MODULADOR INMUNE
(PROINFLAMATORIAS)
Activadora de Neutrófilos napA Participa en la producción de
IL-8
oipA/hopH
FLAGELOS Movilidad flaA
flaB flaG flgA
35 FACTORES DE
VIRULENCIA FUNCIÓN METABÓLICA GENES
RELACIONADOS flgB
flgC flgD flgE_1 flgE_2 flgG_1 flgG_2 flgH
flgl flgK flgL flhA flhB_1 flhB_2 flhF
fliA fliD fliE fliF fliG fliH fliI fliL fliM fliN fliP fliQ fliR
36 FACTORES DE
VIRULENCIA FUNCIÓN METABÓLICA GENES
RELACIONADOS fliS
fliY CITOTOXINAS
Isla de patogenicidad CagPAI
Sistema de secreción que permite la translocación de
cagA
cag1 cag2 cag3 cag4 cag5 cagA cagC cagD cagE cagF cagG cagH cagI cagL cagM cagN cagP cagQ cagS cagT cagU cagV cagW cagX cagY cagZ
37 FACTORES DE
VIRULENCIA FUNCIÓN METABÓLICA GENES
RELACIONADOS virB11 Vacuolización en las células
epiteliales y apoptosis
vacA
ZONAS DE PLASTICIDAD Transposones Promotor de úlcera duodenal
dupA
Promotor de úlcera péptica
IceA
Variantes alélicas de
IceA
iceA1
Variantes alélicas de
IceA
iceA2
4.3. REVISIÓN DE LA ANOTACIÓN DE LOS FACTORES DE VIRULECIA
Se realizó una tabla de contingencia en el programa Excel con los 87 genes relacionados a factores de virulencia, frente a los 135 genomas disponibles de H. pylori. De estás secuencias registradas, 18 no están anotadas en Genbank (26695-1CH, 26695-1CL, HE101/09, HE132/09, HE134/09, HE136/09, HE141/09, HE142/09, HE143/09, HE147/09, HE170/09, HE171/09, HE178/09, HE93/10_v1, HPJP26, ML1, ML2, ML3).
Igualmente se tuvieron en cuenta y se hicieron las propias anotaciones de los genes evaluados. Se revisó la presencia de dichos genes en las cepas, tomando como referencia la cepa Europea de Helicobacter pylori 26695 (Alm et al., 2001), los genes no anotados en esta cepa se seleccionaron de las demás cepas de referencia (Anexo 1), teniéndolos como punto de partida para hallarlos en los genomas restantes mediante un blastn.
38 4.4. POSICIÓN
Para la anotación de la posición de los genes se utilizó las bases de datos propias desarrollada por líneas de comando, tanto de los genes relacionados a factores de virulencia como las secuencias completas de las cepas disponibles; siendo plasmada en una tabla de contingencia en Excel, teniendo en cuenta la ubicación exacta por coordenadas en valores numéricos y la direccionalidad del gen (plus- plus o plus- minus), mediante un alineamiento con el programa informático “Basic Local Alignment Search Tool” (BLAST) (Altschul et al., 1990). Las reorganizaciones presentes en los factores de virulencia de cada cepa de Helicobacter pylori (inversiones, translocaciones, deleciones, duplicaciones e inserciones de grandes regiones en el genoma) se identificaron mediante una comparación pareada de las cepas de referencia frente a cada gen de virulencia, por medio de un alineamiento local con BLAST2seq (NCBI), alineando los genomas que presentan los genes evaluados, contra los genomas que hipotéticamente no los presentan para verificar la presencia o ausencia del gen y la concordancia frente a la anotación presente en el Genbank o algún cambio de posición. La comprobación de cambios en el inicio y el fin de cada gen, se llevó a cabo mediante alineamientos múltiples de las secuencias obtenidas con las coordenadas exactas de la ubicación de los factores de virulencia de los 135 genomas utilizando el programa Geneious (Kearse et al., 2012).
4.5. NÚMERO DE COPIAS
Partiendo de la verificación de las anotaciones de los 87 factores de virulencia en cada cepa, fueron identificadas las reorganizaciones genéticas (duplicaciones, deleciones, inversiones y translocaciones) anotadas en el Genbank de cada cepa, realizando así una matriz en Excel del número de duplicaciones confirmadas y la presencia o ausencia de los genes asociados a factores de virulencia. Para este caso, se requirió BLAST (Altschul et al., 1990), blast2seq (NCBI), Geneious (Kearse et al., 2012) y la base de datos propia, confirmando cada uno de los genes encontrados como duplicaciones en los 135 genomas de Helicobacter pylori. Estas reorganizaciones fueron analizadas dentro de los 7 grupos funcionales para identificar su dinámica evolutiva. Los grupos con mayor
39
dinámica evolutiva, se le realizó un análisis filogenético con el software GRIMM (Tesler, 2002), el cual describe el escenario más parsimonioso; indicando las relaciones evolutivas entre las cepas analizadas a partir de una matriz de distancia de inversiones, los nodos internos corresponden a los nodos ancestrales y las longitudes de las ramas representan el número de reordenamientos (Díaz, 2002). Los árboles filogenéticos generados por este programa, fueron visualizados mediante el programa bioinformático FigTree (Rambaut, 2014). A partir de los datos, fue generada una matriz binaria de presencia o ausencia de factores de virulencia por cepa con el objetivo de calcular las distancias entre las 135 cepas de Helicobacter pylori, mediante análisis de clúster empleando el paquete (hclust), para el análisis jerárquico de clúster utilizando diferentes métodos de disimilaridad en ambiente R (Charif & Lobry, 2007). Se evaluaron las distancias euclidianas entre las cepas y se empleó el método de agrupación de varianza mínima de Ward "ward.D2", para la generación de un dendrograma por UPGMA (Gronau
& Moran, 2007).
4.6. TAMAÑO
Partiendo de la revisión de las anotaciones en los genes analizados, fueron establecidas las diferencias en la longitud de pares de bases de los 87 genes de factores de virulencia entre las 135 cepas de H. pylori principalmente. Para esto, se empleó un filtro de datos de la matriz de coordenadas por línea de comandos obteniendo la longitud de cada gen.
Posteriormente, se utilizó la función heatmap.2 (Enhanced Heat Map) (Khomtchouk et al., 2014) y los paquetes “gplots” y “RColorBrewer” en ambiente R (The R Project, 2019) para la representación a color de los datos con una reordenación de las filas y las columnas para la generación de un dendrograma de acuerdo a la similaridad entre los datos obtenidos.
4.7. SIMILITUD
Se estableció la identidad nucleotídica basado en el porcentaje de similitud de los genes con respecto a los genomas de referencia (Anexo 1). Para evaluar las diferencias
40
nucleotídicas entre los 87 factores de virulencia evaluados en las 135 cepas de Helicobacter pylori, fueron realizados BLAST nucleotídico (blastn) (Altschul et al., 1990) y blast2seq (NCBI). Teniendo como base una matriz de identidad, se realizó un análisis jerárquico de clúster de las variables estructurales evaluadas por cepas, usando el paquete pvclust (Suzuki & Shimodaira, 2006) en ambiente R (The R Project, 2019) para dar soporte estadístico. Cada clúster del análisis jerárquico fue soportado por valores p calculados a través de un remuestreo bootstrap multiescala. Se compararon con dos tipos de valores p: AU (Approximately Unbiased) aproximación imparcial y BP (Bootstrap Probability) valor probabilístico Bootstrap. El valor p AU, es un remuestreo bootstrap a multiescala, lo cual es una mejor aproximación imparcial al valor p, que el valor BP que es calculado mediante un remuestreo bootstrap normal. De esta manera el paquete realiza un análisis de clúster de manera jerárquica y calcula los valores p para todos los clúster creados a partir de los agrupamientos previamente generados con valores bootstrap normales. De igual forma, este genera la gráfica de los clústers con la comparación de los valores p (AU y BP).
41
5. RESULTADOS Y DISCUSIÓN
5.1. REVISIÓN DE ANOTACIÓN DE LOS FACTORES DE VIRULENCIA
La anotación semi-manual realizada a 87 factores de virulencia en 135 cepas de H. pylori, evidencia que de éstos, 117 genomas presentan anotaciones de estos genes en formato GenBank. Esto significa que 18 genomas (26695-1CH, 26695-1CL, HE101/09, HE132/09, HE134/09, HE136/09, HE141/09, HE142/09, HE143/09, HE147/09, HE170/09, HE171/09, HE178/09, HE93/10_v1, HPJP26, ML1, ML2, ML3), a pesar de que aparecen con archivos en formato GenBank, no se encuentran reportados con anotaciones de ningún gen en H. pylori. Por esta razón, se procedió a realizar la anotación de los 87 factores de virulencia en estas cepas mediante alineamientos múltiples. De igual forma, en las cepas con anotaciones, éstos fueron analizados detalladamente para esta bacteria con un total de 9.092 genes analizados, un 65,83%
están bien anotados en la base de datos NCBI, es decir, que coinciden tanto en secuencia nucleotídica como en nombre de anotación en GenBank, comparada con un 34,17% que posee algún tipo de error en su anotación. Dentro de estos errores, encontramos que el más común es la asignación errónea de los nombres de los genes, encontrándose genes anotados como “hypothetical protein” (Figura 8), obteniendo así mayor valor en la información de los genes para la reanotación en las bases de datos.
En otros casos, algunos genes presentaban nombres incompletos o que simplemente hacían una descripción poco detallada del gen, dificultando el hallazgo de éste.
Tabla 3. Total de datos obtenidos en la revisión de las anotaciones.
DATOS
Genomas 135
Genomas con anotaciones 117
Genomas sin anotaciones 18
Factores de virulencia 87
Genes bien anotados 5.986
42 DATOS
Genes mal anotados 3.106
Total de genes (presentes) sin mutaciones y genomas no anotados
9.092
Porcentaje de genes bien anotados (%) 65,83
Porcentaje de genes mal anotados (%) 34,17
Figura 8. Evidencia de errores de anotación en la base de datos NCBI en el formato GenBank.
Fuente: Autor
43
Según algunos autores, el valor de un genoma depende de la exactitud de su anotación (Xavier & Abad, 2011). La anotación manual genera datos con mayor calidad y estructuras de genes más exactas, pero éste es un proceso más lento y requiere expertos con conocimientos bioquímicos y familiarizados con los diversos programas aplicados en genómica; por otro lado, la anotación automática, es más rápida y no requiere un equipo de personas calificado para que realice el proceso de anotación constante. Sin embargo, puede predecir menos genes de los que realmente existen, con resultados más generales no tan exactos y siendo más propensos a errores, teniendo baja calidad en las anotaciones en las diferentes bases de datos (Xavier & Abad, 2011).
La secuenciación genómica masiva está produciendo muchas secuencias de genes que no pueden ser anotadas, y muchas de éstos con funciones desconocidas. Es el caso de genes que codifican proteínas hipotéticas, que se definen como una proteína que existe en un organismo, aunque su existencia no se ha demostrado experimentalmente (Wassarman et al., 2001). Según Park et al. (2012), en el genoma de H. pylori, se han identificado 1600 genes funcionales, sin embargo, algunos de estos genes no están caracterizados porque las secuencias de genes son bastante nuevas, la función de los genes no se ha determinado en ningún otro sistema bacteriano, o la proteína posee una homología de secuencias evidenciando cierta ambigüedad funcional, que a su vez hace que se planteen dudas sobre la función de la proteína producida en H. pylori. Aunque se ha acumulado una gran cantidad de datos biológicos sobre H. pylori, las enzimas o proteínas de función desconocida aún constituyen más de un tercio de los marcos de lectura abiertos (ORF) de esta bacteria (Tomb et al., 1997). Es por esto que, análisis con anotación semi-manual para verificar información de presencia o ausencia de ciertos genes (en este caso, factores de virulencia), proporcionan un reporte minucioso de proteínas que en investigaciones previas reportan como genes hipotéticos o incluso deleciones. Dicho análisis hace que esta información sea inequívoca en las distintas cepas de H. pylori, corrigiendo anotaciones erróneas que generan graves implicaciones en investigaciones aplicadas en bacterias patogénicas, como H. pylori.
5.2. POSICIÓN
44
Nuestros análisis evidencian que la posición de los genes asociados a factores de virulencia ubicados en los distintos genomas de H. pylori, y divididos en 7 grupos funcionales, presentan reorganizaciones en estos genes; sin embargo, en ciertos grupos funcionales los bloques sinténicos son más conservados que en otras (Figura 9). Por ejemplo, las ureasas están codificadas por siete genes denominados ureA, ureB, ureI, ureE, ureF, ureG y ureH (Clayton et al., 1990; Cussac et al., 1992), los cuales en la gran mayoría de genomas presentaban una organización conservada en bloque sinténico similar a la observada en la cepa de referencia Helicobacter pylori 26695 (HpEurope), exceptuando la cepa 2018 (hspWAfrica) que presentaba un gen intermedio entre ureE y ureF, y tras una verificación en la base de datos NCBI pertenece al gen ureF.
De igual forma, la cepa ausabrJ05 (HpSahul) la cual fue la única secuencia registrada con una deleción en el gen ureA pero sin ningún tipo de información que compruebe la mayor o menor patogenicidad por la falta de este gen. Otras de los grupos funcionales que comparten este patrón de organización son los flagelos, las citotoxinas, los antígenos de Lewis, los moduladores inmunes y la zona de plasticidad que siguen manteniendo un patrón de reorganización genética independiente de su ubicación filogeográfica y su fenotipo patogénico.
Nuestros análisis indican que la familia génica más reorganizada son las Adhesinas, las cuales incluyen los genes HpaA, BabA/HopS, BabB/HopT, SabA/HopP, SabB/HopO, alpA/HopC, alpB/HopB, HopZ, HorB (Cover, 2006; Magalhaes & Reis, 2010); que al compararse los genomas entre si no demuestran una evolución conjunta que marque una similaridad entre ellos referente a la posición geográfica o alguna patología asociada a esta bacteria (Figura 9).
45
Figura 9. Patrón comparativo de la reorganización de los factores de virulencia.
Fuente: Autor
46
Al realizar el análisis de sintenia, se puede observar un total de 66 tipos de reorganizaciones genómicas que compartían entre las 135 cepas de H. pylori (Anexo 3) con cepas ancestrales tales como oki673 (hspEAsia) y oki128 (hspEAsia). La filogenia de inversiones generada por el programa GRIMM (Figura 10) para las adhesinas, muestra una división de 3 grupos monofiléticos; a, b y c que comparten una agrupación ancestral similar en cuanto a su organización solo en los genes hopZ, horB, hpaA, sabB y sabA, comparada con las reorganizaciones de la cepa de referencia (Anexo 2). El grupo monofilético a se identifica como el más ancestral y cuya reorganización la poseen cepas de la población hspEAsia, teniendo inversión en los genes hpaA Duplicado y babA con una mayor probabilidad de desarrollar gastritis y úlcera péptica (Figura 10). Por otro lado, los grupos b y c se dividen por la inversión de babA y babB, y a su vez el grupo c se divide en c1 y c2 por la posición en plus/plus del gen sabA en el grupo monofilético c1 (Anexo 2).
Según Oleastro y Ménard (2013), el papel de las adhesinas en el estómago humano como su nombre lo indica, facilita la adherencia y supervivencia exitosa a las superficies de las células epiteliales, permitiendo la colonización y la persistencia de H. pylori. Dicha característica evita que las bacterias sean eliminadas del estómago, principalmente por el recambio de moco y el peristaltismo gástrico; facilitando la evasión del sistema inmune humano y el suministro eficiente de proteínas a la célula gástrica. La bacteria H. pylori es una de las especies bacterianas más diversas debido a su elevada tasa de mutación y un amplio intercambio de material genético, lo que constituye una ventaja valiosa para evadir el sistema inmune del huésped (Suerbaum & Achtman, 1999), lo que conduce a una recombinación libre de genes de H. pylori (Falush et al., 2001), ayudando directamente los procesos de adaptación y virulencia de la bacteria (Odenbreit et al., 2009).
48
Figura 10. Dendrograma de 66 genomas de Helicobacter pylori asociadas a la reorganización en Adhesinas.
Fuente: Autor