BLOG PARA APOYAR LA TEMATICA DE LA CIENCIA CONTEMPORANEA Y QUE LOS ALUMNOS DEL QUINTO SEMESTRE DESARROLLEN SUS COMENTARIOS Y OTRAS TAREAS INERENTES PARA EL DESARROLLO DE SUS COMPETENCIAS.
EPO 23 J.C.R.S
Desde los inicios del Proyecto Genoma Humano, allá por el año 1990,
todo parecía indicar que la respuesta a una de las preguntas más
relevantes de la Genética, la de cuántos genes tiene el genoma humano, estaba cerca.
Las primeras estimaciones previas a la secuenciación del genoma
humano calculaban que había unos 100.000 genes. Sin embargo, para
sorpresa de muchos, el Proyecto Genoma Humano reveló que el
número de genes que codifican para proteínas era sustancialmente menor
de lo esperado: entre 30.000 y 35.000 genes. Desde aquel
primer borrador del genoma, publicado en 2001, el número de genes se ha
ido reduciendo poco a poco y hace no tanto se hablaba de 19.000 genes codificantes para proteínas. Pero lo que es cierto es que todavía no hay un número oficial definitivo.
La última estimación del número de genes de nuestro genoma, llevada a
cabo por un equipo de investigadores de la Universidad Johns Hopkins de
EE.UU., habla de 21.306 genes codificantes de proteínas. En este caso
los investigadores, dirigidos por Steven Salzberg, utilizaron la
información depositada en bases de datos del proyecto GTEx,
correspondiente a la secuenciación de ARN de más de 31 tejidos humanos y
a partir de diferentes aproximaciones bioinformáticas (como la
comparación con otras especies o la validación a partir de datos de
espectrometría de masas) estimaron que existen 21.306 genes codificantes
para proteínas y 21.856 genes no codificantes.
Frente a estas estimaciones, la última versión de GENCODE,
la base de datos del EBI (instituto Europeo de Bioinformática),
considera un total de 19.901 genes codificantes y 23.348 genes de ARN no
codificante y la base de datos SeqRef,
dirigida por el Centro Nacional de Información Biotecnológica de EE.UU.
estima 20.433 genes codificantes y 17.835 genes de ARN no codificante.
Los resultados del equipo de Salzberg no han convencido a toda la
comunidad científica. Adam Frankish, bioinformático en el EBI y el Wellcome Sanger Institute
e investigador principal en GENCODE, consorcio destinado a inventariar
todos los genes y variantes de nuestro genoma, ha manifestado a la
revista Nature
que su grupo ha analizado 100 de los genes codificantes identificados
por Salzberg y únicamente uno presenta evidencias de codificar realmente
para una proteína. Nature también informa sobre las
reticencias de Kim Pruitt, investigador en el NCBI y antiguo responsable
de RefSeq, quien señala que las diferencias entre los resultados de
Salzberg y los mostrados en las bases de datos se deben a la metodología
utilizada por los investigadores de la Universidad Johns Hopkins y al
hecho de que el equipo no revisara manualmente los resultados obtenidos
mediante herramientas bioinformáticas.
La identificación de genes puede verse afectada por los métodos bioinformáticos o las bases de datos que se utilizan.¿Por qué no todavía no se sabe el número exacto de genes de nuestro genoma? ¿Qué dificultad tiene identificar un gen? El primer problema a la hora de identificar los genes del genoma es precisamente definir qué son los genes.
Inicialmente sólo se consideraban genes a aquellas secuencias del
genoma que se transcribían a ARN y posteriormente eran traducidas a
proteínas. Sin embargo, este concepto de gen ha ido ampliándose a
considerar como tales a aquellas moléculas de ADN que se transcriben a
ARNs que llevan a cabo una función biológica, independientemente de que
esta sea esencial o no. Dentro de estos genes se encuentran los genes
que codifican para los ARNs ribosómicos o de transferencia y los
denominados genes de ARN no codificante.
Otra de las dificultades a la hora de identificar los genes es que no
todo aquel DNA que se transcribe a ARN tiene por qué ser un gen, por lo
que detectar moléculas de ARN no siempre garantiza que se trate de
genes.
Además, la identificación de genes puede verse afectada por los
métodos bioinformáticos o las bases de datos que se utilizan. Por
ejemplo, se suele combinar la predicción de genes a partir de secuencias
características del ADN, como las de los promotores o los codones de
inicio o parada, con la información de transcritos de ARN, secuencias de
proteínas… Así, la utilización de diferentes bases de datos para
proporcionar información sobre estos elementos que caracterizan a los
genes, o de distintos algoritmos para llevar a cabo las predicciones,
puede llevar a resultados variables entre diferentes grupos de
investigación.
El equipo de Salzberg defiende sus resultados frente a las críticas
de otros investigadores, aunque reconoce la necesidad de validar los
genes identificados para confirmar que realmente lo son. En definitiva,
el número exacto de genes del genoma humano sigue siendo una incógnita
para la cual quizá haya que esperar un poco más. Referencia:
Pertea M, et al. Thousands of large-scale RNA sequencing experiments
yield a comprehensive new human gene list and reveal extensive
transcriptional noise. Biorxiv. 2018. Doi: https://doi.org/10.1101/332825 Fuentes:
Willyard C. New human gene tally reignites debate. Nature. 2018. Doi: http://dx.doi.org/10.1038/d41586-018-05462-w
GENCODE: https://www.gencodegenes.org/stats/current.html
Biólogo, UBA. Doctor en Química, Fundación
Campomar. Galardonado con los premios Konex de Platino en biología
molecular y de Brillante como científico más destacado de la década
2003-2013.
Introducción. Todos
los organismos vivos estamos compuestos por células. La información
genética está contenida en el ADN (ácido desoxirribonucleico). Esta
sustancia química es el componente principal de los cromosomas del
núcleo de las células. Las células del cuerpo humano tienen 46
cromosomas, en realidad, 23 pares. De cada par, uno de los cromosomas
proviene del padre y el otro de la madre, y se dice que los dos
cromosomas de cada par son homólogos entre sí. La molécula de ADN está formada por la repetición de unidades químicas menores llamadas bases.
Hay cuatro bases identificadas por las letras A, T, C y G, por
adenina, timina, citosina y guanina, respectivamente. Dos hebras de ADN
se aparean para formar la estructura en doble hélice descubierta por
Watson y Crick en 1953. Las bases de cada hebra se enfrentan o aparean
con las bases de la otra, siguiendo siempre la misma regla: frente a A sólo se ubica T y frente a C sólo se ubica G. Se dice que dos hebras que se aparean según estas reglas son complementarias. Así, una hebra de secuencia TGAATTGCCGCCCGATAT tendrá como complementaria una hebra de secuencia ACTTAACGGCGGGCTATA.
La complementariedad de bases permite que el ADN se duplique fielmente.
Para esto primero se separan las dos hebras y cada una de ellas sirve
de molde para fabricar, por medio de enzimas de la célula, otra
complementaria y así tener dos dobles hélices idénticas a la original,
es decir, con la misma secuencia, la misma información. Una vez
duplicada, la información se transmite equitativamente de una célula
madre a sus dos células hijas a través de la mitosis, o división
celular. Otro tipo de división celular, llamada meiosis, ocurre en las
células madres de las gametas (espermatozoides en el hombre y óvulos en
la mujer). En la meiosis, se reduce a la mitad el número de cromosomas.
En los humanos, al igual que en la mayoría de los mamíferos, la
información genética contenida en los 23 cromosomas de una gameta
(célula haploide) tiene aproximadamente 3.300 millones de bases de
longitud. Al poseer 46 cromosomas, el resto de las células (llamadas
diploides) tiene el doble. Cuando decimos que se ha “secuenciado” el
genoma humano, lo que queremos decir es que se ha determinado
experimentalmente cuál es el ordenamiento preciso de esos 3.300 millones
de bases del núcleo de una gameta humana. Todas las células de
un organismo pluricelular, como los humanos, tienen la misma
información genética, porque todas ellas derivan, por mitosis, de una
única célula, el cigoto, que se forma por la fusión del espermatozoide
con el óvulo. Hay excepciones a esta regla: un tipo especial de células
de la sangre, los linfocitos, pierden una pequeña porción de ADN durante
el desarrollo del individuo, como parte de un programa que permite la
adaptabilidad del sistema inmunitario. Genoma y genes. Llamamos genoma al conjunto
de todo el ADN de una célula de una especie y los genes que éste
contiene. En sentido estricto, el genoma humano no sólo comprende al ADN
del núcleo sino también al de las mitocondrias que, aunque sólo tiene
16.000 bases de longitud, es esencial para el funcionamiento celular.
Los genes son segmentos de ADN capaces de ser transcriptos –es decir,
copiados– a una molécula de ARN (ácido ribonucleico) con igual secuencia
que el gen. Los genes no se encuentran yuxtapuestos a lo largo de los
cromosomas, sino más bien esparcidos y separados a grandes distancias
por secuencias de ADN intergénicas. Las regiones intergénicas
constituyen el 70% del genoma, mientras que los genes representan sólo
un 30%. Se estima que el genoma humano tiene unos 20.000 genes. Estos
genes codifican distintos tipos de ARN, entre los que se encuentran los
llamados ARNs mensajeros, que codifican a su vez proteínas. Los otros
ARNs, los que no son mensajeros, reciben el nombre genérico de ARNs no codificantes:
no son intermediarios entre el gen y la proteína sino que cumplen
funciones en sí mismos. Entre éstos están los ARNs ribosomales, de
transferencia, nucleares pequeños, los micro ARNs y las ribozimas. Por
lo tanto, la definición según la cual un gen es el segmento de ADN que
codifica una proteína, no es estrictamente correcta: muchos genes
codifican proteínas, pero no todos. Cada uno de los genes que codifican
proteínas tiene regiones que estarán representadas en el ARN mensajero
maduro intercaladas por otras cuyas secuencias no estarán representadas
allí. Las primeras regiones se llaman exones, en tanto que las segundas son los intrones.
Mientras los intrones no son codificantes, la mayoría de los exones son
las regiones del genoma que codifican proteínas. Estas regiones
constituyen sólo el 1,5% del genoma.
Cada cromosoma tiene muchos genes, y la posición que ocupa cada gen a lo largo del cromosoma se denomina locus (del latín, lugar). Cada gen tiene entonces su copia homóloga en el locus equivalente del otro cromosoma del par. Cada una de las dos copias del gen se llama alelo.
Digamos, entonces, que una célula humana tiene dos alelos para cada
uno de sus 20.000 genes distintos. No todos los genes se expresan (es
decir, se transcriben y se traducen) al mismo tiempo y en el mismo
lugar. En un tejido o tipo celular determinado se expresa un subconjunto
del conjunto de todos los genes. Uno de los puntos clave de la
regulación de la expresión de los genes, es el control de la
transcripción. Este control no sólo se ocupa de “encender” o “apagar”
genes (efecto del todo o nada), sino también de regular la cantidad de
producto (ARN o proteína) de los genes “encendidos”.
Sorprendentemente, el 50% de nuestro genoma está formado por
secuencias repetidas en su mayoría de origen viral. Muchas de estas
secuencias, mayormente localizadas en regiones intergénicas y en
intrones, corresponden a los llamados elementos móviles, o transposones,
segmentos de ADN "saltarines", es decir, que pueden duplicarse e
insertarse en otras regiones dentro del mismo genoma. Splicing. La enzima que transcribe cada gen fabrica un ARN precursor, llamado transcripto primario,
que copia tanto los exones como los intrones. Dentro del núcleo un
sistema enzimático elimina los intrones del transcripto primario y une
sus exones entre sí. Finalmente, el ARN mensajero maduro sin intrones
abandona el núcleo y llega al citoplasma donde el proceso de traducción,
llevado a cabo por los ribosomas, permite fabricar la proteína
correspondiente. Un mismo gen puede dar muchas variantes de proteína. El
mecanismo se conoce como splicing alternativo, y consiste en que durante el splicing
algún exón, por ejemplo, pueda ser alternativamente incluido o excluido
del ARN mensajero maduro. Se estima que podría haber centenares de
miles de proteínas distintas codificadas por los 20.000 genes del genoma
humano. Esto evidencia que el desciframiento del genoma no es
suficiente para entender en su real complejidad el funcionamiento de las
células en el plano molecular y que será necesario acelerar la etapa
del estudio de las proteínas, en lo que se denomina la era posgenómica o
de la proteómica. Por otra parte, como el número de genes humanos no es
significativamente mayor que el de un gusano o el de una mosca, se
estima que la mayor prevalencia del splicing alternativo en los humanos y otros vertebrados explica su mayor complejidad. Genotipo y fenotipo. Al conjunto de la información genética particular de un individuo lo llamamos genotipo. El genotipo es esencialmente la secuencia de ADN. Todo aquello que “vemos” y que no es secuencia de ADN es el fenotipo (del griego, fainein,
visible). El fenotipo es tanto lo macroscópico (forma, anatomía,
fisiología, patología y comportamiento), como lo más pequeño
(histología, bioquímica y estructura molecular). El fenotipo siempre es
el resultado de la interacción de un determinado genotipo con un
determinado ambiente, lo cual se expresa con la fórmula:
FENOTIPO = GENOTIPO + AMBIENTE
Para algunos fenotipos, la influencia del componente genético es
mayoritaria o determinante y, en consecuencia, la ambiental es
virtualmente nula. Un buen ejemplo son las enfermedades hereditarias
como la fibrosis quística, la corea de Huntington y la distrofia
muscular: quien haya heredado el gen de la distrofina mutado padecerá la
enfermedad, no importa en qué ambiente se encuentre. En otros
fenotipos, la influencia del componente ambiental es mayoritaria y la
del genético despreciable. Las enfermedades infecciosas producidas por
contagio son un ejemplo.
Para la mayoría de los rasgos fenotípicos hay tanto un componente
genético como uno ambiental. Muchas veces estamos seguros de la
existencia de ambos pero no conocemos, o incluso sabemos que es difícil
de estimar, la contribución parcial de cada uno. La mayor parte de las
enfermedades no estrictamente hereditarias, como las cardiovasculares,
los cánceres, la hipertensión, el asma, el Alzheimer, el Parkinson y las
autoinmunes como la artritis y el lupus, pueden tener un componente
hereditario, pero sin duda poseen un componente ambiental no
despreciable y, a veces, preponderante. En muchos casos la genética
molecular ha llegado a descubrir genes cuyas mutaciones provocan
predisposición a dichas enfermedades, pero eso no significa que quien
tenga esa mutación padecerá indefectiblemente la enfermedad.
El comportamiento humano también es consecuencia de la interacción
del genotipo con el ambiente. Sin embargo, salvo en unos pocos
trastornos neurológicos hereditarios, no se ha demostrado una influencia
genética específica. La pretendida base genética de fenotipos tan
complejos como la inteligencia, la orientación sexual, la criminalidad,
las capacidades artísticas o deportivas, debe ser tomada con pinzas y
sujeta a riguroso análisis experimental en cada caso particular. De lo
contrario se corre el riesgo de caer en el determinismo genético, que lejos de ser una ley biológica es un instrumento de discriminación y dominación socioeconómica.
El conocimiento del genoma no autoriza a nadie a estigmatizar a las
personas como resultado irreversible de lo que ordenan sus genes. Los
genes nos dicen que podemos hablar, pero no qué idioma; que podemos
amar, pero no a quién; que podemos disfrutar de la música, pero no de
cuál.
Los distintos tipos de inteligencia, las capacidades, los afectos y
nuestros actos son resultados del proceso de culturización, el cual no
está registrado en ningún gen y, en cambio, está fuertemente
influenciado por el ambiente familiar, social y económico en que
vivimos. Lo heredado y lo adquirido. Para referirnos al carácter heredado o adquirido de un rasgo resulta muy importante diferenciar tres conceptos biológicos: congénito, genético y heredable. Congénito
es aquello que le puede ocurrir al embrión o al feto durante la vida
intrauterina, sea o no causado por mutaciones en los genes (es decir, genético) y sean o no esas posibles mutaciones heredadas de alguno de los padres (heredable). Así, un defecto o característica congénita
de un individuo puede provenir de situaciones vividas por la madre
durante el embarazo o simplemente de fenómenos no controlables conocidos
como “ruido” del desarrollo embrionario. En este caso, afectará la vida
de ese individuo pero no se transmitirá a su descendencia.
Una característica genética está causada por alteraciones en los genes, pero no es necesariamente heredable.
Por ejemplo, un tumor de piel tiene origen genético porque está
producido por mutaciones en los genes de alguna célula de la piel. Pero
ese cambio en los genes de esa célula no es transmitido a la
descendencia porque no afecta a las células germinales (óvulos o
espermatozoides). Quiere decir que es genético, pero no es heredable.
Por último, lo heredable, que siempre es genético, es lo
único que podría ser tenido en cuenta para avalar una teoría puramente
determinista. Las alteraciones genéticas se transmiten mediante ciertas
leyes de padres a hijos.
Cuando sin pruebas se atribuyen de comportamiento o capacidades
intelectuales humanas a los genes, y se supone que las variantes de
estos genes están distribuidas en forma asimétrica en distintos grupos
humanos, se terminan postulando hipótesis deterministas como, por
ejemplo, que ciertos grupos tienen un techo intelectual y que no “vale
la pena” invertir dinero en educación para ellos porque están
“genéticamente” limitados. Epigenética. Existen mecanismos de control de la
actividad de los genes que no afectan su información o secuencia de
bases, sino que modifican su encendido y apagado de una forma más o
menos estable.
Entendemos que un gen está encendido cuando se encuentra activa su
transcripción y, en consecuencia, la fabricación de la proteína
correspondiente. Por el contrario, un gen está apagado cuando no está
siendo transcripto.
Un gen puede pasar de estar encendido a apagado y viceversa en
distintos momentos de la vida de una célula, en distintos tipos
celulares del mismo individuo y en respuesta a señales externas. Los
mecanismos de control a los que nos referimos forman parte del terreno
de la epigenética e incluyen el agregado de grupos químicos a
las bases del ADN y/o a los aminoácidos de las histonas. Las histonas
son proteínas que se asocian al ADN de los genes. La asociación entre
ADN e histonas es lo que se conoce como cromatina, y la cromatina es el ingrediente principal de los cromosomas.
Depende de qué grupos químicos sean agregados por ciertas enzimas de
la célula al ADN o a las histonas de un gen dado, para determinar si ese
gen va a estar apagado o encendido. Por ejemplo, si el ADN de un gen
dado está muy metilado, es muy probable que ese gen permanezca apagado.
Lo mismo puede pasar si ciertos aminoácidos de las histonas están
metilados, y lo opuesto si esos mismos aminoácidos están acetilados.
Las modificaciones epigenéticas de un gen dado pueden heredarse de
una célula madre a sus células hijas, de modo que las hijas no sólo
hereden la información del gen (secuencia de bases) sino el estado de
expresión (encendido o apagado) de ese gen. Esto tiene mucha importancia
en garantizar que todas las células de un órgano (p.ej., el hígado) no
sólo tengan la misma información, sino también el mismo patrón de
expresión de sus genes y se encuentren diferenciadas de la misma manera.
La epigenética puede proveer entonces un nivel adicional de
heredabilidad al de la genética. No obstante, frente a la expectativa de
que los fenómenos epigenéticos expliquen un lamarckismo, es decir, una
herencia de caracteres adquiridos fenotípicamente, debemos considerar lo
siguiente:
Los cambios epigenéticos forman parte de los cambios del ambiente.
Si bien se ha corroborado la herencia de cambios epigenéticos de
una célula a sus hijas, en muy pocos casos de plantas y en muchos menos
de animales, se ha podido corroborar herencia transgeneracional.
Cualquier herencia transgeneracional presunta de un cambio
epigenético impone la necesidad de que ese cambio ocurra en las células
madres de las gametas. En este sentido, sería difícil que un cambio
epigenético del ADN de ciertas neuronas del cerebro de un animal, que
determinara un patrón de comportamiento, fuera transmitido a sus hijos,
ya que éste ocurre en células distintas y alejadas de las gametas.
Los cambios suelen revertirse si no persiste el estímulo externo
que los generó. Es por eso que se dice que la epigenética es un tipo de
herencia “blanda” a diferencia de la genética que sería una herencia
“dura”.
Genoma, variabilidad genómica y razas. Podemos definir una especie
como un conjunto de individuos capaces de dar descendencia fértil por
reproducción sexual. Los individuos que pertenecen a una misma especie a
menudo presentan diferencias genéticas. Esto es así porque, aunque para
cada gen el individuo presenta dos alelos –dos variantes del mismo
gen–, el número de alelos de un gen existente en la especie en su
conjunto es generalmente mayor que dos. Un gen puede tener decenas de
alelos diferentes, pero en cada individuo sólo habrá dos de ellos. Una raza
es una subpoblación de individuos de una especie que tiene una alta
homogeneidad genética, es decir que los individuos que la componen
comparten muchos más alelos entre sí que con cualquier otro individuo de
la misma especie, pero de otra raza.
Las comparaciones de secuencias de ADN entre humanos indican que las
grandes diferencias genéticas, de existir, tienen lugar entre individuos
y no entre poblaciones. En términos más sencillos, por ejemplo, una
persona caucásica (blanca) de Europa puede compartir muchas más
variantes alélicas con un asiático o un africano que con otro europeo
del mismo color de piel. Dos negros africanos pueden distar mucho más
genéticamente entre sí que cualquiera de ellos respecto de un blanco.
Esto hace, por ejemplo, que en muchos casos la histocompatibilidad (o
sea, cuán compatibles son sus órganos y tejidos) entre un negro y un
blanco sea mayor que entre dos individuos de la misma “raza” y, como
consecuencia, un negro sea más apto que un blanco para donar un órgano
de trasplante a otro blanco. Estudios moleculares del genetista Svante
Paabo confirman que las razas humanas no existen. El mismo concepto fue
expresado en forma sencilla y elegante por el genetista brasileño Sérgio
Pena: “No es que seamos todos iguales, sino que somos todos igualmente
distintos”.
Una de las fuentes de variabilidad intraespecífica son los cambios de
una base en la misma posición entre distintos individuos. Estos cambios
son llamados SNPs (pronunciado snips), por single nucleotide
polymorphisms. Si bien los SNPs no están uniformemente distribuidos a lo
largo de nuestro genoma, se estima que aparece en promedio un SNP cada
mil bases de secuencia. Esto indica que el genoma de nuestra especie, Homo sapiens,
es altamente homogéneo con una similitud de secuencia del 99,9%. Las
similitud de secuencia entre humanos y chimpancés es de alrededor del
98%. No obstante, hay diferencias, tanto entre humanos entre sí como
entre humanos y chimpancés que no se deben a SNPs sino a variaciones del
número de copias de un dado segmento de ADN dentro del mismo genoma, lo
cual puede elevar las diferencias entre individuos a niveles del 5-6%.
Aún no está claro cómo contribuyen las variaciones en el número de copias al fenotipo de los humanos. Genoma humano patrimonio de la humanidad. El 11 de noviembre de 1997 la UNESCO aprobó unánimemente la Declaración Universal sobre el Genoma Humano y los Derechos Humanos.
Define esta Declaración que el genoma humano es la base de la unidad
fundamentalmente de todos los miembros de la familia humana y del
reconocimiento de su dignidad intrínseca y su diversidad. En sentido
simbólico, el genoma humano es el patrimonio de la humanidad y que cada
individuo tiene derecho al respeto de su dignidad y derechos,
cualesquiera que sean sus características genéticas, respetándose el
carácter único de cada uno y su diversidad.
Bibliografía
CECTE (Comité Nacional de Ética en Ciencia y Tecnología de
Argentina). Informes sobre "Confidencialidad de los datos genéticos",
"Recomendaciones sobre la Resolución “Privacidad genética y no
discriminación” de la UNESCO". Disponible en http://www.cecte.gov.ar/recomendaciones-e-informes/
KORNBLIHTT, A. (2015). La humanidad del genoma. Buenos Aires: Siglo XXI.
PURROY, J. (2001). La era del genoma. Barcelona: Salvat ciencia.