Identificación de los restos del Rey Ricardo III / Nature Communications

octubre 22, 2020

ubicaciones de laboratorio

todo el trabajo de ADN que involucra a los parientes modernos se llevó a cabo en la Universidad de Leicester. Los parientes de línea masculina fueron tipeados usando Promega PowerPlex Y23 y para SNPs definiendo los principales haplogrupos y europeos en Leicester con un subconjunto de la tipificación siendo confirmado en la Université Paul Sabatier. Los parientes de línea femenina fueron secuenciados para todo el genoma mitocondrial en la Universidad de Leicester., El ADN fue extraído de dientes y huesos antiguos en la Universidad de York y la Université Paul Sabatier, Toulouse. La preparación de la biblioteca y el enriquecimiento de los objetivos se llevaron a cabo en la Universidad de York. La secuenciación de 100 bp de un solo extremo utilizando un HiSeq 2000 (Illumina, CA, EE.UU.) Se realizó en el Centro de secuenciación de Copenhague. La secuenciación dirigida del ADN moderno y antiguo también se llevó a cabo en la plataforma técnica genómica PlaGe (Genopole, Toulouse, Francia) y en el laboratorio de Química de ácidos nucleicos de proteínas de la Universidad de Leicester. A continuación proporcionamos una versión condensada de los métodos utilizados., Para cada paso, la información completa se puede encontrar en los métodos complementarios. Los detalles que rodean la extensa investigación genealógica llevada a cabo para este proyecto se pueden encontrar en la nota complementaria 2.

recolección de muestras

El ADN fue extraído de muestras de saliva de los familiares modernos de Ricardo III y todos los participantes fueron reclutados con consentimiento informado después de la revisión del proyecto por el Comité de Ética de Investigación de la Universidad de Leicester.

se excavó el esqueleto 1 y se tomaron muestras en condiciones de limpieza37., Todos los involucrados en la excavación en el sitio de Grey Friars, el laboratorio limpio en Leicester y los involucrados en los laboratorios y trabajos de laboratorio tenían sus mitocondriales y, para los hombres, cromosomas y tipeados. El ADN se extrajo de muestras de saliva y todos los participantes fueron reclutados con consentimiento informado.

extracción de ADN de muestras antiguas

El ADN se extrajo de muestras de dientes y hueso (fémur). Todos los procedimientos se realizaron en laboratorios dedicados de ADN antiguo en la Universidad de York y la Université Paul Sabatier, Toulouse, con las precauciones de contaminación apropiadas en su lugar., Se incluyeron dos espacios en blanco de extracción y se trataron exactamente como si fueran extractos durante todo el proceso. PCRs y experimentos de biblioteca también incluyeron más controles en blanco.

Sex-typing assay performed on Skeleton 1

A newly designed Sex-typing assay comprising of PCR primers for co-amplification of the Sry fragment with UTX and UTY homologous regions was used. Este ensayo se diseñó para permitir que fragmentos de tamaño relativamente pequeño de SRY, UTX y UTY se amplificaran conjuntamente a partir de muestras que probablemente contengan DNA10 degradado.,

el análisis de la región de control mitocondrial del esqueleto 1

El análisis de los segmentos hipervariables (HV1, HV2 y HV3) de la región de control del ADNmt se llevó a cabo mediante la amplificación y secuenciación directa de múltiples fragmentos superpuestos que oscilaban entre 153 y 250 pb en tamaño (http://forensic.yonsei.ac.kr/protocol/mtDNA-midi-mini.pdf) 22. Se utilizó una selección de amplicones para clonar los productos de PCR en el laboratorio de Toulouse. La secuenciación se realizó utilizando el Big-Dye Terminator V3.,1 kit de secuenciación de ciclo (Applied Biosystems) y por electroforesis capilar en un analizador genético ABI Prism 3730 (Applied Biosystems) en el laboratorio de Química de ácidos nucleicos de proteínas de la Universidad de Leicester o en la plataforma técnica genómica PlaGe (Genopole).

las bibliotecas del genoma mitocondrial/y-SNP/HIrisplex del esqueleto 1

fueron construidas siguiendo a Meyer y Kircher16, con la excepción de que el primer paso de filtración entre la reparación del extremo romo y la ligadura del adaptador fue sustituido por inactivación térmica de las enzimas38,39., Se diseñaron dos microarrays, uno para el enriquecimiento del ADNmt y otro para el enriquecimiento del SNP nuclear. El enriquecimiento del ADN se realizó mediante captura de hibridación utilizando el microarray DNA Sureselect de Agilent 244k (Agilent, Böblingen, Alemania). Para la captura nuclear, se diseñaron sondas del cromosoma Y para cubrir los SNP relevantes para las principales líneas Europeas14. Se diseñaron sondas adicionales para cubrir los SNPs relevantes para los marcadores HIrisplex31. Estos dos conjuntos de sondas (mitocondrial y SNPs) se utilizaron por separado para llenar los dos diseños de microarrays diferentes de un formato 1 × 244K., Para cada microarray, el protocolo de captura se realizó siguiendo a Hodges et al.15 con las modificaciones propuestas por Zhang et al.40 y Fortes y Paijmans38. Las bibliotecas se agruparon en cantidades equimolares y se secuenciaron en dos carriles de la plataforma Illumina HiSeq 2000 en modo 100 SE en las instalaciones de secuenciación de la Universidad de Copenhague, Dinamarca.

Las lecturas en bruto de cada biblioteca se ordenaron en función del índice de seis nucleótidos utilizado durante la preparación de la biblioteca. Solo se seleccionaron lecturas con un 100% de coincidencia con el índice para análisis posteriores., Lecturas más cortas que 25 nucleótidos fueron descartadas de análisis posteriores. Las lecturas recortadas fueron mapeadas a autosomas y cromosomas sexuales del genoma humano de referencia build 37 (GRCh37)y al rCRS (NC_012920.1) usando bwa 0.7.5 a-R405 (ref. 41). En cada alineación, los archivos BAM de salida se fusionaron utilizando SAMtools 0.1.19 (ref. 41) y los duplicados de PCR fueron eliminados posteriormente. Las lecturas asignadas se filtraron en función de una calidad de asignación >29 y su alineación a posiciones únicas a lo largo de la secuencia de referencia.,

se identificaron posiciones polimórficas utilizando SAMtools (SAMtools 0.1.19) y bcftools. Por último, vcfutils.pl se utilizó para filtrar la lista de variantes según un genotipo a escala Phred calidad de probabilidad posterior > 20 y una profundidad de lectura superior a 10. Para evitar errores de llamada debido al patrón de desaminación de moléculas de ADN antiguas, todas las posiciones polimórficas reportadas en el archivo de salida de vcf fueron verificadas a ojo., En el caso del genoma mitocondrial, el ensamblaje a la referencia se visualizó en Tablet42, mientras que la alineación de las lecturas que contienen los SNPs a los cromosomas de referencia se visualizó mediante IGV43.

tipificación de SNP por PCR

El enfoque de captura arrojó una cobertura insuficiente para todos los SNP de HIrisPlex y cromosoma Y, por lo tanto, se diseñaron cebadores para generar amplicones que contienen estos SNP, así como dos SNP, que definen aún más el haplogrupo G del cromosoma Y: M285 (G1) y P287 (G2) (ref. 14). Estos fueron amplificados como parte de reacciones multiplex después de Römpler et al.,44 o reacciones singleplex (usando 40 ciclos y sin amplificación secundaria) y secuenciadas en el Ion Torrent después de la preparación de la biblioteca utilizando Ion PGM 200 Xpress Template Kit y PGM 200 Sequencing Kit. Para aumentar la cobertura, se realizó PCR singleplex y secuenciación de un marcador (rs28777) según Binladen et al.45

la tipificación del haplogrupo G definiendo SNPs (M201, M285 y P287) se repitió en Toulouse utilizando PCR singleplex. La secuenciación de estos productos de PCR se realizó utilizando Big-Dye Terminator V3.,1 kit de secuenciación de ciclo (Applied Biosystems) analizado por electroforesis capilar en un analizador genético ABI Prism 3730 (Applied Biosystems) en la plataforma técnica genómica PlaGe (Genopole).

análisis de haplotipos cromosómicos y

Los haplotipos cromosómicos y de muestras antiguas y modernas se obtuvieron utilizando el sistema PowerPlex Y23 (Promega) y se analizaron mediante electroforesis capilar en un analizador genético ABI Prism 3730 (Applied Biosystems) en la plataforma técnica genómica PlaGe (Genopole) y en un analizador genético ABI Prism 3130xl (Applied Biosystems) en la Universidad de Leicester., Para el esqueleto 1, Esto se llevó a cabo en tres extractos separados (RM2, LM1 y LM3) en dos laboratorios diferentes de ADN antiguo (York y Toulouse). Para los parientes modernos, esto se llevó a cabo en dos extractos diferentes en dos laboratorios modernos diferentes (Leicester y Toulouse).

análisis SNP cromosómico-Y de muestras modernas

después de la determinación del haplotipo y para las muestras de línea masculina moderna, el haplogrupo predictivo se determinó utilizando el predictor de haplogrupo de Whit Athey (http://www.hprg.com/hapest5/hapest5a/hapest5.htm?order=num)., Los marcadores binarios que cubrían estos y linajes relacionados se tipificaron en dos múltiplexes mediante el procedimiento de Minisecuenciación de instantáneas (Applied Biosystems) y un analizador genético ABI3130xl (Applied Biosystems) seguido de confirmación mediante secuenciación de Sanger. Somerset 3 se determinó que era derivado de Hg I (M170+ M223−, M253−)14, confirmado posteriormente por el laboratorio de Toulouse. Se determinó que los Somersets 1,2,4 y 5 se derivaban para R1b-U152. Somersets 1,2,4 y 5 fueron probados para SNPs subdividiendo este clade13 (Z56, M126, Z36, Z192, M160 y L2) utilizando secuenciación Sanger en ambos laboratorios.,

análisis moderno de ADNmt

ambas muestras se replicaron dos veces.

se tomaron muestras utilizando kits de recolección de ADN de Oragene (DNA Genotek) y se extrajo ADN utilizando dos métodos diferentes: el Protocolo de sangre y fluidos corporales Qiacube (200 µl con 200 µl de elución) y el protocolo de Oragene. Para analizar la región de control, Las muestras se secuenciaron dos veces en la dirección hacia adelante y hacia atrás utilizando dos conjuntos de imprimación superpuestos (15973-296 y 16524-614) utilizando Big-Dye Terminator V 3.1 (Applied Biosystems). No se encontraron diferencias entre réplicas ni entre muestras.,

Las muestras fueron amplificadas para el genoma mitocondrial completo de ambas extracciones siguiendo a Meyer et al.Se secuenciaron 26 amplicones PCR en un secuenciador Ion Torrent PGM en un Chip Ion314. Las bibliotecas se prepararon utilizando el kit de preparación de la Biblioteca de fragmentos Ion Xpress Plus gDNA, mientras que la preparación de la plantilla y la secuenciación se llevaron a cabo utilizando el kit de plantillas Ion PGM 200 Xpress y el kit de secuenciación Ion PGM 200, respectivamente. Las lecturas Raw se asignaron de nuevo a los rCRS (NC_012920.1) utilizando el software TMAP incluido en el plugin de alineación de iones 3.2.1 (software Torrent Suite 3.2.,1) en el servidor Ion Torrent. La eliminación de lecturas duplicadas y la llamada de variantes se realizaron utilizando SAMtools 0.1.19 (ref. 41) y la realineación local se llevó a cabo con el kit de herramientas de análisis Genómico46. Los sitios variantes se filtraron para la calidad de Base 20, la calidad de mapeo 50 y la profundidad de cobertura 30, después de lo cual se conservaron 33 sitios polimórficos. Todos estos sitios han sido revisados y confirmados manualmente por Sanger secuenciando en ambas direcciones y replicados dos veces.,

control y cuantificación de la contaminación

la contaminación moderna de ADN de los restos antiguos se controló mediante los siguientes métodos:

1
La excavación se llevó a cabo en condiciones limpias (ver Métodos suplementarios)
2
Las muestras se almacenaron en laboratorios limpios y el trabajo de ADN antiguo se llevó a cabo solo en instalaciones dedicadas al ADN antiguo.
3
muestras antiguas separadas se procesaron en laboratorios separados para replicar los resultados.,
4
Todos los miembros del laboratorio y participantes de la excavación tuvieron su ADNmt tipado y la tipificación del cromosoma Y se llevó a cabo en todos los hombres involucrados. Ninguno tenía un ADNmt coincidente o un tipo de cromosoma Y.

como evidencia contra la contaminación significativa, el análisis de ADN del esqueleto 1 muestra una coincidencia perfecta de ADNmt con ML1 y una diferencia de una sola base con ML2. También muestra un claro haplotipo Y-STR, que se ha replicado utilizando una serie de extractos generados y probados en dos laboratorios separados., Finalmente, un examen (ver Métodos suplementarios) del patrón de sustitución en nuestras lecturas también apoya esto.

análisis estadístico

tomando un enfoque conservador en cada paso, calculamos una probabilidad para cada elemento de evidencia observada bajo cada una de dos hipótesis opuestas: hipótesis 1 (H1): esqueleto 1 es Ricardo III, e hipótesis 2 (H2): esqueleto 1 no es Ricardo III.,

como era razonable suponer que todas las diferentes líneas de evidencia eran independientes, la probabilidad conjunta de todas las pruebas se obtuvo mediante la multiplicación de las probabilidades individuales bajo cada hipótesis. El peso de la evidencia para H1, llamado el cociente de verosimilitud (LR), fue entonces dado por el cociente de la verosimilitud bajo H1 A LA bajo H2. Decimos que una suposición es ‘conservadora’ si reduce la LR.

el LR se puede convertir en una probabilidad de que H1 sea verdadero, dada una probabilidad previa., Tomamos como punto de partida el momento en que el esqueleto 1 fue observado y reconocido por primera vez como un esqueleto humano, pero antes de que se realizaran las evaluaciones de edad, sexo, estado de salud y causa de muerte. En ese momento, había evidencia sustancial de que un esqueleto encontrado en lo que se cree que fue la ubicación del coro de los Frailes grises de Leicester podría ser el de Ricardo III. toda la información disponible en el momento en que se desenterró el esqueleto 1, incluida su ubicación precisa y la naturaleza de la tumba, se consideró para este análisis como información de fondo que puede informar la probabilidad previa., Sobre la base de esa información, creemos que un observador escéptico no podría razonablemente haber asignado una probabilidad previa inferior a 1 de cada 40. Este valor fue propuesto en un análisis previo (http://rationalgareth.com/), basado en lo que consideramos evaluaciones escépticas. La probabilidad más alta que podría justificarse por la evidencia anterior podría ser 1 en 2.

hemos utilizado datos relevantes y disponibles siempre que ha sido posible. Inevitablemente se requieren juicios subjetivos, por ejemplo, las poblaciones de referencia relevantes y sobre las probabilidades de error en los hechos reportados., En la medida de lo posible y razonable, nos esforzamos por ser conservadores en nuestro enfoque, por ejemplo, utilizando un método de pseudocount para sesgar el LR hacia un valor neutro de 1, tendiendo así a evitar grandes valores espurios de bajas frecuencias observadas. Los detalles de los datos y métodos utilizados en el análisis estadístico de los datos de radiocarbono, edad y sexo del esqueleto, presencia de escoliosis, presencia de heridas perimortem, cromosoma Y y datos de frecuencia de ADNmt se pueden encontrar en los métodos suplementarios. Para resumir los resultados: los datos de radiocarbono arrojaron una razón de verosimilitud de 1.,84 que representa un apoyo limitado para H1. Los datos de edad y sexo arrojaron una ración de probabilidad de 5,25, lo que nuevamente representa un apoyo limitado para H1. La presencia de un hombro más alto que el otro, reportado durante la vida de Richard, podría atribuirse a la escoliosis (esqueleto 1 tenía escoliosis idiopática severa de inicio adolescente) o a otras dos condiciones conocidas, la parálisis de Erb y la deformidad de Sprengel, las cuales son muy raras. Bajo H1, las tasas anteriores dan una probabilidad estimada de 0.,90 de observar escoliosis dada la descripción de la apariencia física de Ricardo III (=La tasa de escoliosis dividida por la suma de las tres tasas), que multiplicamos por 0.95 para permitir la posibilidad de que la descripción registrada fuera incorrecta. Esto llevó a un LR de 212, proporcionando un apoyo moderadamente fuerte para H1. La presencia de lesiones perimortem dio un LR de 42, y por lo tanto soporte moderado para H1. El cromosoma Y del esqueleto 1 no coincidía con el de los parientes patrilineales de Ricardo III determinados genealógicamente., Esto podría explicarse por un evento de paternidad falsa en uno o más de los 19 supuestos vínculos padre–hijo entre Ricardo III y Enrique Somerset, quinto Duque de Beaufort. Los resultados del cromosoma Y también indican otro evento de paternidad falsa entre Henry Somerset y sus cinco descendientes patrilineales contemporáneos. Para ser conservadores, seleccionamos una tasa de paternidad falsa publicada que era (1) más baja que cualquier otra tasa publicada que consideráramos 17,47 y (2) basada en datos genealogales18., A esto añadimos el evento de paternidad falsa en los 19 vínculos putativos padre-hijo entre Henry Somerset y cinco Somersets masculinos contemporáneos. Esto da una probabilidad de al menos un evento de paternidad falsa en los 19 vínculos putativos padre–hijo entre Ricardo III y Henry Somerset de 0.16. Dado que un evento de paternidad falsa debe haber ocurrido bajo H1, la frecuencia poblacional del haplotipo y del esqueleto 1 es la misma bajo H1 y H2 y se cancela en el cálculo de LR. Por lo tanto, el LR es 0,16, lo que representa una Evidencia limitada contra H1.,

Las secuencias de ADNmt del esqueleto 1 y el presunto pariente matrilineal de 19 meiosis de Ricardo III, Michael Ibsen, coincidieron completamente. Un pariente de 21 meiosis también coincidió excepto en una base (8994). Esta última observación es igualmente probable bajo H1 y H2 dada la secuencia observada de Michael Ibsen, y por lo tanto se cancela en el LR. Por lo tanto, solo necesitamos probabilidades para la observación de la secuencia compartida por Michael Ibsen y esqueleto 1.

para obtener la probabilidad bajo H1, se requiere la tasa de mutación del ADNmt, y en este caso las estimaciones altas son conservadoras. Parsons et al.,28 reportan 10 mutaciones en la región de control en 327 generaciones usando datos genealógicos. Debido a que esto sugiere una tasa más alta que otras estimaciones publicadas, y se basa en datos genealógicos, lo usamos para derivar una probabilidad de 0.52 para ninguna mutación en 19 meiosis.

para la probabilidad bajo H2, se requiere la fracción poblacional del haplotipo esqueleto 1. Aunque obtuvimos la secuencia completa del genoma del ADNmt del esqueleto 1, identificamos pocos datos de comparación del genoma completo publicados en Inglaterra., Así, para el análisis estadístico, utilizamos solamente las regiones de control del ADNmt entre las posiciones 16.093 y 16.320 y entre 00073 y 00188, para lo cual obtuvimos datos de comparación adecuados en inglés a partir de una actualización de Röhl et al.30, complementado con secuencias de ADNmt suministradas por Roots for Real (Genetic Ancestor Ltd., Clare, Suffolk, UK). Usar solo estas secciones cortas de la región de control bajo H2 es conservador, ya que la fracción de población de las secuencias de la región de control observada no puede ser menor que la del genoma completo del ADNmt., La población de referencia relevante tiene más de 500 años en el pasado, pero debido al gran tamaño de la población durante el período considerado, esperamos que las frecuencias de población hayan cambiado poco en los últimos cinco siglos. Encontramos que la frecuencia del haplotipo esqueleto 1 es 0 entre 1823 en la base de datos, a lo que agregamos la única instancia observada en Michael Ibsen. Este enfoque es, de nuevo, conservador, ya que Michael fue muestreado debido a su conocida relación genealógica con Ricardo III. esto conduce a una LR de 478 que representa evidencia moderadamente fuerte para H1.,

también observamos que no hubo coincidencias en una base de datos de 26.127 Haplotipos de la región de control mitocondrial Europea (www.empop.org) 29. no nos basamos en esta base de datos porque es Europea en lugar de específica de Inglaterra y debido a problemas de comprobación, pero sugiere que el haplotipo esqueleto 1 puede ser mucho más raro de lo que se puede inferir de nuestra base de datos inglesa más pequeña. También observamos que es probable que la movilidad femenina entre la nobleza europea haya sido mucho mayor que la de la población en general, debido a las prácticas matrimoniales relacionadas con la formación de alianzas políticas., Tales prácticas proporcionarían cierta justificación para usar la base de datos europea de ADNmt, y por lo tanto para considerar que el haplotipo encontrado en el esqueleto 1 y Michael Ibsen es extremadamente raro. En la tabla complementaria 10, mostramos algunos resultados ilustrativos utilizando la base de datos Europea para demostrar las implicaciones de establecer que el haplotipo esqueleto 1 es tan raro como lo sugiere esa base de datos.

Las RL para diferentes combinaciones de la evidencia, y dos probabilidades posteriores, se muestran en la tabla suplementaria 10., Usando toda la evidencia, el soporte para H1 es extremadamente fuerte con una LR de 6.7 millones, por lo que nuestro escéptico sería llevado a la conclusión de que la probabilidad de que el esqueleto 1 no sea Ricardo III es menor que 1 en 100,000, mientras que para aquellos que toman una posición inicial de 1 en 2 esa probabilidad es mucho menor que 1 en un millón. Teniendo en cuenta los supuestos conservadores que subyacen a nuestro cálculo descrito anteriormente, consideramos que esto establece la verdad de H1 más allá de toda duda razonable.

identificación de los restos del Rey Ricardo III