stringtranslate.com

cifrado de ADN

El cifrado de ADN es el proceso de ocultar o confundir información genética mediante un método computacional para mejorar la privacidad genética en los procesos de secuenciación de ADN . El genoma humano es complejo y largo, pero es muy posible interpretar información importante e identificable a partir de variabilidades más pequeñas, en lugar de leer el genoma completo. Un genoma humano completo es una cadena de 3.200 millones de nucleótidos de pares de bases , los componentes básicos de la vida, pero entre individuos la variación genética difiere sólo en un 0,5%, un importante 0,5% que explica toda la diversidad humana, la patología de las diferentes enfermedades, y una historia ancestral. [1] Las estrategias emergentes incorporan diferentes métodos, como algoritmos de aleatorización y enfoques criptográficos , para desidentificar la secuencia genética del individuo y, fundamentalmente, aislar solo la información necesaria mientras se protege el resto del genoma de investigaciones innecesarias. La prioridad ahora es determinar qué métodos son sólidos y cómo las políticas deberían garantizar la protección continua de la privacidad genética.

Historia

En 2003, el Instituto Nacional de Investigación del Genoma Humano y sus socios afiliados secuenciaron con éxito el primer genoma humano completo, un proyecto que costó poco menos de 3 mil millones de dólares para completarse. [2] Cuatro años más tarde, James Watson , uno de los codescubridores de la estructura del ADN, pudo secuenciar su genoma por menos de 1,5 millones de dólares. [3] A medida que las tecnologías de secuenciación genética han proliferado, racionalizado y adaptado a medios clínicos, ahora pueden proporcionar una visión increíble de las identidades genéticas individuales a un costo mucho menor, con competidores biotecnológicos compitiendo por el título del genoma de 1.000 dólares . [4] El material genético ahora puede extraerse de la saliva, el cabello, la piel, la sangre u otras fuentes de una persona, secuenciarse, digitalizarse, almacenarse y utilizarse para numerosos fines. Siempre que se digitalizan y almacenan datos, existe la posibilidad de que se produzcan violaciones de la privacidad. [5] Si bien la tecnología moderna de secuenciación del genoma completo ha permitido un acceso y una comprensión sin precedentes del genoma humano , y un entusiasmo por las potencialidades de la medicina personalizada , también ha generado una conversación seria sobre los riesgos éticos y de privacidad que acompañan a este proceso de descubrir la identidad de un individuo. Instrucciones esenciales del ser: su secuencia de ADN.

Investigación

La secuenciación genética es un componente fundamental para producir conocimiento científico sobre los orígenes de las enfermedades, su prevención y el desarrollo de intervenciones terapéuticas significativas. Gran parte de la investigación utiliza muestras de ADN de grupos grandes o conjuntos de datos agregados de todo el genoma para comparar e identificar genes asociados con enfermedades o fenotipos particulares; por lo tanto, existe mucha oposición a restringir el acceso a la base de datos del genoma y mucho apoyo para fortalecer la investigación a gran escala. Por ejemplo, si se aplicara una cláusula de consentimiento informado para todas las investigaciones genéticas, las bases de datos genéticas existentes no podrían reutilizarse para nuevos estudios: todos los conjuntos de datos tendrían que destruirse al final de cada estudio o todos los participantes tendrían que volver a ser utilizados. autorizar permisos con cada nuevo estudio. [1] Como los conjuntos de datos genéticos se pueden extrapolar a miembros de la familia estrechamente relacionados, esto agrega otra dimensión del consentimiento requerido en el proceso de investigación. Esto plantea fundamentalmente la cuestión de si estas restricciones son protecciones de privacidad necesarias o un obstáculo para el progreso científico.

Uso clínico

En medicina, la secuenciación genética no sólo es importante para usos tradicionales, como las pruebas de paternidad, sino también para facilitar el diagnóstico y el tratamiento. La medicina personalizada ha sido anunciada como el futuro de la atención sanitaria, ya que la secuenciación del genoma completo ha brindado la posibilidad de personalizar el tratamiento según la expresión y experiencia individual de la enfermedad. Como la farmacología y el desarrollo de fármacos se basan en estudios de población, los tratamientos actuales están normalizados a estadísticas de poblaciones enteras, lo que podría reducir la eficacia del tratamiento para los individuos, ya que la respuesta de cada persona a una enfermedad y a la terapia farmacológica está exclusivamente ligada a sus predisposiciones genéticas. La secuenciación genética ya ha acelerado el asesoramiento pronóstico en enfermedades monogénicas que requieren un diagnóstico diferencial rápido en la atención neonatal . [6] Sin embargo, la distinción a menudo borrosa entre el uso médico y el uso de investigación puede complicar cómo se maneja la privacidad entre estos dos ámbitos, ya que a menudo requieren diferentes niveles de consentimiento y aprovechan políticas diferentes.

Uso comercial

Incluso en el mercado de consumo, la gente ha acudido en masa a Ancestry.com y 23andMe para descubrir su herencia y dilucidar sus genotipos. Dado que la naturaleza de las transacciones de los consumidores permite que estos modelos electrónicos de envoltura de clics eludan las formas tradicionales de consentimiento en la investigación y la atención médica, es posible que los consumidores no comprendan completamente las implicaciones de digitalizar y almacenar su secuencia genética. Además, las políticas de privacidad corporativas a menudo operan fuera del ámbito de la jurisdicción federal, exponiendo a los consumidores a riesgos informativos, tanto en términos de su privacidad genética como de su perfil de consumidor revelado por ellos mismos, incluidos los antecedentes familiares, el estado de salud, la raza, el origen étnico y las características sociales. redes y mucho más. [7] El simple hecho de tener bases de datos genera riesgos potenciales para la privacidad, ya que el almacenamiento de datos implica inherentemente la posibilidad de violaciones de datos y solicitud gubernamental de conjuntos de datos. 23andMe ya recibió cuatro solicitudes de la Oficina Federal de Investigaciones (FBI) para acceder a conjuntos de datos de consumidores y, aunque esas solicitudes fueron denegadas, esto revela un enigma similar al de la disputa sobre cifrado entre el FBI y Apple . [7]

Uso forense

La información del ADN se puede utilizar para resolver casos penales estableciendo una coincidencia entre un sospechoso conocido de un delito en particular y un sospechoso desconocido de un delito no resuelto. Sin embargo, la información del ADN por sí sola puede dar lugar a errores esperados con cierta probabilidad y no debe utilizarse como prueba totalmente fiable por sí sola. [8]

Política

Como la secuencia genómica de un individuo puede revelar información médica reveladora sobre sí mismo y sus familiares, los defensores de la privacidad creen que deberían existir ciertas protecciones para, en última instancia, proteger la privacidad y la identidad del usuario de una posible discriminación por parte de las compañías de seguros o los empleadores, los principales preocupación expresada. Ha habido casos en los que se ha producido discriminación genética, lo que a menudo revela cómo los no expertos pueden malinterpretar la ciencia. En 1970, a los afroamericanos se les negó cobertura de seguro o se les cobraron primas más altas porque eran conocidos portadores de anemia falciforme, pero como portadores, ellos mismos no tienen ningún problema médico, y esta ventaja de portador en realidad les confiere resistencia contra la malaria. [9] La legitimidad de estas políticas ha sido cuestionada por científicos que condenan esta actitud de determinismo genético , según la cual el genotipo determina totalmente el fenotipo . Los factores ambientales, los patrones de desarrollo diferencial y el campo de la epigenética argumentarían que la expresión genética es mucho más compleja y que los genes no son un diagnóstico, ni un diagnóstico confiable, del futuro médico de un individuo. [10]

Legislaciones incipientes se han manifestado en respuesta al excepcionalismo genético , al mayor escrutinio que se espera de la investigación genómica, como la Ley de No Discriminación de la Información Genética (GINA) de 2008 en los Estados Unidos; sin embargo, en muchos casos, el alcance y la responsabilidad de la legislación formal son bastante inciertos, ya que la ciencia parece avanzar a un ritmo mucho más rápido que la ley, y comités de ética especializados han tenido que llenar este nicho necesario. [1] Gran parte de las críticas se centran en cómo las políticas carecen fundamentalmente de comprensión de las cuestiones técnicas involucradas en la secuenciación del genoma y no abordan cómo, en caso de una violación de datos, el genoma personal de un individuo no puede ser reemplazado, lo que complica aún más la protección de la privacidad. [1] Como la genómica computacional es un campo tan técnico, la traducción del lenguaje experto al lenguaje político es difícil - y mucho menos la traducción al lenguaje profano -, lo que presenta una cierta barrera a la percepción pública sobre las capacidades de las tecnologías actuales de secuenciación genómica que, en última instancia, hace que el discurso sobre proteger la privacidad genética sin impedir el avance científico es aún más difícil de tener.

En todo el mundo, cada país tiene marcos únicos de atención médica e investigación que generan diferentes necesidades políticas; la política de privacidad genética se complica aún más cuando se consideran colaboraciones internacionales en investigación genética o biobancos internacionales, bases de datos que almacenan muestras biológicas e información de ADN. Además, la investigación y la atención sanitaria no son los únicos campos que requieren jurisdicción formal; Otras áreas de preocupación incluyen la privacidad genética de quienes están en el sistema de justicia penal y quienes participan en la secuenciación genómica privada basada en consumidores.

Ciencia forense

Inglaterra y Gales

El 91% de la base de datos de ADN forense más grande del mundo, la Base de Datos de ADN de Inteligencia Criminal Nacional (NDNAD), contiene información de ADN de residentes de Inglaterra y Gales . [8] La NDNAD almacena información genética de personas condenadas penalmente, de aquellos que fueron acusados ​​pero absueltos de un delito registrable, de aquellos que fueron arrestados pero nunca acusados ​​de un delito registrable y de aquellos que están bajo control antiterrorista. De los 5,5 millones de personas que figuran en la base de datos, lo que representa el 10% de la población total, 1,2 millones nunca han sido condenados por ningún delito. [8] El Tribunal Europeo de Derechos Humanos decidió, en el caso S y Marper contra Reino Unido (2008), que el gobierno debe presentar justificación suficiente para el tratamiento diferenciado de los perfiles de ADN de aquellos en el sistema de justicia penal en comparación con los de no personas. -personas condenadas; Básicamente, no debe haber abuso de materiales biológicos ni de información de ADN retenidos. [8] La decisión destacó varios problemas existentes con el sistema actual que plantea riesgos de privacidad para las personas involucradas: el almacenamiento de información personal con información genética, el almacenamiento de perfiles de ADN con la capacidad inherente de determinar relaciones genéticas y, fundamentalmente, el acto del almacenamiento de muestras celulares y perfiles de ADN genera oportunidades de riesgos para la privacidad. Como resultado, se creó la Ley de Protección de las Libertades de 2012 para garantizar el uso adecuado de los materiales de ADN recolectados y regular su almacenamiento y destrucción. [8] Sin embargo, aún persisten muchos problemas, ya que las muestras aún pueden conservarse indefinidamente en las bases de datos, independientemente de si el individuo afectado fue condenado o no, e incluso las muestras de delincuentes juveniles. Los críticos han argumentado que esta retención a largo plazo podría conducir a la estigmatización de las personas afectadas e inhibir su reintegración a la sociedad y, además, están sujetas a un uso indebido por parte de un comportamiento discriminatorio innato al sistema de justicia penal. [8]

Alemania

En 1990, el Tribunal Supremo Federal de Alemania y el Tribunal Constitucional Federal de Alemania decidieron que secciones del Código de Procedimiento Penal alemán proporcionaban una base jurídica justificable para el uso de huellas genéticas para identificar a delincuentes y absolver a inocentes. [8] Sin embargo, las decisiones carecían de detalles específicos sobre cómo se pueden obtener materiales biológicos y cómo se pueden utilizar las huellas genéticas; sólo se describieron explícitamente las regulaciones sobre análisis de sangre y exámenes físicos. En 1998, el Parlamento alemán autorizó el establecimiento de una base de datos nacional de ADN, debido a la creciente presión para prevenir casos de abuso sexual y homicidios que involucraran a niños. [8] Esta decisión fue declarada constitucional y respaldada por un interés público imperioso por el Tribunal Constitucional Federal en 2001, a pesar de algunas críticas de que se había violado el derecho a la autodeterminación informativa. El tribunal ordenó que la información y las muestras de ADN deben estar respaldadas por pruebas de que el individuo puede cometer un delito similar en el futuro. Para abordar la inseguridad jurídica, la Ley sobre Análisis Forense de ADN de 2005 introdujo disposiciones que incluían fundamentos jurídicos exactos y limitados para el uso de información basada en el ADN en procesos penales. [8] Algunas secciones ordenan que las muestras de ADN sólo puedan usarse si son necesarias para acelerar la investigación, eliminar a los sospechosos y un tribunal debe ordenar la toma de huellas genéticas. Desde su implementación, se han agregado mensualmente 8.000 nuevos conjuntos a la base de datos, lo que pone en duda la necesidad de una recopilación de datos a tan gran escala y si la redacción de las disposiciones proporcionaba o no una protección eficaz de la privacidad. [8] Una reciente y controvertida decisión del gobierno alemán amplió el alcance de la búsqueda familiar mediante redes de ADN para identificar parientes genéticos de perpetradores sexuales y violentos, una acción que anteriormente el Tribunal Supremo Federal de Alemania consideró en 2012 como carente de fundamento legal. [ 8]

Corea del Sur

El Servicio Forense Nacional de Corea del Sur y la Fiscalía de Corea del Sur establecieron departamentos separados de análisis de ADN en 1991, a pesar de las críticas públicas iniciales de que la recopilación de datos se llevó a cabo sin considerar la privacidad de la información de los sujetos involucrados, una crítica que se convirtió en apoyo con una serie de casos de alto perfil. [8] En 2006, un proyecto de ley propuesto por la Asamblea General sobre la recopilación y puesta en funcionamiento de información de ADN delineó categorías de delitos para el almacenamiento, el control y la destrucción de muestras de ADN e información de ADN. Sin embargo, el proyecto de ley no fue aprobado porque no podía traducirse en ningún cambio significativo en la práctica real. Las categorías de delitos incompletas incluidas solo eran aplicables en la obtención de información biológica sin el consentimiento de un individuo, y el protocolo para destruir las muestras recolectadas no era claro, exponiéndolas a un uso indebido. [8]

La Ley de Información de ADN de 2009 intentó resolver estas debilidades, incluidas disposiciones que establecían que la información biológicamente sensible sólo puede recopilarse de personas condenadas, sospechosos confinados y escenas del crimen. Las huellas genéticas se permitieron para delitos específicos, incluidos incendios provocados, asesinatos, secuestros, violaciones o abusos sexuales, allanamiento de morada durante la noche para robar, hurto y allanamiento de morada, y muchos otros delitos violentos. [8] La ley también requería una orden escrita para adquirir muestras de delincuentes condenados o sospechosos si las personas interesadas no dan su consentimiento por escrito. Todas las muestras deben destruirse de manera oportuna si la persona en cuestión es declarada inocente, absuelta, se desestima su procesamiento y tras su muerte. [8] Es importante destacar que si las muestras recolectadas se utilizan para determinar las personas en la escena del crimen, la información de ADN debe destruirse tras una identificación exitosa. Sin embargo, esta legislación todavía tiene varios defectos y críticas, en términos de clarificar la presunción de inocencia, la aplicación bastante trivial de la destrucción de muestras (sólo el 2,03% de las muestras se eliminan anualmente) y el requisito de una orden escrita (el 99,6% de las muestras se eliminan anualmente). se obtienen sin orden judicial), y todavía hay mucho debate sobre si esta legislación viola o no el derecho de autodeterminación informativa. [8]

Biobancos

Estados Unidos

En los Estados Unidos, los biobancos están principalmente bajo la jurisdicción de la Regla de Privacidad de la Ley de Responsabilidad y Portabilidad del Seguro Médico (HIPAA) y la Política Federal para la Protección de Sujetos Humanos (Regla Común). Como ninguna de estas reglas fue concebida con la intención de regular los biobancos y los niveles descentralizados de regulación, ha habido muchos desafíos en su aplicación y cumplimiento, y la ley federal no aborda directamente la política internacional y cómo se pueden compartir datos fuera de la UE. -Acuerdo de Puerto Seguro de EE.UU. [11] Un área que necesita aclaración es cómo las leyes federales y estatales se aplican de manera diferencial y específica a diferentes biobancos, investigadores o proyectos, una situación que se complica aún más por el hecho de que la mayoría de los biobancos son parte de entidades más grandes o en colaboración con otras instituciones. , confundiendo la línea intereses públicos y privados. Alrededor del 80% de todos los biobancos tienen juntas de supervisión interna que regulan la recopilación, el uso y la distribución de datos. Hay tres modelos de acceso básicos aplicados a la accesibilidad de las muestras y los datos del biobanco: acceso abierto (sin restricciones para nadie), acceso escalonado (algunas restricciones de acceso dependen de la naturaleza del proyecto) o acceso controlado (acceso estrictamente controlado). [11]

Las disposiciones de la GINA prohíben a las aseguradoras de salud exigir pruebas genéticas o solicitar información genética para fines de inscripción y prohíben a los empleadores solicitar pruebas genéticas o información genética para cualquier tipo de evaluación laboral (contratación, ascenso, despido). Sin embargo, las aseguradoras pueden solicitar información genética para determinar la cobertura de un procedimiento específico. Algunos grupos también están excluidos de seguir las disposiciones de GINA, incluidas las aseguradoras y los empleadores de empleados del gobierno federal, militares y empleadores con menos de 15 empleados. [12]

Porcelana

China tiene una amplia red de hospitales e institutos de investigación. Actualmente está llevando a cabo un plan para crear un marco más cohesivo para el intercambio de datos entre los biobancos existentes, que anteriormente estaba bajo la jurisdicción de leyes regulatorias superpuestas y confusas. Muchos biobancos operan de forma independiente o dentro de una red de otras redes, siendo la más destacada la red de Biobancos de Shanghai. [13] En el marco de esta red principal, las directrices detallan políticas específicas de desidentificación y respaldan explícitamente el consentimiento amplio. Recientemente, la Constitución china ha reconocido formalmente la privacidad individual como un derecho constitucional distinto e independiente y, por lo tanto, los legisladores han comenzado a desarrollar un Proyecto de Ordenanza sobre Recursos Genéticos Humanos para organizar las leyes nacionales sobre medidas de gestión de biobancos, responsabilidad legal y castigo por violaciones. El intercambio internacional de datos estará aún más estrictamente regulado por estas leyes federales. [13]

Australia

Los biobancos en Australia están principalmente sujetos a la regulación de pautas de privacidad de la atención médica y comités de ética de investigación en humanos; no existe una legislación formal sobre biobancos, pero el intercambio internacional de datos está ampliamente permitido. El Consejo Nacional de Investigación Médica y de Salud (NHMRC) desarrolla directrices y financia muchas de estas instituciones. Existe una discusión hacia un amplio consentimiento para los biobancos. [14]

Pruebas genéticas del consumidor

Electronic Frontier Foundation , una defensora de la privacidad, descubrió que la legislación existente no tiene jurisdicción formal para garantizar la privacidad del consumidor en lo que respecta a la información de ADN. La información genética almacenada por las empresas de consumo no está protegida por la HIPAA; por lo tanto, estas empresas pueden compartir información genética con terceros, condiciones sujetas a sus propias declaraciones de privacidad. [7] La ​​mayoría de las empresas de pruebas genéticas solo comparten datos agregados y anónimos con el consentimiento de los usuarios. Ancestry.com y 23andMe venden dichos datos a instituciones de investigación y otras organizaciones, y pueden solicitar un consentimiento caso por caso para divulgar datos no anónimos a otras partes, incluidos empleadores o aseguradoras. 23andMe incluso emite una advertencia de que la reidentificación puede tener lugar y es posible. Si un consumidor rechaza explícitamente el uso de la investigación o solicita que se destruyan sus datos, 23andMe aún puede usar su información de identificación y de comportamiento del consumidor, como patrones de navegación y ubicación geográfica, para otros servicios de marketing. [7]

Áreas de preocupación

Muchos expertos en computación han desarrollado, y están desarrollando, sistemas más seguros de secuenciación genómica para proteger el futuro de este campo de una jurisdicción equivocada, una aplicación incorrecta de datos genéticos y, sobre todo, la privacidad genética de los individuos. Actualmente existen cuatro áreas principales de investigación genética en las que se están desarrollando tecnologías que preservan la privacidad para:

Búsqueda y comparación de cadenas

Las pruebas de paternidad, las pruebas de compatibilidad genética y las pruebas de ascendencia son todos tipos de herramientas médicas que se basan en algoritmos de comparación y búsqueda de cadenas . [1] Simplemente, se trata de un enfoque de "aguja en un pajar", en el que se busca en un conjunto de datos una "cadena" coincidente, la secuencia o patrón de interés. A medida que este tipo de pruebas se han vuelto más comunes y se han adaptado a los modelos genómicos de los consumidores, como las aplicaciones de teléfonos inteligentes o las modernas pruebas de ADN, los métodos actuales de protección de la privacidad se centran en fortalecer este proceso y proteger tanto la atención sanitaria como el uso privado.

Publicación de datos agregados

La era moderna de los macrodatos y las pruebas genómicas a gran escala requiere sistemas de procesamiento que minimicen los riesgos de privacidad al publicar datos genómicos agregados, lo que esencialmente significa garantizar que los datos individuales no puedan discernirse dentro de una base de datos genómica. [1] Este enfoque de privacidad diferencial es una simple evaluación de la seguridad de una base de datos genómica y muchos investigadores proporcionan "verificaciones" sobre la rigurosidad de las infraestructuras existentes.

Alineación de datos genómicos sin procesar.

Uno de los avances más importantes en el campo de la genómica es la capacidad de lectura de mapas, en la que millones de secuencias cortas se pueden alinear con una secuencia de ADN de referencia para procesar grandes conjuntos de datos de manera eficiente. Como este proceso de alta capacidad a menudo se divide entre entornos informáticos públicos y privados, existen muchos riesgos asociados y etapas en las que la privacidad genética es particularmente vulnerable; por lo tanto, los estudios actuales se centran en cómo proporcionar operaciones seguras dentro de dos dominios de datos diferentes sin sacrificar la eficiencia y la precisión. [1]

Uso clínico

Con la llegada de la tecnología genómica de alto rendimiento que permite un acceso sin precedentes a la información genética, la medicina personalizada está ganando impulso como el futuro prometido de la atención sanitaria, haciendo que los modelos de pruebas genómicas seguras sean imprescindibles para el progreso de la medicina. En particular, las preocupaciones expresan cómo este proceso implicará la participación de múltiples partes y el acceso a los datos. [1] La distinción entre secuenciación genética con fines médicos y de investigación es polémica y, además, siempre que la atención médica esté involucrada en una discusión, se debe considerar la dimensión de la privacidad del paciente, ya que puede entrar en conflicto o complementar la privacidad genética.

Métodos de cifrado

Mapeo de lectura segura

El mapeo de lectura sensible es esencial para la investigación genómica, ya que el mapeo de lectura no solo es importante para la secuenciación del ADN, sino también para identificar moléculas reguladoras objetivo en RNA-Seq . Una solución propone dividir el mapeo de lectura en dos tareas en una operación informática híbrida: la coincidencia exacta de lecturas utilizando valores hash con clave se puede realizar en una nube pública y la alineación de lecturas se puede realizar en una nube privada . Como sólo los valores hash con clave están expuestos al escrutinio público, se preserva la privacidad de la secuencia original. [15] Sin embargo, como los procesos de alineación tienden a ser de gran volumen y trabajo intensivo, la mayoría de los esquemas de secuenciación aún requieren funcionalmente operaciones informáticas de terceros, lo que reintroduce riesgos de privacidad en el dominio de la nube pública.

Búsqueda segura de cadenas

Numerosas pruebas de detección genética se basan en la búsqueda de cadenas y se han convertido en algo común en la atención médica; por lo tanto, la privacidad de dichas metodologías ha sido un área importante de desarrollo. Un protocolo oculta la posición y el tamaño de subcadenas parciales, lo que permite que una parte (el investigador o el médico) con el genoma digitalizado y una segunda parte (sujeto de investigación o paciente) con propiedad exclusiva de su marcador de ADN realicen pruebas genéticas seguras. Sólo el investigador o el médico conocen la conclusión del esquema de comparación y búsqueda de cadenas y ninguna de las partes puede acceder a otra información, lo que garantiza la preservación de la privacidad. [dieciséis]

Consulta segura del genoma

La base de la medicina personalizada y la atención médica preventiva es establecer la compatibilidad genética comparando el genoma de un individuo con variaciones conocidas para estimar la susceptibilidad a enfermedades, como el cáncer de mama o la diabetes, evaluar la farmacogenómica y cuestionar las relaciones biológicas entre los individuos. [5] Para las pruebas de riesgo de enfermedades, los estudios han propuesto una técnica de preservación de la privacidad que utiliza cifrado homomórfico y comparación segura de números enteros , y sugiere almacenar y procesar datos confidenciales en forma cifrada. Para garantizar la privacidad, la unidad de almacenamiento y procesamiento (SPU) almacena todos los polimorfismos de un solo nucleótido (SNP) como SNP reales (los SNP observados en el paciente) con contenido redundante del conjunto de SNP potenciales. [17] [18] Otra solución desarrolló tres protocolos para asegurar el cálculo de la distancia de edición utilizando intersecciones del circuito confuso de Yao y un algoritmo de alineación con bandas. El principal inconveniente de esta solución es su incapacidad de realizar cálculos a gran escala manteniendo la precisión. [19]

Estudios seguros de asociación de todo el genoma

Los estudios de asociación de todo el genoma (GWAS) son importantes para localizar variaciones específicas en las secuencias del genoma que conducen a enfermedades. Los algoritmos de preservación de la privacidad que identifican SNP significativamente asociados con enfermedades se basan en la introducción de ruido aleatorio para agregar estadísticas para proteger la privacidad individual. [20] En otro estudio, la naturaleza del desequilibrio de vinculación se utiliza para seleccionar los conjuntos de datos más útiles y al mismo tiempo maximizar la protección de la privacidad del paciente con ruido inyectado; sin embargo, puede carecer de capacidades efectivas de asociación de enfermedades. [21] Los críticos de estos métodos señalan que se requiere una cantidad sustancial de ruido para satisfacer la privacidad diferencial para una pequeña proporción de SNP, lo que resulta poco práctico a la hora de realizar una investigación eficiente. [5]

Almacenamiento cifrado autenticado

La naturaleza de las secuencias genómicas requiere una herramienta de cifrado específica para proteger contra ataques de baja complejidad (contenido repetitivo) y KPA ( ataque de texto plano conocido ), dados varios símbolos esperados. Cryfa [22] utiliza embalaje (que reduce el tamaño de almacenamiento), un mecanismo de reproducción aleatoria (aleatorización de las posiciones de los símbolos) y el cifrado AES ( Estándar de cifrado avanzado ) para almacenar de forma segura archivos FASTA, FASTQ, VCF, SAM y BAM con cifrado autenticado.

Referencias

  1. ^ abcdefgh Ayday E, De Cristofaro E, Hubaux JP, Tsudik G (febrero de 2015). "Secuenciación del genoma completo: ¿medicina revolucionaria o pesadilla de la privacidad?". Computadora . 48 (2): 58–66. doi :10.1109/MC.2015.59. hdl : 11693/22558 . S2CID  2431877.
  2. ^ Guttmacher AE, Collins FS (septiembre de 2003). "Bienvenidos a la era genómica". El diario Nueva Inglaterra de medicina . 349 (10): 996–8. doi : 10.1056/NEJMe038132 . PMID  12954750. S2CID  32233347.
  3. ^ Wadman M (abril de 2008). "El genoma de James Watson secuenciado a alta velocidad". Naturaleza . 452 (7189): 788. Bibcode :2008Natur.452R....W. doi : 10.1038/452788b . PMID  18431822. S2CID  205037214.
  4. ^ Servicio RF (marzo de 2006). "Secuenciación de genes. La carrera por el genoma de 1000 dólares". Ciencia . 311 (5767): 1544–6. doi : 10.1126/ciencia.311.5767.1544. PMID  16543431. S2CID  23411598.
  5. ^ abc Akgün M, Bayrak AO, Ozer B, Sağıroğlu MŞ (agosto de 2015). "Procesamiento de datos genómicos que preserva la privacidad: una encuesta". Revista de Informática Biomédica . 56 (Suplemento C): 103–11. doi : 10.1016/j.jbi.2015.05.022 . PMID  26056074.
  6. ^ Saunders CJ, Miller NA, Soden SE, Dinwiddie DL, Noll A, Alnadi NA, et al. (Octubre 2012). "Secuenciación rápida del genoma completo para el diagnóstico de enfermedades genéticas en unidades de cuidados intensivos neonatales". Medicina traslacional de la ciencia . 4 (154): 154ra135. doi :10.1126/scitranslmed.3004041. PMC 4283791 . PMID  23035047. 
  7. ^ abcd Drabiak K (1 de enero de 2017). "Caveat Emptor: cómo la intersección de Big Data y la genómica del consumidor aumenta exponencialmente los riesgos de privacidad de la información". Health Matrix: Revista de Derecho-Medicina . 27 (1): 143. Vendaval  A495831384.
  8. ^ abcdefghijklmnop Lee J (marzo de 2016). "La presencia y el futuro del uso de la información del ADN y la protección de la privacidad de la información genética: una perspectiva comparada". Revista Internacional de Derecho, Crimen y Justicia . 44 : 212-29. doi :10.1016/j.ijlcj.2015.10.001.
  9. ^ Marrón SM (2003). Fundamentos de la genómica médica. John Wiley e hijos. pag. 219.ISBN 978-0-471-27061-4.
  10. ^ Weinhold B (marzo de 2006). "Epigenética: la ciencia del cambio". Perspectivas de salud ambiental . 114 (3): A160-7. doi :10.1289/ehp.114-a160. PMC 1392256 . PMID  16507447. 
  11. ^ ab Harrell HL, Rothstein MA (marzo de 2016). "Leyes de privacidad e investigación de biobancos en los Estados Unidos". La Revista de Derecho, Medicina y Ética . 44 (1): 106–27. doi :10.1177/1073110516644203. PMID  27256128. S2CID  3670078.
  12. ^ Gammon A, Neklason DW (octubre de 2015). "Confidencialidad y el riesgo de discriminación genética: lo que los cirujanos necesitan saber". Clínicas de Oncología Quirúrgica de América del Norte . 24 (4): 667–81. doi :10.1016/j.soc.2015.06.004. PMC 4568442 . PMID  26363536. 
  13. ^ ab Chen H, Chan B, Joly Y (2015). "Privacidad y biobancos en China: un caso de política en transición". La Revista de Derecho, Medicina y Ética . 43 (4): 726–42. doi :10.1111/jlme.12315. PMID  26711413. S2CID  23026547.
  14. ^ Chalmers D (2015). "Leyes de privacidad y biobancos en Australia". La Revista de Derecho, Medicina y Ética . 43 (4): 703–13. doi :10.1111/jlme.12313. PMID  26711411. S2CID  34539242.
  15. ^ Wang XF. "Mapeo a gran escala para preservar la privacidad de secuencias genómicas humanas en nubes híbridas. | Bienvenido". www.informatics.indiana.edu . Consultado el 3 de noviembre de 2017 .
  16. ^ De Cristofaro E, Faber S, Tsudik G (noviembre de 2013). "Pruebas genómicas seguras con coincidencia de subcadenas privadas que ocultan el tamaño y la posición" . Actas del 12º taller de ACM sobre Taller sobre privacidad en la sociedad electrónica. Nueva York, NY, Estados Unidos. págs. 107-118. doi :10.1145/2517840.2517849.
  17. ^ "Cálculo del riesgo de enfermedades que preserva la privacidad mediante el uso de datos genómicos, clínicos y ambientales | USENIX". www.usenix.org . Consultado el 3 de noviembre de 2017 .
  18. ^ Ayday E, Raisaro JL, Hubaux JP (2012). "Tecnologías de mejora de la privacidad para pruebas médicas que utilizan datos genómicos". {{cite journal}}: Citar diario requiere |journal=( ayuda )
  19. ^ Aziz MM, Alhadidi D, Mohammed N (julio de 2017). "Aproximación segura de la distancia de edición de datos genómicos". Genómica médica BMC . 10 (Suplemento 2): 41. doi : 10.1186/s12920-017-0279-9 . PMC 5547448 . PMID  28786362. 
  20. ^ Johnson A, Shmatikov V (agosto de 2013). "Exploración de datos que preservan la privacidad en estudios de asociación de todo el genoma". Actas de la 19ª conferencia internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos . vol. 2013. págs. 1079-1087. doi :10.1145/2487575.2487687. ISBN 9781450321747. PMC  4681528 . PMID  26691928.
  21. ^ Zhao Y, Wang X, Jiang X, Ohno-Machado L, Tang H (enero de 2015). "Elegir a ciegas pero sabiamente: solicitud diferencialmente privada de conjuntos de datos de ADN para el descubrimiento de marcadores de enfermedades". Revista de la Asociación Estadounidense de Informática Médica . 22 (1): 100–8. doi :10.1136/amiajnl-2014-003043. PMC 4433380 . PMID  25352565. 
  22. ^ Hosseini M, Pratas D, Pinho AJ (enero de 2019). "Cryfa: una herramienta de cifrado segura para datos genómicos". Bioinformática . 35 (1): 146-148. doi : 10.1093/bioinformática/bty645. PMC 6298042 . PMID  30020420.