El cribado de dos híbridos (originalmente conocido como sistema de dos híbridos de levadura o Y2H ) es una técnica de biología molecular utilizada para descubrir interacciones proteína-proteína (PPI) [1] e interacciones proteína-ADN [2] [3] mediante la prueba de interacciones físicas (como la unión) entre dos proteínas o una sola proteína y una molécula de ADN , respectivamente.
La premisa detrás de la prueba es la activación de los genes reporteros descendentes mediante la unión de un factor de transcripción a una secuencia activadora ascendente (UAS). Para la detección de dos híbridos, el factor de transcripción se divide en dos fragmentos separados, llamados dominio de unión al ADN (DBD o a menudo también abreviado como BD) y dominio activador (AD). El BD es el dominio responsable de la unión al UAS y el AD es el dominio responsable de la activación de la transcripción . [1] [2] El Y2H es, por lo tanto, un ensayo de complementación de fragmentos de proteína .
La técnica , desarrollada por Stanley Fields y Ok-Kyu Song en 1989, se diseñó originalmente para detectar interacciones proteína-proteína utilizando el activador transcripcional Gal4 de la levadura Saccharomyces cerevisiae . La proteína Gal4 activaba la transcripción de un gen involucrado en la utilización de galactosa, que formaba la base de la selección. [4] Desde entonces, el mismo principio se ha adaptado para describir muchos métodos alternativos, incluidos algunos que detectan interacciones proteína-ADN o interacciones ADN-ADN, así como métodos que utilizan diferentes organismos hospedadores como Escherichia coli o células de mamíferos en lugar de levadura. [3] [5]
La clave de la prueba de dos híbridos es que en la mayoría de los factores de transcripción eucariotas , los dominios de activación y unión son modulares y pueden funcionar cerca uno del otro sin unión directa. [6] Esto significa que, aunque el factor de transcripción se divide en dos fragmentos, aún puede activar la transcripción cuando los dos fragmentos están conectados indirectamente.
El método de detección más común es el ensayo de doble híbrido de levadura. En este método, el investigador sabe dónde se encuentra cada presa en el medio utilizado (placas de agar). En la última década se han examinado millones de interacciones potenciales en varios organismos utilizando sistemas de detección de alto rendimiento (a menudo utilizando robots) y se han detectado y categorizado más de miles de interacciones en bases de datos como BioGRID. [7] [8] Este sistema a menudo utiliza una cepa de levadura modificada genéticamente en la que falta la biosíntesis de ciertos nutrientes (normalmente aminoácidos o ácidos nucleicos ). Cuando se cultiva en medios que carecen de estos nutrientes, la levadura no sobrevive. Se puede hacer que esta cepa de levadura mutante incorpore ADN extraño en forma de plásmidos . En el cribado de doble híbrido de levadura, se introducen simultáneamente plásmidos de cebo y presa separados en la cepa de levadura mutante o se utiliza una estrategia de apareamiento para obtener ambos plásmidos en una célula huésped. [9]
El segundo enfoque de alto rendimiento es el de cribado de bibliotecas. En este método, las células que albergan el cebo y la presa se aparean en un orden aleatorio. Después del apareamiento y la selección de las células supervivientes en un medio selectivo, el científico secuenciará los plásmidos aislados para ver qué presa (secuencia de ADN) está interactuando con el cebo utilizado. Este enfoque tiene una tasa de reproducibilidad menor y tiende a producir una mayor cantidad de falsos positivos en comparación con el enfoque matricial. [9]
Los plásmidos se diseñan para producir un producto proteico en el que el fragmento del dominio de unión al ADN (BD) se fusiona con una proteína, mientras que otro plásmido se diseña para producir un producto proteico en el que el fragmento del dominio de activación (AD) se fusiona con otra proteína. La proteína fusionada al BD puede denominarse proteína cebo y, por lo general, es una proteína conocida que el investigador está utilizando para identificar nuevos socios de unión. La proteína fusionada al AD puede denominarse proteína presa y puede ser una sola proteína conocida o una biblioteca de proteínas conocidas o desconocidas. En este contexto, una biblioteca puede consistir en una colección de secuencias codificantes de proteínas que representan todas las proteínas expresadas en un organismo o tejido en particular, o puede generarse sintetizando secuencias de ADN aleatorias. [3] Independientemente de la fuente, se incorporan posteriormente a la secuencia codificante de proteínas de un plásmido, que luego se transfecta en las células elegidas para el método de detección. [3] Esta técnica, cuando se utiliza una biblioteca, supone que cada célula se transfecta con no más de un único plásmido y que, por lo tanto, cada célula en última instancia no expresa más que un único miembro de la biblioteca de proteínas.
Si las proteínas de cebo y presa interactúan (es decir, se unen), entonces el AD y el BD del factor de transcripción se conectan indirectamente, lo que acerca el AD al sitio de inicio de la transcripción y puede ocurrir la transcripción del gen o los genes reporteros. Si las dos proteínas no interactúan, no hay transcripción del gen reportero. De esta manera, una interacción exitosa entre la proteína fusionada está vinculada a un cambio en el fenotipo celular. [1]
En la siguiente sección se aborda el desafío de separar las células que expresan proteínas que interactúan con sus proteínas de fusión homólogas de aquellas que no lo hacen.
En cualquier estudio, algunos de los dominios proteicos, aquellos bajo investigación, serán variados de acuerdo con los objetivos del estudio mientras que otros dominios, aquellos que no están siendo investigados, serán mantenidos constantes. Por ejemplo, en un estudio de dos híbridos para seleccionar dominios de unión al ADN, el dominio de unión al ADN, BD, será variado mientras que las dos proteínas interactuantes, el cebo y la presa, deben mantenerse constantes para mantener una fuerte unión entre el BD y el AD. Hay una serie de dominios de los cuales elegir el BD, cebo y presa y AD, si estos deben permanecer constantes. En las investigaciones de interacción proteína-proteína, el BD puede ser elegido de cualquiera de muchos dominios de unión al ADN fuertes como Zif268 . [2] Una elección frecuente de dominios cebo y presa son los residuos 263-352 de la levadura Gal11P con una mutación N342V [2] y los residuos 58-97 de la levadura Gal4, [2] respectivamente. Estos dominios se pueden utilizar en técnicas de selección basadas tanto en levaduras como en bacterias y se sabe que se unen fuertemente entre sí. [1] [2]
El AD elegido debe ser capaz de activar la transcripción del gen reportero, utilizando la maquinaria de transcripción propia de la célula. Por lo tanto, la variedad de AD disponibles para su uso en técnicas basadas en levaduras puede no ser adecuada para su uso en sus análogos basados en bacterias. El AD derivado del virus del herpes simple, VP16 y el AD Gal4 de levadura se han utilizado con éxito en levaduras [1], mientras que una parte de la subunidad α de la ARN polimerasa de E. coli se ha utilizado en métodos basados en E. coli . [2] [3]
Si bien los dominios activadores poderosos pueden permitir una mayor sensibilidad hacia interacciones más débiles, por el contrario, un AD más débil puede proporcionar una mayor rigurosidad.
Para realizar un análisis de dos híbridos o una de sus técnicas derivadas, es necesario incorporar a la célula huésped una serie de secuencias genéticas modificadas. Las consideraciones y los métodos utilizados en la construcción y administración de estas secuencias difieren según las necesidades del ensayo y el organismo elegido como base experimental.
Existen dos grandes categorías de bibliotecas híbridas: bibliotecas aleatorias y bibliotecas basadas en ADNc. Una biblioteca de ADNc está constituida por el ADNc producido a través de la transcripción inversa del ARNm recolectado de células específicas de tipos de células. Esta biblioteca se puede ligar en un constructo de modo que se adhiera al BD o AD que se utiliza en el ensayo. [1] Una biblioteca aleatoria utiliza longitudes de ADN de secuencia aleatoria en lugar de estas secciones de ADNc. Existen varios métodos para la producción de estas secuencias aleatorias, incluida la mutagénesis en casete . [2] Independientemente de la fuente de la biblioteca de ADN, se liga en el lugar apropiado en el plásmido/fagémido relevante utilizando las endonucleasas de restricción adecuadas . [2]
Al colocar las proteínas híbridas bajo el control de los promotores lac inducibles por IPTG , se expresan únicamente en medios suplementados con IPTG. Además, al incluir diferentes genes de resistencia a antibióticos en cada construcción genética, el crecimiento de células no transformadas se previene fácilmente mediante el cultivo en medios que contienen los antibióticos correspondientes. Esto es particularmente importante para los métodos de contraselección en los que se necesita una falta de interacción para la supervivencia celular. [2]
El gen reportero puede insertarse en el genoma de E. coli insertándolo primero en un episoma , un tipo de plásmido con la capacidad de incorporarse al genoma de la célula bacteriana [2] con un número de copias de aproximadamente una por célula. [10]
Los fagémidos de expresión híbridos pueden electroporarse en células E. coli XL-1 Blue que, después de la amplificación y la infección con el fago auxiliar VCS-M13 , producirán un stock de fagos de biblioteca. Cada uno de estos fagos contendrá un miembro monocatenario de la biblioteca de fagémidos. [2]
Una vez realizada la selección, se debe determinar la estructura primaria de las proteínas que presentan las características adecuadas. Esto se logra recuperando las secuencias codificantes de las proteínas (tal como se insertaron originalmente) de las células que muestran el fenotipo apropiado.
El fagémido utilizado para transformar las células de E. coli puede ser "rescatado" de las células seleccionadas infectándolas con el fago auxiliar VCS-M13. Las partículas de fago resultantes que se producen contienen los fagémidos monocatenarios y se utilizan para infectar las células XL-1 Blue. [2] Los fagémidos bicatenarios se recogen posteriormente de estas células XL-1 Blue, revirtiendo esencialmente el proceso utilizado para producir el fago de la biblioteca original. Finalmente, las secuencias de ADN se determinan mediante secuenciación didesoxi . [2]
El represor Tet-R derivado de Escherichia coli se puede utilizar en línea con un gen reportero convencional y se puede controlar con tetraciclina o doxiciclina (inhibidores de Tet-R). Por lo tanto, la expresión de Tet-R está controlada por el sistema estándar de dos híbridos, pero el Tet-R a su vez controla (reprime) la expresión de un reportero mencionado anteriormente, como HIS3 , a través de su promotor Tet-R. La tetraciclina o sus derivados se pueden utilizar para regular la sensibilidad de un sistema que utiliza Tet-R. [1]
La sensibilidad también se puede controlar variando la dependencia de las células de sus genes reporteros. Por ejemplo, esto se puede lograr modificando la concentración de histidina en el medio de crecimiento para las células dependientes de his3 y modificando la concentración de estreptomicina para las células dependientes de aadA . [2] [3] La dependencia del gen de selección también se puede controlar aplicando un inhibidor del gen de selección a una concentración adecuada. El 3-amino-1,2,4-triazol (3-AT), por ejemplo, es un inhibidor competitivo del producto del gen HIS3 y se puede utilizar para titular el nivel mínimo de expresión de HIS3 requerido para el crecimiento en medios deficientes en histidina. [2]
La sensibilidad también se puede modular variando el número de secuencias operadoras en el ADN reportero.
Una tercera proteína no fusionada puede coexpresarse con dos proteínas de fusión. Según la investigación, la tercera proteína puede modificar una de las proteínas de fusión o mediar o interferir en su interacción. [1]
La coexpresión de la tercera proteína puede ser necesaria para la modificación o activación de una o ambas proteínas de fusión. Por ejemplo, S. cerevisiae no posee una tirosina quinasa endógena. Si una investigación involucra una proteína que requiere fosforilación de tirosina, la quinasa debe suministrarse en forma de un gen de tirosina quinasa. [1]
La proteína no fusionada puede mediar la interacción uniendo ambas proteínas de fusión simultáneamente, como en el caso de la dimerización del receptor dependiente de ligando. [1]
En el caso de una proteína con un compañero de interacción, su homología funcional con otras proteínas se puede evaluar suministrando la tercera proteína en forma no fusionada, que luego puede o no competir con la proteína de fusión por su compañero de unión. La unión entre la tercera proteína y la otra proteína de fusión interrumpirá la formación del complejo de activación de la expresión del reportero y, por lo tanto, reducirá la expresión del reportero, lo que conduce al cambio distintivo en el fenotipo. [1]
Una limitación de los análisis clásicos de dos híbridos de levadura es que se limitan a proteínas solubles. Por lo tanto, es imposible utilizarlos para estudiar las interacciones proteína-proteína entre proteínas integrales de membrana insolubles . El sistema de ubiquitina dividida proporciona un método para superar esta limitación. [11] En el sistema de ubiquitina dividida, dos proteínas integrales de membrana que se van a estudiar se fusionan a dos fracciones de ubiquitina diferentes : una fracción de ubiquitina C-terminal ("Cub", residuos 35-76) y una fracción de ubiquitina N-terminal ("Nub", residuos 1-34). Estas proteínas fusionadas se denominan cebo y presa, respectivamente. Además de estar fusionada a una proteína integral de membrana, la fracción Cub también está fusionada a un factor de transcripción (TF) que puede ser escindido por proteasas específicas de ubiquitina . Tras la interacción cebo-presa, las fracciones Nub y Cub se ensamblan, reconstituyendo la ubiquitina dividida. La molécula de ubiquitina dividida reconstituida es reconocida por las proteasas específicas de ubiquitina, que escinden el factor de transcripción, lo que le permite inducir la transcripción de genes reporteros . [12]
Zolghadr y sus colaboradores presentaron un sistema fluorescente de dos híbridos que utiliza dos proteínas híbridas que se fusionan con diferentes proteínas fluorescentes, así como con LacI, el represor lac . La estructura de las proteínas de fusión se ve así: FP2-LacI-cebo y FP1-presa, donde las proteínas cebo y presa interactúan y acercan las proteínas fluorescentes (FP1 = GFP , FP2 = mCherry ) al sitio de unión de la proteína LacI en el genoma de la célula huésped. [13] El sistema también se puede utilizar para detectar inhibidores de interacciones proteína-proteína. [14]
Mientras que el sistema Y2H original utilizaba un factor de transcripción reconstituido, otros sistemas crean actividades enzimáticas para detectar los IBP. Por ejemplo, el sensor de sustrato de quinasa ("KISS") es un enfoque de dos híbridos de mamíferos que se ha diseñado para mapear los IBP intracelulares. Aquí, una proteína cebo se fusiona con una porción de TYK2 que contiene quinasa y una presa se acopla a un fragmento del receptor de citocina gp130 . Cuando el cebo y la presa interactúan, TYK2 fosforila los sitios de acoplamiento de STAT3 en la quimera de la presa, lo que finalmente conduce a la activación de un gen reportero . [15]
La variante híbrida de esta técnica está diseñada para investigar las interacciones proteína-ADN y utiliza una única proteína de fusión en la que el AD está unido directamente al dominio de unión. Sin embargo, en este caso, el dominio de unión no tiene necesariamente una secuencia fija como en el análisis proteína-proteína con dos híbridos, sino que puede estar constituido por una biblioteca. Esta biblioteca puede seleccionarse en función de la secuencia diana deseada, que se inserta en la región promotora del constructo del gen reportero. En un sistema de selección positiva, se selecciona así un dominio de unión que se une con éxito al UAS y permite la transcripción. [1]
Tenga en cuenta que la selección de dominios de unión al ADN no se realiza necesariamente utilizando un sistema de un híbrido, sino que también puede realizarse utilizando un sistema de dos híbridos en el que se varía el dominio de unión y las proteínas de cebo y presa se mantienen constantes. [2] [3]
Las interacciones entre el ARN y las proteínas se han investigado mediante una variante de tres híbridos de la técnica de dos híbridos. En este caso, una molécula de ARN híbrida sirve para unir los dos dominios de fusión de proteínas, que no están destinados a interactuar entre sí, sino con la molécula de ARN intermediaria (a través de sus dominios de unión al ARN). [1] Las técnicas que implican proteínas que no son de fusión y que realizan una función similar, como se describe en la sección "proteínas que no son de fusión" anterior, también pueden denominarse métodos de tres híbridos.
El uso simultáneo de los métodos de uno y dos híbridos (es decir, interacción simultánea proteína-proteína y proteína-ADN) se conoce como enfoque uno-dos híbridos y se espera que aumente la rigurosidad del análisis. [1]
Aunque teóricamente, cualquier célula viva podría ser utilizada como base para un análisis de dos híbridos, existen consideraciones prácticas que dictan cuál se elige. La línea celular elegida debe ser relativamente barata y fácil de cultivar y lo suficientemente robusta para soportar la aplicación de los métodos y reactivos de investigación. [1] Esto último es especialmente importante para realizar estudios de alto rendimiento . Por lo tanto, la levadura S. cerevisiae ha sido el principal organismo huésped para estudios de dos híbridos. Sin embargo, no siempre es el sistema ideal para estudiar proteínas interactuantes de otros organismos. [16] Las células de levadura a menudo no tienen las mismas modificaciones postraduccionales, tienen un uso de codones diferente o carecen de ciertas proteínas que son importantes para la expresión correcta de las proteínas. Para hacer frente a estos problemas, se han desarrollado varios sistemas novedosos de dos híbridos. Dependiendo del sistema utilizado, se utilizan placas de agar o un medio de crecimiento específico para cultivar las células y permitir la selección para la interacción. El método más común utilizado es el de siembra en agar, en el que las células se siembran en un medio selectivo para ver si se produce la interacción. Las células que no tienen proteínas de interacción no deberían sobrevivir en este medio selectivo. [7] [17]
La levadura S. cerevisiae fue el organismo modelo utilizado durante el inicio de la técnica de doble hibridación. Se la conoce comúnmente como el sistema Y2H. Tiene varias características que la convierten en un organismo robusto para albergar la interacción, incluida la capacidad de formar estructuras proteicas terciarias, pH interno neutro, capacidad mejorada para formar enlaces disulfuro y glutatión en estado reducido, entre otros factores tampón citosólicos, para mantener un entorno interno hospitalario. [1] El modelo de levadura se puede manipular a través de técnicas no moleculares y se conoce su secuencia genómica completa. [1] Los sistemas de levadura son tolerantes a diversas condiciones de cultivo y productos químicos agresivos que no podrían aplicarse a cultivos de tejidos de mamíferos. [1]
Se han creado varias cepas de levadura específicamente para las pruebas Y2H, por ejemplo, Y187 [18] y AH109 [19] , ambas producidas por Clontech . También se han utilizado las cepas de levadura R2HMet y BK100. [20]
C. albicans es una levadura con una característica particular: traduce el codón CUG en serina en lugar de leucina. Debido a este uso diferente del codón, es difícil utilizar el sistema modelo S. cerevisiae como Y2H para comprobar las interacciones proteína-proteína utilizando genes de C. albicans . Para proporcionar un entorno más nativo, se desarrolló un sistema de doble híbrido (C2H) de C. albicans . Con este sistema, las interacciones proteína-proteína se pueden estudiar en la propia C. albicans . [21] [22] Una incorporación reciente fue la creación de un sistema de alto rendimiento. [23] [24] [25]
Los métodos híbridos bacterianos (B2H o BTH) se llevan a cabo habitualmente en E. coli y tienen algunas ventajas sobre los sistemas basados en levaduras. Por ejemplo, la mayor eficiencia de transformación y la mayor tasa de crecimiento hacen que E. coli sea apta para el uso de bibliotecas más grandes (superiores a 10 8 ). [2] La ausencia de requisitos para que se incluya una señal de localización nuclear en la secuencia de proteínas y la capacidad de estudiar proteínas que serían tóxicas para las levaduras también pueden ser factores importantes a tener en cuenta al elegir un organismo de base experimental. [2]
La actividad de metilación de ciertas proteínas metiltransferasas de ADN de E. coli puede interferir con algunas selecciones de proteínas de unión al ADN. Si se prevé que esto ocurra, el uso de una cepa de E. coli que sea defectuosa para una metiltransferasa particular puede ser una solución obvia. [2] La B2H puede no ser ideal para estudiar interacciones proteína-proteína eucariotas (por ejemplo, proteínas humanas), ya que las proteínas pueden no plegarse como en las células eucariotas o pueden carecer de otro procesamiento.
En los últimos años, se ha diseñado un sistema de dos híbridos de mamíferos (M2H) para estudiar las interacciones proteína-proteína de los mamíferos en un entorno celular que imita de cerca el entorno proteico nativo. [26] En este sistema se utilizan células de mamíferos transfectadas transitoriamente para encontrar interacciones proteína-proteína. [27] [28] El uso de una línea celular de mamíferos para estudiar las interacciones proteína-proteína de los mamíferos ofrece la ventaja de trabajar en un contexto más nativo. [5] Las modificaciones postraduccionales, fosforilación, acilación y glicosilación son similares. La localización intracelular de las proteínas también es más correcta en comparación con el uso de un sistema de dos híbridos de levadura. [29] [30] También es posible con el sistema de dos híbridos de mamíferos estudiar las entradas de señales. [31] Otra gran ventaja es que los resultados se pueden obtener dentro de las 48 horas posteriores a la transfección. [5]
En 2005 se desarrolló un sistema de dos híbridos en plantas. Utilizando protoplastos de A. thaliana se pueden estudiar las interacciones proteína-proteína en plantas. De esta manera, las interacciones se pueden estudiar en su contexto nativo. En este sistema, GAL4 AD y BD están bajo el control del fuerte promotor 35S. La interacción se mide utilizando un reportero GUS. Para permitir un cribado de alto rendimiento, los vectores se hicieron compatibles con la puerta de enlace. El sistema se conoce como el sistema de dos híbridos de protoplastos (P2H). [32]
La liebre marina A. californica es un organismo modelo en neurobiología para estudiar, entre otros, los mecanismos moleculares de la memoria a largo plazo. Para estudiar las interacciones, importantes en neurología, en un entorno más nativo se ha desarrollado un sistema de dos híbridos en neuronas de A. californica . En este sistema se utilizan A. GAL4 AD y A. BD. [33] [34]
Se desarrolló un sistema de doble híbrido de insectos (I2H) en una línea celular de gusanos de seda a partir de la larva u oruga de la polilla de seda domesticada, Bombyx mori (células BmN4). Este sistema utiliza el dominio BD GAL4 y el dominio de activación de NF-κB P65 de ratón. Ambos están bajo el control del promotor OpIE2. [35]
Al cambiar aminoácidos específicos mediante la mutación de los pares de bases de ADN correspondientes en los plásmidos utilizados, se puede determinar la importancia de esos residuos de aminoácidos para mantener la interacción. [1]
Después de utilizar un método basado en células bacterianas para seleccionar proteínas que se unen al ADN, es necesario comprobar la especificidad de estos dominios, ya que existe un límite en el grado en que el genoma de la célula bacteriana puede actuar como sumidero de dominios con afinidad por otras secuencias (o, de hecho, una afinidad general por el ADN). [2]
Las interacciones de señalización entre proteínas plantean objetivos terapéuticos adecuados debido a su especificidad y ubicuidad. El enfoque de descubrimiento aleatorio de fármacos utiliza bancos de compuestos que comprenden estructuras químicas aleatorias y requiere un método de alto rendimiento para probar estas estructuras en su objetivo previsto. [1] [17]
La célula elegida para la investigación puede ser diseñada específicamente para reflejar el aspecto molecular que el investigador pretende estudiar y luego utilizada para identificar nuevos agentes terapéuticos o antiplagas para humanos o animales. [1] [17]
Mediante la determinación de los socios de interacción de proteínas desconocidas, se pueden inferir las posibles funciones de estas nuevas proteínas. [1] Esto se puede hacer utilizando una única proteína conocida frente a una biblioteca de proteínas desconocidas o, a la inversa, seleccionando de una biblioteca de proteínas conocidas utilizando una única proteína de función desconocida. [1]
Para seleccionar proteínas con dedos de zinc (ZFP) para la ingeniería de proteínas , se han utilizado con éxito métodos adaptados de la técnica de detección de dos híbridos. [2] [3] Una ZFP es en sí misma una proteína de unión al ADN utilizada en la construcción de dominios de unión al ADN personalizados que se unen a una secuencia de ADN deseada. [36]
Al utilizar un gen de selección con la secuencia diana deseada incluida en el UAS y aleatorizar las secuencias de aminoácidos relevantes para producir una biblioteca de ZFP, se pueden seleccionar células que albergan una interacción ADN-ZFP con las características requeridas. Cada ZFP reconoce típicamente solo 3-4 pares de bases, por lo que para evitar el reconocimiento de sitios fuera del UAS, la ZFP aleatorizada se diseña en un "andamio" que consiste en otras dos ZFP de secuencia constante. El UAS está diseñado para incluir la secuencia diana del andamio constante además de la secuencia para la que se selecciona una ZFP. [2] [3]
También se pueden investigar otros dominios de unión al ADN utilizando este sistema. [2]
La razón de esta alta tasa de error radica en las características de la pantalla:
Cada uno de estos puntos por sí solo puede dar lugar a resultados falsos. Debido a los efectos combinados de todas las fuentes de error, los híbridos de levadura deben interpretarse con precaución. La probabilidad de generar falsos positivos significa que todas las interacciones deben confirmarse mediante un ensayo de alta confianza, por ejemplo, la co-inmunoprecipitación de las proteínas endógenas, lo que es difícil para los datos de interacción proteína-proteína a gran escala. Alternativamente, los datos de Y2H pueden verificarse utilizando múltiples variantes de Y2H [38] o técnicas bioinformáticas. Estas últimas prueban si las proteínas interactuantes se expresan al mismo tiempo, comparten algunas características comunes (como anotaciones de ontología genética o ciertas topologías de red ) o tienen interacciones homólogas en otras especies. [39]