stringtranslate.com

IP (complejidad)

En la teoría de la complejidad computacional , la clase IP ( prueba interactiva ) es la clase de problemas que se pueden resolver mediante un sistema de prueba interactivo . Es igual a la clase PSPACE . El resultado se estableció en una serie de artículos: el primero de Lund, Karloff, Fortnow y Nisan mostró que el co-NP tenía múltiples pruebas interactivas; [1] y el segundo, de Shamir, emplearon su técnica para establecer que IP=PSPACE. [2] El resultado es un ejemplo famoso en el que la prueba no relativiza . [3]

El concepto de sistema de prueba interactivo fue introducido por primera vez por Shafi Goldwasser , Silvio Micali y Charles Rackoff en 1985. Un sistema de prueba interactivo consta de dos máquinas, un probador, P , que presenta una prueba de que una cadena dada n es miembro de algo de lenguaje y un verificador, V , que comprueba que la prueba presentada es correcta. Se supone que el probador es infinito en cálculo y almacenamiento, mientras que el verificador es una máquina probabilística de tiempo polinómico con acceso a una cadena de bits aleatoria cuya longitud es polinómica del tamaño de n . Estas dos máquinas intercambian un número polinómico, p ( n ), de mensajes y una vez completada la interacción, el verificador debe decidir si n está o no en el idioma, con solo 1/3 de probabilidad de error. (Por lo tanto, cualquier idioma en BPP está en IP , desde entonces el verificador podría simplemente ignorar al probador y tomar la decisión por sí solo).

Representación general de un protocolo de prueba interactivo.

Definición

Un lenguaje L pertenece a IP si existe V , P tal que para todo Q , w :

El protocolo Arthur-Merlin , introducido por László Babai , es de naturaleza similar, excepto que el número de rondas de interacción está limitado por una constante en lugar de un polinomio.

Goldwasser et al. han demostrado que los protocolos de monedas públicas , donde los números aleatorios utilizados por el verificador se proporcionan al probador junto con los desafíos, no son menos poderosos que los protocolos de monedas privadas. Se requieren como máximo dos rondas adicionales de interacción para replicar el efecto de un protocolo de moneda privada. La inclusión opuesta es sencilla, porque el verificador siempre puede enviar al probador los resultados de sus lanzamientos de moneda privados, lo que demuestra que los dos tipos de protocolos son equivalentes.

En la siguiente sección demostramos que IP = PSPACE , un teorema importante en complejidad computacional, que demuestra que se puede usar un sistema de prueba interactivo para decidir si una cadena es miembro de un lenguaje en tiempo polinómico, aunque la prueba PSPACE tradicional puede ser exponencialmente largo.

Prueba de IP = PSPACE

La prueba se puede dividir en dos partes, demostramos que IPPSPACE y PSPACEIP .

IP ⊆ ESPACIO

Para demostrar que IPPSPACE , presentamos una simulación de un sistema de prueba interactivo mediante una máquina espacial polinomial. Ahora podemos definir:

y para cada 0 ≤ jp y cada historial de mensajes M j , definimos inductivamente la función N M j :

dónde:

donde Pr r es la probabilidad tomada sobre la cadena aleatoria r de longitud p . Esta expresión es el promedio de N M j+1 , ponderado por la probabilidad de que el verificador haya enviado el mensaje m j+1 .

Tome M 0 como la secuencia de mensajes vacía, aquí mostraremos que N M 0 se puede calcular en el espacio polinomial y que N M 0 = Pr[ V acepta w ]. Primero, para calcular N M 0 , un algoritmo puede calcular recursivamente los valores N M j para cada j y M j . Dado que la profundidad de la recursividad es p , sólo es necesario el espacio polinomial. El segundo requisito es que necesitamos N M 0 = Pr[ V acepta w ], el valor necesario para determinar si w está en A. Usamos la inducción para probar esto de la siguiente manera.

Debemos demostrar que para cada 0 ≤ jp y cada M j , N M j = Pr[ V acepta w comenzando en M j ], y lo haremos usando inducción en j . El caso base es demostrar que j = p . Luego usaremos inducción para bajar de p a 0.

El caso base de j = p es bastante simple. Dado que m p es aceptar o rechazar, si m p es aceptar, N M p se define como 1 y Pr[ V acepta w comenzando en M j ] = 1 ya que el flujo de mensajes indica aceptación, por lo que la afirmación es verdadera. Si m p es rechazado, el argumento es muy similar.

Para la hipótesis inductiva, asumimos que para algún j +1 ≤ p y cualquier secuencia de mensajes M j+1 , N M j+1 = Pr[ V acepta w comenzando en M j+1 ] y luego probamos la hipótesis para j y cualquier secuencia de mensajes M j .

Si j es par, m j+1 es un mensaje de V a P. Según la definición de N M j ,

Entonces, por la hipótesis inductiva, podemos decir que esto es igual a

Finalmente, por definición, podemos ver que esto es igual a Pr[ V acepta w comenzando en Mj ].

Si j es impar, m j +1 es un mensaje de P a V. Por definición,

Entonces, según la hipótesis inductiva, esto es igual

Esto es igual a Pr[ V acepta w comenzando en M j ] ya que:

porque el demostrador del lado derecho podría enviar el mensaje m j+1 para maximizar la expresión del lado izquierdo. Y:

Ya que el mismo Probador no puede hacer nada mejor que enviar ese mismo mensaje. Por lo tanto, esto es válido tanto si i es par como impar y la prueba de que IPPSPACE es completa.

Aquí hemos construido una máquina espacial polinómica que utiliza el mejor probador P para una cadena particular w en el lenguaje A. Usamos este mejor probador en lugar de un probador con bits de entrada aleatorios porque podemos probar cada conjunto de bits de entrada aleatorios en el espacio polinomial. Como hemos simulado un sistema de prueba interactivo con una máquina espacial polinomial, hemos demostrado que IPPSPACE , como se desea.

ESPACIO ⊆ IP

Para ilustrar la técnica que se utilizará para demostrar PSPACEIP , primero demostraremos un teorema más débil, que fue demostrado por Lund y otros: #SAT ∈ IP . Luego, usando los conceptos de esta prueba, la ampliaremos para mostrar que TQBF ∈ IP . Dado que TQBF ∈ PSPACE -completo y TQBF ∈ IP, entonces PSPACEIP .

#SAT es miembro del IP

Comenzamos mostrando que #SAT está en IP , donde:

Tenga en cuenta que esto es diferente de la definición normal de #SAT , en que es un problema de decisión, en lugar de una función.

Primero usamos la aritmetización para mapear la fórmula booleana con n variables, φ( b 1 , ..., b n ) a un polinomio p φ ( x 1 , ..., x n ), donde p φ imita a φ en ese p φ es 1 si φ es verdadero y 0 en caso contrario, siempre que a las variables de p φ se les asigne valores booleanos. Las operaciones booleanas ∨, ∧ y ¬ utilizadas en φ se simulan en p φ reemplazando los operadores en φ como se muestra en la siguiente tabla.

Como ejemplo, φ = a ∧ ( b ∨ ¬ c ) se convertiría en un polinomio de la siguiente manera:

Cada una de las operaciones ab y ab dan como resultado un polinomio con un grado acotado por la suma de los grados de los polinomios para a y b y, por lo tanto, el grado de cualquier variable es como máximo la longitud de φ.

Ahora sea F un cuerpo finito de orden q > 2 n ; También exija que q sea al menos 1000. Para cada 0 ≤ in , defina una función f i en F , que tenga parámetros y una sola variable a i en F : para 0 ≤ in y para let

Tenga en cuenta que el valor de f 0 es el número de asignaciones satisfactorias de φ. f 0 es una función vacía, sin variables.

Ahora el protocolo para #SAT funciona de la siguiente manera:

Tenga en cuenta que este es un algoritmo de moneda pública.

Si φ tiene k asignaciones satisfactorias, claramente V las aceptará. Si φ no tiene k asignaciones satisfactorias, asumimos que hay un demostrador que intenta convencer a V de que φ sí tiene k asignaciones satisfactorias. Demostramos que esto sólo se puede hacer con baja probabilidad.

Para evitar que V rechace en la fase 0, tiene que enviar un valor incorrecto a P. Luego, en la fase 1, debe enviar un polinomio incorrecto con la propiedad de que . Cuando V elige un r 1 aleatorio para enviarlo a P ,

Esto se debe a que un polinomio en una sola variable de grado como máximo d no puede tener más de d raíces (a menos que siempre se evalúe como 0). Entonces, dos polinomios cualesquiera en una sola variable de grado como máximo d pueden ser iguales solo en d lugares. Desde | F | > 2 n la probabilidad de que r 1 sea uno de estos valores es como máximo si n > 10, o como máximo ( n /1000) ≤ ( n / n 3 ) si n ≤ 10.

Generalizando esta idea para las otras fases tenemos para cada 1 ≤ in si

entonces para r i elegido al azar de F ,

Hay n fases, por lo que la probabilidad de tener suerte porque V selecciona en algún momento un r i conveniente es como máximo 1/ n . Entonces, ningún probador puede hacer que el verificador acepte con una probabilidad mayor que 1/ n . También podemos ver en la definición que el verificador V opera en tiempo polinómico probabilístico. Por tanto, #SAT ∈ IP .

TQBF es miembro de IP

Para mostrar que PSPACE es un subconjunto de IP , debemos elegir un problema de PSPACE completo y mostrar que está en IP . Una vez que mostramos esto, queda claro que PSPACEIP . La técnica de prueba demostrada aquí se atribuye a Adi Shamir .

Sabemos que TQBF está en PSPACE-Complete . Entonces, sea ψ una expresión booleana cuantificada:

donde φ es una fórmula CNF. Entonces Q i es un cuantificador, ya sea ∃ o ∀. Ahora f i es igual que en la prueba anterior, pero ahora también incluye cuantificadores.

Aquí, φ( a 1 , ..., a i ) es φ con a 1 a a i sustituido por x 1 a x i . Por tanto, f 0 es el valor de verdad de ψ. Para aritmetizar ψ debemos utilizar las siguientes reglas:

donde como antes definimos xy = 1 − (1 −  x )(1 −  y ).

Al utilizar el método descrito en #SAT, debemos enfrentar el problema de que para cualquier f i el grado del polinomio resultante puede duplicarse con cada cuantificador. Para evitar esto, debemos introducir un nuevo operador de reducción R que reducirá los grados del polinomio sin cambiar su comportamiento en las entradas booleanas.

Entonces, antes de aritmetizar, introducimos una nueva expresión:

o dicho de otra manera:

Ahora para cada ik definimos la función f i . También definimos como el polinomio p ( x 1 , ..., x m ) que se obtiene aritmetizando φ. Ahora, para mantener bajo el grado del polinomio, definimos f i en términos de f i+1 :

Ahora podemos ver que la operación de reducción R, no cambia el grado del polinomio. También es importante ver que la operación R x no cambia el valor de la función en las entradas booleanas. Entonces f 0 sigue siendo el valor de verdad de ψ, pero el valor de R x produce un resultado que es lineal en x . Además, después de any agregamos ψ′ para reducir el grado a 1 después de aritmetizar .

Ahora describamos el protocolo. Si n es la longitud de ψ, todas las operaciones aritméticas en el protocolo se realizan sobre un campo de tamaño al menos n 4 donde n es la longitud de ψ.

Si alguno de los dos falla, rechace.

V usa coeficientes para evaluar y . Luego comprueba que el grado del polinomio sea como máximo n y que las siguientes identidades sean verdaderas:

Si alguno de los dos falla, rechace.

VP : V elige una r aleatoria en F y la envía a P. (Si entonces esta r reemplaza la r anterior ).

Vaya a la fase i  + 1 donde P debe persuadir a V de que es correcto.

Este es el final de la descripción del protocolo.

Si ψ es verdadero, entonces V aceptará cuando P siga el protocolo. Del mismo modo, si es un probador malicioso el que miente, y si ψ es falso, entonces necesitará mentir en la fase 0 y enviar algún valor para f 0 . Si en la fase i , V tiene un valor incorrecto para entonces y probablemente también será incorrecto, y así sucesivamente. La probabilidad de tener suerte con algún r aleatorio es como máximo el grado del polinomio dividido por el tamaño del campo: . El protocolo pasa por O ( n 2 ) fases, por lo que la probabilidad de tener suerte en alguna fase es ≤ 1/ n . Si nunca hay suerte, entonces V rechazará en la fase k +1.

Como ahora hemos demostrado que tanto IPPSPACE como PSPACEIP , podemos concluir que IP = PSPACE como se desee. Además, hemos demostrado que cualquier algoritmo IP puede considerarse una moneda pública, ya que la reducción de PSPACE a IP tiene esta propiedad.

Variantes

Existen varias variantes de IP que modifican ligeramente la definición del sistema de prueba interactivo. Resumimos aquí algunos de los más conocidos.

aderezo

Un subconjunto de IP es la clase determinista Prueba interactiva , que es similar a IP pero tiene un verificador determinista (es decir, sin aleatoriedad). Esta clase es igual a NP .

Perfecta integridad

Una definición equivalente de IP reemplaza la condición de que la interacción tenga éxito con alta probabilidad en cadenas del lenguaje con el requisito de que siempre tenga éxito:

Este criterio aparentemente más fuerte de "integridad perfecta" no cambia la clase de complejidad IP , ya que cualquier lenguaje con un sistema de prueba interactivo puede recibir un sistema de prueba interactivo con integridad perfecta. [4]

PIM

En 1988, Goldwasser et al. Creó un sistema de prueba interactivo aún más poderoso basado en IP llamado MIP en el que hay dos probadores independientes. Los dos probadores no pueden comunicarse una vez que el verificador ha comenzado a enviarles mensajes. Así como es más fácil saber si un criminal miente si él y su compañero son interrogados en habitaciones separadas, es considerablemente más fácil detectar a un probador malicioso que intenta engañar al verificador si hay otro probador con quien pueda verificar. De hecho, esto es tan útil que Babai, Fortnow y Lund pudieron demostrar que MIP = NEXPTIME , la clase de todos los problemas solucionables por una máquina no determinista en tiempo exponencial , una clase muy grande. Además, todos los idiomas en NP tienen pruebas de conocimiento cero en un sistema MIP , sin suposiciones adicionales; esto sólo se conoce para IP asumiendo la existencia de funciones unidireccionales.

PPI

IPP ( IP ilimitada ) es una variante de IP donde reemplazamos el verificador BPP por un verificador PP . Más precisamente, modificamos las condiciones de integridad y solidez de la siguiente manera:

Aunque IPP también es igual a PSPACE , los protocolos IPP se comportan de manera bastante diferente a IP con respecto a los oráculos : IPP = PSPACE con respecto a todos los oráculos, mientras que IPPSPACE con respecto a casi todos los oráculos. [5]

QIP

QIP es una versión de IP que reemplaza el verificador BPP por un verificador BQP , donde BQP es la clase de problemas que pueden resolver las computadoras cuánticas en tiempo polinomial. Los mensajes están compuestos de qubits. [6] En 2009, Jain, Ji, Upadhyay y Watrous demostraron que QIP también es igual a PSPACE , [7] lo que implica que este cambio no otorga poder adicional al protocolo. Esto incluye un resultado previo de Kitaev y Watrous de que QIP está contenido en EXPTIME porque QIP = QIP [3], por lo que nunca son necesarias más de tres rondas. [8]

compIP

Mientras que IPP y QIP otorgan más poder al verificador, un sistema compIP ( sistema de prueba de IP competitivo ) debilita la condición de integridad de una manera que debilita al probador:

Esencialmente, esto convierte al probador en una máquina BPP con acceso a un oráculo para el idioma, pero solo en el caso de que esté completo, no en el caso de que sea sólido. El concepto es que si un lenguaje está en compIP , entonces probarlo interactivamente es, en cierto sentido, tan fácil como decidirlo. Con el oráculo, el probador puede resolver fácilmente el problema, pero su poder limitado hace que sea mucho más difícil convencer al verificador de algo. De hecho, ni siquiera se sabe ni se cree que compIP contenga NP .

Por otra parte, un sistema de este tipo puede resolver algunos problemas que se consideran difíciles. De manera un tanto paradójica, aunque no se cree que un sistema de este tipo sea capaz de resolver todos los NP , puede resolver fácilmente todos los problemas NP completos debido a la autorreducibilidad. Esto se debe al hecho de que si el lenguaje L no es NP -duro, el poder del demostrador está sustancialmente limitado (ya que ya no puede decidir todos los problemas NP con su oráculo).

Además, el problema del no isomorfismo del gráfico (que es un problema clásico en IP ) también está en compIP , ya que la única operación difícil que tiene que realizar el demostrador es la prueba de isomorfismo, que puede usar el oráculo para resolver. La no residuosidad cuadrática y el isomorfismo gráfico también están en compIP . [9] Tenga en cuenta que la no residuosidad cuadrática (QNR) es probablemente un problema más fácil que el isomorfismo gráfico, ya que QNR está en la intersección UP co-UP . [10]

Notas

  1. ^ Lund, C.; Fortnow, L.; Karloff, H.; Nisan, N. (1990). "Métodos algebraicos para sistemas de prueba interactivos". Actas [1990] 31º Simposio anual sobre fundamentos de la informática . Computación IEEE. Soc. Prensa. págs. 2–10. doi :10.1109/fscs.1990.89518. ISBN 0-8186-2082-X. S2CID  32614901.
  2. ^ Shamir, Adi. "Ip=pespacio." Revista de la ACM 39.4 (1992): 869-877.
  3. ^ Chang Richard; et al. (1994). "La hipótesis del oráculo aleatorio es falsa". Revista de Ciencias de la Computación y de Sistemas . 49 (1): 24–39. doi : 10.1016/s0022-0000(05)80084-4 .
  4. ^ Furer Martin, Goldreich Oded, Mansour Yishay, Sipser Michael, Zachos Stathis (1989). "Sobre la integridad y solidez de los sistemas de prueba interactivos". Avances en la investigación en informática: un anuario de investigación . 5 : 429–442. CiteSeerX 10.1.1.39.9412 . {{cite journal}}: CS1 maint: multiple names: authors list (link)
  5. ^ R. Chang, B. Chor, Oded Goldreich, J. Hartmanis, J. Håstad, D. Ranjan y P. Rohatgi. La hipótesis del oráculo aleatorio es falsa. Revista de Ciencias de la Computación y de Sistemas , 49(1):24-39. 1994.
  6. ^ J. Watrous. PSPACE tiene sistemas de prueba interactivos cuánticos de ronda constante. Actas de IEEE FOCS'99 , págs. 112-119. 1999.
  7. ^ Rahul Jainista; Zhengfeng Ji; Sarvagya Upadhyay; John Watrous (2009). "QIP = ESPACIO". arXiv : 0907.4737 [cuántico-ph].
  8. ^ A. Kitaev y J. Watrous. Paralelización, amplificación y simulación de tiempo exponencial de sistemas de prueba cuánticos interactivos. Actas del 32º Simposio ACM sobre Teoría de la Computación , págs. 2000.
  9. ^ Shafi Goldwasser y Mihir Bellare . La complejidad de la decisión frente a la búsqueda. Revista SIAM de Computación , Volumen 23, N° 1. Febrero de 1994.
  10. ^ Cai JY, Threlfall RA (2004). "Una nota sobre residuosidad cuadrática y UP ". Cartas de procesamiento de información . 92 (3): 127-131. CiteSeerX 10.1.1.409.1830 . doi :10.1016/j.ipl.2004.06.015. 

Referencias