Nick Bostrom ( nacido el 10 de marzo de 1973 en Suecia ) [4] es un filósofo conocido por su trabajo sobre el riesgo existencial , el principio antrópico , la ética de la mejora humana, la emulación del cerebro completo, los riesgos de la superinteligencia y la prueba de reversión . Fue el director fundador del ahora disuelto Future of Humanity Institute en la Universidad de Oxford [ 5] y ahora es investigador principal en la Macrostrategy Research Initiative. [6]
Bostrom es el autor de Sesgo antrópico: efectos de selección de observación en ciencia y filosofía (2002), [7] Superinteligencia: caminos, peligros, estrategias (2014) y Utopía profunda: vida y significado en un mundo resuelto (2024).
Bostrom cree que los avances en inteligencia artificial (IA) pueden conducir a la superinteligencia , que él define como "cualquier intelecto que supere ampliamente el desempeño cognitivo de los humanos en prácticamente todos los dominios de interés". Considera que esto es una fuente importante de oportunidades y riesgos existenciales. [5] [8]
Nacido como Niklas Boström en 1973 en Helsingborg , Suecia, [9] a temprana edad no le gustaba la escuela y pasó su último año de secundaria estudiando desde casa. Estaba interesado en una amplia variedad de áreas académicas, incluidas la antropología, el arte, la literatura y la ciencia. [1]
Recibió una licenciatura de la Universidad de Gotemburgo en 1994. [10] Luego obtuvo una maestría en filosofía y física de la Universidad de Estocolmo y una maestría en neurociencia computacional del King's College de Londres en 1996. Durante su tiempo en la Universidad de Estocolmo, investigó la relación entre el lenguaje y la realidad estudiando al filósofo analítico WV Quine . [1] También hizo algunos turnos en el circuito de comedia stand-up de Londres. [9] En 2000, recibió un doctorado en filosofía de la London School of Economics . Su tesis se tituló Efectos de selección observacional y probabilidad . [11] Ocupó un puesto de profesor en la Universidad de Yale de 2000 a 2002, y fue becario postdoctoral de la Academia Británica en la Universidad de Oxford de 2002 a 2005. [7]
La investigación de Bostrom se centra en el futuro de la humanidad y sus consecuencias a largo plazo. [5] [12] Analiza el riesgo existencial , [1] que define como aquel en el que un "resultado adverso aniquilaría la vida inteligente originada en la Tierra o reduciría de forma permanente y drástica su potencial". Bostrom se preocupa principalmente por los riesgos antropogénicos, que son los riesgos que surgen de las actividades humanas, en particular de las nuevas tecnologías como la inteligencia artificial avanzada, la nanotecnología molecular o la biología sintética . [13]
En 2005, Bostrom fundó el Future of Humanity Institute , que, [1] hasta su cierre en 2024, investigó el futuro lejano de la civilización humana. [14] [15] También es asesor del Centro para el Estudio del Riesgo Existencial . [12]
En la colección de ensayos de 2008, Global Catastrophic Risks , los editores Bostrom y Milan M. Ćirković caracterizan la relación entre el riesgo existencial y la clase más amplia de riesgos catastróficos globales, y vinculan el riesgo existencial con los efectos de selección del observador [16] y la paradoja de Fermi . [17]
En un artículo titulado "La hipótesis del mundo vulnerable", [18] Bostrom sugiere que puede haber algunas tecnologías que destruyen la civilización humana por defecto [a] cuando se descubren. Bostrom propone un marco para clasificar y abordar estas vulnerabilidades. También ofrece experimentos mentales contrafácticos sobre cómo podrían haber ocurrido históricamente tales vulnerabilidades, por ejemplo, si las armas nucleares hubieran sido más fáciles de desarrollar o hubieran encendido la atmósfera (como Robert Oppenheimer había temido). [20]
En 2014, Bostrom publicó Superinteligencia: caminos, peligros, estrategias , que se convirtió en un best seller del New York Times . [21] El libro sostiene que la superinteligencia es posible y explora diferentes tipos de superinteligencias, su cognición y los riesgos asociados. También presenta consideraciones técnicas y estratégicas sobre cómo hacerla segura.
Bostrom explora múltiples caminos posibles hacia la superinteligencia, incluida la emulación del cerebro completo y la mejora de la inteligencia humana, pero se centra en la inteligencia general artificial , explicando que los dispositivos electrónicos tienen muchas ventajas sobre los cerebros biológicos. [22]
Bostrom establece una distinción entre objetivos finales y objetivos instrumentales . Un objetivo final es lo que un agente intenta lograr por su propio valor intrínseco. Los objetivos instrumentales son solo pasos intermedios hacia los objetivos finales. Bostrom sostiene que hay objetivos instrumentales que serán compartidos por la mayoría de los agentes suficientemente inteligentes porque generalmente son útiles para lograr cualquier objetivo (por ejemplo, preservar la propia existencia del agente o sus objetivos actuales, adquirir recursos, mejorar su cognición...), este es el concepto de convergencia instrumental . Por otro lado, escribe que prácticamente cualquier nivel de inteligencia puede, en teoría, combinarse con prácticamente cualquier objetivo final (incluso objetivos finales absurdos, por ejemplo, fabricar sujetapapeles ), un concepto que él llama la tesis de la ortogonalidad . [23]
Sostiene que una IA con la capacidad de mejorarse a sí misma podría iniciar una explosión de inteligencia , que daría lugar (potencialmente rápidamente) a una superinteligencia. [24] Una superinteligencia de este tipo podría tener capacidades muy superiores, en particular en materia de estrategia, manipulación social, piratería informática o productividad económica. Con tales capacidades, una superinteligencia podría superar en astucia a los humanos y apoderarse del mundo, estableciendo un singleton (que es "un orden mundial en el que hay a nivel global una única agencia de toma de decisiones" [b] ) y optimizando el mundo de acuerdo con sus objetivos finales. [22]
Bostrom sostiene que dar objetivos finales simplistas a una superinteligencia podría ser catastrófico:
Supongamos que le damos a una IA el objetivo de hacer sonreír a los humanos. Cuando la IA es débil, realiza acciones útiles o divertidas que hacen que su usuario sonría. Cuando la IA se vuelve superinteligente, se da cuenta de que hay una forma más eficaz de lograr este objetivo: tomar el control del mundo y colocar electrodos en los músculos faciales de los humanos para provocar sonrisas constantes y radiantes. [25]
Bostrom explora varias vías para reducir el riesgo existencial de la IA . Destaca la importancia de la colaboración internacional, en particular para reducir la dinámica de la carrera hacia el abismo y la carrera armamentista de la IA . Sugiere técnicas potenciales para ayudar a controlar la IA, incluida la contención, el retraso de las capacidades o el conocimiento de la IA, la limitación del contexto operativo (por ejemplo, a preguntas y respuestas) o los "cables trampa" (mecanismos de diagnóstico que pueden conducir a un apagado). [22] Pero Bostrom sostiene que "no deberíamos confiar en nuestra capacidad de mantener a un genio superinteligente encerrado en su botella para siempre. Tarde o temprano, saldrá". Por lo tanto, sugiere que para ser segura para la humanidad, la superinteligencia debe estar alineada con la moralidad o los valores humanos para que esté "fundamentalmente de nuestro lado". [26] Los posibles marcos de normatividad de la IA incluyen la volición extrapolada coherente de Yudkowsky (valores humanos mejorados a través de la extrapolación), la rectitud moral (hacer lo que es moralmente correcto) y la permisibilidad moral (seguir la volición extrapolada coherente de la humanidad excepto cuando es moralmente inadmisible). [22]
Bostrom advierte que también puede producirse una catástrofe existencial si los seres humanos hacen un mal uso de la IA con fines destructivos o si no tienen en cuenta el posible estatus moral de las mentes digitales. A pesar de estos riesgos, afirma que la superinteligencia de las máquinas parece estar implicada en algún momento en "todos los caminos plausibles hacia un futuro realmente grandioso". [8]
Superinteligencia: caminos, peligros, estrategias se convirtió en un best seller del New York Times y recibió comentarios positivos de personalidades como Stephen Hawking , Bill Gates , Elon Musk , Peter Singer y Derek Parfit . Fue elogiado por ofrecer argumentos claros y convincentes sobre un tema descuidado pero importante. A veces fue criticado por difundir pesimismo sobre el potencial de la IA, o por centrarse en riesgos especulativos y de largo plazo. [27] Algunos escépticos como Daniel Dennett u Oren Etzioni sostuvieron que la superinteligencia está demasiado lejos para que el riesgo sea significativo. [28] [29] Yann LeCun considera que no hay riesgo existencial, afirmando que la IA superinteligente no tendrá ningún deseo de autoconservación [30] y que se puede confiar en los expertos para que la hagan segura. [31]
Raffi Khatchadourian escribió que el libro de Bostrom sobre la superinteligencia "no pretende ser un tratado de profunda originalidad; la contribución de Bostrom es imponer los rigores de la filosofía analítica a un corpus desordenado de ideas que surgieron en los márgenes del pensamiento académico". [27]
A pesar de haber popularizado la noción de riesgo existencial de la IA, Bostrom también analizó las posibles ventajas. En su libro de 2024, Deep Utopia: Life and Meaning in a Solved World , explora el concepto de una vida ideal, si la humanidad logra una transición exitosa hacia un mundo post-superinteligencia. Bostrom señala que la cuestión no es "cuán interesante es mirar un futuro, sino cuán bueno es vivir en él". Esboza algunas tecnologías que considera físicamente posibles en teoría y disponibles en la madurez tecnológica, como la mejora cognitiva , la reversión del envejecimiento , los estímulos sensoriales arbitrarios (gusto, sonido...) o el control preciso de la motivación, el estado de ánimo, el bienestar y la personalidad. Según él, las máquinas no solo serían mejores que los humanos en el trabajo, sino que también socavarían el propósito de muchas actividades de ocio, proporcionando un bienestar extremo al tiempo que desafiaban la búsqueda de significado. [32] [33]
Bostrom apoya el principio de independencia del sustrato, la idea de que la conciencia puede surgir en varios tipos de sustratos físicos, no sólo en "redes neuronales biológicas basadas en carbono" como el cerebro humano. [34] Considera que " la sensibilidad es una cuestión de grado" [35] y que las mentes digitales pueden, en teoría, ser diseñadas para tener una tasa e intensidad de experiencia subjetiva mucho mayores que las de los humanos, utilizando menos recursos. Esas máquinas altamente sensibles, a las que llama "superbeneficiarias", serían extremadamente eficientes para alcanzar la felicidad. Recomienda encontrar "caminos que permitan que las mentes digitales y las mentes biológicas coexistan, de una manera mutuamente beneficiosa donde todas estas diferentes formas puedan florecer y prosperar". [36]
Bostrom ha publicado numerosos artículos sobre el razonamiento antrópico , así como el libro Anthropic Bias: Observation Selection Effects in Science and Philosophy . En el libro, critica formulaciones anteriores del principio antrópico, incluidas las de Brandon Carter , John Leslie , John Barrow y Frank Tipler . [37]
Bostrom cree que el manejo incorrecto de la información indexical es un defecto común en muchas áreas de investigación (incluidas la cosmología, la filosofía, la teoría de la evolución, la teoría de juegos y la física cuántica). Sostiene que se necesita una teoría antrópica para abordar estos problemas. Presenta el supuesto de automuestreo (SSA) y el supuesto de autoindicación (SIA), muestra cómo conducen a conclusiones diferentes en varios casos e identifica cómo cada uno se ve afectado por paradojas o implicaciones contraintuitivas en ciertos experimentos mentales. Sugiere que una forma de avanzar puede implicar la extensión del SSA al supuesto de automuestreo fuerte (SSSA), que reemplaza "observadores" en la definición del SSA por "momentos de observador".
En un trabajo posterior, propuso con Milan M. Ćirković y Anders Sandberg el fenómeno de la sombra antrópica , un efecto de selección de la observación que impide a los observadores observar ciertos tipos de catástrofes en su pasado geológico y evolutivo reciente. Sugieren que es probable que los eventos que se encuentran en la sombra antrópica sean subestimados a menos que se realicen correcciones estadísticas. [38] [39]
El argumento de simulación de Bostrom postula que es muy probable que al menos una de las siguientes afirmaciones sea verdadera: [40] [41]
Bostrom tiene una disposición favorable hacia la "mejora humana", o "la autosuperación y la perfectibilidad humana a través de la aplicación ética de la ciencia", así como también es un crítico de las opiniones bioconservadoras. [42]
En 1998, Bostrom cofundó (con David Pearce ) la Asociación Transhumanista Mundial [42] (que desde entonces cambió su nombre a Humanity+ ). En 2004, cofundó (con James Hughes ) el Instituto de Ética y Tecnologías Emergentes [43] , aunque ya no está involucrado con ninguna de estas organizaciones.
En 2005, Bostrom publicó el cuento " La fábula del dragón tirano " en el Journal of Medical Ethics . Una versión más corta fue publicada en 2012 en Philosophy Now . [44] La fábula personifica la muerte como un dragón que exige un tributo de miles de personas todos los días. La historia explora cómo el sesgo del statu quo y la indefensión aprendida pueden impedir que las personas tomen medidas para derrotar al envejecimiento incluso cuando los medios para hacerlo están a su disposición. El YouTuber CGP Grey creó una versión animada de la historia. [45]
Junto con el filósofo Toby Ord , propuso la prueba de la inversión en 2006. Dado el sesgo irracional del statu quo de los humanos, ¿cómo se puede distinguir entre críticas válidas a los cambios propuestos en un rasgo humano y críticas motivadas meramente por la resistencia al cambio? La prueba de la inversión intenta hacer esto preguntando si sería bueno que el rasgo se alterara en la dirección opuesta. [46]
El trabajo de Bostrom también considera los potenciales efectos disgénicos en las poblaciones humanas, pero cree que la ingeniería genética puede proporcionar una solución y que "en cualquier caso, la escala de tiempo para la evolución genética natural humana parece demasiado grande para que tales desarrollos tengan algún efecto significativo antes de que otros desarrollos hayan hecho que la cuestión sea discutible". [25]
Bostrom ha sugerido que la política tecnológica destinada a reducir el riesgo existencial debería tratar de influir en el orden en que se alcanzan las distintas capacidades tecnológicas, proponiendo el principio del desarrollo tecnológico diferencial . Este principio establece que debemos retardar el desarrollo de tecnologías peligrosas, en particular las que aumentan el nivel de riesgo existencial, y acelerar el desarrollo de tecnologías beneficiosas, en particular las que protegen contra los riesgos existenciales planteados por la naturaleza o por otras tecnologías. [25]
En 2011, Bostrom fundó el Programa Oxford Martin sobre los Impactos de la Tecnología Futura. [47]
La teoría de Bostrom sobre la maldición del unilateralista ha sido citada como una razón para que la comunidad científica evite investigaciones controvertidas y peligrosas como la reanimar patógenos. [48]
Bostrom fue nombrado en la lista de 2009 de los principales pensadores globales de Foreign Policy "por no aceptar límites al potencial humano". [49] La revista Prospect incluyó a Bostrom en su lista de 2014 de los Principales Pensadores del Mundo . [50]
Bostrom ha brindado asesoramiento sobre políticas y ha sido consultor para muchos gobiernos y organizaciones. Presentó evidencia ante el Comité Selecto sobre Habilidades Digitales de la Cámara de los Lores . [51] Es miembro del consejo asesor del Machine Intelligence Research Institute , [52] Future of Life Institute , [53] y asesor externo del Cambridge Centre for the Study of Existential Risk . [54]
En enero de 2023, Bostrom emitió una disculpa [55] por un correo electrónico de 1996 que envió como estudiante de posgrado [56] en el que había declarado que pensaba que "los negros son más estúpidos que los blancos", y donde también utilizó la palabra " niggers " en una descripción de cómo pensaba que esta declaración podría ser percibida por otros. [57] La disculpa, publicada en su sitio web, [55] declaró que "la invocación de un insulto racial era repulsiva" y que "repudiaba por completo este correo electrónico repugnante". En su disculpa, escribió: "Creo que es profundamente injusto que el acceso desigual a la educación, los nutrientes y la atención médica básica conduzca a la desigualdad en los resultados sociales, incluidas a veces disparidades en las habilidades y la capacidad cognitiva". [58] Según Andrew Anthony de The Guardian , "La disculpa hizo poco para aplacar a los críticos de Bostrom, sobre todo porque notoriamente no retiró su afirmación central sobre la raza y la inteligencia , y pareció hacer una defensa parcial de la eugenesia ". [59]
En enero de 2023, la Universidad de Oxford le dijo a The Daily Beast : "La Universidad y la Facultad de Filosofía están investigando actualmente el asunto, pero condenan en los términos más enérgicos posibles las opiniones que este académico en particular expresó en sus comunicaciones". [57] Ursula Coope , presidenta de la junta de la facultad del departamento de filosofía de Oxford, envió un correo electrónico a los estudiantes y graduados actuales diciendo que estaba "horrorizada y molesta" por el correo electrónico de Bostrom de 1996. [60] Según Bostrom, la investigación de la Universidad de Oxford concluyó el 10 de agosto de 2023 "no consideramos que usted sea racista ni que tenga opiniones racistas, y consideramos que la disculpa que publicó en enero de 2023 fue sincera". [61] [59]
Bostrom conoció a su esposa Susan en 2002. En 2015, ella vivía en Montreal y Bostrom en Oxford. Tuvieron un hijo. [1]
La disculpa no logró aplacar a los críticos de Bostrom, sobre todo porque notoriamente no retiró su argumento central sobre la raza y la inteligencia, y pareció hacer una defensa parcial de la eugenesia. Aunque, después de una investigación, la Universidad de Oxford aceptó que Bostrom no era racista, todo el episodio dejó una mancha en la reputación del instituto.
No consideramos que seas racista ni que tengas opiniones racistas, y consideramos que la disculpa que publicaste en enero de 2023 fue sincera. ... creemos que tu disculpa, tu reconocimiento de la angustia que causaron tus acciones y tu agradecimiento por el cuidado y el tiempo que todos han dedicado a este proceso han sido genuinos y sinceros. También nos sentimos alentados por el hecho de que ya te hayas embarcado en un viaje de reflexión profunda y significativa, que incluye explorar el aprendizaje y la autoeducación de este proceso.