Natasha Fridman Noy es una científica investigadora estadounidense nacida en Rusia [3] que trabaja en Google Research en Mountain View, CA , [4] y se centra en hacer que los datos estructurados sean más accesibles y utilizables. [5] [2] [6] Ella es la líder del equipo de Dataset Search, un motor de búsqueda basado en web para todos los conjuntos de datos. [7] Natasha trabajó en el Centro de Investigación en Informática Biomédica de Stanford antes de unirse a Google, donde hizo importantes contribuciones a la construcción y alineación de ontologías, así como a la ingeniería ontológica colaborativa. [4] Natasha forma parte de los consejos editoriales de muchas publicaciones sobre web semántica y sistemas de información y es la ex presidenta inmediata de la Asociación de Ciencias de la Web Semántica. [4] De 2011 a 2017, fue presidenta de la Semantic Web Science Association. [7]
Natasha Noy obtuvo una licenciatura en matemáticas aplicadas de la Universidad Estatal de Moscú, una maestría en informática de la Universidad de Boston y un doctorado de la Universidad Northeastern. [2] Su tesis se centró en documentos ricos en conocimiento, en particular la recuperación de información para artículos científicos. [8]
Noy se mudó de Northeastern a la Universidad de Stanford para trabajar con Mark Musen en el editor de ontología Protégé como investigador postdoctoral y más tarde como científico investigador. Fue aquí donde completó su importante trabajo en Prompt, un entorno para la alineación de ontologías automatizadas, que se publicó en 2002. [9] [10] Por reconocer los detalles específicos del problema y proporcionar una solución inventiva, este estudio recibió el clásico AAAI. premio por artículo en 2018. Sin embargo, con diferencia su trabajo más distribuido [2] fue el tutorial Ontology 101, [11] que Noy desarrolló como parte del programa educativo para los clientes de Protégé, el tutorial se convirtió en un documento introductorio estándar para la semántica. web y ontologías. Se ha citado casi 6800 veces hasta 2018 y se ha descargado con frecuencia. [2]
En abril de 2014, Noy ingresó a Google Research; Google ha lanzado un motor de búsqueda para ayudar a los investigadores a encontrar datos en línea disponibles públicamente. El 5 de septiembre se lanzó el programa y está dirigido a "científicos, periodistas de datos, expertos en datos o cualquier otra persona". [7] Dataset Search, que ahora sigue a otros motores de búsqueda especializados de Google, incluida la búsqueda de noticias e imágenes, así como Google Scholar y Google Books, localiza archivos y bases de datos basándose en cómo los han categorizado sus propietarios. No lee el contenido de los archivos de la misma manera que los motores de búsqueda leen las páginas web. [7] Los investigadores que quieren saber qué tipos de datos son accesibles o que quieren encontrar datos que ya saben que existen, según Natasha Noy, a menudo deben confiar en el boca a boca, este problema es particularmente grave, según Noy, para académicos que inician su carrera y que todavía tienen que "conectarse" a una red de vínculos profesionales. Noy y su colega de Google, Dan Brickley, escribieron una publicación de blog en enero de 2017 proponiendo una solución al problema. Los motores de búsqueda típicos operan en dos etapas: la primera etapa es buscar en Internet sitios para indexar de forma regular, la segunda etapa es clasificar esos sitios indexados para que el motor pueda arrojar resultados relevantes en orden cuando un usuario ingresa un buscar palabra. Los propietarios de conjuntos de datos deben "etiquetarlos" utilizando un vocabulario estandarizado llamado Schema.org. Según Noy y Brickley, Google y otros tres gigantes de los motores de búsqueda (Microsoft, Yahoo y Yandex) crearon Schema.org para ayudar a los motores de búsqueda a escanear conjuntos de datos existentes. [7]
Noy es mejor conocida por su trabajo en el editor de ontología Protégé y la herramienta de alineación Prompt, por el cual ella y el coautor Mark Musen recibieron el premio AAAI Classic Paper en 2018, el premio AAAI Classic Paper honra a los autores de los trabajos más artículos influyentes de un año de conferencia específico, y el período de tiempo examinado avanza un año por año. [12] Fue elegida miembro de AAAI en 2020 [13] y miembro de ACM en 2023. [1]