Natasha Fridman Noy es una científica investigadora estadounidense nacida en Rusia [3] que trabaja en Google Research en Mountain View, CA , [4] que se centra en hacer que los datos estructurados sean más accesibles y utilizables. [5] [2] [6] Es la líder del equipo de Dataset Search, un motor de búsqueda basado en la web para todos los conjuntos de datos. [7] Natasha trabajó en el Centro de Investigación en Informática Biomédica de Stanford antes de unirse a Google, donde hizo importantes contribuciones a la construcción y alineación de ontologías, así como a la ingeniería de ontologías colaborativas. [4] Natasha forma parte de los consejos editoriales de muchas publicaciones sobre sistemas de información y web semántica y es la expresidenta inmediata de la Semantic Web Science Association. [4] De 2011 a 2017, fue presidenta de la Semantic Web Science Association. [7]
Natasha Noy obtuvo una licenciatura en matemáticas aplicadas de la Universidad Estatal de Moscú, una maestría en informática de la Universidad de Boston y un doctorado de la Universidad del Noreste. [2] Su tesis se centró en documentos ricos en conocimiento, en particular la recuperación de información para artículos científicos. [8]
Noy se mudó de Northeastern a la Universidad de Stanford , para trabajar con Mark Musen en el editor de ontologías de Protégé como investigadora postdoctoral , y más tarde como científica investigadora. Fue aquí donde completó su importante trabajo en Prompt, un entorno para la alineación automatizada de ontologías, que se publicó en 2002. [9] [10] Por reconocer los detalles del problema y brindar una solución inventiva, este estudio recibió el premio de artículo clásico AAAI en 2018. Sin embargo, su trabajo más distribuido con diferencia [2] fue el tutorial Ontology 101, [11] que Noy desarrolló como parte del programa educativo para los clientes de Protégé; el tutorial se convirtió en un documento introductorio estándar para la web semántica y las ontologías; se ha citado casi 6800 veces en 2018 y se ha descargado con frecuencia. [2]
En abril de 2014, Noy se fue a Google Research; Google ha lanzado un motor de búsqueda para ayudar a los investigadores a encontrar datos disponibles públicamente en línea. El 5 de septiembre, se lanzó el programa y está dirigido a "científicos, periodistas de datos, expertos en datos o cualquier otra persona". [7] Dataset Search, que ahora sigue a otros motores de búsqueda especializados de Google, como la búsqueda de noticias e imágenes, así como Google Scholar y Google Books, localiza archivos y bases de datos en función de cómo sus propietarios los han categorizado. No lee el contenido de los archivos de la misma manera que los motores de búsqueda leen las páginas web. [7] Los investigadores que quieren saber qué tipos de datos son accesibles o que quieren encontrar datos que ya saben que existen, según Natasha Noy, a menudo deben confiar en el boca a boca; este problema es particularmente agudo, según Noy, para los académicos en el inicio de su carrera que aún no se han "conectado" a una red de vínculos profesionales. Noy y su colega de Google, Dan Brickley, escribieron una publicación en un blog en enero de 2017 proponiendo una solución al problema. Los motores de búsqueda típicos funcionan en dos etapas: la primera es buscar en Internet sitios para indexar de forma regular, la segunda es clasificar esos sitios indexados para que el motor pueda devolver resultados relevantes en orden cuando un usuario introduzca una palabra de búsqueda. Los propietarios de conjuntos de datos deberían "etiquetarlos" utilizando un vocabulario estandarizado llamado Schema.org. Según Noy y Brickley, Google y otros tres gigantes de los motores de búsqueda (Microsoft, Yahoo y Yandex) crearon Schema.org para ayudar a los motores de búsqueda a escanear los conjuntos de datos existentes. [7]
Noy es más conocida por su trabajo en el editor de ontología Protégé y la herramienta de alineación Prompt, por la que ella y el coautor Mark Musen recibieron el premio AAAI Classic Paper en 2018. El premio AAAI Classic Paper honra al autor o autores de los artículos más influyentes de un año de conferencia específico, y el período de tiempo examinado avanza un año por año. [12] Fue elegida miembro de la AAAI en 2020 [13] y miembro de la ACM en 2023. [1]