Google Ngram Viewer

[6]​ Los n-grams son comparados con el texto en el corpus seleccionado, con la opción de ortografía case-sensitive (que compara el uso exacto de las mayúsculas y minúsculas),[3]​ y, si se encuentran en 40 libros o más, se ilustran en un gráfico.

[2]​[4]​ Fue inspirado por un prototipo (llamado “Bookworm”, o comelibros) creado por Jean-Baptiste Michel y Erez Aiden del Observatorio Cultural de Harvard, Yuan Shen del MIT y Steven Pinker.

[8]​ Omitir puntos en las abreviaturas permite una forma de correspondencia, por ejemplo utilizar "R M S" para buscar el término "R.M.S."

[12]​[13]​ Por estos errores, y porque no está controlada contra la parcialidad[14]​ (por ejemplo el incremento en literatura científica que hace que la popularidad de otros términos baje), es arriesgado utilizar este corpus para estudios lingüísticos o para evaluar teorías.

En particular, errores sistemáticos como la confusión de la letra “s” y la “f” en textos previos al siglo XIX (dado el uso de la s larga) que tenía apariencia muy similar a la “f”) puede causar tendencias erróneas.

Aunque el Ngram Viewer dice que los resultados son confiables para textos a partir del 1800, los problemas con el OCR y la insuficiencia de datos significan que para algunos idiomas, como el chino, las frecuencias son confiables sólo a partir del 1970, visto que las secciones previas del corpus no muestran ningún resultado aún para términos de búsqueda communes, y que los datos correspondientes a algunos años contienen más de 50% de ruido.