[1] Una medida comúnmente utilizada de la diversidad de nucleótidos fue introducida por primera vez por Nei y Li en 1979.
Esta medida se define como el número promedio de diferencias de nucleótidos por sitio entre dos secuencias de ADN en todos los pares posibles en la población de muestra, y se denota por
Está dado por la fórmula: dónde
son las frecuencias respectivas de las secuencias
es el número de secuencias en la muestra.
Suele asociarse con otras medidas estadísticas de la diversidad de la población y es similar a la heterocigosidad esperada.
Esta estadística puede usarse para monitorear la diversidad dentro o entre poblaciones ecológicas, para examinar la variación genética en cultivos y especies relacionadas,[2] o para determinar relaciones evolutivas.