Limpieza de datos

Datos que son falsos o incorrectos pueden crear conclusiones falsas y dirigir a inversiones.Si un gobierno quiere analizar datos de un censo de población será muy importante que los datos sean fiables para evitar tomar decisiones fiscales erróneas.[1]​ Hay paquetes disponibles para poder limpiar o lavar datos de direcciones, típicamente hecho por una interfaz de programación de aplicaciones (API del inglés).Implementa varias herramientas útiles para el manejo y manipulación de datos que hacen la vida del Científico de Datos mucho más fácil.La primera ventaja obvia sobre cualquier otra biblioteca o framework de limpieza de datos públicos es que funcionará en una computadora portátil o un gran cluster, y segundo, es increíblemente fácil de instalar, usar y entender.