SPSS Statistics es un paquete de software estadístico desarrollado por IBM para la gestión de datos , análisis avanzados, análisis multivariante , inteligencia empresarial e investigación criminal . Producido durante mucho tiempo por SPSS Inc. , fue adquirido por IBM en 2009. Las versiones del software lanzadas desde 2015 tienen la marca IBM SPSS Statistics .
El nombre del software originalmente significaba Paquete estadístico para las ciencias sociales ( SPSS ), [4] lo que reflejaba el mercado original, luego cambió a Soluciones de productos y servicios estadísticos . [5] [6]
SPSS es un programa ampliamente utilizado para el análisis estadístico en las ciencias sociales . [7] También lo utilizan investigadores de mercado, investigadores de salud, empresas de encuestas, el gobierno, investigadores educativos, industrias, organizaciones de marketing, mineros de datos, [8] y otros. El manual original de SPSS (Nie, Bent y Hull, 1970) [9] ha sido descrito como uno de los "libros más influyentes de la sociología" por permitir a los investigadores comunes hacer su propio análisis estadístico. [10] Además del análisis estadístico, la gestión de datos (selección de casos, remodelación de archivos y creación de datos derivados) y la documentación de datos ( se almacena un diccionario de metadatos en el archivo de datos ) son características del software base.
Las numerosas funciones de SPSS Statistics son accesibles a través de menús desplegables o pueden programarse con un lenguaje de sintaxis de comandos 4GL patentado . La programación de sintaxis de comandos tiene las ventajas de generar resultados reproducibles, simplificar tareas repetitivas y manejar manipulaciones y análisis de datos complejos. Además, algunas aplicaciones complejas solo pueden programarse en sintaxis y no son accesibles a través de la estructura de menús. La interfaz de menú desplegable también genera sintaxis de comandos: esta puede mostrarse en el resultado, aunque se deben cambiar los ajustes predeterminados para que la sintaxis sea visible para el usuario. También se pueden pegar en un archivo de sintaxis utilizando el botón "pegar" presente en cada menú. Los programas se pueden ejecutar de forma interactiva o sin supervisión, utilizando la función de trabajo de producción suministrada.
Se puede utilizar un lenguaje de "macro" para escribir subrutinas de lenguaje de comandos . Una extensión de programación de Python puede acceder a la información del diccionario de datos y a los datos y crear dinámicamente programas de sintaxis de comandos. Esta extensión, introducida en SPSS 14, reemplazó a los "scripts" SAX Basic menos funcionales para la mayoría de los propósitos, aunque SaxBasic sigue estando disponible. Además, la extensión Python permite a SPSS ejecutar cualquiera de las estadísticas del paquete de software gratuito R. A partir de la versión 14, SPSS puede ser controlado externamente por un programa Python o VB.NET utilizando los "plug-ins" suministrados. (A partir de la versión 20, estas dos funciones de scripts, así como muchos scripts, están incluidos en el medio de instalación y normalmente se instalan de forma predeterminada).
SPSS Statistics impone restricciones en la estructura interna de los archivos, los tipos de datos , el procesamiento de datos y los archivos de correspondencia, que en conjunto simplifican considerablemente la programación. Los conjuntos de datos de SPSS tienen una estructura de tabla bidimensional, donde las filas suelen representar casos (como individuos u hogares) y las columnas representan mediciones (como edad, sexo o ingresos del hogar). Solo se definen dos tipos de datos: numéricos y de texto (o "cadena"). Todo el procesamiento de datos se produce de forma secuencial caso por caso a lo largo del archivo (conjunto de datos). Los archivos se pueden emparejar uno a uno y uno a muchos , pero no muchos a muchos . Además de esa estructura y procesamiento de casos por variables, hay una sesión de Matriz independiente en la que se pueden procesar datos como matrices mediante operaciones de álgebra lineal y de matriz.
La interfaz gráfica de usuario tiene dos vistas que se pueden alternar. La "Vista de datos" muestra una vista de hoja de cálculo de los casos (filas) y las variables (columnas). A diferencia de las hojas de cálculo, las celdas de datos solo pueden contener números o texto, y no se pueden almacenar fórmulas en estas celdas. La "Vista de variables" muestra el diccionario de metadatos, donde cada fila representa una variable y muestra el nombre de la variable, la etiqueta de la variable, las etiquetas de valor, el ancho de impresión, el tipo de medición y una variedad de otras características. Las celdas en ambas vistas se pueden editar manualmente, definiendo la estructura del archivo y permitiendo la entrada de datos sin usar la sintaxis de comandos. Esto puede ser suficiente para conjuntos de datos pequeños. Los conjuntos de datos más grandes, como las encuestas estadísticas , se crean con mayor frecuencia en software de entrada de datos o se ingresan durante entrevistas personales asistidas por computadora , mediante escaneo y uso de software de reconocimiento óptico de caracteres y reconocimiento óptico de marcas , o mediante captura directa de cuestionarios en línea. Luego, estos conjuntos de datos se leen en SPSS.
SPSS Statistics puede leer y escribir datos de archivos de texto ASCII (incluidos archivos jerárquicos), otros paquetes de estadísticas, hojas de cálculo y bases de datos . También puede leer y escribir en tablas de bases de datos relacionales externas a través de ODBC y SQL .
La salida estadística se presenta en un formato de archivo propietario (archivo *.spv, compatible con tablas dinámicas ) para el cual, además del visualizador incluido en el paquete, se puede descargar un lector independiente. La salida propietaria se puede exportar a texto o Microsoft Word , PDF , Excel y otros formatos. Alternativamente, la salida se puede capturar como datos (usando el comando OMS), como texto, texto delimitado por tabulaciones, PDF, XLS , HTML , XML , conjunto de datos SPSS o una variedad de formatos de imágenes gráficas ( JPEG , PNG , BMP y EMF ).
Existen varias variantes de SPSS Statistics. Los paquetes de graduación de SPSS Statistics son versiones con grandes descuentos que se venden solo a estudiantes. [11] SPSS Statistics Server es una versión del software con una arquitectura cliente/servidor . Los paquetes complementarios pueden mejorar el software base con funciones adicionales (por ejemplo, muestras complejas , que se pueden ajustar para muestras agrupadas y estratificadas, y tablas personalizadas , que pueden crear tablas listas para publicar). SPSS Statistics está disponible con una licencia de suscripción anual o mensual .
La versión 25 de SPSS Statistics se lanzó el 8 de agosto de 2017. Esta versión agregó estadísticas nuevas y avanzadas, como resultados de soluciones de efectos aleatorios (GENLINMIXED), errores estándar robustos (GLM/UNIANOVA) y gráficos de perfil con barras de error dentro del complemento Estadísticas avanzadas y tablas personalizadas. La versión 25 también incluye nuevas capacidades de estadísticas bayesianas , un método de inferencia estadística y gráficos listos para publicación, como nuevas y poderosas capacidades de gráficos, incluidas nuevas plantillas predeterminadas y la capacidad de compartir con aplicaciones de Microsoft Office. [12]
SPSS se lanzó en su primera versión en 1968 como el Paquete estadístico para las ciencias sociales (SPSS) después de ser desarrollado por Norman H. Nie , Dale H. Bent y C. Hadlai Hull. Estos directores se incorporaron como SPSS Inc. en 1975. Las primeras versiones de SPSS Statistics se escribieron en Fortran y se diseñaron para el procesamiento por lotes en mainframes , incluidas, por ejemplo , las versiones IBM e ICL , que originalmente usaban tarjetas perforadas para la entrada de datos y programas. Una ejecución de procesamiento leía un archivo de comandos de SPSS y un archivo de entrada sin procesar de datos de formato fijo con un solo tipo de registro, o un "archivo de obtención" de datos guardados por una ejecución anterior. Para ahorrar un valioso tiempo de computadora, se podía realizar una ejecución de "edición" para verificar la sintaxis de los comandos sin analizar los datos. A partir de la versión 10 (SPSS-X) en 1983, los archivos de datos podían contener múltiples tipos de registros.
Antes de SPSS 16.0, había diferentes versiones de SPSS disponibles para Windows , Mac OS X y Unix .
La versión 13.0 de SPSS Statistics para Mac OS X no era compatible con los ordenadores Macintosh con procesador Intel , debido a que el software de emulación Rosetta causaba errores en los cálculos. Para que SPSS Statistics 15.0 para Windows fuera compatible con Windows Vista , era necesario instalar una revisión descargable .
A partir de la versión 16.0, la misma versión funciona en Windows, Mac y Linux. La interfaz gráfica de usuario está escrita en Java . La versión para Mac OS se proporciona como binario universal , lo que la hace totalmente compatible con hardware Mac basado en Intel y PowerPC.
SPSS Inc anunció el 28 de julio de 2009 que IBM la adquiriría por 1200 millones de dólares. [19] Debido a una disputa sobre la propiedad del nombre "SPSS", entre 2009 y 2010, el producto se denominó PASW (Predictive Analytics SoftWare). [20] A partir de enero de 2010, pasó a llamarse "SPSS: An IBM Company". La transferencia completa del negocio a IBM se realizó el 1 de octubre de 2010. Para esa fecha, SPSS: An IBM Company dejó de existir. IBM SPSS ahora está completamente integrado en IBM Corporation y es una de las marcas de la cartera de análisis empresarial de IBM Software Group, junto con IBM Algorithmics , IBM Cognos e IBM OpenPages .
El software complementario de la familia "IBM SPSS" se utiliza para minería de datos y análisis de texto ( IBM SPSS Modeler ), servicios de calificación crediticia en tiempo real (IBM SPSS Collaboration and Deployment Services) y modelado de ecuaciones estructurales (IBM SPSS Amos).
SPSS Data Collection y SPSS Dimensions se vendieron en 2015 a UNICOM Systems, Inc., una división de UNICOM Global , y se fusionaron en la suite de software integrada UNICOM Intelligence (diseño de encuestas, implementación de encuestas, recopilación de datos, gestión de datos y generación de informes). [21] [22] [23]
IDA (Interactive Data Analysis) [24] fue un paquete de software que se originó en lo que antes era el National Opinion Research Center ( NORC ), en la Universidad de Chicago . Inicialmente ofrecido en la HP-2000 , [25] algo más tarde, bajo la propiedad de SPSS, también estuvo disponible en MUSIC/SP . [26] El análisis de regresión fue uno de los puntos fuertes de IDA . [25]
SCSS era un producto de software destinado al uso en línea de mainframes de IBM. [27]
Aunque la "C" significaba "conversacional", también representaba una distinción con respecto a cómo se almacenaban los datos: utilizaba una base de datos orientada a columnas en lugar de una base de datos orientada a filas (interna). [ cita requerida ]
Esto proporcionó un buen tiempo de respuesta interactiva para el Sistema estadístico conversacional SPSS (SCSS), cuyo punto fuerte, al igual que con SPSS, era la tabulación cruzada. [28]
En octubre de 2020, IBM anunció el inicio de un programa de acceso anticipado para el "Nuevo SPSS Statistics", cuyo nombre en código es Proyecto NX. [29] [30] Contiene "muchas de sus capacidades favoritas de SPSS presentadas en una nueva interfaz fácil de usar, con guía integrada, múltiples pestañas, gráficos mejorados y mucho más".
En diciembre de 2021, IBM abrió el Programa de acceso anticipado para la próxima generación de SPSS Statistics para más usuarios y compartió más imágenes al respecto. [31] [32]