Un lenguaje de programación es un sistema de notación para escribir programas de computadora . [1]
Los lenguajes de programación se describen en términos de su sintaxis (forma) y semántica (significado), generalmente definidos por un lenguaje formal . Los lenguajes normalmente proporcionan características tales como un sistema de tipos , variables y mecanismos para el manejo de errores . Se requiere una implementación de un lenguaje de programación para ejecutar programas, es decir, un intérprete o un compilador . Un intérprete ejecuta directamente el código fuente, mientras que un compilador produce un programa ejecutable .
La arquitectura informática ha influido fuertemente en el diseño de los lenguajes de programación, y el tipo más común ( lenguajes imperativos , que implementan operaciones en un orden específico) se desarrolló para funcionar bien en la popular arquitectura von Neumann . Si bien los primeros lenguajes de programación estaban estrechamente vinculados al hardware , con el tiempo han desarrollado una mayor abstracción para ocultar los detalles de implementación para una mayor simplicidad.
Se han desarrollado miles de lenguajes de programación, a menudo clasificados como imperativos, funcionales , lógicos u orientados a objetos , para una amplia variedad de usos. Muchos aspectos del diseño de lenguajes de programación implican compensaciones; por ejemplo, el manejo de excepciones simplifica el manejo de errores, pero a un costo de rendimiento. La teoría de los lenguajes de programación es el subcampo de la informática que estudia el diseño, implementación, análisis, caracterización y clasificación de los lenguajes de programación.
Hay una variedad de criterios que pueden considerarse al definir qué constituye un lenguaje de programación.
El término lenguaje informático a veces se utiliza indistintamente con lenguaje de programación. [2] Sin embargo, el uso de ambos términos varía entre los autores, incluido el alcance exacto de cada uno. Un uso describe los lenguajes de programación como un subconjunto de lenguajes informáticos. [3] De manera similar, los lenguajes utilizados en informática que tienen un objetivo diferente al de expresar programas informáticos se denominan genéricamente lenguajes informáticos. Por ejemplo, los lenguajes de marcado a veces se denominan lenguajes informáticos para enfatizar que no están destinados a usarse para programación. [4] Una forma de clasificar los lenguajes informáticos es mediante los cálculos que son capaces de expresar, como lo describe la teoría de la computación . La mayoría de los lenguajes de programación prácticos son Turing completo , [5] y todos los lenguajes Turing completo pueden implementar el mismo conjunto de algoritmos . ANSI/ISO SQL-92 y Charity son ejemplos de lenguajes que no son completos de Turing, pero que a menudo se denominan lenguajes de programación. [6] [7] Sin embargo, algunos autores restringen el término "lenguaje de programación" a los lenguajes completos de Turing. [1] [8]
Otro uso considera los lenguajes de programación como construcciones teóricas para programar máquinas abstractas y los lenguajes informáticos como el subconjunto de los mismos que se ejecuta en computadoras físicas, que tienen recursos de hardware finitos. [9] John C. Reynolds enfatiza que los lenguajes de especificación formal son tanto lenguajes de programación como los lenguajes destinados a la ejecución. También sostiene que los formatos de entrada textuales e incluso gráficos que afectan el comportamiento de una computadora son lenguajes de programación, a pesar de que comúnmente no son Turing completos, y señala que la ignorancia de los conceptos del lenguaje de programación es la razón de muchas fallas en los formatos de entrada. [10]
En la mayoría de los contextos prácticos, un lenguaje de programación implica una computadora; en consecuencia, los lenguajes de programación suelen definirse y estudiarse de esta manera. [11] Los lenguajes de programación se diferencian de los lenguajes naturales en que los lenguajes naturales solo se utilizan para la interacción entre personas, mientras que los lenguajes de programación también permiten a los humanos comunicar instrucciones a las máquinas.
También vale la pena considerar el dominio del idioma. Los lenguajes de marcado como XML , HTML o troff , que definen datos estructurados , no suelen considerarse lenguajes de programación. [12] [13] [14] Sin embargo, los lenguajes de programación pueden compartir la sintaxis con los lenguajes de marcado si se define una semántica computacional. XSLT , por ejemplo, es un lenguaje completo de Turing que utiliza enteramente sintaxis XML. [15] [16] [17] Además, LaTeX , que se utiliza principalmente para estructurar documentos, también contiene un subconjunto completo de Turing. [18] [19]
Los lenguajes de programación suelen contener abstracciones para definir y manipular estructuras de datos o controlar el flujo de ejecución . La necesidad práctica de que un lenguaje de programación admita abstracciones adecuadas se expresa mediante el principio de abstracción . [20] Este principio a veces se formula como una recomendación al programador para que haga un uso adecuado de dichas abstracciones. [21]
A finales de los años 40 se inventaron los primeros ordenadores programables y, con ellos, los primeros lenguajes de programación. [22] Las primeras computadoras se programaron en lenguajes de programación de primera generación (1GL), lenguaje de máquina (instrucciones simples que el procesador podía ejecutar directamente). Este código era muy difícil de depurar y no era portátil entre diferentes sistemas informáticos. [23] Para mejorar la facilidad de programación, se inventaron los lenguajes ensambladores (o lenguajes de programación de segunda generación, 2GL), que se diferenciaban del lenguaje de máquina para hacer que los programas fueran más fáciles de entender para los humanos, aunque no aumentaron la portabilidad. [24]
Inicialmente, los recursos de hardware eran escasos y caros, mientras que los recursos humanos eran más baratos. Por lo tanto, se favorecieron los lenguajes engorrosos que requerían mucho tiempo de uso, pero que estaban más cerca del hardware para una mayor eficiencia. [25] La introducción de lenguajes de programación de alto nivel ( lenguajes de programación de tercera generación, 3GL): revolucionó la programación. Estos lenguajes abstrajeron los detalles del hardware y, en cambio, fueron diseñados para expresar algoritmos que los humanos pudieran entender más fácilmente. Por ejemplo, las expresiones aritméticas ahora podrían escribirse en notación simbólica y luego traducirse a código de máquina que el hardware podría ejecutar. [24] En 1957, se inventó Fortran (TRADUCCIÓN DE FÓRMULA). A menudo considerado el primer lenguaje de programación compilado de alto nivel, [24] [26] Fortran se ha mantenido en uso hasta el siglo XXI. [27]
Alrededor de 1960 se desarrollaron los primeros mainframes (ordenadores de uso general), aunque sólo podían ser operados por profesionales y el coste era extremo. Los datos y las instrucciones se ingresaron mediante tarjetas perforadas , lo que significa que no se pudo agregar ninguna entrada mientras el programa estaba en ejecución. Por lo tanto, los lenguajes desarrollados en este momento están diseñados para una interacción mínima. [29] Después de la invención del microprocesador , las computadoras en la década de 1970 se volvieron dramáticamente más baratas. [30] Las nuevas computadoras también permitieron una mayor interacción del usuario, que fue respaldada por lenguajes de programación más nuevos. [31]
Lisp , implementado en 1958, fue el primer lenguaje de programación funcional . [32] A diferencia de Fortran, admite recursividad y expresiones condicionales , [33] y también introdujo la gestión dinámica de la memoria en un montón y la recolección automática de basura . [34] Durante las siguientes décadas, Lisp dominó las aplicaciones de inteligencia artificial . [35] En 1978, otro lenguaje funcional, ML , introdujo tipos inferidos y parámetros polimórficos . [31] [36]
Después del lanzamiento de ALGOL (lenguaje ALGOrithmic) en 1958 y 1960, [37] se convirtió en el estándar en la literatura informática para describir algoritmos . Aunque su éxito comercial fue limitado, los lenguajes imperativos más populares, incluidos C , Pascal , Ada , C++ , Java y C# , descienden directa o indirectamente de ALGOL 60. [38] [27] Entre sus innovaciones adoptadas por lenguajes de programación posteriores se incluyen mayor portabilidad y el primer uso de gramática BNF libre de contexto . [39] Simula , el primer lenguaje que admite programación orientada a objetos (incluidos subtipos , despacho dinámico y herencia ), también desciende de ALGOL y logró un éxito comercial. [40] C, otro descendiente de ALGOL, ha mantenido su popularidad hasta el siglo XXI. C permite el acceso a operaciones de máquinas de nivel inferior más que otros lenguajes contemporáneos. Su potencia y eficiencia, generadas en parte con operaciones de puntero flexibles , tienen el costo de hacer más difícil escribir código correcto. [31]
Prolog , diseñado en 1972, fue el primer lenguaje de programación lógica que se comunicaba con una computadora mediante notación lógica formal. [41] [42] Con la programación lógica, el programador especifica un resultado deseado y permite al intérprete decidir cómo lograrlo. [43] [42]
Durante la década de 1980, la invención de la computadora personal transformó las funciones para las cuales se utilizaban los lenguajes de programación. [44] Los nuevos lenguajes introducidos en la década de 1980 incluyeron C++, un superconjunto de C que puede compilar programas en C pero que también admite clases y herencia . [45] Ada y otros lenguajes nuevos introdujeron soporte para la concurrencia . [46] El gobierno japonés invirtió mucho en los llamados lenguajes de quinta generación que agregaron soporte para la concurrencia a las construcciones de programación lógica, pero estos lenguajes fueron superados por otros lenguajes que soportan la concurrencia. [47] [48]
Debido al rápido crecimiento de Internet y la World Wide Web en la década de 1990, se introdujeron nuevos lenguajes de programación para respaldar las páginas web y las redes . [49] Java , basado en C++ y diseñado para una mayor portabilidad entre sistemas y seguridad, disfrutó de un éxito a gran escala porque estas características son esenciales para muchas aplicaciones de Internet. [50] [51] Otro desarrollo fue el de los lenguajes de secuencias de comandos escritos dinámicamente ( Python , JavaScript , PHP y Ruby ) diseñados para producir rápidamente pequeños programas que coordinan aplicaciones existentes . Debido a su integración con HTML , también se han utilizado para construir páginas web alojadas en servidores . [52] [53]
Durante la década de 2000, se produjo una desaceleración en el desarrollo de nuevos lenguajes de programación que alcanzaron una gran popularidad. [54] Una innovación fue la programación orientada a servicios , diseñada para explotar sistemas distribuidos cuyos componentes están conectados por una red. Los servicios son similares a los objetos en la programación orientada a objetos, pero se ejecutan en un proceso separado. [55] Ideas cruzadas de C# y F# entre programación imperativa y funcional. [56] Después de 2010, varios lenguajes nuevos ( Rust , Go , Swift , Zig y Carbon ) compitieron por el software de rendimiento crítico para el que históricamente se había utilizado C. [57] La mayoría de los nuevos lenguajes de programación utilizan escritura estática, mientras que algunos lenguajes nuevos utilizan escritura dinámica como Ring y Julia . [58] [59]
Algunos de los nuevos lenguajes de programación se clasifican como lenguajes de programación visual como Scratch , LabVIEW y PWCT . Además, algunos de estos lenguajes combinan el uso de programación visual y textual como Ballerina . [60] [61] [62] [63] Además, esta tendencia conduce al desarrollo de proyectos que ayudan a desarrollar nuevos VPL como Blockly de Google . [64] Muchos motores de juegos como Unreal y Unity también agregaron soporte para secuencias de comandos visuales. [65] [66]
Todo lenguaje de programación incluye elementos fundamentales para describir datos y las operaciones o transformaciones que se les aplican, como sumar dos números o seleccionar un elemento de una colección. Estos elementos se rigen por reglas sintácticas y semánticas que definen su estructura y significado, respectivamente.
La forma superficial de un lenguaje de programación se conoce como sintaxis . La mayoría de los lenguajes de programación son puramente textuales; utilizan secuencias de texto que incluyen palabras, números y puntuación, de forma muy parecida a los lenguajes naturales escritos. Por otro lado, algunos lenguajes de programación son gráficos y utilizan relaciones visuales entre símbolos para especificar un programa.
La sintaxis de un lenguaje describe las posibles combinaciones de símbolos que forman un programa sintácticamente correcto. El significado dado a una combinación de símbolos se maneja mediante la semántica (ya sea formal o codificada en una implementación de referencia ). Dado que la mayoría de los idiomas son textuales, este artículo analiza la sintaxis textual.
La sintaxis del lenguaje de programación generalmente se define mediante una combinación de expresiones regulares (para la estructura léxica ) y la forma Backus-Naur (para la estructura gramatical ). A continuación se muestra una gramática simple, basada en Lisp :
expresión ::= átomo | listaátomo ::= número | símbolonúmero ::= [+-]?['0'-'9']+símbolo ::= ['A'-'Z''a'-'z'].*lista ::= '(' expresión* ')'
Esta gramática especifica lo siguiente:
Los siguientes son ejemplos de secuencias de tokens bien formadas en esta gramática 12345
: ()
y (a b c232 (1))
.
No todos los programas sintácticamente correctos son semánticamente correctos. No obstante, muchos programas sintácticamente correctos están mal formados, según las reglas del lenguaje; y puede (dependiendo de la especificación del idioma y la solidez de la implementación) resultar en un error de traducción o ejecución. En algunos casos, dichos programas pueden exhibir un comportamiento indefinido . Incluso cuando un programa está bien definido dentro de un lenguaje, aún puede tener un significado que no es el previsto por la persona que lo escribió.
Usando el lenguaje natural como ejemplo, puede que no sea posible asignar un significado a una oración gramaticalmente correcta o que la oración sea falsa:
El siguiente fragmento de lenguaje C es sintácticamente correcto, pero realiza operaciones que no están definidas semánticamente (la operación *p >> 4
no tiene significado para un valor que tiene un tipo complejo y p->im
no está definida porque el valor de p
es el puntero nulo ):
complejo * p = NULL ; abs_p complejo = sqrt ( * p >> 4 + p -> im );
Si se omitiera la declaración de tipo en la primera línea, el programa generaría un error en la variable no definida p
durante la compilación. Sin embargo, el programa seguiría siendo sintácticamente correcto ya que las declaraciones de tipo sólo proporcionan información semántica.
La gramática necesaria para especificar un lenguaje de programación se puede clasificar según su posición en la jerarquía de Chomsky . La sintaxis de la mayoría de los lenguajes de programación se puede especificar mediante una gramática de tipo 2, es decir, son gramáticas libres de contexto . [67] Algunos lenguajes, incluidos Perl y Lisp, contienen construcciones que permiten la ejecución durante la fase de análisis. Los lenguajes que tienen construcciones que permiten al programador alterar el comportamiento del analizador hacen que el análisis de sintaxis sea un problema indecidible y, en general, desdibujan la distinción entre análisis y ejecución. [68] A diferencia del sistema de macros de Lisp y los bloques de Perl BEGIN
, que pueden contener cálculos generales, las macros en C son simplemente reemplazos de cadenas y no requieren ejecución de código. [69]
El término semántica se refiere al significado de las lenguas, a diferencia de su forma (sintaxis).
La semántica estática define restricciones a la estructura de textos válidos que son difíciles o imposibles de expresar en formalismos sintácticos estándar. [1] [ verificación fallida ] Para los lenguajes compilados, la semántica estática esencialmente incluye aquellas reglas semánticas que se pueden verificar en el momento de la compilación. Los ejemplos incluyen verificar que cada identificador se declare antes de usarse (en idiomas que requieren tales declaraciones) o que las etiquetas en los brazos de una declaración de caso sean distintas. [70] Muchas restricciones importantes de este tipo, como verificar que los identificadores se utilicen en el contexto apropiado (por ejemplo, no agregar un número entero al nombre de una función), o que las llamadas a subrutinas tengan el número y tipo de argumentos apropiados, se pueden imponer definiendo ellos como reglas en una lógica llamada sistema de tipos . Otras formas de análisis estático , como el análisis de flujo de datos, también pueden ser parte de la semántica estática. Los lenguajes de programación como Java y C# tienen un análisis de asignación definido , una forma de análisis de flujo de datos, como parte de su respectiva semántica estática.
Una vez que se han especificado los datos, se debe indicar a la máquina que realice operaciones con los datos. Por ejemplo, la semántica puede definir la estrategia mediante la cual las expresiones se evalúan en valores, o la manera en que las estructuras de control ejecutan sentencias condicionalmente . La semántica dinámica (también conocida como semántica de ejecución ) de un lenguaje define cómo y cuándo las diversas construcciones de un lenguaje deben producir el comportamiento de un programa. Hay muchas formas de definir la semántica de ejecución. El lenguaje natural se utiliza a menudo para especificar la semántica de ejecución de los lenguajes comúnmente utilizados en la práctica. Una cantidad significativa de investigación académica se centra en la semántica formal de los lenguajes de programación , lo que permite especificar la semántica de ejecución de manera formal. Los resultados de este campo de investigación han visto una aplicación limitada al diseño e implementación de lenguajes de programación fuera del mundo académico.
Un tipo de datos es un conjunto de valores permitidos y operaciones que se pueden realizar con estos valores. [71] El sistema de tipos de cada lenguaje de programación define qué tipos de datos existen, el tipo de expresión y cómo funcionan la equivalencia y la compatibilidad de tipos en el lenguaje. [72]
Según la teoría de tipos , un lenguaje está completamente tipificado si la especificación de cada operación define los tipos de datos a los que es aplicable la operación. [73] Por el contrario, un lenguaje sin tipo, como la mayoría de los lenguajes ensambladores , permite realizar cualquier operación sobre cualquier dato, generalmente secuencias de bits de varias longitudes. [73] En la práctica, si bien pocos idiomas están completamente mecanografiados, la mayoría ofrece cierto grado de mecanografía. [73]
Debido a que diferentes tipos (como enteros y flotantes ) representan valores de manera diferente, se producirán resultados inesperados si se utiliza un tipo cuando se espera otro. La verificación de tipos señalará este error, generalmente en tiempo de compilación (la verificación de tipos en tiempo de ejecución es más costosa). [74] Con tipificación segura , los errores de tipo siempre se pueden detectar a menos que las variables se conviertan explícitamente a un tipo diferente. La tipificación débil ocurre cuando los lenguajes permiten la conversión implícita, por ejemplo, para permitir operaciones entre variables de diferentes tipos sin que el programador realice una conversión de tipo explícita. Cuantos más casos se permita este tipo de coerción , menos errores de tipo se podrán detectar. [75]
Los primeros lenguajes de programación a menudo solo admitían tipos numéricos integrados, como el número entero (con y sin signo) y el punto flotante (para admitir operaciones con números reales que no son enteros). La mayoría de los lenguajes de programación admiten múltiples tamaños de flotantes (a menudo llamados flotantes y dobles ) y números enteros, según el tamaño y la precisión requeridos por el programador. Almacenar un número entero en un tipo que es demasiado pequeño para representarlo provoca un desbordamiento de enteros . La forma más común de representar números negativos con tipos con signo es el complemento a dos , aunque también se utiliza el complemento a uno . [76] Otros tipos comunes incluyen booleano , que es verdadero o falso, y carácter , tradicionalmente un byte , suficiente para representar todos los caracteres ASCII . [77]
Los arrays son un tipo de datos cuyos elementos, en muchos lenguajes, deben consistir en un único tipo de longitud fija. Otros lenguajes definen matrices como referencias a datos almacenados en otro lugar y admiten elementos de distintos tipos. [78] Dependiendo del lenguaje de programación, las secuencias de múltiples caracteres, llamadas cadenas , pueden admitirse como matrices de caracteres o como su propio tipo primitivo . [79] Las cadenas pueden ser de longitud fija o variable, lo que permite una mayor flexibilidad a costa de un mayor espacio de almacenamiento y una mayor complejidad. [80] Otros tipos de datos que pueden admitirse incluyen listas , [81] matrices asociativas (desordenadas) a las que se accede mediante claves, [82] registros en los que los datos se asignan a nombres en una estructura ordenada, [83] y tuplas , similares a los registros. pero sin nombres para los campos de datos. [84] Los punteros almacenan direcciones de memoria, generalmente haciendo referencia a ubicaciones en el montón donde se almacenan otros datos. [85]
El tipo definido por el usuario más simple es un tipo ordinal cuyos valores se pueden asignar al conjunto de números enteros positivos. [86] Desde mediados de la década de 1980, la mayoría de los lenguajes de programación también admiten tipos de datos abstractos , en los que la representación de los datos y las operaciones están ocultas para el usuario , que sólo puede acceder a una interfaz . [87] Los beneficios de la abstracción de datos pueden incluir una mayor confiabilidad, una complejidad reducida, menos potencial de colisión de nombres y permitir cambiar la estructura de datos subyacente sin que el cliente necesite alterar su código. [88]
En la escritura estática , todos los tipos de expresiones se determinan antes de que se ejecute un programa, generalmente en tiempo de compilación. [73] Los lenguajes de programación de tipo estático más utilizados requieren que los tipos de variables se especifiquen explícitamente. En algunos idiomas, los tipos están implícitos; una forma de esto es cuando el compilador puede inferir tipos según el contexto. La desventaja de la escritura implícita es la posibilidad de que los errores pasen desapercibidos. [89] La inferencia de tipos completa se ha asociado tradicionalmente con lenguajes funcionales como Haskell y ML . [90]
Con la escritura dinámica, el tipo no se adjunta a la variable sino solo al valor codificado en ella. Una sola variable se puede reutilizar para un valor de un tipo diferente. Aunque esto proporciona más flexibilidad al programador, tiene el costo de una menor confiabilidad y una menor capacidad del lenguaje de programación para verificar errores. [91] Algunos lenguajes permiten variables de tipo unión a las que se puede asignar cualquier tipo de valor, en una excepción a sus reglas habituales de escritura estática. [92]
En informática, se pueden ejecutar varias instrucciones simultáneamente. Muchos lenguajes de programación admiten la concurrencia a nivel de instrucción y a nivel de subprograma. [93] En el siglo XXI, la potencia de procesamiento adicional en las computadoras provenía cada vez más del uso de procesadores adicionales, lo que requiere que los programadores diseñen software que utilice múltiples procesadores simultáneamente para lograr un mejor rendimiento. [94] Los lenguajes interpretados como Python y Ruby no admiten el uso simultáneo de múltiples procesadores. [95] Otros lenguajes de programación admiten la gestión de datos compartidos entre diferentes subprocesos controlando el orden de ejecución de instrucciones clave mediante el uso de semáforos , controlando el acceso a datos compartidos a través de monitor o permitiendo el paso de mensajes entre subprocesos. [96]
Muchos lenguajes de programación incluyen controladores de excepciones, una sección de código activada por errores de tiempo de ejecución que puede solucionarlos de dos maneras principales: [97]
Algunos lenguajes de programación admiten dedicar un bloque de código para ejecutarlo independientemente de si se produce una excepción antes de alcanzar el código; esto se llama finalización. [98]
Existe una compensación entre una mayor capacidad para manejar excepciones y un rendimiento reducido. [99] Por ejemplo, aunque los errores de índice de matriz son comunes [100] C no los verifica por razones de rendimiento. [99] Aunque los programadores pueden escribir código para detectar excepciones definidas por el usuario, esto puede saturar un programa. Las bibliotecas estándar en algunos lenguajes, como C, usan sus valores de retorno para indicar una excepción. [101] Algunos lenguajes y sus compiladores tienen la opción de activar y desactivar la capacidad de manejo de errores, ya sea temporal o permanentemente. [102]
Una de las influencias más importantes en el diseño de lenguajes de programación ha sido la arquitectura de computadoras . Los lenguajes imperativos , el tipo más utilizado, fueron diseñados para funcionar bien en la arquitectura von Neumann , la arquitectura informática más común. [103] En la arquitectura von Neumann, la memoria almacena tanto datos como instrucciones, mientras que la CPU que realiza instrucciones sobre los datos está separada y los datos deben canalizarse de ida y vuelta a la CPU. Los elementos centrales en estos lenguajes son las variables, la asignación y la iteración , que es más eficiente que la recursividad en estas máquinas. [104]
Muchos lenguajes de programación se han diseñado desde cero, se han modificado para satisfacer nuevas necesidades y se han combinado con otros lenguajes. Muchos finalmente han caído en desuso. [ cita necesaria ] El nacimiento de los lenguajes de programación en la década de 1950 fue estimulado por el deseo de crear un lenguaje de programación universal adecuado para todas las máquinas y usos, evitando la necesidad de escribir código para diferentes computadoras. [105] A principios de la década de 1960, la idea de un lenguaje universal fue rechazada debido a los diferentes requisitos de la variedad de propósitos para los cuales se escribía el código. [106]
Las cualidades deseables de los lenguajes de programación incluyen legibilidad, capacidad de escritura y confiabilidad. [107] Estas características pueden reducir el costo de capacitar a los programadores en un lenguaje, la cantidad de tiempo necesario para escribir y mantener programas en el lenguaje, el costo de compilar el código y aumentar el rendimiento del tiempo de ejecución. [108]
El diseño de lenguajes de programación a menudo implica compensaciones. [118] Por ejemplo, las características para mejorar la confiabilidad generalmente tienen un costo de rendimiento. [119] La mayor expresividad debido a una gran cantidad de operadores facilita la escritura de código, pero tiene un costo de legibilidad. [119]
La programación en lenguaje natural se ha propuesto como una forma de eliminar la necesidad de un lenguaje especializado para la programación. Sin embargo, este objetivo sigue siendo lejano y sus beneficios están abiertos a debate. Edsger W. Dijkstra adoptó la posición de que el uso de un lenguaje formal es esencial para evitar la introducción de constructos sin sentido. [120] Alan Perlis se mostró igualmente desdeñoso ante la idea. [121]
La especificación de un lenguaje de programación es un artefacto que los usuarios del lenguaje y los implementadores pueden usar para acordar si un fragmento de código fuente es un programa válido en ese lenguaje y, de ser así, cuál será su comportamiento.
Una especificación de lenguaje de programación puede adoptar varias formas, incluidas las siguientes:
Una implementación de un lenguaje de programación es la conversión de un programa en código de máquina que puede ser ejecutado por el hardware. Luego, el código de máquina se puede ejecutar con la ayuda del sistema operativo . [125] La forma más común de interpretación en el código de producción es mediante un compilador , que traduce el código fuente a través de un lenguaje de nivel intermedio a código de máquina, conocido como ejecutable . Una vez compilado el programa, se ejecutará más rápidamente que con otros métodos de implementación. [126] Algunos compiladores pueden proporcionar una optimización adicional para reducir el uso de memoria o cálculo cuando se ejecuta el ejecutable, pero aumentan el tiempo de compilación. [127]
Otro método de implementación es ejecutar el programa con un intérprete , que traduce cada línea de software a código de máquina justo antes de ejecutarse. Aunque puede facilitar la depuración, la desventaja de la interpretación es que se ejecuta entre 10 y 100 veces más lento que un ejecutable compilado. [128] Los métodos de interpretación híbridos proporcionan algunos de los beneficios de la compilación y algunos de los beneficios de la interpretación mediante compilación parcial. Una forma que esto adopta es la compilación justo a tiempo , en la que el software se compila con anticipación en un lenguaje intermedio y luego en código de máquina inmediatamente antes de la ejecución. [129]
Aunque la mayoría de los lenguajes de programación más utilizados tienen especificaciones e implementaciones completamente abiertas, muchos lenguajes de programación existen solo como lenguajes de programación propietarios y la implementación está disponible únicamente a través de un único proveedor, que puede afirmar que dicho lenguaje propietario es su propiedad intelectual. Los lenguajes de programación propietarios suelen ser lenguajes de dominio específico o lenguajes de secuencias de comandos internos para un solo producto; Algunos lenguajes propietarios se utilizan sólo internamente dentro de un proveedor, mientras que otros están disponibles para usuarios externos. [ cita necesaria ]
Algunos lenguajes de programación existen en la frontera entre propietarios y abiertos; por ejemplo, Oracle Corporation afirma derechos de propiedad sobre algunos aspectos del lenguaje de programación Java , [130] y el lenguaje de programación C# de Microsoft , que tiene implementaciones abiertas de la mayor parte del sistema, también tiene Common Language Runtime (CLR) como sistema cerrado. ambiente. [131]
Muchos lenguajes propietarios se utilizan ampliamente, a pesar de su naturaleza patentada; los ejemplos incluyen MATLAB , VBScript y Wolfram Language . Algunos idiomas pueden hacer la transición de cerrados a abiertos; por ejemplo, Erlang era originalmente el lenguaje de programación interno de Ericsson. [132]
Los lenguajes de programación de código abierto son particularmente útiles para aplicaciones de ciencia abierta , ya que mejoran la capacidad de replicación y uso compartido de código. [133]
Se han creado miles de lenguajes de programación diferentes, principalmente en el campo de la informática. [134] Los proyectos de software individuales suelen utilizar cinco lenguajes de programación o más. [135]
Los lenguajes de programación se diferencian de la mayoría de las otras formas de expresión humana en que requieren un mayor grado de precisión e integridad. Cuando se utiliza un lenguaje natural para comunicarse con otras personas, los autores y hablantes humanos pueden ser ambiguos y cometer pequeños errores, y aun así esperar que se comprenda su intención. Sin embargo, en sentido figurado, las computadoras "hacen exactamente lo que se les dice que hagan" y no pueden "entender" qué código pretendía escribir el programador. La combinación de la definición del lenguaje, un programa y las entradas del programa debe especificar completamente el comportamiento externo que ocurre cuando se ejecuta el programa, dentro del dominio de control de ese programa. Por otro lado, las ideas sobre un algoritmo se pueden comunicar a los humanos sin la precisión necesaria para su ejecución mediante el uso de pseudocódigo , que entrelaza el lenguaje natural con el código escrito en un lenguaje de programación.
Un lenguaje de programación proporciona un mecanismo estructurado para definir piezas de datos y las operaciones o transformaciones que pueden realizarse automáticamente en esos datos. Un programador utiliza las abstracciones presentes en el lenguaje para representar los conceptos involucrados en un cálculo. Estos conceptos se representan como una colección de los elementos más simples disponibles (llamados primitivos ). [136] La programación es el proceso mediante el cual los programadores combinan estas primitivas para componer nuevos programas o adaptar los existentes a nuevos usos o a un entorno cambiante.
Los programas para una computadora pueden ejecutarse en un proceso por lotes sin interacción humana, o un usuario puede escribir comandos en una sesión interactiva de un intérprete . En este caso los "comandos" son simplemente programas, cuya ejecución está encadenada. Cuando un lenguaje puede ejecutar sus comandos a través de un intérprete (como un shell de Unix u otra interfaz de línea de comandos ), sin compilar, se le llama lenguaje de scripting . [137]
Es difícil determinar cuál es el lenguaje de programación más utilizado ya que la definición de uso varía según el contexto. Un lenguaje puede ocupar la mayor cantidad de horas de programador, otro tiene más líneas de código y un tercero puede consumir más tiempo de CPU. Algunos lenguajes son muy populares para tipos particulares de aplicaciones. Por ejemplo, COBOL sigue siendo fuerte en el centro de datos corporativo, a menudo en grandes mainframes ; [138] [139] Fortran en aplicaciones científicas y de ingeniería; Ada en aplicaciones aeroespaciales, de transporte, militares, en tiempo real e integradas; y C en aplicaciones integradas y sistemas operativos. Regularmente se utilizan otros lenguajes para escribir muchos tipos diferentes de aplicaciones.
Se han propuesto varios métodos para medir la popularidad del idioma, cada uno sujeto a un sesgo diferente sobre lo que se mide:
Combinando y promediando información de varios sitios de Internet, stackify.com informó los diez lenguajes de programación más populares (en orden descendente por popularidad general): Java , C , C++ , Python , C# , JavaScript , VB.NET , R , PHP y MATLAB. . [143]
En junio de 2024, los cinco lenguajes de programación principales según el índice TIOBE son Python , C++ , C , Java y C# . TIOBE proporciona una lista de los 100 lenguajes de programación principales según su popularidad y actualiza esta lista cada mes. [144]
Un dialecto de un lenguaje de programación o de un lenguaje de intercambio de datos es una variación o extensión (relativamente pequeña) del lenguaje que no cambia su naturaleza intrínseca. En lenguajes como Scheme y Forth , los implementadores pueden considerar que los estándares son insuficientes, inadecuados o ilegítimos, por lo que a menudo se desvían del estándar y crean un nuevo dialecto . En otros casos, un dialecto se crea para su uso en un idioma de dominio específico , a menudo un subconjunto. En el mundo Lisp , la mayoría de los lenguajes que usan sintaxis básica de expresión S y semántica similar a Lisp se consideran dialectos Lisp, aunque varían enormemente como, por ejemplo, Racket y Clojure . Como es común que un idioma tenga varios dialectos, puede resultar bastante difícil para un programador sin experiencia encontrar la documentación adecuada. El idioma BASIC tiene muchos dialectos .
Los lenguajes de programación a menudo se clasifican en cuatro categorías principales: imperativos , funcionales , lógicos y orientados a objetos . [145]
Aunque los lenguajes de marcado no son lenguajes de programación, algunos tienen extensiones que admiten programación limitada. Además, existen lenguajes de propósito especial que no se comparan fácilmente con otros lenguajes de programación. [149]
Los programas y lenguajes pueden definirse como objetos matemáticos puramente formales. Sin embargo, hay más gente interesada en los programas que en otros objetos matemáticos como los grupos, precisamente porque es posible utilizar el programa (la secuencia de símbolos) para controlar la ejecución de una computadora. Si bien recomendamos encarecidamente el estudio de la teoría de la programación, este texto generalmente se limitará al estudio de los programas tal como se ejecutan en una computadora.
HTML no es un lenguaje de programación.
...es un lenguaje de marcado, no un lenguaje de programación.
XSLT, aunque está altamente especializado en la transformación de XML, es un lenguaje de programación completo de Turing.
TeX no es sólo un excelente motor de composición tipográfica, sino también un verdadero lenguaje de programación.
Este sitio enumera 8512 idiomas.
Resultados: Encontramos (a) un número medio de 5 idiomas por proyecto con un lenguaje principal de propósito general claramente dominante y 5 tipos de DSL de uso frecuente, (b) una influencia significativa del tamaño, el número de confirmaciones y el idioma principal sobre la cantidad de idiomas, así como sobre la ausencia de una influencia significativa de la edad y la cantidad de contribuyentes, y (c) tres ecosistemas de idiomas agrupados en torno a XML, Shell/Make y HTML/CSS. Conclusiones: La programación multilenguaje parece ser común en proyectos de código abierto y es un factor que debe tenerse en cuenta en las herramientas y al evaluar el desarrollo y mantenimiento de dichos sistemas de software.
{{cite web}}
: CS1 maint: multiple names: authors list (link)