Semánticamente, el sujeto puede tener muchos papeles temáticos diferentes: agente, paciente, experimentador, causa, etc. Morfológicamente puede tomar diversos casos: nominativo, absolutivo, ergativo, etc. Sintácticamente, según el análisis generativista más reciente, se considera que ocupa la posición sintáctica de especificador del sintagma oracional o sintagma de tiempo.
El sujeto es un concepto sintáctico, y aunque en ciertas lenguas pueden usarse criterios fonéticos, morfológicos e incluso semánticos para identificarlo, todos estos últimos son falibles por lo que la identificación de sujeto debe atenerse en lo posible a la sintaxis.
En muchas lenguas del mundo toda oración completa requiere la presencia de un sujeto explícito.
En otras lenguas por el contrario se acepta la posibilidad de que no exista un elemento fonéticamente realizado que pueda ser interpretado como sujeto (lenguas pro-drop), en estos casos se habla de sujeto elíptico.
Finalmente en algunas lenguas no existe sujeto semántico asociado en las oraciones genuinamente impersonales (las relacionadas por ejemplo con verbos meteorológicos: llueve, nieva, ...).
Sin embargo, en las lenguas de sujeto explícito obligatorio suele aparecer un pronombre expletivo en la posición usual de sujeto, como sucede en francés e inglés: En (1a) y (1b) aparecen los «pronombres expletivos» it y il que no tienen referente real (es decir, semánticamente vacíos).
Sin embargo, en el análisis generativista resultó más fácil hacer generalizaciones y formular algunos principios sintácticos, encontrados en las lenguas del mundo, suponiendo que todo sintagma es endocéntrico, en la línea la hipótesis de la X'-barra.