El PLN es un subcampo de lingüística, informática, ingeniería de información e inteligencia artificial preocupada por las interacciones entre computadoras y los lenguajes humanos (naturales), en particular cómo programar las computadoras para procesar y analizar grandes cantidades de datos en lenguaje natural.
El PLN es importante porque ayuda a resolver la ambigüedad en lenguaje y agrega una estructura numérica útil a los datos para muchas aplicaciones posteriores, como voz, reconocimiento o análisis de texto.
La minería de texto logra esto mediante el uso de una variedad de análisis y metodologías. El procesamiento del lenguaje natural (PLN) es uno de ellos. En cambio, en minería de textos, el objetivo principal es descubrir información relevante que posiblemente sea desconocido y oculto en el contexto de otra información.
El procesamiento de lenguaje natural ayuda a las computadoras a comunicarse con los humanos en su propio idioma y escala otras tareas relacionadas con el idioma. Por ejemplo, el PLN hace posible que las computadoras lean texto, escuchen el habla, lo interpreten, midan el sentimiento y determinar que partes son importantes.