Een natuurlijke taal query is input die uitsluitend bestaat uit termen of zinnen die normaal gesproken of ingevoerd worden zoals ze gesproken zouden kunnen worden, zonder niet-talige tekens, zoals het plus symbool of de asterisk, en zonder speciale opmaak of wijziging van de syntaxis. Vraagstellingen in natuurlijke taal kunnen worden uitgevoerd via een tekst- of spraakinterface.
Natuurlijke taalverwerking (NLP) maakt het voor software mogelijk om typisch menselijke spraak of geschreven inhoud als input te "begrijpen" en er eventueel op te reageren, afhankelijk van de toepassing. Een virtuele assistent, bijvoorbeeld, is ontworpen om te reageren op gesproken input of tekst. Geen enkele software is echter in staat om daadwerkelijk betekenis te ontlenen aan menselijke taal zoals die wordt gesproken, dus NLP omvat processen om taal tussen beide te vertalen.
NLP past syntaxis-technieken toe zoals parsing voor een grammaticale analyse, woordsegmentatie om tekst op te splitsen in kleinere eenheden, zinsafbreking om betekenisvolle grenzen aan te brengen in ononderbroken tekst, morfologische segmentatie om de structuur en vorm van woorden vast te stellen en stammen, waarbij woorden worden gereduceerd tot de stammen waaraan achtervoegsels en voorvoegsels hechten. Naast deze processen gebruikt NLP technieken zoals named entity recognition (NER) en word sense disambiguation om ingevoerde gebruikersvragen te begrijpen, te vertalen en als menselijk begrijpelijke antwoorden terug te sturen via natuurlijke taalgeneratie (NLG).