2.3. Idees principals de la interacció basada en la conversa
2.3.2. La interacció com a conversa
El concepte de llenguatge natural va molt lligat al que veurem tot seguit sobre la interacció com a conversa.
Una llengua natural és la forma de llenguatge que té com a objectiu la comunicació i que està dotada d’una sintaxi. És qualsevol llengua que ha evolucionat de manera natural en els humans a través del seu ús i sense que la seva evolució hagi estat planificada.
El processament del llenguatge natural té l’objectiu de fer possible que el sistema comprengui i processi la informació que un usuari expressa mitjançant el llenguatge humà. L’usuari no ha de memoritzar instruccions ni diàlegs, sinó que pot comunicar-se de manera efectiva amb el sistema tan sols coneixent l’idioma amb què treballa.
Un cas concret d’aplicació del processament del llenguatge natural són els assistents virtuals dels dispositius mòbils com Siri o Google Assistant. Per mitjà de l’entrenament, el sistema reconeix l’usuari. Això permet que aquests sistemes puguin ser utilitzats, fins i tot, per reconèixer la identitat dels usuaris en entorns segurs.
Això no és nou, i abans que existissin assistents de veu ja teníem sistemes amb els quals es podia interactuar per mitjà de llenguatge natural de manera escrita. Però tan important és la interacció amb el sistema, com el missatge i l’objectiu amb què interactuem amb un sistema.
Els límits de la interacció basada en conversa són difusos. Fins a quin punt estem parlant de conversar i no de donar instruccions? És per això que hem de diferenciar entre dos estils principals d’interacció basada en conversa: instructing i conversing.
L’instructing és un model conceptual d’interacció que permet descriure un sistema interactiu a partir de les ordres que dona l’usuari. És un model que genera interaccions de manera ràpida i eficient i que, per tant, és molt útil quan l’usuari ha de dur a terme accions repetitives o tasques de manera successiva.
Un exemple molt bo d’aquest tipus d’interacció són les interfícies de línia d’ordres, on els usuaris poden donar instruccions amb el sistema escrivint línies de text a través d’un teclat. Les ordres que l’usuari pot donar són molt concretes i normalment estan basades en un llenguatge molt limitat que l’usuari ha de conèixer i recordar abans de fer-lo servir. És habitual que aquest tipus d’interacció sigui mitjançant el typing, perquè les instruccions són molt més concretes i l’usuari pot escriure exactament el que el sistema entendrà.
El model d’interacció de conversing es diferencia del d’instructing principalment en la relació de l’usuari amb el sistema. Aquest model permet descriure un producte interactiu com si estigués duent a terme una conversa amb l’usuari. Aquí la bidireccionalitat és clau, ja que el sistema no només obeeix ordres sinó que pretén ser un interlocutor vàlid per a l’usuari.
Això no vol dir que l’usuari pugui fer servir un llenguatge natural i que el sistema l’entengui. La comunicació pot estar limitada a un cert nombre de frases que l’usuari pot triar, però a diferència de l’instructing, l’usuari no ha de portar sempre la iniciativa.
Parlar de conversa en aquest context pot ser molt abstracte i cal definir quins són els elements que té una conversa entre humans per tal d’implementar-los en interaccions conversacionals amb sistemes. Per sort, l’any 1976 R. S. Nickerson ja establia aquestes característiques.
Si vols saber més sobre les diferents característiques que Nickerson atorga als sistemes conversacionals, et recomanem que tornis a llegir la fitxa sobre conversing al Design Toolkit.
El que ens interessa tenir clar en aquest punt és que quan ens referim a interfícies conversacionals cal diferenciar quan s’està intentant mantenir una conversa i quan simplement es donen instruccions al sistema. Un element clau per parlar de conversa és la bidireccionalitat, que hi hagi un canal d’anada i tornada quan es conversa amb el sistema.
Quan pensis en la diferència entre instructing i conversing, recorda la diferència entre un programa amb línia d’ordres, on escriuríem comandes concretes per tal que el sistema realitzés les acciones que li ordenem, i un bot conversacional, on se simularia tenir una conversa amb el sistema.
Tot i així, ara mateix no podem parlar de cap sistema que simuli perfectament una conversa entre dos humans. La manca de certs elements en la conversa ens fa veure que qui mana en aquest tipus d’interacció és sempre l’usuari. Imagina’t com seria que l’Alexa interactués amb tu per iniciativa pròpia, que et fes una pregunta sense el teu input d’usuari o que t’interrompés mentre estàs parlant.
Per altra banda, hi ha un element molt important de la comunicació que veurem en els apartats següents i que afegeix una capa extra de significat que actualment els sistemes conversacional no tenen: la comunicació no verbal.