2. Veus

2.4. Bots i veus (IA domèstica)

Fins ara hem parlat en termes molt generals de dos estils d’interacció basada en la conversa. En el cas de l’instructing, hem vist un exemple molt clar de sistema basat en aquest estil. Però quan parlem de conversar, de què estem parlant? Sense entrar en productes concrets, podem parlar de dos exemples que exemplifiquen molt bé aquest estil i que són bastant diferents.

Parlem dels bots i dels assistents de veu o IA domèstiques.

Tot i que en termes generals parlem de bots i chatbots indistintament, caldria matisar els termes. Bot és el mot genèric usat per referir-nos a una eina dissenyada per completar tasques específiques a partir d’unes instruccions. Chatbot és un tipus de bot concret creat per interactuar de manera conversacional amb els usuaris. En aquest apartat, i per simplificar els termes, farem servir els dos mots de manera intercanviable per referir-nos a sistemes conversacionals.

En aquests sistemes, l’usuari pot fer servir un llenguatge més obert i menys acotat per dirigir-se al sistema, i gràcies als components de IA que inclouen, aprenen al llarg del temps per millorar la comprensió.

Però enlloc de quedar-nos amb aquesta primera capa que diferencia un sistema d’un altre, pensem com nosaltres interactuem amb aquests sistemes. Hem parlat d’instructing i conversing, així com de qüestions de gènere que influeixen en la nostra interacció. Canvia el nostre llenguatge? Ens dirigim a un bot de la mateixa manera que ens dirigim a un amic?

En el nostre dia a dia fem servir un llenguatge natural que canvia quan ens adrecem a un sistema. I tot i que aquesta tecnologia està molt desenvolupada i ha millorat en els últims anys, encara hi trobem una distància òbvia que fa que adaptem la nostra manera de parlar al que creiem que el sistema entendrà.

Com hem vist al principi, la conversa és un acte molt natural i, tot i així, l’hem hagut d’aprendre de nou quan l’apliquem a sistemes. I tot i que aquests sistemes estan dissenyats per què la conversa sigui natural, com a usuaris hi ha barreres que no ens ho permeten del tot.

Aquestes barreres poden ser idiomàtiques, ja que no totes les llengües hi estan representades. Sense anar més lluny, cap dels principals sistemes de IA domèstica inclou cap dels idiomes cooficials de l’Estat espanyol a la seva llista d’idiomes disponibles. Això fa que els catalans, bascos o gallecs puguin sentir que hi ha una distància amb aquests dispositius perquè han de canviar d’idioma per usar-los. La raó darrere d’això és evident. En un país on hi ha una llengua majoritària, es pressuposa que tothom la parlarà i, per tant, els idiomes cooficials passen a segon terme.

Això passa en molts països on idiomes com l’anglès o el castellà són la llengua principal i, per tant, els idiomes propis del país no apareixen disponibles en aquests sistemes d’IA. Per exemple, cap sistema inclou les llengües pròpies de països sud-americans, com el quechua o el guaraní. Tot i no ser llengües molt extenses en nombre de parlants, els que en són parlants nadius poden sentir una barrera idiomàtica per dirigir-se a l’altaveu, si ho han de fer en castellà.

En aquesta mateixa línia, és molt difícil fer servir dobles sentits i ironia amb aquests sistemes, ja que no entenen allò que va més enllà del literal. Pot ser que no ens n’adonem, però fem servir expressions i frases fetes contínuament, i el fet de modificar i adaptar la nostra manera de parlar pot provocar que ens limitem a donar instruccions i que mantenir una conversa natural sigui gairebé impossible.

Ser conscients d’aquests matisos us farà adonar de tot el que implica la interacció amb assistents de veu i bots i, per tant, us farà més hàbils i flexibles a l’hora de dissenyar el vostre propi sistema d’interacció per veu.