divendres, 27 d’abril de 2018

XiaoIce: quan un xat-bot es capaç de parlar amb veu humana

Parlar amb els assistents de veu no és com parlar amb els humans. No obstant això, s'ha produït un gir sorprenent: El xat social Xiaolce de Microsoft. Basat en la intel·ligència artificial (IA) és capaç de mantenir una conversa.
La majoria dels assistents digitals personals o fins i tot els xats, formen part d'una experiència comparable als walkie-talkie i/o missatges de text, però Microsoft ha fet un avenç tecnològic: una persona pot conversar amb una bústia de xat amb IA que cada vegada sembla més real.

XiaoIce: quan un xat-bot es capaç de parlar amb veu humana

La conversa més llarga aconseguida fins ara amb aquesta nova tecnologia va durar més de quatre hores, amb 1.600 canvis entre humans i bot. A banda de les converses més llargues, la nova tecnologia de veu de Microsoft no requereix que l'usuari necessiti la wake word constantment, de manera que els robots poden predir el que els humans diran a continuació d'una conversa dinàmica.
No utilitzar o dir la wake word, en si mateix és un pas endavant que permet una conversa més real. L'apel·lació de xats socials no es basa únicament en la seva capacitat per respondre a les diverses peticions dels usuaris, sinó també per establir-hi una connexió emocional.

XiaoIce: quan un xat-bot es capaç de parlar amb veu humana

S'afirma que els xats socials han de poder reconèixer l'emoció i fer un seguiment dels canvis emocionals durant una conversa, de manera que el XiaoIce, és un exemple de progrés significatiu en el desenvolupament de xatbots socials.
XiaoIce es un xat social desplegat des del seu llançament el 2014 a la Xina. Dissenyada amb la veu com si fos d'una noia de 19 anys, té una gran capacitat lingüística, consciència visual i més de 180 habilitats. Actualment, XiaoIce té més de 100 milions d'usuaris únics a tot el món, i ha conversat amb usuaris humans en més de 30 mil milions de converses.
El xat XiaoIce de Microsoft ara pot operar en full duplex, això vol dir que pot estar escoltant un usuari, analitzant la informació i, posteriorment, respondre de forma més natural al mateix temps.

XiaoIce: quan un xat-bot es capaç de parlar amb veu humana

De fet, s'està segur que la nova capacitat és la comunicació bidireccional, similar a escoltar i parlar alhora. En aquesta modalitat semi-duplex, una primera part diu o escriu alguna cosa. L'altra part resumeix tot i respon. El problema és que la gent no parla d'aquesta manera.
Microsoft preferiria alguna cosa més que semi-dúplex per a la seva xatbot social. El mode full-duplex és per humans, i ara, per millorar; així es pot entreveure que es va en la direcció d'adquirir l'art de la conversa. De fet, ara ja s'està treballant a Microsoft per construir màquines de xat socials amb IA a un nivell més sofisticat.

XiaoIce: quan un xat-bot es capaç de parlar amb veu humana

En telecomunicacions, un sistema de comunicació dúplex implica que dos dispositius connectats es comuniquen en dues direccions. L'accent és social. A diferència dels assistents centrats en la productivitat, com ara Cortana, els xats socials de Microsoft estan dissenyats per tenir sessions de conversa més llargues amb els usuaris, tenen sentit de l'humor, canvien, juguen a jocs, recorden dades personals i participen en bromes interessants.


Font: Microsoft

Cap comentari:

Publica un comentari a l'entrada

Aquest és un blog amb moderador dels comentaris. Per tant, no apareixen immediatament