fbpx

Como enseñarle catalán a un altavoz

altaveus intel·ligents, català, amazon alexa

También puedes leer este artículo en: Català

Todo indica que la voz acabará siendo nuestra manera preferente de interactuar con la tecnología. Gracias a los progresos en inteligencia artificial, las órdenes verbales y el diálogo con las máquinas en lenguaje natural sustituirán en muchos casos la manipulación de botones, los clics de ratón y los toques sobre una pantalla táctil. Cada uno de los gigantes digitales ha creado su ama de llaves digital -hablo en femenino porque prácticamente todas tienen voz de mujer-: Siri de Apple, el Alexa de Amazon, el Assistant de Google y la Bixby de Samsung son las más populares en Occidente, y saben comunicarse en inglés, en español y en otros idiomas con cientos de millones de hablantes.

En cambio, los hablantes de lenguas más modestas como el catalán todavía no tenemos esa posibilidad. Si queremos dialogar con cualquiera de las amas de llaves digitales mencionadas -o con alguna de las decenas menos conocidas aquí- tenemos que cambiar de idioma y hablar en alguno de los pocos que entienden. Al menos, hasta ahora: tanto Amazon como Google, responsables de Alexa y Assistant, apenas han iniciado el proceso de entrenamiento en catalán de sus respectivas inteligencias artificiales, las más populares en nuestro mercado. Las dos empresas se añaden así a una tercera iniciativa, Common Voice de la fundación Mozilla, que ya lleva unos meses en marcha. Los tres proyectos tienen un aspecto en común: piden a los consumidores catalanohablantes que sean ellos los que le enseñen catalán en la plataforma. Pero cada uno lo hace de manera diferente.

Common Voice: leer y verificar

El catalán es uno de los idiomas con que Mozilla quiere construir el corpus hablado en que basará un futuro asistente propio para sus navegadores web, además de ofrecerlo en régimen de código abierto a cualquier empresa o institución interesada. Para participar en su entrenamiento debe darse de alta en voice.mozilla.org y elegir el idioma que desea ayudar a entrenar -en nuestro caso, el catalán-, supervisados ​​por voluntarios de SoftCatalà. A partir de entonces, desde el ordenador o el teléfono móvil, puede dar su voz, leyendo en voz alta cada una de las frases que irán apareciendo en la pantalla del dispositivo, o bien validar frases leídas por otros participantes. Para cada frase hay que indicar si considera que está bien leída o no.

Tanto la donación de la voz propia como la verificación de voces ajenas se pueden repetir tantas veces como se quiera. Los expertos consideran que se necesitan entre 1.000 y 1.200 horas de entrenamiento para considerar que un idioma está preparado para salir a producción. Actualmente, el catalán lleva alcanzada una cuarta parte de este volumen recomendado

Google Assistant: leer cobrando

Google ha optado por entrenar su Assistant igual que Mozilla: mostrando fragmentos de texto en la pantalla del ordenador o el teléfono para que los usuarios las lean, habiendo indicado previamente su edad y género. Cabe decir que los textos que hay que leer no son tan estructurados como los de Common Voice, ya menudo no tienen ningún sentido aparente. Además, no se puede escuchar o corregir lo que acabamos de leer, ni verificar lo que otras personas han leído. De hacer esto se encarga la empresa Lionbridge de servicios lingüísticos, a quien Google parece que ha contratado para el proceso de entrenamiento en varios idiomas, incluido el catalán. Un aspecto destacable es que la participación de los usuarios es remunerada: Lionbridge ofrece 10 euros por leer 200 fragmentos de texto, un importe que se abonará mediante PayPal y que aumenta hasta los 25 euros si el lector es menor de edad, previo consentimiento paterno .

No espere hacerse rico enseñando catalán en Google Assistant. No se trata de ingresar 10 euros por cada lote de 200 frases. Cada participante puede leer sólo 200, por lo que los máximos honorarios posibles son 10 euros y basta. Si todavía tiene interés, puede inscribirse en esta dirección.

Alexa: enséñame jugando

Amazon es la tercera empresa que nos propone enseñar catalán a su ama de llaves digital Alexa, y haciéndolo de manera ingeniosa: transformando el entrenamiento en un juego verbal dinamizado por el Alexa misma, que le pide al usuario (en español o en el idioma que tenga configurado) que le dé (ahora ya en catalán) órdenes ( “Dime que apague las luces”, “Pídeme que añada un producto de cocina a la lista de la compra”) o le haga consultas ( “Piensa en un músico que te guste y pregúntame cuando editó su primer disco”, “preguntame qué tiempo hara mañana en una ciudad que te gustaría visitar”).

Para participar es necesario descargar la aplicación móvil de Alexa, crear un perfil de usuario -si es cliente de Amazon ya lo teneis- y activar la skill (así llama Amazon las aplicaciones para la plataforma- llamada Cleo). Hecho esto, basta ordenarle a Alexa que abra Cleo – “Alexa, abre Cleo” – y seguir las indicaciones del sistema. Al final de cada sesión, el usuario obtiene recompensas en forma de medallas virtuales, sin otro valor que el orgullo de haber colaborado.

Se puede participar utilizando sólo la aplicación móvil, pero resulta más divertido hacerlo dialogando con un altavoz conectado a Alexa, como los Amazon Echo. Cabe decir que al principio cuesta un poco acostumbrarse a recibir instrucciones en español -o inglés, o francés- y atenderlas en catalán, pero se acaba cogiendo la costumbre. En este caso tampoco es posible revisar ni rectificar las frases que hemos dicho, y, aunque supuestamente el Alexa reconoce las voces de varias personas para un único perfil, aunque no he conseguido que Cleo contabilice por separado las de cada miembro de la familia.

Cuando hablarán en catalán?

Tanto Amazon como Google han declinado indicar ninguna fecha para el despliegue del idioma catalán en sus respectivas amas de llaves digitales. Ni siquiera admiten que estén entrenando en nuestro idioma. Pero, considerando que casi el 80% de los catalanes querrían poder hablar en catalán con su asistente virtual-encuesta de GESOP para la dirección general de Política Lingüística- y que el gobierno de la Generalitat ha acordado exigir a los proveedores de tecnología que todos los productos que dispongan de interfaz de voz incluyan al menos el catalán, que no quede porque nosotros no hemos puesto nuestro grano de arena.

Publicdo en el diari Ara
Sin título

Albert Cuesta

Periodista, analista, traductor i conferenciant especialitzat en electrònica de consum i tecnologies de la informació. És l’editor d’aquest blog, de l’edició en espanyol del butlletí Mobile World Live de la GSMA i del blog de l'Observatorio Nacional de la 5G. També col·labora al diari Ara, Catalunya Ràdio i TV3. ---------------- Periodista, analista, traductor y conferenciante especializado en electrónica de consumo y tecnologías de la información. Es el editor de este blog, de la edición en español del boletín Mobile World Live de la GSMA y del blog del Observatorio Nacional de la 5G. También colabora en el diario Ara, Catalunya Ràdio y TV3.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.