The machines recognize any voice

News

The machines recognize any voice

Published 14-11-2006

Robots can react, ask, talk. And survey, pay, bless.

The Argentine “Soda Stereo” may fall dead.

If artists “Nothing personal” will mark the 313 from the phone and browse with the voice of a decision tree, come to “karaoke”, para cantar una melodía, grabarla, escuchar las que otros han grabado y votar por la versión que les guste.

Funciona así el robot de reconocimiento automático de voz.

Otra aplicación: El poder de la voz permite que un autómata le llame por teléfono y le pregunte “¿ha tenido quejas de nuestro servicio?”. Según la respuesta, siguen nuevas preguntas. Un computador ficha los problemas y el servicio al cliente reacciona.

“In fact, nuestros ingenieros han estado probando los sistemas de una telefónica y quejándose a propósito y muy agriamente del mal servicio”, cuenta Mario Arancibia, el gerente general de Merlín, la empresa que trabaja con la Universidad de Chile en el rubro reconocimiento de voz.

“La telefónica criticada llamó muy solícita a nuestros ingenieros quejosos. ¡Hubo que explicarles que era un ensayo!”.

Merlín se asoció hace 18 meses con el Laboratorio de Procesamiento y Transmisión de Voz de la Facultad de Ciencias Físicas y Matemáticas de la Universidad de Chile.

Fondef también había intervenido financiando parte de la aventura en la universidad, y Corfo en la empresa.

On Thursday 16 celebraron su primera exportación: a una telefónica argentina.

“Les vendimos interacción por voz con el respaldo de la Universidad de Chile”, dice Mario Arancibia.

El doctor Néstor Becerra-Yoma conformó un equipo de estudiantes de pre y posgrado y se pusieron a escuchar. Hay software de reconocimiento automático de voz (ASR, su sigla en inglés) muy avanzado. Pero había que crear uno adaptable a nuestros países e igualmente competitivo. Y comercializable.

“Nosotros no tenemos necesariamente la capacidad empresarial”, reconoce el doctor Becerra-Yoma. Y afirma que aquí se dio lo que tanto se busca cuando se habla de innovación: la alianza de empresa y universidad para tener éxito en el mercado.

Sonoman

Becerra-Yoma y su equipo partieron por escuchar. Debían lograr que una máquina reconociera el habla, cosa compleja.

No basta con el sonido, hay muchas palabras parecidas. El computador tiene que ver en qué contexto está lo que escucha (“caza” and “casa” podrán sonar igual, pero se entiende por el ambiente que rodea la palabra), cuáles reglas del lenguaje se cumplen y sólo entonces identificará la palabra.

Lo peor es que cada persona habla distinto. No importa, ellos vencen esa barrera.

Le ofrecen a cada cliente una solución. Algunas son fáciles: coordinar la agenda personal a punta de voces, asignar horas en consultas médicas mediante un robot, vender y comprar pasajes, revisar la cuenta bancaria…

“Cada vez que presentamos el proyecto surgen ideas. ¡Es un campo infinito y nuevo!”, dice Mario Arancibia.

Merlín desarrolló y controla proyectos en Argentina, Colombia, Venezuela, Puerto Rico y República Dominicana.

La idea del karaoke telefónico es suya. “No la patentamos, la hicimos”. After, una empresa japonesa salió con bombos diciendo que ellos habían lanzado un karaoke telefónico.

AN INTERNET

Laboratorio de la universidad:

www.die.uchile.cl/LPTV

Merlín

www.merlin.com

CONFERENCIA

Para llamar a varios y trabajar en grupo idearon www.multiconferencia.movistar.cl

Source: CL. MERCURY

Date: 24/NOV/2006

Fondef Fund for the Promotion of Scientific and Technological

Filter results by

TYPE OF CONTENTS

RESEARCH AREA

News

The machines recognize any voice

Leave a Reply Cancel reply

Fondef Fund for the Promotion of Scientific and Technological

NEED HELP?