Commandes vocales ?
15/10/2011
La magie de la voix ! Un vrai feuilleton !
Comme lors de la reconnaissance optique de caractère les techniques d'aujourd'hui ne dépassent pas le taux de réussite de 95% ! Le résultat est meilleur lorsque le vocabulaire est technique, précis et limité ! C'est pour cette raison que les systèmes de reconnaissance vocale se sont implantés chez les avocats et les médecins...et non dans les voitures, où le flou ne peut être toléré !
Sous Windows la commande du système par la voix, qui existe depuis 5 ans, n'est pas utilisée.
Lernout et Hauspie, pionnier belge de la question dans les années 2000, fit faillite après avoir racheté tout ce qui travaillait dans le monde sur ce sujet !
Nuance en est aujourd'hui l'héritier "chanceux" avec IBM en outsider.
Ce domaine est toujours considéré comme "l'après-clavier", comme l'a été le "tactile" avec l'Iphone et l'Ipad. On sent bien toutefois que cette dernière technologie n'est pas encore compétitive avec le couple clavier-souris.
Le "geste" a trouvé son marché avec l'accessoire "Kinect" chez Microsoft, mais les utilisations ne sont pas les mêmes !
Commander son Iphone "à la voix" ? Pourquoi pas...Mais quel désagrément pour les voisins !
Apple pourrait populariser les commandes vocales sur les appareils mobiles
Les Echos du 14 octobre 2011
Avec son assistant vocal Siri, l'iPhone 4S fait le pari de populariser une nouvelle interface. Le « cloud » ouvre de nouvelles perspectives à la reconnaissance de la voix.
Solveig GODELUCK
Un joggeur court, et dans ses écouteurs une voix féminine lit ses messages. « Va-t-il faire froid ce week-end à San Francisco ? », demande une femme qui fait sa valise. A cette question, la voix dans le mobile répond : « Pas trop froid. Peut-être la température va-t-elle tomber à 61° F. » Dans sa cuisine, une ménagère tech demande à son téléphone des précisions sur une recette. Il lui fait signe quand le temps de cuisson est écoulé. Vous venez de faire la connaissance de Siri, la voix de l'iPhone 4S, telle que la présente un spot publicitaire. Cette intelligence artificielle a été développée par Siri, une société qu'Apple a achetée en avril 2010. Elle mixe les données de localisation, celles du téléphone (messageries, agenda, cartes...) et lance des requêtes sur le Web. Puis elle écoute et parle.
Nuance est le fournisseur officiel des commandes vocales de l'iPhone 4S. Issue en 1994 de Stanford, cette société a inventé le langage T9, qui permet de rédiger intuitivement un SMS. Sur 6.000 employés, Nuance compte un millier de scientifiques et linguistes. Elle vend des packs pour les ordinateurs des médecins ou des avocats, et des briques logicielles pour les systèmes embarqués. Motorola, BlackBerry, Nokia, Samsung, Siemens, les principaux équipementiers télécoms sont déjà ses clients, essentiellement pour appeler un nom dans le carnet d'adresses. Apple pousse l'expérience un cran plus loin.
4.000 brevets
Jusqu'à présent, l'innovateur dans la voix était Google avec son Nexus S, entièrement piloté à la voix mais encore faiblement intelligent. Le géant Internet a d'ailleurs recruté le fondateur de Nuance, Mike Cohen. Mais Frédéric Delahais, qui dirige la filiale française de Nuance, considère que Google n'est pas une menace dans l'immédiat : « Il nous a fallu dix ans pour mettre au point nos algorithmes, avec plus de 50 acquisitions » (dont le pionnier belge Lernhout & Hauspie), explique-t-il. Nuance a déposé 4.000 brevets. IBM, son autre grand concurrent, vient de conclure avec elle un partenariat.
Grâce à l'iPhone 4S, les commandes vocales pourraient devenir l'interface privilégiée dans les mobiles. Apple a déjà popularisé la souris, l'écran tactile ; la voix arrive à présent à maturité. « Il y a encore deux ans, c'était fastidieux, car il fallait enseigner votre façon de parler au logiciel, mais aujourd'hui ce n'est plus le cas », explique Frédéric Delahais. Osera-t-on parler à son téléphone dans la rue ? Pourquoi pas, puisqu'on téléphone déjà n'importe où sans vergogne. « Il est difficile de taper sur son écran tactile en mouvement ou en situation de faible luminosité. La voix peut répondre à ce problème », est convaincue Carolina Milanesi, de Gartner.
A terme, les fabricants disposant d'un écosystème (tablette, TV, mobile, PC...) ont tout intérêt à familiariser leurs clients avec cette interface unique, reliée à des bases de données dans le « cloud ». Ainsi, les terminaux obéissant à la voix se multiplieront, tout en se faisant de plus en plus discrets.
SOLVEIG GODELUCK, Les Echos
1 commentaire
Ok, c'est cool, mais qu'est-ce que ça vient foutre là ?
À part te permettre d'en remettre une couche sur tes marottes habituelles j'entends (cloud, fibre, etc.)
Moi, j'ai un Nexus S, mais tout le monde s'en fout !
Comment va ton BlackBerry au fait ???
Les commentaires sont fermés.