La saisie vocale pourrait-elle remplacer le toucher ?

L’interaction des utilisateurs avec les ordinateurs a changé à plusieurs reprises au cours des dernières décennies. Après l’opération avec les gestes et la souris, la reconnaissance vocale et la commande vocale avec des systèmes d’assistance sont de plus en plus utilisées, surtout dans le domaine de la saisie d’un texte.

De la commande manuelle à la commande vocale

Lorsque le premier iPhone a été introduit par Apple il y a dix ans, le monde a été enthousiasmé par son utilisation simple et intuitive via un écran plus sensible au toucher. Le magazine d’information Time a même élu l’iPhone “Invention de l’année”, si ce n’est de la décennie.

Un autre jalon a été l’iPhone 4S, qui a été présenté par Steve Jobs lui-même en octobre 2011 et comprenait l’assistant de reconnaissance vocale Siri. Les premières tentatives pour mettre la reconnaissance vocale des laboratoires de recherche à la disposition d’un public plus large sont venues d’IBM au début des années 1990 sous forme de logiciel pour PC. Depuis quelque temps déjà, le langage technique peut être converti en texte (speech to text). Pour la parole au quotidien, la recherche vocale de Google est devenue populaire en 2002 pour effectuer des requêtes vocales à Google dans le navigateur. À cette époque, un microphone et une reproduction audio améliorée n’étaient pas encore standard, mais étaient déjà plus répandus.

Plus tard, Google a également intégré le contrôle vocal dans ses autres services en ligne et dans son système d’exploitation mobile Android. Cela a permis, en ligne et, bien que de façon quelque peu limitée, hors ligne, de donner des ordres pour déclencher des actions ou contrôler des applications. En raison de la mise en réseau croissante des appareils, la reconnaissance vocale s’est également considérablement améliorée. Grâce à des références contextuelles plus nombreuses, à un éventail de discours plus large et à une intelligence artificielle accrue dans le nuage, la compréhension a été considérablement améliorée.

La saisie vocale dans les appareils domestiques intelligents

Avec l’intégration de la saisie vocale dans les appareils domestiques intelligents, tels que le haut-parleur Echo avec microphone intégré et connexion au service vocal Alexa d’Amazon, le contrôle vocal fait des incursions dans des domaines et des endroits que les téléphones intelligents et l’Internet n’ont pas encore atteints. Entre-temps, d’autres fournisseurs d’électronique ont également proposé la connexion Alexa et il existe une alternative avec Google Home. L’astuce, cependant, est que des règles sont appliquées au texte converti et que le dialogue peut être mené dans les deux sens pour améliorer le résultat. Ce n’est que grâce à des programmes simples, des compétences (avec Alexa) ou des recettes (avec IFTTT (If This Then That)), qu’il devient possible d’utiliser ces systèmes comme des assistants de tous les jours.

Apple a perdu son avance initiale dans le domaine de la reconnaissance vocale en très peu de temps. Alors qu’Apple a permis à très peu de développeurs de proposer des fonctionnalités pour Siri, Amazon et Google se sont complètement ouverts. Cela facilite également la création de “chat bots” qui entrent en dialogue avec les utilisateurs pour les aider à résoudre des questions de routine typiques.

Comme la reconnaissance vocale ne nécessite pas encore la reconnaissance de la voix ou du locuteur, en fin de compte, n’importe qui, même les personnes non autorisées, peut utiliser ces dispositifs lorsque le microphone et la connexion Internet sont allumés. Tout récemment, une émission de télévision aux États-Unis a parlé de l’assistant vocal Alexa. L’exemple montré a déclenché des commandes en masse de la part des téléspectateurs et de leur Alexa dédiée.

Outre les écoutes involontaires, les services vocaux posent un autre problème. Qu’arrive-t-il exactement à vos données ? Les fournisseurs ne disent rien sur la durée de stockage et l’utilisation des dialogues vocaux. Tout cela rappelle un peu le livre “1984” de George Orwell, qui parle d’un État de surveillance totalitaire, qui devient un peu plus réel.

La commande vocale ouvre de nouveaux groupes d’utilisateurs

La commande vocale crée de nouvelles possibilités de dialogue avec le client. Il ouvre de nouveaux groupes d’utilisateurs (par exemple, les personnes âgées et les personnes handicapées) et de nouveaux scénarii (par exemple, les achats en ligne, le contrôle du système et la voiture connectée). Google (Speech), IBM (Watson Speech to Text) Amazon (Alexa), Microsoft (Cortana) et Apple (Siri) proposent différentes solutions et approches du sujet. Il y aura donc une forte concurrence pour savoir qui peut offrir le plus de partenaires, les meilleures intégrations et fonctionnalités. Le chemin du smartphone à la maison intelligente n’a pas été aussi long que le chemin de l’Internet au nuage. Avec Siri dans l’iPhone 4S, la saisie vocale a franchi une nouvelle étape. Mais en attendant, les systèmes d’assistance vocale tels qu’Amazon Echo peuvent non seulement convertir la parole en texte, mais aussi assurer des services simples de la vie quotidienne tels que la commande, la recherche, le contrôle des appareils dans un dialogue contrôlé par la voix.

Lorsque l’équipage du vaisseau Enterprise trouve un ordinateur avec souris et clavier lors d’un de ses voyages en 1986, l’ingénieur en chef Scotty tente d’utiliser la souris pour une saisie vocale normale. Le Macintosh d’Apple a montré qu’il y a eu à l’époque une révolution pour beaucoup, dont la génération actuelle ne peut que profiter.

L’avenir avec les architectures durables pour l’interconnexion entre internet et les objets
Réflexions sur l’avenir incertain de la suprématie quantique