Dans le cadre de la sortie de l'étude “Les enceintes à commandes vocales sur les médias sociaux en France”, nous allons regarder quels sont les principaux défis auxquels doivent faire face les assistants vocaux en France et dans le monde pour mieux pénétrer le marché.
Les technologies d’assistance vocale et les appareils où elles sont embarquées doivent encore, pour se développer auprès de l'utilisateur grand public, faire face à de nombreux challenges. En France, la pénétration est encore relativement faible avec 19% des internautes qui ont utilisé la recherche vocale en 2018 contre 30% des italiens, 27% des espagnols et 26% des britanniques. On estime à 1,7 million le nombre d’utilisateurs d’enceintes à commande vocale (de type Google Home et Amazon Echo) dans notre pays soit 3,2 % des 53 millions d’internautes.
Quels sont les principaux défis à relever pour les technologies de reconnaissance vocale ?
C’est certainement le plus gros défi à surmonter pour les fabricants d'assistants vocaux puisqu'il est inhérent à la culture du consommateur : la crainte face à la sécurisation et au manque de confidentialité des données. 2018 a connu de nombreux scandales médiatiques liés à des actions de piratage ou à l'exploitation des données privées des internautes sans leur accord.
À l'échelle mondiale, les utilisateurs des technologies d'assistance vocale se disent inquiets : 70% sont préoccupés par les atteintes d'internet à la vie privée et 65% par la façon dont les données personnelles sont utilisées par les entreprises (1).
Et c’est particulièrement marqué en Europe et notamment en France : 40% des internautes pensent que leurs données privées online sont mal exploitées, contre 37% en Suède, 36% au Royaume-Uni (2).
Les requêtes et besoins des consommateurs vont différer selon qu'ils utilisent une assistance vocale dans la rue, dans leur voiture, dans leur salon. En déplacement, il s'agit de prendre des décisions souvent rapides (direction, météo, commerce de proximité). Pour les enceintes de salon, l’usage est davantage orienté sur le divertissement, le confort, l’interaction via la musique, la télévision ou les objets connectés. Mais pour l’instant, les technologies de reconnaissance et d’assistance vocale ne se différencient pas ou très peu selon le contexte, l'environnement et l'appareil où elles sont embarquées.
Depuis plus de 10 ans, les technologies de reconnaissance vocale à destination du grand public font des progrès notables. D'après les tests de cabinets de conseil, Google Assistant se révèle toujours comme la plus pertinente, mais Siri d'Apple tend à rattraper son retard.
En fin d’année dernière, le cabinet Loup Ventures (3) a comparé les technologies Google, Alexa d’Amazon, Siri et Cortana de Microsoft à travers 800 questions. Les 4 technologies ont compris de 99% à 100% des questions posées; Google Assistant a répondu correctement à 97,9% d’entre elles; Siri à 74,6% et Alexa a donné 72,5% de bonnes réponses. Mais on observe quelques disparités de performance selon les 5 catégories de questions (Local : "Où est le bar le plus proche ? ", Shopping : "Achète 2 douzaines d'œufs ”, Navigation : ”Comment aller en banlieue en bus" et Information : "Quels sont les matchs de foot ce soir ? "). Ainsi, si Google Assistant est le plus pertinent dans ces 4 catégories, il est battu par Siri pour la 5ème catégorie, Commande de type "Rappelle moi d’appeler Mélusine à 14h ".
Les assistants vocaux permettent de faciliter l’achat de produits, mais, à l’heure actuelle, ils ne sont performants et pertinents que lors de certaines phases du parcours client et pour des produits de grande consommation courants, plutôt à bas prix ou pour lesquels on a déjà effectué les recherches préliminaires via des requêtes classiques tapées sur PC, smartphone ou tablette. Tous les produits à coût élevé, engageants, qui nécessitent des recherches d'information et des comparaisons importantes sur les caractéristiques, les services, les prix ou qui impliquent d'être testés ou vus avant l'achat ne sont pas encore concernés par une recherche vocale. Par ailleurs, la limitation intrinsèque du nombre de résultats à une requête vocale constitue l’un des freins à l’achat des enceintes intelligentes pour les français (4).