Sonos lancera le mois prochain un nouvel assistant vocal, qui cohabitera dans ses haut-parleurs connectés avec Alexa et l’Assistant Google. Malgré un retard de quelques années, et même s’il a été créé par une entreprise beaucoup plus petite qu’Amazon et Google, l’assistant parvient tout de même à se démarquer, selon ce que j’ai pu constater lors d’un essai avant le lancement du service.

Un assistant privé

La plus grande force de l’assistant de Sonos est sa conception privée. Contrairement à Amazon, Apple et Google qui transfèrent vos enregistrements dans le nuage pour être analysés, toute la reconnaissance vocale se fait ici sur le haut-parleur directement.

L’enregistrement n’est jamais stocké, ni localement, ni dans les serveurs de Sonos. Seuls les noms de chansons, d’artistes, d’albums, de listes ou de genres sont envoyés aux différents services musicaux compatibles (comme Apple Music, mais pas Spotify au lancement).

L’avantage pour la vie privée est évident, mais ce n’est pas le seul. Grâce au traitement local, la reconnaissance peut aussi se faire plus rapidement, selon Sonos. « La rapidité est permise par le fait que le traitement est local, il n’y a donc pas d’aller-retour vers le nuage. On traite aussi chaque fragment de son l’un après l’autre, sans attendre la fin de la phrase », m’a expliqué Alice Coucke, chef de l’apprentissage machine chez Sonos.

En pratique, l’assistant m’a en effet semblé rapide, mais il sera intéressant de l’essayer plus en profondeur pour quantifier l’amélioration.

L’aspect privé de l’assistant de Sonos offre un autre avantage: il permet d’écouter quelques secondes de plus après la requête initiale, pour que l’utilisateur puisse faire des requêtes supplémentaires, sans redire le mot d’éveil (Hey Sonos). « Si on traitait les données dans le nuage, on enregistrerait de très longues portions de conversations. Il y aurait des problèmes par rapport au respect de la vie privée », note Alice Coucke.

L’écoute prolongée n’a pas été conçue pour ça, mais celle-ci pourrait aussi être perçue comme une mesure d’accessibilité. Comme bègue, il m’arrive souvent de devoir recommencer une requête parce que Siri ou l’Assistant Google se sont impatientés. Un assistant qui traite chaque son un après l’autre localement, et qui enregistre plus longtemps, pourrait changer la donne pour les gens dans ma situation (et pour les enfants, peinent aussi à dire les phrases dans les temps demandés).

Techniquement, l’assistant vocal de Sonos offrirait un autre avantage, selon l’entreprise, soit celui d’être dédié à la musique. Celui-ci pourrait donc comprendre des requêtes supplémentaires pour la musique, sans avoir à se soucier de toutes les autres demandes, ce qui augmenterait son efficacité. Ça semble logique, mais ici aussi, il faudra mettre l’assistant à l’essai pour plus longtemps pour mesurer cette amélioration.

Cela dit, j’aurais tout de même apprécié que l’assistant comprennent quelques requêtes importantes de plus, comme la météo.

Une voix anglophone avec beaucoup de style

Photo : Sonos En anglais, l’acteur Giancarlo Esposito prête sa voix à l’assistant vocal de Sonos.

La voix est une autre différence importante entre l’assistant de Sonos et ceux d’Amazon, Apple et Google. Alors que les géants technos ont opté pour des voix neutres et généralement féminines, Sonos a choisi celle de l’acteur Giancarlo Esposito (Breaking Bad, The Mandalorian).

Ses réponses ont du style et sont données d’un ton affirmé. Ce n’est pas la première fois qu’un assistant utilise une voix connue (les navigateurs GPS le font depuis plusieurs années), mais c’est tout de même étonnant.

Est-ce que j’aime ça? On verra avec le temps. Pour l’instant, je suis plus surpris qu’émerveillé.

Que vaut l’assistant vocal de Sonos en français?

L’assistant vocal de Sonos sera lancé le 1er juin en anglais américain, puis en français de France plus tard cette année.

Bonne nouvelle, même avec mon accent français à couper au couteau, l’assistant n’a eu aucun problème à me comprendre quand je lui ai demandé des chansons en anglais. Par curiosité, j’ai aussi demandé (en anglais) des chansons et des artistes en français : en une fraction de seconde, l’assistant comprenait que quelque chose clochait, et me redirigeait vers l’application mobile.

C’est de bon augure. Ça me démontre que lorsque le français sera ajouté, l’assistant devrait être en mesure de gérer les requêtes bilingues.

Autre bonne nouvelle, l’équipe responsable du développement de l’assistant est celle de l’ancienne entreprise française Snips, rachetée par Sonos en 2019. Autrement dit, ceux qui ont créé et testé l’assistant tout au long de son développement parlent aussi avec un accent français, et écoutent aussi (je présume) de la musique francophone à l’occasion.

Malheureusement, adapter l’assistant à une nouvelle géographie est un processus complexe, et force est de constater qu’il y aura probablement beaucoup de marchés plus gros que le Québec à cibler avant que l’assistant soit adapté à la langue de Dédé Fortin et de Kevin Parent.

Reste à voir si on pourra tout de même se faire comprendre d’ici là.