Google Gemini améliore la navigation sur le web pour les utilisateurs ayant des défis visuels et auditifs

Google Gemini améliore la navigation sur le web pour les utilisateurs ayant des défis visuels et auditifs

Les appareils Android ont longtemps pris en charge un lecteur d’écran intégré appelé TalkBack, conçu pour aider les personnes malvoyantes à naviguer sur leurs smartphones grâce à des commandes vocales. À partir de 2024, Google a intégré son AI Gemini pour améliorer cette fonctionnalité, offrant aux utilisateurs des descriptions plus nuancées des images affichées sur leurs écrans.

Google améliore continuellement l’expérience utilisateur avec TalkBack. Avec Gemini, les utilisateurs peuvent désormais non seulement recevoir des descriptions d’images, mais aussi poser des questions de suivi concernant l’image. Cette couche supplémentaire d’interactivité élève considérablement l’expérience d’accessibilité pour les utilisateurs malvoyants.

Comment TalkBack peut-il aider les utilisateurs ayant des difficultés visuelles ?

Imaginez recevoir une photo d’un ami présentant sa nouvelle guitare. Plutôt que de simplement voir une image, vous pouvez maintenant poser des questions à Gemini sur la marque, la couleur et même d’autres objets sur la photo. Cette fonctionnalité s’appuie sur les mises à jour d’accessibilité apportées l’année dernière, qui ont intégré Gemini dans le système TalkBack.

Le menu TalkBack comprend désormais une fonction dédiée à la Description de l’écran, offrant à Gemini davantage de capacités. Si les utilisateurs consultent un catalogue de vêtements en ligne, il ne décrit pas seulement les articles, mais répond également aux questions. Vous pourriez demander : « Quelle robe est idéale pour une froide soirée d’hiver ? » ou « Quelle sauce se marie le mieux avec ce sandwich ? » Gemini peut analyser l’ensemble de l’écran, aidant les utilisateurs à comprendre des détails complexes sur les produits, y compris les remises disponibles.

Améliorer les expériences de visionnage en ligne avec des légendes expressives

Dans le navigateur Chrome, Google améliore les sous-titres vidéo générés automatiquement. Par exemple, en regardant un match de football, les sous-titres refléteront les émotions et les expressions du commentateur plutôt que de rester figés. Au lieu de simplement lire « but », les téléspectateurs verront un joyeux « goooaaal ! »

Google les appelle des légendes expressives. Elles intègrent non seulement les mots prononcés, mais aussi des sons ambiants significatifs, tels que des sifflets, des acclamations ou même le locuteur qui se raccle la gorge. Les légendes expressives seront accessibles sur les appareils fonctionnant sous Android 15 ou une version ultérieure aux États-Unis, au Royaume-Uni, au Canada et en Australie.

Zoom de texte adaptatif : un changement radical pour la personnalisation des utilisateurs

Une autre amélioration réfléchie dans Chrome est l’introduction du zoom de texte adaptatif. Cette mise à jour améliore le système de zoom de page existant pour les utilisateurs Android. Désormais, lorsque vous augmentez la taille du texte, la mise en page de la page Web reste intacte. Vous pouvez facilement ajuster votre niveau de zoom préféré à l’aide d’un curseur en bas de la page, que vous souhaitiez l’appliquer universellement ou uniquement sur certains sites Web.

Des options de personnalisation comme celles-ci rendent la navigation plus conviviale pour les personnes ayant divers besoins visuels.

Y a-t-il des fonctionnalités spécifiques qui rendent TalkBack efficace pour les utilisateurs malvoyants ? Oui, des fonctionnalités comme la description des images et la réponse à des questions de suivi en font bien plus qu’un simple lecteur d’écran. L’intégration de Gemini dans TalkBack enrichit considérablement l’expérience d’accessibilité globale.

Comment Gemini sait-il quoi décrire ? Il utilise des algorithmes d’IA avancés pour analyser ce qui se trouve à l’écran et fournir des informations détaillées et pertinentes en fonction des requêtes des utilisateurs.

Qu’est-ce que les légendes expressives et comment enrichissent-elles la consommation de vidéos ? Les légendes expressives ajoutent des nuances émotionnelles aux sous-titres, reflétant le ton du locuteur et les sons importants, enrichissant considérablement l’expérience de visionnage pour les sourds et malentendants.

Comment fonctionne le zoom de texte adaptatif ? Cette fonctionnalité permet aux utilisateurs d’ajuster la taille du texte sans affecter la mise en page de la page Web, facilitant ainsi la lecture pendant la navigation.

En conclusion, l’engagement d’Android à renforcer les fonctionnalités d’accessibilité continue d’améliorer l’expérience utilisateur pour les personnes malvoyantes. En mettant en œuvre des solutions intelligentes comme l’IA Gemini, Google fixe une norme élevée pour l’inclusivité numérique. Découvrez-en plus sur ces améliorations et d’autres analyses technologiques sur Moyens I/O.

Voir aussi:  Les 1 million de robots d'Amazon : Révolutionner le travail et remplacer les humains
Moyens I/O Staff est une équipe de rédacteurs spécialisés, passionnés par la technologie, l’innovation et les usages numériques. Forts d’une expertise pointue en IA, applications mobiles, gaming et tendances digitales, nous produisons un contenu rigoureux, vérifié et utile. Notre mission : vous offrir une information fiable et claire pour mieux naviguer dans le monde numérique en constante évolution. Découvrez les avis de nos lecteurs sur Trustpilot.