Je fais confiance à Google Lens depuis que j’ai acheté mon premier smartphone Xiaomi en 2016, et c’est une fonctionnalité indispensable sur tous les appareils que je possède.
Je l’ai configuré comme une application autonome, un widget qui revendique l’espace de l’écran d’accueil sur tous mes téléphones, ou comme un raccourci attaché en permanence à la barre de recherche Google pour un accès direct.
Lorsque je rencontre une plante inconnue lors d’une randonnée ou dans un parc, je sors mon téléphone, je le dirige vers la caméra et je laisse l’application identifier la plante que je regarde.
C’est comme regarder fixement les horaires d’un train dans une ville étrangère qui déclenche la mémoire musculaire. Je ne paniquerai pas. Je suis sûr que Linz peut le décoder ou le traduire avec précision en temps réel.
La lentille fournit des résultats fiables depuis des années. Mais l’arrivée des Gémeaux, et avec elle capacités multimodales et des modèles plus expérimentés ont soudainement interrompu ce mode.
Au lieu de simplement identifier des objets ou des scènes, je souhaitais poser des questions conversationnelles plus complexes lors de l’utilisation de la recherche visuelle. Cela m’a amené à basculer entre les deux applications.
La semaine dernière, j’ai mené une expérience et j’ai décidé de faire de Gemini mon principal outil de recherche visuelle. Google Pixel 9 ProXL et la tablette Samsung Galaxy Tab S10 FE pour voir si elle est meilleure pour tous les travaux et peut remplacer entièrement l’objectif.
Gemini offre un moyen flexible de poser des questions
Il prend en charge le téléchargement d’images et de vidéos


lors du passage à Gémeaux pour la recherche visuelleJ’ai remarqué une différence de fonctionnalité importante que je devais surmonter en tant que problème.
Si vous avez utilisé les premières versions de Gemini, vous savez déjà à quel point ses capacités de recherche sont rudimentaires, en particulier en matière de recherche et d’analyse visuelles.
Mais dans la version actuelle, Gemini prend en charge le partage d’écran via Ask Gemini pour joindre des photos ou des vidéos et pour l’analyse de photos.
Avec la première méthode, vous devez prendre une photo et la joindre à votre rappel. Cela crée de la complexité pour l’utilisateur, mais permet également une résolution globale des problèmes et une analyse plus approfondie.
Il s’agit d’une option pour les appareils Android qui ne prennent pas en charge le partage d’écran avec Ask Gemini.
Le moyen le plus rapide et le plus efficace d’accéder à Gemini pour la recherche visuelle consiste à utiliser Ask Gemini. J’ai appuyé sur le bouton sur le côté pour l’allumer et il a été immédiatement suivi d’un bip.
Semblable à la pièce jointe, ma capture d’écran actuelle est capturée et enregistrée dans le chat Gemini, afin que je puisse consulter l’historique plus tard.
Je suis très reconnaissant de pouvoir reparler à Gemini et reprendre là où je m’étais arrêté ou poser d’autres questions.
Si vous souhaitez ajouter des questions ou des commentaires supplémentaires à votre requête, ou si vous souhaitez traduire le texte dans une autre langue, vous devrez à nouveau effectuer une recherche visuelle sur le Web avec Lens.
De plus, Lens n’a pas la capacité d’analyser les clips vidéo enregistrés, une fonctionnalité que Gemini gère facilement.
Bien que Lens dispose d’une fonctionnalité Live, il est conçu pour les flux de caméra en temps réel et ne peut pas traiter les clips préenregistrés pour extraire du texte ou analyser des événements vidéo passés.
Gemini a un avantage sur Google Lens
Il fournit un contexte puissant sur les requêtes visuelles partielles


J’apprécie la façon dont Gemini fournit des réponses plus profondes et plus précises à la plupart des recherches visuelles que Google Lens.
Au lieu de vous fier uniquement aux personnalisations visuelles standard basées sur le Web, Gemini vous permet d’utiliser directement les modèles d’IA les plus avancés de Google.
Je peux passer à Gemini Pro pour une analyse plus approfondie et des réponses plus détaillées, ou utiliser le modèle Flash pour obtenir des résultats plus rapides et plus concis.
Il existe également un niveau de communication avec les Gémeaux qui fait que Linz semble incroyablement rigide en comparaison.
Lens effectue simplement une recherche sur le Web et renvoie les meilleurs résultats de recherche, ou repasse en mode IA pour des réponses plus intelligentes et plus contextuelles.
Gemini, quant à lui, crée des conversations réalistes et réactives sur les photos ou vidéos que vous partagez.
Par exemple, je peux poser des questions supplémentaires sur une recette recommandée, ajuster les mesures des ingrédients à la volée ou demander une toute nouvelle recette en cours de conversation.
En plus des bases, il propose des réponses détaillées dès la première requête, comme me dire où se trouve le singe macaque et analyser ses caractéristiques physiques dans l’image.
Mieux encore, je peux exécuter d’autres requêtes avancées, comme compter le nombre de personnes qui regardent un objet. Bien que les résultats ne soient pas précis à 100 % dans la plupart des cas, il fait bien son travail.
Afin d’afficher les capacités contextuelles de Lens de quelque manière que ce soit, vous devez utiliser son mode Live, car Lens par défaut recherche uniquement les correspondances Web via la détection ou la traduction statique.
Alors que Google a commencé à intégrer davantage de capacités de résolution de problèmes basées sur l’IA dans Lens, Gemini dispose toujours d’un avantage considérable lorsqu’il s’agit de résoudre des problèmes complexes à plusieurs niveaux.
Gemini s’améliore en recherche visuelle
J’aimerais voir Google combiner Gemini et Lens à l’avenir


Objectif Google Il excelle dans la reconnaissance instantanée d’objets, la correspondance visuelle associée et les recherches rapides de traductions sur le Web.
Google mérite également le mérite d’avoir ajouté de nouvelles fonctionnalités à Lens au fil du temps, telles que la fonctionnalité Live et un nouvel outil de création d’images.
Cependant, Gemini offre plus de flexibilité dans la manière dont les résultats sont présentés et dans la manière dont je peux en tirer le meilleur parti. Il va encore plus loin en accédant directement aux meilleurs modèles d’IA.
Si vous préférez une interface conversationnelle et une connaissance contextuelle supérieure, Gemini est un choix plus puissant.
Je prévois de continuer à utiliser Gemini pour la plupart de mes recherches visuelles et Lens pour des tâches rapides et fluides comme la traduction en direct.
En fin de compte, les deux sont des outils très performants pour les tâches visuelles quotidiennes, et le bon choix dépend entièrement des besoins spécifiques de votre flux de travail.
