"Deep learning" et Robert ?

27/08/2014

La lexicographie est un sous-ensemble de la reconnaissance d'image...

Dans l'informatique d'aujourd'hui, le "dictionnaire" est "caché"... derrière Word chez Microsoft, derrière la messagerie, le correcteur orthographique rectifie aujourd'hui assez bien les erreurs de frappe ou les fautes d'orthographe. Dans les tablettes, les propositions de mot lors de la frappe des premières lettres fonctionnent aussi avec un "dictionnaire".

En France, il est interdit de copier un "dictionnaire" comme le Robert. Tout nouveau créateur se doit donc d'innover, lorsqu'il crée un nouveau Dictionnaire.

Microsoft décide donc de créer le sien (en français) dans les années 2000 avec une spécialiste des dictionnaires et une équipe d'une trentaine de lexicographes, qui firent sur la tranche allouée une redéfinition des mots (50.000 au total). Ce dictionnaire de français était disponible dans l'Encyclopédie Encarta... puis désormais à travers les applications principales de bureautique !

La grandes maisons (Larousse, Robert et autres) livrent aussi leur dictionnaire sous forme informatique, mais n'utilisent pas leur trésor dans les applications informatiques...

L'image, aujourd'hui, est un nouvel enjeu, tant elle s'est multiplié, avec les smartphones ! Le souci, qui est vieux comme le monde, est de trier ou d'extraire les informations pertinentes. A l'université Dauphine, dans les années 70, l'Armée planchait déjà sur la reconnaissance automatique des images de "chars", pour évaluer rapidement leur puissance de feu ! Aujourd'hui, les visages, les marques, ainsi que les méta-données, qui accompagnent les images (positionnement géographique, auteur, date) sont autant d'éléments significatifs, qui nécessitent des logiciels très performants, des bases de données fort bien organisées pour en faire quelque chose !

Un bon dessin vaut mieux qu'un long discours !

Alain Rey, l'amoureux des mots
Télégramme du 27 août 2014

Alain Rey, rédacteur en chef du dictionnaire Le Robert, vient passer, depuis 15 ans, ses vacances à l'Aber-Wrac'h, où il possède une maison. À presque 86 ans, le linguiste conserve intact son amour de la langue française qu'il aime voir évoluer et s'enrichir.

À l'Aber-Wrac'h, Alain Rey aime s'installer, en compagnie de son épouse, au Café du port quand il n'observe pas de sa fenêtre les mouvements des bateaux qui rejoignent ou quittent le port. « Émile Littré, connu pour son Dictionnaire de la langue française, est venu lui aussi à l'Aber-Wrac'h dans les années 1870 pour se détendre », souligne-t-il. Le poète russe Alexandre Blok et Céline ont, eux aussi, aimé l'aber. Ce lieu serait-il pour les grands mots le grand remède ?

Alain Rey a oublié son âge et travaille sans relâche sur l'univers des mots. « C'est un peu par hasard. Alors que j'avais fait mes études d'histoire de l'art et Science Po, je suis tombé sur une annonce de Paul Robert qui recherchait des collaborateurs pour l'élaboration d'un nouveau type de dictionnaire. J'ai trouvé mon bonheur ». S'il voit dans le Larousse un dictionnaire encyclopédique, il précise la différence avec le Robert : « Nous essayons de donner la dimension culturelle de la langue française, plus historique, humaniste ».

« Savoir comment les gens parlent »
Pour lui, dans un dictionnaire, l'essentiel est l'ouverture d'esprit par rapport à la société. « Il faut voir comment les gens parlent vraiment. Celui qui donne une norme c'est celui de l'Académie française. J'ai mis au point un système, avec les éditions du Robert, qui permet de le faire vivre par rapport au rythme de la langue. La langue évolue vite et le français est pluriel. Je ne parle pas des langues mais des expressions régionales qui le colorent, que très peu de langues connaissent dans le monde ».

150 mots nouveaux chaque année
Et les mots nouveaux ? « C'est une question de bonne observation de l'évolution réelle du langage. Notre dictionnaire est un observatoire mais pas un conservatoire. Nous introduisons plus de 150 mots ou expressions nouvelles chaque année, un choix par rapport à un millier possible. Si une majorité de Français les pratique, il faut les introduire. Le livre d'Hervé Lossec sur les bretonnismes était dans la bibliothèque du Robert au lendemain de sa parution ». Il ajoute : « Dans les mots nouveaux, il y avait "zlatané " que tous les gosses emploient dans les cours de récréation. Nous ne l'avons pas mis. "vuvuzela " ne se dit plus beaucoup mais je l'ai vu réapparaître dans les matchs de foot ! Nous avons en bibliothèque le bouquin sur l'arsenal de Brest mais nous ne pourrons en utiliser les mots car ils sont trop spécifiques. Quant à "selfie", nous ne pouvons l'éviter car utilisé dans le monde entier ! ».

Les vertus du bilinguisme
Et la langue bretonne dans tout ça ? Les langues régionales sont, pour lui, une richesse qui a servi à donner des couleurs à la langue française. « J'étais content quand, en 2001, la Délégation à la langue française et aux langues de France a acquis la seconde partie de son appellation. C'est déjà un pas en avant. On a beaucoup de progrès à faire par rapport aux autres pays européens. En Italie, comme en Allemagne, chacun parle sa langue régionale et nationale. C'est mieux pour l'identité culturelle. Je crois beaucoup aux vertus du bilinguisme, il y a une formation humaine qui est meilleure. Pour faire survivre une langue, il faut y mettre le paquet : il faut voir le fric que les Irlandais ont mis pour défendre leur langue avec les émissions de télé et de radio ! C'est une décision politique ! ».

Le dernier ouvrage d'Alain Rey « Le voyage des mots », joliment calligraphié par Lassaâd Metoui, évoque l'enrichissement de la langue française par des mots persans, arabes et turcs (éditions Trédaniel). Quand les marins bretons vêtus de leur caban lisent leur almanach en subissant la houle, ils peuvent se consoler en buvant un verre d'alcool produit par un alambic : ils seront alors au zénith et pourront faire un baroud d'honneur. Tous ces mots viennent des pays cités et ont été confirmés par les académiciens. Ce livre, loin d'être austère, fait partager le plaisir qu'a eu son auteur à voyager dans le monde des mots.

La reconnaissance d'images, nouveau terrain de jeu des géants du Net
Les Echos du 25 août 2014

Amazon et eBay investissent dans cette technologie, qui séduit les annonceurs.

Ils cherchent à analyser grâce à elle les photos postées sur les réseaux sociaux.
C'est un petit bouton, à gauche de l'écran. Il s'appelle Firefly, et Amazon en a fait l'un des principaux moteurs de son entrée sur le marché des smartphones, lors de la présentation de son Fire Phone en juin dernier. Il suffit de pointer le téléphone vers un livre, un CD ou un jeu vidéo et un lien direct apparaît pour l'acheter sur la plate-forme d'e-commerce, s'il est disponible en ligne.

Cette nouvelle fonction, extension de l'application Flow créée par Amazon il y a deux ans, repose sur la reconnaissance d'images. Amazon n'est pas le seul à s'intéresser à cette technologie. eBay a déjà mené plusieurs expériences similaires avec ses applications eBay Motors et eBay Fashion, qui permettent de proposer des vêtements ou des véhicules proches de ceux pris en photo.

Les fournisseurs historiques de ces technologies, de leur côté, travaillent avec plusieurs grandes enseignes qui cherchent une alternative au QR, ce code-barre destiné à être flashé par les smartphones « qui ne s'est jamais vraiment démocratisé », estime Guillaume Faure, de l'agence digitale Fabernovel. LTU Technologies, un des leaders français du secteur, a fourni la fonction « scan and find » (scanne et trouve) de l'application de l'enseigne de prêt-à-porter Celio, qui permet de rechercher un vêtement similaire à celui d'une photo. Zalando, le site Web allemand spécialisé dans la vente de vêtements et chaussures, vient de lancer une application similaire. Le fournisseur espagnol Catchoom mise lui sur la réalité augmentée, en permettant de voir en 3D les meubles du catalogue Ikea.

Mais les applications de reconnaissance d'images ne s'arrêtent pas à l'e-commerce : reconnaissance faciale, robotique, traduction ou encore publicité, le marché total est évalué à 9,65 milliards de dollars par le cabinet Markets and Markets. Il devrait croître de 21,6 % par an sur les cinq prochaines années, pour atteindre 25,65 milliards de dollars en 2019. De quoi aiguiser les appétits des géants du Net. Passée un peu inaperçue au milieu de l'été, l'acquisition par Google de Jetpac, une start-up qui analyse les photographies postées sur les réseaux de partage comme Instagram ou Flickr, confirme l'intérêt du géant de Mountain View pour cette technologie. Il y a un an et demi, Google avait déjà racheté DNN Research, une start-up de Toronto spécialisée dans ce domaine.

« Hashtags passifs »
« L'image s'impose désormais comme le moyen de communication dominant sur le Web », avance Frédéric Jahard, le PDG de LTU Technologies pour expliquer l'intérêt des GAFA (Google, Apple, Facebook, Amazon). Le nombre de smartphones ne cesse d'augmenter, et avec eux les photographies partagées sur les réseaux sociaux. 1,8 milliard de photographies sont partagées chaque jour sur Facebook, Instagram, Flickr, Snapchat et Whats-App, soit six fois plus qu'il y a deux ans, selon la dernière étude de KPCB sur les tendances sur Internet. Cette masse d'images a permis d'améliorer une technologie qui n'est pas nouvelle, mais qui restait encore peu efficiente.

« Le taux de réussite de la reconnaissance d'images est passé de 40 à 70 % il y a environ trois ans, grâce au progrès du "deep learning ", des algorithmes qui cherchent à simuler le fonctionnement de l'activité neuronale du cerveau humain », raconte Frédéric Jahard.

Les réseaux sociaux, qui ont misé sur l'image comme Tumblr ou Pinterest, pourraient trouver grâce à la reconnaissance d'images une manière de se monétiser. Rarement accompagnées de textes, les photos partagées sur leurs plates-formes créaient jusqu'ici peu de métadonnées. Ditto Labs, une entreprise américaine qui vient de nouer un partenariat avec Tumblr, promet de révéler leurs « hashtags passifs » : en clair, elle passe au crible les photographies en ligne pour analyser la présence des marques. Häagen-Dazs sait ainsi que ses glaces sont consommées en majorité à 1 h du matin. Et Vera Bradley que ses sacs à main sont régulièrement offerts comme cadeaux d'anniversaire aux adolescentes.
Anaïs Moutot, Les Echos

16 commentaires

Quelle est la définition de verbiage dans les différents dictionnaires ?
Et celle de ridicule ?

Publié il y a 135 mois par jeremie.