Accueil

English Version Newsletter
FAQ

Vous trouverez ici toutes les réponses aux questions les plus fréquemment posées au sujet des technologies de Sight'Up.


1. Quel est le métier de Sight’Up ?

Fondamentalement, Sight’Up développe des technologies d'infrastructure qui automatisent les processus et organisent de grandes quantités d'informations non structurées, en contenu approprié pour les moteurs de recherche.
Les moteurs d’intelligence artificielle de Sight’Up peuvent presque être considérés comme des logiciels d'exploitation amenant des fonctions intelligentes supplémentaires. La technologie de noyau (IS) fournit une plate-forme pour la catégorisation automatique, le profilage d'informations non structurées, permettant de ce fait la livraison automatique de grands volumes d'informations personnalisées. Les technologies de Sight’Up sont surtout employées au sein d'entreprises de ecommerce et pour la gestion des mails entrants.


2. Ce que les logiciels de Sight’Up ne sont pas ?

Ce ne sont pas des moteurs de recherche mais plutôt des outils d’infrastructure qui organisent des données hétérogènes en vue d’une utilisation directe via un moteur de recherche.
Ils ont été spécialement étudiés pour le monde du ecommerce (produit, actualité …) et de la gestion des mails, qui ont tous les deux la particularité d’avoir des structures grammaticales pratiquement inexistantes. A contrario ils conviennent moins à la structuration documentaire sur des textes longs et littéraires (grandes documentations, brevets, livres …).


3. A quels marchés s’adresse Sight’Up ?

La technologie de Sight’Up s’adresse en priorité aux marchés du ecommerce. Le fonctionnement en a été spécialement étudié pour des textes courts et non-littéraires. Les moteurs sont étudiés pour donner une grande « précision » en limitant au maximum le « bruit » qui est très pénalisant pour ces types de marché.


4. Comment fonctionnent les « machine-learning » ?

Les « machine-learning » sont des mécanismes par lesquels la connaissance est acquise grâce à l'expérience. Il y a plusieurs modèles pour apprendre ; ceux basés sur des statistiques, de la logique, des structures neuronales, la théorie de l'information et des algorithmes heuristiques de recherche. Sight’Up a développé des algorithmes, basés sur le comportement génétique des documents d’apprentissage, qui identifient des dispositifs dans les données observées afin de prédire le comportement de nouvelles données jamais encore rencontrées.

Cette technique est utilisée pour les produits de Sight’Up :

         Sightis : Moteur de catégorisation

         Taggis : Moteur d’extraction de caractéristiques

         MailRelation : Gestion des mails entrants


5. Quelles sont les différences entre la technologie Sight’Up et l'approche à base de règles ou l’approche statistique ?

  • L'approche basée sur les règles classifie les documents sur l'existence ou l'absence de mots-clés prédéterminés. Cette méthode souffre de plusieurs inconvénients, principalement celui de la rigidité des règles. En conséquence, il est très difficile de créer des règles car elles ne sont pas sensibles au contexte de chaque document. L’ajout d’une nouvelle règle pour un contre exemple peut mettre en péril l’ensemble de l’édifice. Il faut également noter que les personnes chargées de la maintenance du système doivent souvent posséder une double compétence : linguistique mais aussi informatique.

  • L'approche statistique utilise la présence ou l’absence de mots dans les documents pour faire des prédictions. L’approche statistique n’a de sens que sur les grands nombres, il est impossible sinon d’obtenir une convergence. Il convient donc de faire l’apprentissage sur un très grand nombre de documents et oblige ainsi à un investissement humain très lourd. La plupart de ces types d’approche ne tiennent pas compte de la structure des phrases comme par exemple la position des mots dans une phrase et ceci nuit gravement aux résultats.

Cliquez sur le lien pour en apprendre plus au sujet des bénéfices par rapport aux autres approches.


6. Quelles langues sont gérées ?

La technologie de Sight’Up est complètement indépendante de la langue utilisée. Pour démarrer dans une langue particulière, il suffit alors d’effectuer l’apprentissage dans cette même langue.
Ceci est valable pour les langues latines, mais également pour les langues asiatiques comme par exemple le chinois (traditionnel et simplifié) le coréen, le japonais et le vietnamien.


7. De quoi le système a-t-il besoin pour commencer à travailler ?

À la différence des autres types de solution, Taggis et Sightis nécessitent seulement une installation minimale avant qu'ils ne puissent commencer à travailler. Ces logiciels peuvent donner un résultat très élevé avec un corpus d’apprentissage réduit, 10 à 12 documents suffisent amplement. Le petit nombre de documents d’apprentissage diminue nettement l'effort exigé pour former le système.


8. Comment est-ce que j'intègre ces moteurs dans mes applications existantes ?

Les moteurs de Sight’Up peuvent être considérés comme une brique technologique s’intégrant facilement dans votre process métier. Ils incluent une API XML qui rend l'intégration simple avec d'autres systèmes. Les systèmes de gestion deviennent alors des "clients" des moteurs.


9. Quelles APIs sont disponibles ?

C, C++, Java et .NET


10. Quels systèmes d'exploitation et bases de données sont utilisables ?

Linux, Unix et Windows NT/2000/XP.
Les moteurs d’intelligence artificielle de Sight’Up peuvent fonctionner sur tout type de bases de données qui peut travailler avec un format XML.


11. Quelle est la vitesse de traitement ?

Les moteurs d’intelligence artificielle sont développés entièrement en langage C pur, ce qui permet une grande portabilité et une très grande capacité de traitement :

  • De un à deux millions de documents par heure.

 

Aujourd’hui Sight’Up gère quotidiennement plus de 100 millions de documents dans une dizaine de langues.


Si vous souhaitez nous poser une autre question : contactez nous