|
|
|
|
|
|
Bénéfices par rapport aux des autres approches
La technologie de “text-mining” de Sight’Up emploie une collection d’algorithmes basée sur le comportement génétique des documents. En ce sens cette approche est une véritable rupture technologique avec les technologies classiques qui existent depuis plusieurs dizaines d’années comme les approches linguistiques à base de dictionnaires et de règles ou les approches statistiques ne prenant en compte que la présence ou l’absence d’un mot dans un document.
Avantages Par rapport À d'Autres Approches
- Exige très peu de documents d’apprentissage. Le principal avantage des algorithmes de Sight’Up réside dans leur incroyable capacité à généraliser à partir d’un corpus d’exemples extrêmement réduit. A titre d’exemple 10 offres de produits permet de gérer plus de 10 000 produits de la même famille avec un précision de l’ordre de 98%. Les efforts d’apprentissage, de maintenance et d'installation sont ainsi extrêmement réduits.
- Rapidité d’installation et de modification par rapport aux systèmes basés sur les règles. Les efforts d’apprentissage étant limités à une simple collecte d’exemple, et il n'y a aucun besoin de concevoir des règles booléennes complexes et souvent difficile à maintenir. A tout moment, lorsque le flux documentaire change, il est très simple de modifier le corpus d’apprentissage en ajoutant de nouveaux exemples ou en enlevant les obsolètes.
- Plus robuste que les systèmes basés sur les règles. L'emphase dans l'approche de Sight’Up est d’apprendre à généraliser à partir d’un ensemble fini d'exemples, plutôt que de former une solution algorithmique basée sur de la connaissance antérieure et un ensemble de règles. L’ajout d’une règle, dans une approche traditionnelle, pour intégrer un nouvel exemple peut remettre en cause la totalité de l’édifice, alors qu’avec dans la technologie de Sight’Up il suffit d’ajouter le contre-exemple dans le corpus d’apprentissage.
- Pilotage sans expertise particulière. L'approche de Sight’Up assure qu’il n’est nul besoin de posséder une expertise informatique pour gérer facilement le système. Une simple connaissance de la famille de produits gérés et le “bon sens” suffisent à la bonne marche des moteurs.
- Plus rapide dans le traitement : En moyenne les technologies de Sight’Up parviennent à traiter entre 1 et 2 millions de documents à l’heure, alors que les autres approches plafonnent à quelques dizaines de milliers. Ce gain de productivité permet de limiter les investissements matériels et de répondre à une demande des clients toujours plus exigeante en terme de rapidité d’accès aux informations
Cette approche est utilisée pour les produits de Sight'Up
Sightis : Moteur de catégorisation
Taggis : Moteur d’extraction de caractéristiques
Dis : Moteur de construction de glossaires
MailRelation : gestion des mails entrants
|
|
|
© Sight'Up 2000-2006. All rights reserved 
|
|
|
|
|

|
 |
|