Horeaux & Stephen
International Inc.

Traduction et informatique linguistique depuis 1989

anglais allemand neermand italien espagnol portugais russe coreen chin japon

EASYWEB
Système de traduction professionnelle de sites internet et de contenus en ligne.

Contexte
- La nécessité d’accélérer la traduction des sites français.
- Les obstacles à la traduction des sites
Principes
Fonctionnalités
- Analyse des documents à traduire
- Création et maintenance du référentiel linguistique
- Exploitation du référentiel
- Contrôles terminologiques
- Gestion des formats
- Cas spécifique des fichiers au format HTML
- Processus
- Schéma
- Détail des opérations
- Extraction des textes
- Format d'extraction
- Relation traducteurs
- Traduction humaine
- Constitution de la base de données du site
- Création des pages
- Réintégration des pages
- Mises à jour courantes
Les points forts du système
- Un système complet
- Un système transparent
- Un système entièrement automatisé
- Un système économique
- Une qualité optimale des traductions
Mise en œuvre
Liberté de choix des traducteurs
Tarification
Glossaire


Contexte

La nécessité d’accélérer la traduction des sites français.
Selon une étude publiée par OC&C Strategy Consultants, en collaboration avec Google, la France accuse un «déficit commercial» de 700 millions d'euros sur Internet en 2013, sur un marché des flux transnationaux évalué à quatre milliards.
Pour les auteurs de l’étude, ces résultats s'expliquent par le manque de moyens mis en œuvre par les commerçants français sur Internet. «Il faut investir massivement et rapidement à l'international pour s'adapter aux marchés locaux. Cela passe par la traduction des contenus dans la langue du pays»

Les obstacles à la traduction des sites
Pourtant cette étude ne met pas en évidence les deux obstacles majeurs rencontrés par les sites français :
- le manque d’appétence des français pour les langues étrangères
- la difficulté pratique de traduire des sites internet.



Le site web véhicule l’image d’une entreprise ou d’un organisme. Il est évident que sa traduction doit rester sous la responsabilité de traducteurs professionnels et non pas céder à la traduction automatique.
Reste la difficulté d’accéder aux textes contenus dans les pages web et la mise en œuvre de logiciels de mémoire de traduction pour baisser les coûts et garantir la Qualité.
Pour cela, il convient de réunir dans un processus unique les savoirs faire de deux métiers : l'informatique et la traduction, mais la traduction humaine assistée par ordinateur et non pas la traduction automatique.

Principes

Les principes qui régissent le fonctionnement du logiciel de EASYWEB sont les suivants :

- L'administrateur, comme les contributeurs n'ont pas à travailler dans le code des pages pour la gestion d'un site multilingue.
Ils ne sont impliqués que dans la mise à jour des textes de la langue source.

- Les traducteurs n'interviennent pas non plus dans le code des pages du site, le risque étant de modifier les balises, d'oublier des textes et d'être déconnectés des outils de TAO.
Ils n'utilisent que Word (traitement de textes de Microsoft Office) comme interface.

- Le site posséde sa propre mémoire de traduction.
Chaque page, pour chaque langue cible, représente un index de la base de données.

- Le logiciel repère les modifications intervenues dans les pages : suppression, modification de textes, ajouts.
Dans le cas de textes nouveaux, la mémoire de EASYWEB assiste le traducteur.

- La structure des pages n'est pas altérée par le logiciel, les balises de mise en page (gras, italiques, polices de caractères,..) sont repérées.
Elles sont regénérées lors de la création des pages afin de restituer dans chaque langue cible la présentation exacte de la langue source.

Dans le respect de ces principes, le processus entièrement automatisé de EASYWEB met en oeuvre un certain nombre de fonctionnalités.


Fonctionnalités

Les principales fonctionnalités du logiciel recensées ci-dessous comportent de nombreux modules additionnels non décrits dans ce document.

- Analyse des documents à traduire
Démarche qui consiste à neutraliser les éléments non signifiants pour la traduction : noms propres, données numériques,...
Restitue les textes déjà traduits dans le même contexte et contenus dans la mémoire de traduction du site. Cette démarche vise à réduire les volumes à traduire, donc les budgets et les délais.
Cette fonction permet de mesurer les écarts entre plusieurs versions d’un document et de ne travailler que sur les deltas. C'est cette démarche qui permet de réduire les coûts et les délais de traduction.

- Création et maintenance du référentiel linguistique
Le référentiel linguistique est composé de segments dont l’expression la plus réduite est le glossaire. Celui-ci est composé de groupes nominaux dont l’unité minimale est un (1) mot non ambigu.
Le référentiel est créé par compilation et assemblage de documents existants déjà traduits et fournis par le client dans le cadre d’un projet précis.
Le référentiel est enrichi de chaque traduction effectuée par la suite après validation du client, si celui-ci le souhaite. Ce processus est automatisé (informatisé) et contrôlé par un traducteur qui en garantit l’intégrité.

- Exploitation du référentiel
Le référentiel permet la production de glossaires.
Il pilote les traductions informatisées.
Sa traçabilité permet l’analyse des documents.

- Contrôles terminologiques
Avant chaque livraison de traduction, le document est confronté au glossaire.
Toute distorsion est signalée au relecteur qui l’analyse et apporte éventuellement une correction. Dans le cas contraire, une note est transmise au client, si les conventions prévues avec celui-ci l’indiquent.

- Gestion des formats
Un traitement spécifique permet aux traducteurs de travailler dans un environnement confortable ; en effet, le repérage des textes, ainsi que l'interprétation des caractères spéciaux, rendent le travail dans les fichiers HTML quasiment impossible pour les traducteurs.

EASYWEB rend le contenu des textes accessible dans un format standard (Word) pour :
- permettre la pré-traduction automatique par le référentiel linguistique
- permettre le contrôle glossaire automatique
- faciliter les opérations de relecture
Dans les fichiers au format HTML, il évite la re-saisie d'informations et leur contrôle. L'ensemble de ce processus, négligeable en terme d'exploitation informatique, permet d'éviter des coûts d'exploitation additionnels.




Processus
Schéma

Schema

      Tableau
Détail des opérations

Récupération des pages La récupération peut s'effectuer de deux façons :
- Soit par accès direct au site grâce aux habilitations délivrées par le client
- Soit par envoi du fichier HTML par e-mail

Extraction des textes Les textes à traduire sont extraits des balises et placés dans une colonne d'un tableau Word. La segmentation des textes obéit à la structure des balises. Dans le cas où les segments extraits ont déjà été traduits, les traductions issues de la mémoire de traduction du site sont placées dans le tableau Word dans la cellule en regard du segment concerné.

Format d'extraction Le résultat de l'extraction et de la pré-traduction sont donc placés dans un tableau Word à trois colonnes. La première colonne est réservée au logiciel, la seconde aux textes extraits, la troisième à la pré-traduction. Les cellules de cette dernière colonne restées vides et correspondent aux mises à jour. Elles font l'objet d'une traduction et d'une relecture humaine.

Exemple : Mise à jour de la traduction d'un site en français vers le chinois.


Colonnes



Relation traducteurs Le logiciel gère l'annuaire des traducteurs affectés à la traduction du site en fonction de leur langue et de leur spécialité. Un module expédie automatiquement par e-mail les tableaux Word à compléter.

Traduction humaine
Le traducteur complète le tableau Word et le renvoie par e-mail vers EASYWREB.

Constitution de la base de données du site
Dès la traduction de la première page, la base de données est créée et enrichie. Chaque tableau Word traduit est mémorisé segment par segment. Chaque segment possède des éléments de traçabilité.

Création des pages
Le logiciel utilise la base de données afin de recréer les pages du site Web en code HTML. Celles-ci sont livrées avec le nom d'origine suivi du caractère underscore (tiret du 8) et en suffixe le code de la langue cible. (Exemple, la page index.htm est livrée traduite en anglais sous le nom index_en.htm). Si elle existe, l'arborescence des répertoires du site est respectée et restituée.

Réintégration des pages
Comme pour la récupération des pages sources, la réintégration peut s'effectuer de deux façons :
- Soit par accès direct au site grâce aux habilitations délivrées par le client, - Soit par livraison par e-mail des pages traduites, éventuellement dans leur arborescence.

Mises à jour courantes
Lors des mises à jour consécutives aux interventions des contributeurs, il suffit de signaler quelle est la, ou quelles sont les, page(s) concernée(s). Après récupération et extraction, celles ci sont confrontées à la base de données du site qui va mettre en évidence les modifications apportées.

                           

Les points forts du système

Un système complet
EASYWEB développe tout le processus de gestion d’un site multilingue. Le client ne gère que les mises à jour de la langue source, l'alignement dans les langues cibles est automatique.

Un système transparent
Il permet au client de contrôler le nombre réel de mots à traduire et de disposer, s'il le souhaite, du contenu de la mémoire de traduction du site (base de données des textes et de leurs traductions) au format Word ou Excel.

Un système entièrement automatisé
L’ensemble du processus est entièrement automatisé : de l'extraction des textes, en passant par l'envoi aux traducteurs, jusqu'à la création des pages traduites.
Les seules interventions humaines se limitent à :
- la récupération des pages signalées en modification
- la traduction et la relecture des nouvelles traductions.
- le rechargement des pages traduites.

Un système économique
Le coût de la traduction se limite aux textes nouveaux et non redondants.

Qualité optimale des traductions
Les traductions sont effectuées par des traducteurs professionnels de langue maternelle correspondant à la langue cible et spécialisés dans le domaine du site. La mémoire de traduction constituée pour la mise à jour des sites est garante d’une Qualité terminologique optimale.



Mise en œuvre
EASYWEB est capable d’analyser très rapidement de grandes quantités de documents ou de répertoires de documents.
La prise en charge d'un site est très simple :
- récupération des pages du site, dans leur arborescence si elle existe,
- extraction des pages vers Word avec déduplication directe des éléments redondants,
- envoi du devis,
- traduction des tableaux Word par les traducteurs du client ou de hs2i,
- création des pages,
- livraison ou rechargement des pages.
Ce processus est répété pour chaque nouvelle langue cible.
Le webmaster doit simplement intégrer un drapeau dans la page d'accueil du site et gérer les liens des pages du site source vers les pages du ou des site(s) cible(s).

Liberté de choix des traducteurs

Le client peut choisir ses propres traducteurs, ceux de hs2i ou d'une autre entreprise de traduction.
Dans ces deux derniers cas, les traducteurs doivent se conformer aux consignes de hs2i qui n'intervient alors que comme prestataire informatique et gestionnaire de la mémoire de traduction du site.

Tarification

Tarif des traductions
- Le tarif est établi, au mot traduit, conjointement avec le client. Il varie en fonction du couple de langues.
- Seuls les textes nouveaux sont facturés. Par texte nouveau, il faut entendre segment de texte non encore présent dans la mémoire de traduction du site.

Tarif des prestations informatiques
- La création et la gestion de la mémoire de traduction du site sont automatisées et ne font l'objet d'aucune facturation.
- Le traitement de EASYWEB (de la récupération de la page source à la livraison de la page traduite) est facturé au forfait par page.
Le forfait est fonction de la complexité du site et varie de 1€ à 9€. Il est dégressif en fonction du nombre de pages traitées pour chaque demande.



Glossaire
- Administrateur du site : responsable des contenus du site.
- Balises : chaînes de caractères utilisées dans HTML permettant de mettre en forme les textes (polices de caractères, structure de la page,...).
- CMS : Content Management System, logiciel de conception et de maintenance de site Web.
- Contributeur : personne qui intervient sur les contenus du site.
- HTML : langage de codification des pages Web.
- Langue source : langue de création du site.
- Langues cibles : langues dans lesquelles le site est traduit.
- Logiciel de mémoire de traduction : logiciel de gestion de création et administration de la mémoire de traduction. (Principales fonctions : découpage de textes en segments multilingues homogènes, cryptage permettant leur identification exacte ou approchée pour répondre aux besoins de traduction, propositions de glossaires, contrôle terminologique.)
- Mémoire de traduction du site : ensemble des segments multilingues constituant une base de données.
- Segment : chaîne de caractères représentant du texte de longueur variable
- TAO : traduction assistée par ordinateur.
- Webmaster : technicien qui maîtrise le logiciel de développement du site et le code des pages.