Baliser un texte en Python

Natacha nbodineau at club-internet.fr
Wed Jan 15 07:56:49 EST 2003


EpSyLOn <sasDOTepsylon at wanadoo.fr> wrote in message news:<v6t82v0k2igqhceu33rs3ohnkt00q4o29k at 4ax.com>...
> On 14 Jan 2003 07:35:17 -0800, nbodineau at club-internet.fr (Natacha)
> wrote:
> 
> >bonjour,
> >
> >nous aimerions savoir si Python peut baliser un texte(format .txt) en
> >format XML ou HTML.
> 
> Peut-tu donner plus de précisions sur ce que tu veut faire exactement
> ?

Bonjour,
Nous voulons aligner un texte avec sa traduction et nous avons besoin
d'un
algorithme de balisage et d'un algorithme d'alignement.

Lors du balisage des deux textes, nous aimerions avoir les résultats
suivants(voir PJ1).

Lorsque les deux textes sont balisés, nous aimerions les aligner
Sachant que nous désirons aligner ces textes par paragraphe, phrase,
mot.(voir PJ)

PJ1:
Voici un exemple de balisage sur un exemple de texte "articlefr.txt"
que nous aimerions avoir :


Texte brut :

La croissance réelle qui était d'environ 7.6% par an durant les années
70 en terme de volume de ventes était tombée à 3,1% durant les années
80.

Ces deux dernières années, une baisse de la valeur du marché est
encore venue confirmer ce recul. En 1992, la consommation mondiale de
produits agrochimiques n'a généré que 25,2 millions de dollars soit
une baisse de 6% par rapport au chiffre d'affaires record enregistré
en 1991, 26,8 millions de dollars.


Texte balisé (en XML):

< ?xml version= "1.0 "encoding= "UTF-8 " ?>
< !DOCTYPE BASE SYSTEM'Base.dtd'>
	<body>
		<p id= "p1 ">
			La croissance réelle qui était d'environ 7.6% par an durant les
années 70 en terme de volume de ventes était tombée à 3,1% durant les
années 80.	< /s>
		</p>
		<p id= "p2 " >
			Ces deux dernières années, une baisse de la valeur du marché est
encore venue confirmer ce recul. En 1992, la consommation mondiale de
produits agrochimiques n'a généré que 25,2 millions de dollars soit
une baisse de 6% par rapport au chiffre d'affaires record enregistré
en 1991, 26,8 millions de dollars.
		</p>
	</body>
</xml>



PJ2:

Résultat de l'alignement des fichiers "articlefr.txt" et
"articleen.txt" par phrase:

La croissance réelle qui était d'environ 7.6% par an durant les années
70 en terme de volume de ventes était tombée à 3,1% durant les années
80.
During the 1970s, real growth, measured by sales value, was about 7,6%
per annum.
1-1

Ces deux dernières années, une baisse de la valeur du marché est
encore venue confirmer ce recul. En 1992, la consommation mondiale de
produits agrochimiques n'a généré que 25,2 millions de dollars soit
une baisse de 6% par rapport au chiffre d'affaires record enregistré
en 1991, 26,8 millions de dollars.
By the 1980s, this growth has slowed to 3,1% per annum and in the past
two years the market has experienced a real decline in value.In 1992,
the global end-user agrochemical market was valued at $25,200M, a 6%
decrease from the $26,800M recorded in 1991.
2-2

En données corrigées des fluctuations des taux de change et de
l'inflation, la baisse est de 5,1%, contre 2% en 1991.
When the effects of exchange rate movements and inflation are removed,
the global market experienced a decline of 5,1% in comparison with the
previous year.
1-1

Globalement, en Europe Occidental, le marché a accusé une baisse de
18% en 1992 pour tomber à 6800 millions de dollars.
This compares with a 2% drop during 1991.Overall, the West European
market declined by over 18% in 1992 to reach just under $6800M.
1-2

La consolidation et le déstockage des chaînes de distribution à
l'intérieur de la CE a été l'un des faits marquants du marché en 1992,
particulièrement en Allemagne et en France.
Consolidation and destocking of the distribution chain was a factor of
the EC markets in 1992, particularly in Germany and France.
1-1

Cette tendance devrait se poursuivre.
This is likely to continue.
1-1

Au Royaume Uni, beaucoup de ces changements ont déjà pris effets.
In the UK, it is believed that much of this consolidation has already
occured.
1-1

Si l'on ajoute à cela, la dévaluation de la livre fin 1992 (et ses
répercussions sur les prix des productions en provenance de Grande
Bretagne sur le marché européen), nous sommes en droit de penser que
le marché britannique ne sera pas aussi sévèrement touché que d'autres
marchés de la communauté.
Coupled with the devaluation of the pound at the end of 1992 (and the
knock-on effect this had on the prices the UK receives for crops in
the EC), this suggests that the UK market will not be so greatly
affected as others in the EC.
1-1




More information about the Python-list mailing list