Corpore de interlingua de IALA - un collaboration

Presentation e coordination de projectos

Corpore de interlingua de IALA - un collaboration

Message publicper tmockler » mer. mai 27, 2020 9:56 pm

Salute! Io vole organisar un projecto collaborative per compilar un corpore comprensive de textos de interlingua, in forma electronic.

Le objecto de iste corpore de textos de interlingua va esser adjutar con analyses de computator del lingua, esser un resource pro le communitate, e facilitar le disveloppamento de utensiles in linea (aperte-fonte) pro interlingua.

Le scopo de iste projecto include, mais non limate a, 1) faciente un dictionario frequential pro interlingua, e 2) faciente intelligentia artificial pro traducer interlingua (como Google Translate).

Assi, io cerca pro collaborators qui me adjutara assembler un collection grande de textos de interlingua. Io necessita vostre adjuta con trovar e collectionar documentos electronic e sitos web in interlingua includiente PDFs e pars del mesme phrases in interlingua e anglese.

Per exemplo, Tatoeba.org es un fonte excellente de phrases, mais illo solmente contine circa 25,000 phrases de interlingua e circa 15,000 pars de phrases in interlingua e anglese. Iste es troppos pauc pars de phrases pro facer un modelo de alte-qualitate traduction machina.

Mesmo 55,000 phrases de interlingua combinate de Tatoeba e Wikipedia es inadequate pro facer un modelo de interlingua comparabile a altere linguas tal como anglese, germano, francese, espaniol, italiano, portuguese, e mesmo esperanto.

Si tu ha interresse in contribuer a iste effortio, o tu ha alcun suggestions, per favor inviar un message a interlinguacorpus@gmail.com o adder vostre commentos aqui.

Correctiones es benvenite.

Todd
tmockler
 
Messages public: 1
Membro desde: dom. mai 24, 2020 5:20 pm

Retro a(l) Projectos de interlingua

Qui es in linea

Usatores qui lege iste foro: Bing [Bot] e 2 visitantes

cron