@inproceedings {sagot11perlextaln, title = {D{\'e}veloppement de ressources pour le persan: le nouveau lexique morphologique PerLex2 et l{\textquoteright}{\'e}tiqueteur morphosyntaxique MElt_fa}, year = {2011}, month = {06/2011}, address = {Montpellier, France}, abstract = {
\
R{\'e}sum{\'e}. Nous pr{\'e}sentons une nouvelle version de PerLex, lexique morphologique du persan, une version corrig{\'e}e et partiellement r{\'e}annot{\'e}e du corpus {\'e}tiquet{\'e} BijanKhan (BijanKhan, 2004) et MEltfa, un nouvel {\'e}tique- teur morphosyntaxique librement disponible pour le persan. Apr{\`e}s avoir d{\'e}velopp{\'e} une premi{\`e}re version de PerLex (Sagot \& Walther, 2010), nous en proposons donc ici une version am{\'e}lior{\'e}e. Outre une validation manuelle par- tielle, PerLex 2 repose d{\'e}sormais sur un inventaire de cat{\'e}gories linguistiquement motiv{\'e}. Nous avons {\'e}galement d{\'e}velopp{\'e} une nouvelle version du corpus BijanKhan : elle contient des corrections significatives de la tokenisation ainsi qu\&$\#$39;un r{\'e}{\'e}tiquetage {\`a} l\&$\#$39;aide des nouvelles cat{\'e}gories. Cette nouvelle version du corpus a enfin {\'e}t{\'e} utilis{\'e}e pour l\&$\#$39;entra{\^{\i}nement de MEltfa, notre {\'e}tiqueteur morphosyntaxique pour le persan librement disponible, s\&$\#$39;appuyant {\`a} la fois sur ce nouvel inventaire de cat{\'e}gories, sur PerLex 2 et sur le syst{\`e}me d\&$\#$39;{\'e}tiquetage MElt (Denis \& Sagot, 2009).
Abstract. We present a new version of PerLex, the morphological lexicon for the Persian language, a cor- rected and partially re-annotated version of the BijanKhan corpus (BijanKhan, 2004) and MEltfa, a new freely available POS-tagger for the Persian language. After PerLex\&$\#$39;s first version (Sagot \& Walther, 2010), we propose an improved version of our morphological lexicon. Apart from a partial manual validation, PerLex 2 now relies on a set of linguistically motivated POS. Based on these POS, we also developped a new version of the BijanKhan corpus with significant corrections of the tokenisation. It has been re-tagged according to the new set of POS. The new version of the BijanKhan corpus has been used to develop MEltfa, our new freely-available POS-tagger for the Persian language, based on the new POS set, PerLex 2 and the MElt tagging system (Denis \& Sagot, 2009).\
\
}, keywords = {cat{\'e}gories, {\'e}tiqueteur morphosyntaxique, Lexical resource, MElt, MElt., PerLex, persan, Persian, POS, Ressource lexicale, tagger, validation}, author = {Beno{\^\i}t Sagot and G{\'e}raldine Walther and Pegah Faghiri and Samvelian, Pollet} }