NoNiRes: Corpus del catalán anotado con negación
Any
2023
Lloc
Procesamiento del Lenguaje Natural, 71, 39-51
ISBN
ISSN: 1989-7553
En aquest article es presenten els criteris aplicats per a l'anotació de la negació i del focus de la negació del corpus NoNiRes del català. El corpus està constituït per 20.600 oracions procedents de datasets ja existents (5.000 oracions), un fòrum d'Internet (10.000 oracions) i un periòdic digital (5.600 oracions). S'han tractat aspectes complexos com ara el focus i la gradació de la negació. S'ofereixen dades estadístiques sobre les estructures anotades.
dimarts, 12 setembre, 2023 - 09:12