wikipedia2XML 0.1

Licencia: Gratis ‎Tamaño del archivo: N/A
‎Calificación de usuarios: 3.0/5 - ‎1 ‎Votos

acerca de wikipedia2XML

Una colección de scripts python para crear y manejar un corpus XML (una gran colección de texto para fines linguísticos) a partir de un volcado de copia de seguridad original de la base de datos de Wikipedia. Incluye un analizador basado en expresiones regulares para el lenguaje de marcado MediaWiki.