wikipedia2XML 0.1

Licencia: Gratis ‎Tamaño del archivo: N/A
‎Calificación de usuarios: 3.0/5 - ‎1 ‎Votos

Una colección de scripts python para crear y manejar un corpus XML (una gran colección de texto para fines linguísticos) a partir de un volcado de copia de seguridad original de la base de datos de Wikipedia. Incluye un analizador basado en expresiones regulares para el lenguaje de marcado MediaWiki.

historial de versiones

  • Versión 0.1 publicado en 2008-04-01
    Varias correcciones y actualizaciones
  • Versión 0.1 publicado en 2008-04-01

Detalles del programa