Arch Search Engine 1.15

Licencia: Gratis ‎Tamaño del archivo: 31.07 MB
‎Calificación de usuarios: 3.5/5 - ‎2 ‎Votos

Arch es una extensión de código abierto de Apache Nutch (un popular motor de búsqueda de propósito general altamente escalable) para la búsqueda de intranet. ¿No está satisfecho con su motor de búsqueda corporativo? No es de extrañar, muy poca gente lo es. Hasta bien sómoslo, no hay motores de intranet que funcionen tan bien como lo hace la búsqueda web global de Google. Hay una razón fundamental para esto: los algoritmos utilizados por Google en la Web global (o similar) no funcionan casi tan bien en intranets por la falta de datos estadísticos. Arch (¡finalmente!) resuelve este problema. Utiliza un método novedoso para ofrecer resultados de búsqueda de alta precisión que funciona muy bien. ¿No lo crees? Se incluyen herramientas de evaluación de pruebas ciegas. Puede implementar Arch y comparar su rendimiento con su motor de búsqueda actual y / o Google (en la parte pública de su sitio) utilizando una metodología de prueba a ciegas. Además de la excelente calidad de búsqueda, Arch tiene muchas características críticas para entornos corporativos: - Seguridad a nivel de documento. Los usuarios solo pueden encontrar los documentos que están autorizados a ver. - Actualizaciones de índices de bajo costo. Arch es capaz de mantener los índices actualizados y evitar el repamiento regular completo del sitio. - Disponibilidad 24/7. Siempre hay un índice de trabajo disponible, incluso si se produce un error en un rastreo. - Soporte para la indexación simultánea y búsqueda de múltiples sitios web, con la capacidad de buscar y administrar cualquier sitio por separado, si es necesario. La adición dinámica y la eliminación de sitios web es fácil. - Un directorio de sitio generado automáticamente. - Soporte de bajo costo una vez desplegado. - Interfaz dual (PHP y Java) para una fácil implementación y personalización. - Búsqueda facetada "fuera de la caja". - Un amplio y extensible conjunto de analizadores para analizar una variedad de formatos de archivo: HTML, PHP, PDF, MS Office, Open Office, etc. - Una arquitectura modular basada en plugins que se puede personalizar y ampliar fácilmente. - El código fuente está incluido. - Alto rendimiento y escalabilidad. Arch se puede ejecutar en clústeres de equipos para indexar conjuntos de datos muy grandes.

historial de versiones

  • Versión 1.15 publicado en 2019-05-17
    Portado en Nutch 1.15
  • Versión 1.9.2 publicado en 2016-08-18
    Se ha mejorado el análisis de documentos, portado en Nutch 1.9.
  • Versión 1.2 publicado en 2010-09-17
    Portado a Apache Nutch 1.2, actualizó el analizador PDF, agregó herramientas de prueba y ajuste, resolvió los problemas encontrados en la versión beta, permitió el uso de clústeres de computadoras.

Detalles del programa