Inicio Acerca de ScienSe Documentación Capturas de Pantalla Licencia Descargas Soporte Desarrollo

Lenguajes
Español
Ingles
Página del Proyecto
AnteriorArribaSiguiente

Configurando htsciense

Htsciense es un software basado en htdig (http://www.htdig.org) que lleva a cabo 2 funciones fundamentales:

  1. Crea un indice con los sitios indicados y almacena esta información en una base de datos de tipo Berkeley para posteriormente realizar búsquedas por medio de un guión CGI.

  2. Busca artículos de investigación y los analiza para extraer información sobre estos, misma que sirve de entrada a una base de datos relacional.
Como se ve, la información más importante que necesita htsciense para funcionar son los sitios que debe revisar, aunque soporta muchas otras configuraciones. En el momento de escribir está ayuda se estaba desarrollando htConf una aplicación Java Swing que facilita la configuración de htsciense por medio de una amigable interfaz gráfica.

La configuración de htsciense se lleva a cabo escribiendo un archivo de configuración htsciense.conf que se ubica en el directorio "/etc" en sistemas Unix. La instalación de ScienSe ya contiene un archivo htsciense.conf por defecto con una configuración que deberá servir para la mayoría de los casos, solo hay que cambiar la opción "start_url" donde deberán ponerse los sitios que se desean revisar.

Se puede ejecutar el comando rundig para iniciar el proceso de indexado, pero no es necesario pues en la instalación se añade una entrada en el comando cron para realizar este proceso todos los días a la media noche. Este valor de cron puede modificarse si así se desea.

Noticias

Recursos

Buscar en Google