Skip to content

configespec_doaj_es

scielo edited this page Apr 28, 2011 · 21 revisions

Configurando DOAJ

português | english

Objetivo

El procesamiento de generación de XML's para envío de metadatos para el DOAJ tiene como objetivo generar archivos XML válidos por la DTD del DOAJ con el metadado de los artículos incluyedos en la base de datos.

Sin embargo el envío de los archivos XML debe ser hecho manualmente, considerando que el DOAJ no dispone de un servício automático de envío de metadados.

Para realizar el envío de los XML's, la colección SciELO deberá crear una cuenta de publisher en el sítio del DOAJ. Chequearse manualmente al sitio con la cuenta y utilizar el servício de envio de archivos XML.

Prerequisitos

software product URL
Python 2.5 or 2.6 http://www.python.org/
python2.x-dev 2.5 or 2.6 http://www.python.org/
GNU compiler and tools http://www.python.org/
System Python Library http://pypi.python.org/pypi/distribute
Virtual Environment http://pypi.python.org/pypi/virtualenv
Libreria lxml http://pypi.python.org/simple/lxml

Instalando los pré-requisitos

La instalación considera la utilización de la distribuición de Linux (CentOS)

Python 2.6

No existe un paquete nativo del Python 2.6 en el CentOS. Para instalalo es necesario utilizar un repositorio EPEL.

Obs.: La instalación fue hecha y probada en el CentOS 5.5.

#> cd /usr/src
#> wget http://dl.iuscommunity.org/pub/ius/stable/Redhat/5/x86_64/epel-release-1-1.ius.el5.noarch.rpm
#> wget http://dl.iuscommunity.org/pub/ius/stable/Redhat/5/x86_64/ius-release-1.0-6.ius.el5.noarch.rpm
#> yum localinstall epel-release-1-1.ius.el5.noarch.rpm ius-release-1.0-6.ius.el5.noarch.rpm --nogpgcheck
#> yum clean all
#> yum install python26 rpm -ql python26 | grep '/usr/bin' 

System Python Library

#> cd /tmp
#> wget http://python-distribute.org/distribute_setup.py
#> python distribute_setup.py

Virtual Environment

#> easy_install virtualenv

Guia

Crear el ambiente virtual python para SciELO

#> cd /var/www/scielo
#> virtualenv --python=/usr/bin/python26 --distribute --no-site-packages scielo-env

activar el ambiente virtual para finalizar la instalación

#> source /var/www/scielo/scielo-env/bin/activate

el prompt quedará como:

(scielo-env)#>

Instalando libreria lxml en el ambiente virtual

(scielo-env)#> easy_install lxml
(scielo-env)#> deactivate

el prompt volverá para:

#>

Configurando el procesamento

#> cd /var/www/scielo/proc/scielo_doaj/py
#> vi doaj_config.py

el archivo doaj_config.py

# coding: utf-8
##################
# variáveis com caminho para bases de dados utilizadas no processmento.
##################
database_title="/var/www/scielo/bases/title/title"
database_article="/var/www/scielo/bases/artigo/artigo"
database_issue="/var/www/scielo/bases/issue/issue"
proc_path="/var/www/scielo/proc"
cisis="/var/www/scielo/proc/cisis"
scielo_env="/var/www/scielo/scielo-env"
doi_prefix="XX.XXXX"
max_file_size=4000000
  • Editar los paths si necesario
  • indicar el prefijo DOI de su colección. Si no lo tienes dejar el parâmetro sin contenido bojando el ("XX.XXXX").

Ejecutando el Procesamento

#> doaj_run.sh

Notas

  • Al final de procesamento los XML's particionados en archivos de 4Mb estarán en la carpeta /var/www/scielo/proc/scielo_doaj/output/doaj/file__##.xml
  • Enviar los archivos para la persona que hará en envío de los XML's atraves de portal del DOAJ.
  • Poner cron el script doaj_run.sh para ejecutar periodicamente.