Skip to content

EXI invés de XML

Peter edited this page Aug 2, 2017 · 3 revisions

O formato EXI, que o W3C vem normatizando como compressão eficiente de XML, já está na "boca do forno", é candidato e pela agenda deles se torna padrão este ano. Ver https://www.w3.org/TR/exi-c14n/

O EXI amarra a DTD com a compressão, e de fato não é apenas compressão, mas também um formato que torna mais ágil a leitura do conteúdo.

Resumidamente EXI = asBinary(XML + XMLSchema). Quando indicamos a DTD ou XSD (no caso ScieLO NISO JATS 1.0), chega a ficar 20% do XML original, contra os 30% obtidos de um zip padrão. Não compensa se for só para comprir. Todavia, para preservar em git e/ou ofertar no repositório de forma alternativa aos já ofertados por SciELO e PMC, pode ser interessante.

Testes realizados com http://exificient.github.io/java/ Precisei do apt install openjdk-8-jre-headless para rodar jar baixado de https://github.com/exificient Testei apenas com a GUI, java -jar exificient-gui-jar-with-dependencies.jar. Falta testar via comando de linha, com opções de uso do XSD e compressão integral.

Atenção, o XSD completo do se encontra em jats.nlm.nih.gov/publishing/1.1, baixar completo (com MathML) de publishing/1.1/xsd.

NOTA: justificativas e comparativos de uso do EXI, http://www.agiledelta.com/product_efx_fi_comp.html

Em exposição de large files, sugere-se tar de EXI, com por exemplo todos os fascículos de uma revista XML (PMC ou SciELO).