From c09708b111c3bdd723f811b4349d27db150cbd63 Mon Sep 17 00:00:00 2001 From: Maria Grandury Date: Fri, 28 Jul 2023 17:31:20 +0200 Subject: [PATCH] update datasets --- datasets.csv | 1 + 1 file changed, 1 insertion(+) diff --git a/datasets.csv b/datasets.csv index 78a4fc5..248e5ce 100644 --- a/datasets.csv +++ b/datasets.csv @@ -17,3 +17,4 @@ name,tags,description,website,github,paper,hf_dataset_name,hf_contributor_handle "Spanish Skip-Gram Word Embeddings in FastText","modelado del lenguaje,FastText","El corpus cuenta con más de 2TB de texto de alta calidad, recopilado a partir de los diferentes análisis web realizados por la Biblioteca Nacional de España desde 2009 hasta 2019. Dataset compuesto exclusivamente por embeddings Skip-Gram.","https://doi.org/10.5281/zenodo.5046525",,,"http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/6405","" "Spanish CBOW Word Embeddings in FastText","modelado del lenguaje,FastText","Embeddings de palabras en español en FastText generados a partir del mayor corpus realizado en español hasta la fecha. El corpus cuenta con más de 2 TB de texto de alta calidad, recopilado a partir de los diferentes rastreos web realizados por la Biblioteca Nacional de España entre 2009 y 2019. Dataset compuesto exclusivamente por CBOW embeddings.","https://doi.org/10.5281/zenodo.5044988",,,"http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/6405","" "Spanish Legal Domain Word & Sub-Word Embeddings","modelado del lenguaje","Conjunto de embeddings generados a partir del corpus compuesto de recursos jurídicos españoles más grande hasta la fecha (9GB).","https://doi.org/10.5281/zenodo.5036147","https://github.com/PlanTL-GOB-ES/lm-legal-es","https://arxiv.org/abs/2110.12201","","" +"Spanish Legal Domain Word & Sub-Word Embeddings","modelado del lenguaje","Conjunto de embeddings generados a partir del corpus compuesto de recursos jurídicos españoles más grande hasta la fecha (9GB).","https://doi.org/10.5281/zenodo.5036147","https://github.com/PlanTL-GOB-ES/lm-legal-es","https://arxiv.org/abs/2110.12201","",""