Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Melhoria dos dados no Wikidata #16

Open
aariops opened this issue Oct 20, 2020 · 12 comments
Open

Melhoria dos dados no Wikidata #16

aariops opened this issue Oct 20, 2020 · 12 comments
Labels

Comments

@aariops
Copy link
Contributor

aariops commented Oct 20, 2020

Além de afinarmos as queries de Wikidata (#2), convém irmos melhorando a qualidade dos dados lá disponibilizados.

  • Verificação automatizada:

    • através de bases de dados com listagens de equipamentos (quais?)
  • Verificação manual

@marado
Copy link
Collaborator

marado commented Oct 24, 2020

Além da verificação dos dados, pode ser interessante a adição de informação no wikidata.

@themudo
Copy link

themudo commented Oct 24, 2020

Para as bibliotecas, as bibliotecas municipais estão quase completas, mas falta uma ou outra. A página da RNBP (http://bibliotecas.dglab.gov.pt/pt/Bibliotecas/Paginas/default.aspx) tem info em formato xls que pode ser usado para comparar com o que já tem no wikidata. Tinha esta query para ver o estado das bibliotecas municipais: https://w.wiki/QdF

@themudo
Copy link

themudo commented Oct 24, 2020

Se quiserem também fazer dos monumentos, o Wikidata deve estar bastante completo, mas é capaz de ter até coisas a mais e alguns duplicados, convém ser um pouco restrito. Aqui tem uma query que agrupa por distrito: https://query.wikidata.org/#%23defaultView%3AMap%0ASELECT%20DISTINCT%20%3Fitem%20%3FitemLabel%20%3Flocation%20%3Fimage%20%3Fprovince%20%3FprovinceLabel%20%28SAMPLE%28%3Flayer%29%20AS%20%3Flayer%29%0AWHERE%20%7B%0A%20%20%3Fitem%20wdt%3AP17%20wd%3AQ45%20.%20%0A%20%20%3Fitem%20wdt%3AP1702%20%3Fdgpcid%20.%0A%20%20%3Fitem%20wdt%3AP1700%20%3Fsipaid%20.%0A%20%20%3Fitem%20wdt%3AP625%20%3Flocation%20.%20%0A%23%20%20minus%20%7B%3Fitem%20wdt%3AP18%20%3Fimage%20%7D%0A%20%20%0A%20%20%3Fitem%20wdt%3AP131%2a%20%3Fprovince%20.%0A%20%20values%20%3Fprovince%20%7Bwd%3AQ273533%20%23Guarda%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20wd%3AQ373528%20%23Bragan%C3%A7a%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20wd%3AQ210527%20%23Aveiro%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20wd%3AQ244517%20%23Coimbra%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20wd%3AQ244512%20%23Leiria%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20wd%3AQ321455%20%23Beja%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20wd%3AQ326203%20%23Braga%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20wd%3AQ273529%20%23Castelo%20Branco%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20wd%3AQ244521%20%23Faro%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20wd%3AQ207199%20%23Lisboa%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20wd%3AQ225189%20%23Portalegre%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20wd%3AQ244510%20%23Santar%C3%A9m%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20wd%3AQ274109%20%23Set%C3%BAbal%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20wd%3AQ326214%20%23Viana%20do%20Castelo%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20wd%3AQ379372%20%23Vila%20Real%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20wd%3AQ273525%20%23Viseu%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20wd%3AQ274118%20%23%C3%89vora%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20wd%3AQ322792%20%23Porto%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20wd%3AQ25263%20%23A%C3%A7ores%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20wd%3AQ26253%20%23Madeira%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%7D%0A%20%20%0A%20%20BIND%28%3Fprovince%20AS%20%3Flayer%29%0A%20%20SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22pt%22.%20%7D%0A%7D%0AGROUP%20BY%20%3Fitem%20%3FitemLabel%20%3Flocation%20%3Fimage%20%3Fprovince%20%3FprovinceLabel

@themudo
Copy link

themudo commented Oct 24, 2020

Talvez uma boa fonte para os teatros (e cinemas): https://www.municipiosefreguesias.pt/categoria/1295/Cinemas-e-Teatros; https://www.uc.pt/org/centrodramaturgia/10/diretorio_companhias/teatro_profissional

@waldyrious
Copy link
Contributor

Para as bibliotecas, as bibliotecas municipais estão quase completas, mas falta uma ou outra. A página da RNBP (http://bibliotecas.dglab.gov.pt/pt/Bibliotecas/Paginas/default.aspx) tem info em formato xls que pode ser usado para comparar com o que já tem no wikidata. Tinha esta query para ver o estado das bibliotecas municipais: w.wiki/QdF

FYI @themudo, este item tinha informação agregada do que eram na verdade várias bibliotecas com o mesmo nome. Extraí os dados para itens separados (aqui, aqui e aqui). Talvez haja outras bibliotecas em que tenha acontecido o mesmo; se puderes, confirma pfv.

@themudo
Copy link

themudo commented Oct 26, 2020

Obrigado @waldyrious. Há também pelo menos um outro caso em que o item deve ser separado, porque é sobre o edifício.

@waldyrious
Copy link
Contributor

Done :)

@themudo
Copy link

themudo commented Oct 30, 2020

Para as bibliotecas, as bibliotecas municipais estão quase completas, mas falta uma ou outra. A página da RNBP (http://bibliotecas.dglab.gov.pt/pt/Bibliotecas/Paginas/default.aspx) tem info em formato xls que pode ser usado para comparar com o que já tem no wikidata. Tinha esta query para ver o estado das bibliotecas municipais: https://w.wiki/QdF

Com a ajuda do @waldyrious , as bibliotecas municipais já estão todas no wikidata.

@waldyrious
Copy link
Contributor

@marado @aariops podemos fazer uma checklist do que seria necessário fazer para considerar este issue concluído, pelo menos numa fase inicial? (Incluindo quer tarefas de importação de determinados datasets, que tarefas de investigação se existem datasets para os dados em causa, entre outros).

@marado
Copy link
Collaborator

marado commented Oct 30, 2020

Da minha prespectiva pessoal:

  • há uma falta gritante de galerias de arte
  • as ilhas estão com fraca informação em todas? as áreas

@waldyrious
Copy link
Contributor

waldyrious commented Oct 31, 2020

há uma falta gritante de galerias de arte

Fui explorar um pouco o Overpass Turbo para ver o que havia no OpenStreetMap, e apesar de nunca o ter usado, até foi fácil obter a lista de galerias mapeadas em Portugal — bastou meter tourism=gallery in Portugal no Wizard, e ele gerou uma query com os dados todos :)

Exportei os dados em JSON e estive a limpá-los. Já criei alguns manualmente no Wikidata, mas temos cerca de 30 que ainda faltam ser inseridos. @themudo achas que consegues converter os dados em instruções do QuickStatements, passando pelo OpenRefine? É preciso mapear os campos "city" e "operator" para entidades do Wikidata.

JSON:
[
  {
    "coordinates": "38.9617, -9.4190"
  },
  {
    "name": "Galeria de Arte do Estoril",
    "operator": "Junta de Freguesia de Cascais e Estoril",
    "coordinates": "38.7036, -9.3913"
  },
  {
    "name": "Mercado Velho",
    "city": "Tondela",
    "operator": "Câmara Municipal de Tondela",
    "street_address": "Av. Dr. António José de Almeida",
    "website": "http://www.cm-tondela.pt/index.php/servicos/gabinete-de-cultura-e-projectos-culturais/equipamentos/mercado-velho",
    "coordinates": "40.5170, -8.0791"
  },
  {
    "name": "Arte Graça",
    "city": "Lisboa",
    "street_address": "Rua da Graça, 27/29",
    "coordinates": "38.7209, -9.1300"
  },
  {
    "coordinates": "41.0015, -8.6404"
  },
  {
    "name": "Galeria de Arte Santo André",
    "coordinates": "40.9974, -8.4727"
  },
  {
    "name": "Centro Cultural Emérico Nunes",
    "coordinates": "37.9551, -8.8676"
  },
  {
    "coordinates": "39.7520, -8.8129"
  },
  {
    "name": "Carpintarias de São Lázaro",
    "city": "Lisboa",
    "postal_code": "1150-199",
    "street_address": "Rua de São Lázaro, 72",
    "coordinates": "38.7184, -9.1362"
  },
  {
    "name": "Centro Municipal de Cultura",
    "coordinates": "37.7401947, -25.6715996"
  },
  {
    "name": "Ricardo Campus - Caricaturas",
    "website": "http://www.ricardocampus.com",
    "coordinates": "41.1543416, -8.5912762"
  },
  {
    "name": "Galeria Municipal de Montijo",
    "city": "Montijo",
    "operator": "Câmara Municipal de Montijo",
    "phone": "+351 21 232 77 36",
    "postal_code": "2870-253",
    "street_address": "Rua Almirante Cândido dos Reis, 12",
    "website": "https://www.mun-montijo.pt/pages/592",
    "coordinates": "38.7056231, -8.974021"
  },
  {
    "name": "Galeria do Museu Carris",
    "coordinates": "38.7025212, -9.1801889"
  },
  {
    "name": "Valquiria Enxoval;Joana Vasconcelos",
    "coordinates": "39.5166243, -7.6507932"
  },
  {
    "name": "Casa das Artes",
    "city": "Miranda do Corvo",
    "street_address": "Alameda das Moitas",
    "coordinates": "40.093398, -8.324527"
  },
  {
    "name": "ART I Form",
    "street_address": "Avenida Clotilde, 52 F",
    "coordinates": "38.7039393, -9.3971693"
  },
  {
    "name": "Officina Mundi",
    "operator": "Município de Avis",
    "street_address": "Rua Cerca do Convento",
    "coordinates": "39.056372, -7.8884466"
  },
  {
    "name": "Forum Arte Braga",
    "coordinates": "41.5418039, -8.4219338"
  },
  {
    "name": "Galeria de Arte Beltrão Coelho",
    "postal_code": "1900-410",
    "street_address": "Rua Sarmento de Beires, 3, Loja",
    "coordinates": "38.74219, -9.1279487"
  },
  {
    "name": "Galeria de Arte da Praça do Mar",
    "coordinates": "37.0680934, -8.104135"
  },
  {
    "city": "Barreiro e Lavradio",
    "name": "PADA Studios",
    "postal_code": "2830-314",
    "street_address": "Rua 42, 2",
    "coordinates": "38.6658524, -9.064892"
  },
  {
    "name": "Espaço Mira",
    "city": "Campanhã",
    "postal_code": "4300-171",
    "street_address": "Rua de Miraflor, 159",
    "coordinates": "41.1485832, -8.5873615"
  },
  {
    "name": "MIRAForum",
    "city": "Campanhã",
    "postal_code": "4300-171",
    "street_address": "Rua de Miraflor, 155",
    "coordinates": "41.14855, -8.5873773"
  },
  {
    "name": "Mira - Artes Performativas",
    "city": "Campanhã",
    "postal_code": "4300-171",
    "street_address": "Rua do Padre António Vieira, 68",
    "coordinates": "41.1477342, -8.5886946"
  },
  {
    "name": "Galeria de Exposições Temporárias",
    "operator": "Câmara Municipal de Portalegre",
    "coordinates": "39.2909605, -7.4304633"
  },
  {
    "coordinates": "39.7428751, -8.8072405"
  },
  {
    "name": "Galeria de Arte Molduras",
    "street_address": "Rua Comandante António Feio, 91",
    "coordinates": "38.6838503, -9.1513997"
  },
  {
    "name": "Galeria Munincipal",
    "phone": "+351 289 840 211",
    "coordinates": "37.1529573, -7.8885966"
  },
  {
    "name": "Centro Cultural de Ermidas-Sado",
    "coordinates": "38.0073049, -8.4112369"
  },
  {
    "name": "Hannah Art Gallery",
    "coordinates": "40.1559581, -8.2079502"
  },
  {
    "name": "Sala de Exposições",
    "coordinates": "40.1113586, -8.491377"
  }
]
CSV:
coordinates,name,operator,city,street_address,website,postal_code,phone
"38.9617, -9.4190",,,,,,,
"38.7036, -9.3913",Galeria de Arte do Estoril,Junta de Freguesia de Cascais e Estoril,,,,,
"40.5170, -8.0791",Mercado Velho,Câmara Municipal de Tondela,Tondela,Av. Dr. António José de Almeida,http://www.cm-tondela.pt/index.php/servicos/gabinete-de-cultura-e-projectos-culturais/equipamentos/mercado-velho,,
"38.7209, -9.1300",Arte Graça,,Lisboa,"Rua da Graça, 27/29",,,
"41.0015, -8.6404",,,,,,,
"40.9974, -8.4727",Galeria de Arte Santo André,,,,,,
"37.9551, -8.8676",Centro Cultural Emérico Nunes,,,,,,
"39.7520, -8.8129",,,,,,,
"38.7184, -9.1362",Carpintarias de São Lázaro,,Lisboa,"Rua de São Lázaro, 72",,1150-199,
"37.7401947, -25.6715996",Centro Municipal de Cultura,,,,,,
"41.1543416, -8.5912762",Ricardo Campus - Caricaturas,,,,http://www.ricardocampus.com,,
"38.7056231, -8.974021",Galeria Municipal de Montijo,Câmara Municipal de Montijo,Montijo,"Rua Almirante Cândido dos Reis, 12",https://www.mun-montijo.pt/pages/592,2870-253,+351 21 232 77 36
"38.7025212, -9.1801889",Galeria do Museu Carris,,,,,,
"39.5166243, -7.6507932",Valquiria Enxoval;Joana Vasconcelos,,,,,,
"40.093398, -8.324527",Casa das Artes,,Miranda do Corvo,Alameda das Moitas,,,
"38.7039393, -9.3971693",ART I Form,,,"Avenida Clotilde, 52 F",,,
"39.056372, -7.8884466",Officina Mundi,Município de Avis,,Rua Cerca do Convento,,,
"41.5418039, -8.4219338",Forum Arte Braga,,,,,,
"38.74219, -9.1279487",Galeria de Arte Beltrão Coelho,,,"Rua Sarmento de Beires, 3, Loja",,1900-410,
"37.0680934, -8.104135",Galeria de Arte da Praça do Mar,,,,,,
"38.6658524, -9.064892",PADA Studios,,Barreiro e Lavradio,"Rua 42, 2",,2830-314,
"41.1485832, -8.5873615",Espaço Mira,,Campanhã,"Rua de Miraflor, 159",,4300-171,
"41.14855, -8.5873773",MIRAForum,,Campanhã,"Rua de Miraflor, 155",,4300-171,
"41.1477342, -8.5886946",Mira - Artes Performativas,,Campanhã,"Rua do Padre António Vieira, 68",,4300-171,
"39.2909605, -7.4304633",Galeria de Exposições Temporárias,Câmara Municipal de Portalegre,,,,,
"39.7428751, -8.8072405",,,,,,,
"38.6838503, -9.1513997",Galeria de Arte Molduras,,,"Rua Comandante António Feio, 91",,,
"37.1529573, -7.8885966",Galeria Munincipal,,,,,,+351 289 840 211
"38.0073049, -8.4112369",Centro Cultural de Ermidas-Sado,,,,,,
"40.1559581, -8.2079502",Hannah Art Gallery,,,,,,
"40.1113586, -8.491377",Sala de Exposições,,,,,,

marado added a commit that referenced this issue Oct 31, 2020
Como referido em #16, foram feitas várias actualizaões e adições aos
dados no wikidata (em particular no que diz respeito às bibliotecas).

As mudanças deste commit são resultado directo de correr o script para
a actualização.
@marado
Copy link
Collaborator

marado commented Oct 31, 2020

A usar o CSV (mais útil para os wikistatements), tirei as entradas que não interessam (coordenadas sem informação, vi uma delas e não era uma galeria...), e transformei os "operator"s em entidades do wikidata.
gal.csv.txt

marado added a commit that referenced this issue Nov 1, 2020
The galleries mentioned on #16 were all added to wikidata.

Closes: #62.
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

4 participants