Larramendi, Azkoitiko Sermoia: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
Testu historikoen edukiak errepresentatzeko eta anotazioez aberasteko datu-eredu garatzeko asmotan, Larramendiren [[Item:Q453|Azkoitiko Sermoia]] hartu dugu adibide. Wikitekan (euskarazko Wikisourcen), eskuizkribua eta transkribapena ditugu, eta hemen, MLV Wikibase honetan, transkribaketaren tokenak (hau da, hitzak eta interpuntzio ikurrak segmentu banatan jasotzen duen zatiketa, modu bertikalean errepresentatu daitekeena, aspalditik usadioa den legez (ikus, adibidez, [https://universaldependencies.org/format.html CONLL formatua]). Galdeketak bistarazten duen taularen atzetik, Datu Lotuak daude, hau da, hirukote semantikoak. Corpus datuak Datu Lotu gisan jasotzeko proposatzen dugun eredu honetan, Linguistik Linked Data arloko azkenengo proposamenak hartzen ditugu aintzat (ikus Stanković et al. 2023). | Testu historikoen edukiak errepresentatzeko eta anotazioez aberasteko datu-eredu garatzeko asmotan, Larramendiren [[Item:Q453|Azkoitiko Sermoia]] hartu dugu adibide. Wikitekan (euskarazko Wikisourcen), eskuizkribua eta transkribapena ditugu, eta hemen, MLV Wikibase honetan, transkribaketaren tokenak (hau da, hitzak eta interpuntzio ikurrak segmentu banatan jasotzen duen zatiketa, modu bertikalean errepresentatu daitekeena, aspalditik usadioa den legez (ikus, adibidez, [https://universaldependencies.org/format.html CONLL formatua]). Galdeketak bistarazten duen taularen atzetik, Datu Lotuak daude, hau da, hirukote semantikoak. Corpus datuak Datu Lotu gisan jasotzeko proposatzen dugun eredu honetan, Linguistik Linked Data arloko azkenengo proposamenak hartzen ditugu aintzat (ikus [[Item:Q1260|Stanković et al. 2023]]). | ||
== SPARQL == | == SPARQL == |
Revision as of 16:35, 16 November 2023
Testu historikoen edukiak errepresentatzeko eta anotazioez aberasteko datu-eredu garatzeko asmotan, Larramendiren Azkoitiko Sermoia hartu dugu adibide. Wikitekan (euskarazko Wikisourcen), eskuizkribua eta transkribapena ditugu, eta hemen, MLV Wikibase honetan, transkribaketaren tokenak (hau da, hitzak eta interpuntzio ikurrak segmentu banatan jasotzen duen zatiketa, modu bertikalean errepresentatu daitekeena, aspalditik usadioa den legez (ikus, adibidez, CONLL formatua). Galdeketak bistarazten duen taularen atzetik, Datu Lotuak daude, hau da, hirukote semantikoak. Corpus datuak Datu Lotu gisan jasotzeko proposatzen dugun eredu honetan, Linguistik Linked Data arloko azkenengo proposamenak hartzen ditugu aintzat (ikus Stanković et al. 2023).
SPARQL
Erabili galdeketa hau Azkoitiko Sermoiaren tokenak eta anotazioak ikusteko.
PREFIX mwb: <https://monumenta.wikibase.cloud/entity/>
PREFIX mdp: <https://monumenta.wikibase.cloud/prop/direct/>
PREFIX mp: <https://monumenta.wikibase.cloud/prop/>
PREFIX mps: <https://monumenta.wikibase.cloud/prop/statement/>
PREFIX mpq: <https://monumenta.wikibase.cloud/prop/qualifier/>
PREFIX mpr: <https://monumenta.wikibase.cloud/prop/reference/>
PREFIX mno: <https://monumenta.wikibase.cloud/prop/novalue/>
#title: Galdetzen du tokenak non dauden wikisourcen, eta zer lema-formei lotuta dauden
select ?token ?token_zbk ?token_forma ?wikisource ?lexeme_id (iri(concat('http://www.wikidata.org/entity/',?wd_qid)) as ?wikidata_lexeme)
?lemma ?sense_id ?sense ?form_id ?forma where {
?token mdp:P5 mwb:Q15 ;
mdp:P148 ?token_zbk ;
mdp:P147 ?token_forma ;
mdp:P177 ?wikisource ;
optional { ?token mp:P7 ?lemmanode . ?lemmanode mps:P7 ?lexeme_id. ?lexeme_id wikibase:lemma ?lemma .
optional {?lexeme_id mdp:P1 ?wd_qid .}
optional {?lemmanode mpq:P155 ?sense_id. ?sense_id skos:definition ?sense .}
optional {?lemmanode mpq:P156 ?form_id. ?form_id ontolex:representation ?forma .}
}
} order by xsd:integer(?token_zbk)