From 6aeb8b80ecaebf371499624b1e261109771adfae Mon Sep 17 00:00:00 2001 From: Jack Rueter Date: Sun, 30 Jun 2024 15:30:45 +0300 Subject: [PATCH] Work with nominal declension type guesser --- src/fst/morphology/affixes/adjectives.lexc | 3 + src/fst/morphology/affixes/nouns.lexc | 112 +++++++++++++++---- src/fst/morphology/affixes/propernouns.lexc | 6 + src/fst/morphology/root.lexc | 98 ++++++++++++++++ src/fst/morphology/stems/adjectives.lexc | 36 +++--- src/fst/morphology/stems/adjectives.xml | 36 +++--- src/fst/morphology/stems/nouns.lexc | 82 +++++++------- src/fst/morphology/stems/nouns.xml | 82 +++++++------- src/fst/morphology/stems/nouns_newwords.lexc | 45 ++++++++ src/fst/morphology/stems/propernouns.lexc | 54 ++++----- src/fst/morphology/stems/propernouns.xml | 56 +++++----- src/fst/morphology/stems/quantifiers.lexc | 8 +- src/fst/morphology/stems/quantifiers.xml | 20 ++-- 13 files changed, 429 insertions(+), 209 deletions(-) diff --git a/src/fst/morphology/affixes/adjectives.lexc b/src/fst/morphology/affixes/adjectives.lexc index 0bd8aab4..dc6818fe 100644 --- a/src/fst/morphology/affixes/adjectives.lexc +++ b/src/fst/morphology/affixes/adjectives.lexc @@ -32,6 +32,9 @@ LEXICON A_KALĀ !!= @CODE@ contains kalā:kaʼlā 18 LEXICON A_TUBĀ !!= @CODE@ tubā:tuʼbā 19 NMN_TUBĀ ; +LEXICON A_AMĀ !!= @CODE@ amā:aʼm 19a + NMN_AMĀ ; + LEXICON A_AIGĀ !!= @CODE@ aigā:aʼig 20 NMN_AIGĀ ; +Comp:%^StodRM%>īm NMN_SIDĀM ; diff --git a/src/fst/morphology/affixes/nouns.lexc b/src/fst/morphology/affixes/nouns.lexc index bb741135..84884418 100644 --- a/src/fst/morphology/affixes/nouns.lexc +++ b/src/fst/morphology/affixes/nouns.lexc @@ -63,6 +63,15 @@ LEXICON N_KALĀ-SG !!≈ * **@CODE@** contains kalā:kaʼlā 18 LEXICON N_KALĀ-PL !!≈ * **@CODE@** contains kalā:kaʼlā 18 NMN_KALĀ-PL ; +LEXICON N_IRĒ !!≈ * **@CODE@** contains irē:iʼr 18 + NMN_IRĒ ; + +LEXICON N_IRĒ-SG !!≈ * **@CODE@** contains irē:iʼr 18 + NMN_IRĒ-SG ; + +LEXICON N_IRĒ-PL !!≈ * **@CODE@** contains irē:iʼr 18 + NMN_IRĒ-PL ; + LEXICON N_TUBĀ !!≈ * **@CODE@** tubā:tuʼbā 19 N_TUBĀ-SG ; N_TUBĀ-PL ; @@ -73,6 +82,16 @@ LEXICON N_TUBĀ-SG !!≈ * **@CODE@** tubā:tuʼbā 19 LEXICON N_TUBĀ-PL !!≈ * **@CODE@** tubā:tuʼbā 19 NMN_TUBĀ-PL ; +LEXICON N_AMĀ !!≈ * **@CODE@** amā:aʼm 19a + N_AMĀ-SG ; + N_AMĀ-PL ; + +LEXICON N_AMĀ-SG !!≈ * **@CODE@** amā:aʼm 19a + NMN_AMĀ-SG ; + +LEXICON N_AMĀ-PL !!≈ * **@CODE@** amā:aʼm 19a + NMN_AMĀ-PL ; + LEXICON N_AIGĀ !!≈ * **@CODE@** aigā:aigā 20 NMN_AIGĀ ; @@ -1375,6 +1394,32 @@ LEXICON NMN_KALĀ-PL :%^PalatalizeLeft PL-ILL_ži ; :%^PalatalizeLeft PL-PAR_ḑi ; +!! 18a +LEXICON NMN_IRĒ !!≈ * **@CODE@** irē:iʼr +!!≈ * Yaml: **N-kalaa** Pass: 2014.12.12 +!! Stem change: Yes +!! Consonant lengthening +!! Consonant palatalization +!! Vowel change in 2nd syllable ā:õ/0 +!! Stød: Yes + NMN_IRĒ-SG ; + NMN_IRĒ-PL ; + +LEXICON NMN_IRĒ-SG +:%^StodRMē SG-DAT_n ; +:%^StodRMē SG-ELA/INE_st ; +:%^StodRMē SG-GEN ; +:%{XC%}%>õ SG-ILL_ZERO ; +:%^StodRMē SG-INS_ks ; +:%^StodRMē SG-NOM ; +:%{XC%}%>õ SG-PAR_ZERO ; + +LEXICON NMN_IRĒ-PL +:%^StodRMē PL-INS_DÕKS-STEM ; +:%^PalatalizeLeft PL-ELA/INE_šti ; +:%^PalatalizeLeft PL-ILL_ži ; +:%^PalatalizeLeft PL-PAR_ḑi ; + !! 19 LEXICON NMN_TUBĀ !!≈ * **@CODE@** tubā:tuʼb !! * Yaml: **A-amaa, N-tubaa** Pass: 2014.12.12 @@ -1398,6 +1443,29 @@ LEXICON NMN_TUBĀ-PL :%^PalatalizeLeft PL-ILL_ži ; :%^PalatalizeLeft PL-PAR_ḑi ; +!! 19a +LEXICON NMN_AMĀ !!≈ * **@CODE@** amā:tuʼb +!! * Yaml: **A-amaa, N-tubaa** Pass: 2014.12.12 +!! Stem change: Yes +!! Vowel change in word-final position a:õ/0 +!! Stød + NMN_AMĀ-SG ; + NMN_AMĀ-PL ; +LEXICON NMN_AMĀ-SG +:%^StodRMā SG-DAT_n ; +:%^StodRMā SG-ELA/INE_st ; +:%^StodRMā SG-GEN ; +:%{XC%}%>õ SG-ILL_ZERO ; +:%^StodRMā SG-INS_ks ; +:%^StodRMā SG-NOM ; +:%{XC%}%>õ SG-PAR_ZERO ; + +LEXICON NMN_AMĀ-PL +:%^StodRMā PL-INS_DÕKS-STEM ; +:%^PalatalizeLeft PL-ELA/INE_šti ; +:%^PalatalizeLeft PL-ILL_ži ; +:%^PalatalizeLeft PL-PAR_ḑi ; + !! 20 LEXICON NMN_AIGĀ !!≈ * **@CODE@** aigā:aʼig !! * Yaml: **N-aigaa** @@ -1431,19 +1499,19 @@ LEXICON NMN_LĒBA !!≈ * **@CODE@** lēba:leib NMN_LĒBA-PL ; LEXICON NMN_LĒBA-SG -:%^VowsLI1a SG-DAT_n ; -:%^VowsLI1a SG-ELA/INE_st ; -:%^VowsLI1a SG-GEN ; -: SG-ILL_õ ; -:%^VowsLI1a SG-INS_ks ; -:%^VowsLI1a SG-NOM ; -: SG-PAR_õ ; +:%^U2ZERO SG-DAT_n ; +:%^U2ZERO SG-ELA/INE_st ; +:%^U2ZERO SG-GEN ; +:%^VV2V%^VowsRM SG-ILL_õ ; +:%^U2ZERO SG-INS_ks ; +:%^U2ZERO SG-NOM ; +:%^VV2V%^VowsRM SG-PAR_õ ; LEXICON NMN_LĒBA-PL -:%^VowsLI1a PL-INS_DÕKS-STEM ; -: PL-ELA/INE_šti ; -: PL-ILL_ži ; -: PL-PAR_ḑi ; +:%^U2ZERO PL-INS_DÕKS-STEM ; +:%^VV2V%^VowsRM PL-ELA/INE_šti ; +:%^VV2V%^VowsRM PL-ILL_ži ; +:%^VV2V%^VowsRM PL-PAR_ḑi ; !! 21 LEXICON NMN_KŪJA !!≈ * **@CODE@** kūja:leiba @@ -1661,19 +1729,19 @@ LEXICON NMN_LIEPĀ !!≈ * **@CODE@** liepā:liep 29 NMN_LIEPĀ-SG ; NMN_LIEPĀ-PL ; LEXICON NMN_LIEPĀ-SG !!≈ * **@CODE@** liepā:lieppā 29 -:ā SG-DAT_n ; -:ā SG-ELA/INE_st ; -:ā SG-GEN ; -:%{XC%} SG-ILL_õ ; -:ā SG-INS_ks ; -:ā SG-NOM ; -:%{XC%} SG-PAR_õ ; +:%^CC2C SG-DAT_n ; +:%^CC2C SG-ELA/INE_st ; +:%^CC2C SG-GEN ; +:%^VowsRM SG-ILL_õ ; +:%^CC2C SG-INS_ks ; +:%^CC2C SG-NOM ; +:%^VowsRM SG-PAR_õ ; LEXICON NMN_LIEPĀ-PL !!≈ * **@CODE@** liepā:lieppā 29 -:ā PL-INS_DÕKS-STEM ; -: PL-ELA/INE_īst ; -: PL-ILL_īž ; -:%^VV2V PL-PAR_ți ; +:%^CC2C PL-INS_DÕKS-STEM ; +:%^CC2C%^VowsRM PL-ELA/INE_īst ; +:%^CC2C%^VowsRM PL-ILL_īž ; +:%^VV2V%^CC2C%^VowsRM PL-PAR_ți ; LEXICON NMN_OKSĀ !!≈ * **@CODE@** oksā:oksā 30 !!≈ * Yaml: **N-oksaa** Passed: diff --git a/src/fst/morphology/affixes/propernouns.lexc b/src/fst/morphology/affixes/propernouns.lexc index d5fa3841..d12b6d1c 100644 --- a/src/fst/morphology/affixes/propernouns.lexc +++ b/src/fst/morphology/affixes/propernouns.lexc @@ -49,6 +49,12 @@ LEXICON PROP_KALĀ !!= @CODE@ contains kalā:kalā 18 LEXICON PROP_KALĀ-SG !!= @CODE@ contains kalā:kalā 18 NMN_KALĀ-SG ; +!LEXICON PROP_IRĒ !!= @CODE@ contains irē:iʼr 18a +! NMN_IRĒ ; + +LEXICON PROP_IRĒ-SG !!= @CODE@ contains irē:iʼr 18a + NMN_IRĒ-SG ; + LEXICON PROP_TUBĀ !!= @CODE@ tubā:tubā 19 NMN_TUBĀ ; diff --git a/src/fst/morphology/root.lexc b/src/fst/morphology/root.lexc index 809f555b..853c2c76 100644 --- a/src/fst/morphology/root.lexc +++ b/src/fst/morphology/root.lexc @@ -532,6 +532,104 @@ Multichar_Symbols %^VowsL1aToǭ !!≈ * **@CODE@** = a >> ǭ ! guess attempt ++N_12_puu ++N_13_rooq ++N_14_paeae ++N_15_tiiqe ++N_16_brii ++N_17_tei ++N_18_kalaa ++N_18a_iree ++N_19_tubaa ++N_19a_amaa ++N_20_aigaa ++N_21_leeba +!+N_22_puuoga only one stem ++N_23_looja ++N_24_paeaeva ++N_25_izaa ++N_25a_piezaa ++N_26_azhaa ++N_27_aaldzha ++N_28_sukaa ++N_29_liepaa + ++N_30_oksaa ++N_31_voontsa ++N_32_liestaa ++N_33_aaiga ++N_33a_laanga ++N_34_siilma ++N_35_kaeaenga ++N_36_aaina ++N_37_veena ! virtually same as 38 ++N_38_rooda ! virtually same as 37 ++N_39_padaa + ++N_40_sobraa ++N_41_kaepaa ++N_42_maksaa ++N_43_keera ++N_44_joora +!+N_45_puuola single word ++N_46_aaita ++N_47_uushka ++N_48_mooka ++N_49_dadzhaa + ++N_50_sushaa ++N_51_kupshaa ++N_52_tshuurtsha ++N_53_seemda ++N_54_tiiera ++N_55_krooipa ++N_56_lilla ++N_57_kutaa ++N_58_neetsha ++N_59_kiqv + ++N_60_ ++N_61_ ++N_62_ ++N_63_ ++N_64_ ++N_65_ ++N_66_ ++N_67_ ++N_68_ ++N_69_ + ++N_70_ ++N_71_ ++N_72_ ++N_73_ ++N_74_ ++N_75_ ++N_76_ ++N_77_ ++N_78_ ++N_79_ + ++N_80_ ++N_81_ ++N_82_ ++N_83_ ++N_84_ ++N_85_ ++N_86_ ++N_87_ ++N_88_ ++N_89_ + ++N_90_ ++N_91_ ++N_92_ ++N_93_ ++N_94_ ++N_95_ ++N_96_ ++N_97_ ++N_98_ +N_99_ul +N_101_täm +N_136_tas diff --git a/src/fst/morphology/stems/adjectives.lexc b/src/fst/morphology/stems/adjectives.lexc index dcbde66f..da2cf13a 100644 --- a/src/fst/morphology/stems/adjectives.lexc +++ b/src/fst/morphology/stems/adjectives.lexc @@ -26,7 +26,7 @@ alāstli+A:alāstli A_AʼBLI "armelias" ; alāz+A:alāz A_ALĪZ "surullinen" ; amerikānli+A:amerikānli A_AʼBLI "amerikkalainen" ; amorāli+A:amorāli A_AʼBLI "moraaliton" ; -amā+A:aʼm A_TUBĀ "kaikki" ; +amā+A:aʼm A_AMĀ "kaikki" ; amāimli+A:amā#iʼmli A_SĒMI "ihmeen kaunis" ; amāpūoļi+A:amā#pūoļi A_TŪĻI "monipuolinen" ; amāsugli+A:amā#suʼgli A_SĒMI "kaikenlainen" ; @@ -109,10 +109,10 @@ drūm+A:drūm A_IRM "kolkko" ; drūošõ+A:drūʼošõ A_DRŪʼOŠÕ "rohkea" ; dullõnz+A:dullõn A_DULLÕNZ "hourupäinen" ; dumpiji+A:dumpiji A_AKKIJI "kapinallinen" ; -dumā+A:duʼm A_PADĀ "tummanruskea" ; +dumā+A:duʼmmā A_PADĀ "tummanruskea" ; dēņ+A:dēņ A_-ZERO "tanskalainen" ; dēņkēļi+A:dēņ#kēļi A_TŪĻI "tanskankielinen" ; -dōŗa+A:dōŗa A_JǬRA "omapäinen" ; +dōŗa+A:dōŗŗa A_JǬRA "omapäinen" ; dūšig+A:dūšig A_KǬRAND "urhea" ; efektīv+A:efektīv A_ANALĪZ "tehokas" ; eitliji+A:eitliji A_AKKIJI "muuttuva" ; @@ -172,16 +172,16 @@ gigantli+A:gigantli A_AʼBLI "giganttinen" ; ginekolōgli+A:ginekolōgli A_AʼBLI "gynekologinen" ; glittõn+A:glittõn A_APPÕN "niljakas" ; globāl+A:globāl A_ANALĪZ "globaalinen" ; -glumā+A:gluʼm A_PADĀ "limainen" ; +glumā+A:gluʼmmā A_PADĀ "limainen" ; glōzi+A:glǭzi A_TŪĻI "lasimainen" ; -gorā+A:goʼr A_PADĀ "hyvin matala" ; -grabā+A:graʼb A_PADĀ "laiha" ; +gorā+A:goʼrrā A_PADĀ "hyvin matala" ; +grabā+A:graʼbbā A_PADĀ "laiha" ; grafītōgi+A:grafīt#ǭʼgi A_SĒMI "grafiitinharmaa" ; gramatili+A:gramatili A_AʼBLI "kieliopillinen" ; granti+A:granti A_TŪĻI "sorainen" ; granītōgi+A:granīt#ǭʼgi A_SĒMI "graniitinharmaa" ; griekõ+A:griekõ A_-ZERO "kreikkalainen" ; -grinā+A:griʼn A_PADĀ "kiukkuinen" ; +grinā+A:griʼnnā A_PADĀ "kiukkuinen" ; grobļimi+A:groʼbļimi A_LĒʼMI "karkea" ; grēkõ+A:grēkõ A_-ZERO "kreikkalainen" ; grēkõkēļi+A:grēkõ#kēļi A_TŪĻI "kreikankielinen" ; @@ -298,7 +298,7 @@ jumālkartli+A:jumāl#kartli A_TŪĻI "jumalaapelkäävä" ; jumālvastli+A:jumāl#vastli A_TŪĻI "jumalaton" ; jurg+A:jurg A_KAND "karkea" ; jurgkarri+A:jurg#karri A_TŪĻI "karkeakarvainen" ; -jutā+A:jutā A_KÄPĀ "raidallinen" ; +jutā+A:juttā A_KÄPĀ "raidallinen" ; juļgi+A:juļgi A_TŪĻI "häikäisevä" ; järsk+A:järsk A_FAKT "jyrkkä" ; jõugi+A:jõugi A_TŪĻI "hiekkainen" ; @@ -590,7 +590,7 @@ libḑi+A:liʼbḑi A_SĒMI "liukas" ; libḑizkēļi+A:liʼbḑiz#kēļi A_TŪĻI "lipeväkielinen" ; limmi+A:liʼmmi A_PUʼNNI "limainen" ; linni+A:liʼnni A_PUʼNNI "pellavainen" ; -lodžā+A:lodžā A_DADŽĀ "nuokuksissa" ; +lodžā+A:loʼdžā A_DADŽĀ "nuokuksissa" ; lomākõz+A:lomākõz A_ARĀGÕZ "hidas" ; loppõn+A:loppõn A_ "loppunut" ; loptāmõt+A:loptāmõt A_-ZERO "loputon" ; @@ -613,7 +613,7 @@ luggõmõt+A:luʼggõmõt A_-ZERO "luvuton" ; lummi+A:luʼmmi A_PUʼNNI "luminen" ; lumvālda+A:luʼm#vālda A_ĀITA "lumivalkoinen" ; luņḑžiji+A:luʼņḑžiji A_LĒʼJI "" ; -läkā+A:läkā A_KÄPĀ "pliisu" ; +läkā+A:läkkā A_KÄPĀ "pliisu" ; lämmi+A:lämmi A_TŪĻI "tukahduttava" ; läppõn+A:läppõn A_APPÕN "ylpeilevä" ; läpātõn+A:läpātõn A_APPÕN "tunkkainen" ; @@ -665,7 +665,7 @@ magḑi+A:maʼgḑi A_SĒMI "maukas" ; magḑiappõn+A:maʼgḑi#appõn A_APPÕN "hapanimelä" ; magḑizvīți+A:maʼgḑiz#vīți A_TŪĻI "makeahko" ; magḑõ+A:maʼgḑõ A_NǬʼGÕ "makea" ; -merk+A:merk A_KAND "omaperäinen" ; +merk+A:merk A_SERK "omaperäinen" ; mettõrpitkit+A:mettõr#pitkit A_ĀIGAST "metrin pituinen" ; metālli+A:metālli A_AʼBLI "metallinen" ; mežži+A:meʼžži A_PUʼNNI "metinen" ; @@ -973,7 +973,7 @@ pȭzlimi+A:pȭzlimi A_AʼBLI "-pensainen" ; pȯlgimizvǟrtli+A:pȯlgimiz#vǟrtli A_TŪĻI "halveksittava" ; pȯlgli+A:pȯlgli A_TŪĻI "halveksiva" ; pȯlgtõb+A:pȯlgtõb A_KǬRAND "halveksittava" ; -rabā+A:raʼb A_PADĀ "murea" ; +rabā+A:raʼbbā A_PADĀ "murea" ; raiklimi+A:raiklimi A_AʼBLI "lovellinen" ; raņțpūjaļgi+A:raņț#pū#jāļgi A_AIGI "länkisäärinen" ; rabdõ+A:raʼbdõ A_NǬʼGÕ "murea" ; @@ -997,7 +997,7 @@ rovvi+A:roʼvvi A_SĒMI "kansallinen" ; rovvõdvaili+A:roʼvvõd#vaʼili A_SĒMI "kansainvälinen" ; rubīžaigi+A:rubīž#aʼigi A_AʼIGI "rajaseudun" ; rubīžtaggi+A:rubīž#taʼggi A_PUʼNNI "rajantakainen" ; -rudā+A:ruʼd A_PADĀ "kuparinruskea" ; +rudā+A:ruʼddā A_PADĀ "kuparinruskea" ; rujā+A:ruʼj A_TUBĀ "sairas" ; rujāli+A:rujāli A_AʼBLI "vaivainen" ; rumāli+A:rumāli A_AʼBLI "likainen" ; @@ -1100,7 +1100,7 @@ sižži+A:siʼžži A_PUʼNNI "hiilinen" ; skitsõn+A:skitsõn A_APPÕN "juovuksissa" ; skōrgiļi+A:skǭrgiļi A_AʼBLI "huono" ; slikțõ+A:slikțõ A_SIELDÕ "huono" ; -smagā+A:smaʼg A_PADĀ "raskas" ; +smagā+A:smaʼggā A_PADĀ "raskas" ; smekīg+A:smekīg A_SIDĀM "maukas" ; smouļ+A:smouļ A_VIĻȚ "nutipäinen" ; smīdõr+A:smīdõr A_KĪNDÕR "siro" ; @@ -1263,9 +1263,9 @@ ummi+A:uʼmmi A_PUʼNNI "omansa" ; ummõ+A:uʼmmõ A_NǬʼGÕ "omansa" ; uņņi+A:uʼņņi A_PUʼNNI "uninen" ; va+A:va A_-ZERO "" ; -vabā+A:vaʼb A_PADĀ "vapaa" ; +vabā+A:vaʼbbā A_PADĀ "vapaa" ; vabāilā+A:vabā#iʼl A_KALĀ "ulkoilma-" ; -vagā+A:vaʼg A_PADĀ "hiljainen" ; +vagā+A:vaʼggā A_PADĀ "hiljainen" ; vagāmēļi+A:vagā#mēļi A_TŪĻI "hyveellinen" ; vaigā+A:vaʼig A_AIGĀ "matala" ; vaimli+A:vaimli A_TŪĻI "hengellinen" ; @@ -1329,7 +1329,7 @@ vālda+A:vālda A_ĀITA "valkoinen" ; vāldaibūkslimi+A:vālda#ibūkslimi A_AʼBLI "vaaleahiuksinen" ; vāldiņ+A:vāldiņ A_ĀNKAŖ "aukinainen" ; vērtig+A:vērtig A_KǬRAND "arvokas" ; -vēļa+A:vēļa A_KĒRA "harva" ; +vēļa+A:vēļļa A_KĒRA "harva" ; vīdkȭrdali+A:vīd#kȭrdali A_AʼBLI "viisikertainen" ; vīdnūrkali+A:vīd#nūrkali A_AʼBLI "viisikulmainen" ; vīdstuņḑi+A:vīd#stuņḑi A_TŪĻI "viisituntinen" ; @@ -1532,7 +1532,7 @@ zīḑi+A:zīḑi A_TŪĻI "silkkinen" ; ūž+A:ūd A_ŪŽ "uusi" ; ūžim+A:ūžim A_KǬRAND "uudempi" ; ūogi+A:ūʼogi A_SĒMI "vihneinen" ; -ōra+A:ǭra A_JǬRA "harva" ; +ōra+A:ǭrra A_JǬRA "harva" ; ōrali+A:ǭrali A_AʼBLI "harvinainen" ; ōļaz+A:ǭļļaz A_PǬĻAZ "vihreä" ; ōdõrz+A:ǭʼdõr A_AŅGÕRZ "maho" ; diff --git a/src/fst/morphology/stems/adjectives.xml b/src/fst/morphology/stems/adjectives.xml index ff0a26bf..95432b39 100644 --- a/src/fst/morphology/stems/adjectives.xml +++ b/src/fst/morphology/stems/adjectives.xml @@ -625,7 +625,7 @@ amā - aʼm + aʼm amā 1 @@ -2791,7 +2791,7 @@ dumā - duʼm + duʼmmā dumā @@ -2871,7 +2871,7 @@ dōŗa - dōŗa + dōŗŗa dōŗa @@ -4390,7 +4390,7 @@ glumā - gluʼm + gluʼmmā glumā @@ -4438,7 +4438,7 @@ gorā - goʼr + goʼrrā gorā @@ -4471,7 +4471,7 @@ grabā - graʼb + graʼbbā grabā @@ -4616,7 +4616,7 @@ grinā - griʼn + griʼnnā grinā @@ -7634,7 +7634,7 @@ jutā - jutā + juttā jutā @@ -15498,7 +15498,7 @@ lodžā - lodžā + loʼdžā lodžā @@ -16135,7 +16135,7 @@ läkā - läkā + läkkā läkā @@ -17514,7 +17514,7 @@ merk - merk + merk merk 2 @@ -25701,7 +25701,7 @@ rabā - raʼb + raʼbbā rabā 1 @@ -26369,7 +26369,7 @@ rudā - ruʼd + ruʼddā rudā @@ -29260,7 +29260,7 @@ smagā - smaʼg + smaʼggā smagā @@ -33763,7 +33763,7 @@ vabā - vaʼb + vaʼbbā vabā 2 @@ -33812,7 +33812,7 @@ vagā - vaʼg + vaʼggā vagā 2 @@ -35562,7 +35562,7 @@ vēļa - vēļa + vēļļa vēļa @@ -41036,7 +41036,7 @@ ōra - ǭra + ǭrra ǭra diff --git a/src/fst/morphology/stems/nouns.lexc b/src/fst/morphology/stems/nouns.lexc index 5a07e266..2312ac11 100644 --- a/src/fst/morphology/stems/nouns.lexc +++ b/src/fst/morphology/stems/nouns.lexc @@ -294,8 +294,8 @@ appõlsinlīem+N:appõlsin#līem N_LĪEM "appelsiinimehu" ; appõlsinmormolād+N:appõlsin#mormolād N_ANALĪZ "appelsiinimarmeladi" ; appõlsinpū+N:appõlsin#pū N_PŪ "appelsiinipuu" ; appõn+N:appõn N_APPÕN "happo" ; -appõndlēba+N:appõnd#leib N_LĒBA "hapanimeläleipä" ; -appõnlēba+N:appõn#leib N_LĒBA "hapanimeläleipä" ; +appõndlēba+N:appõnd#lēiba N_LĒBA "hapanimeläleipä" ; +appõnlēba+N:appõn#lēiba N_LĒBA "hapanimeläleipä" ; appõnnōțõrok+N:appõn#nǭțõ#rok N_TUP "hapankaalikeitto" ; appõnnōțõz+N:appõn#nǭțõ N_VȬRÕZ "hapankaali" ; appõnrok+N:appõn#rok N_TUP "hapatettu jauhojuoma" ; @@ -335,7 +335,7 @@ armi+N:armi N_TŪĻI "armo" ; armij+N:armij N_KǬJ "armeija" ; armjänū+N:arm#jänū N_RUZŪ "rauhankaipuu" ; armkad+N:arm#kaʼd N_NIʼM "mustasukkaisuus" ; -armlēba+N:arm#leib N_LĒBA "armoleipä" ; +armlēba+N:arm#lēiba N_LĒBA "armoleipä" ; armsǟdimi+N:arm#sǟdimi N_AʼBLI "rauhansopimus" ; armsǟdimi+N:arm#sǟdimi N_AʼBLI "rauhansopimus" ; armtõks+N:armtõks N_ĀNDÕKS "tyydytys" ; @@ -588,7 +588,7 @@ bikț+N:bikț N_USK "ehtoollinen" ; biljard+N:biljard N_ĀIGAST "biljardi" ; bilt+N:bilt N_KAND "lestyjauhot" ; biltbikšõd+N:bilt#bikšāz N_BIKŠĀZ-PL "" ; -biltlēba+N:bilt#leib N_LĒBA "hapanimeläleipä" ; +biltlēba+N:bilt#lēiba N_LĒBA "hapanimeläleipä" ; biltõrnikā+N:biltõrnikkā N_PADĀ "taiteilija" ; bilānts+N:bilānts N_ĀIGAST "bilanssi" ; binzõl+N:binzõl N_APPÕN "sisäpohja" ; @@ -711,7 +711,7 @@ brāndiļpuțkõz+N:brāndiļ#puțkõ N_MÕTKÕZ "kuisma" ; brētļi+N:brētļi N_TŪĻI "kilohaili" ; brēḑig+N:brēḑig N_KǬRAND "perjantai" ; brīmō+N:brī#mǭ N_PŪ "hylkymaa" ; -brīvlēba+N:brīv#leib N_LĒBA "almu" ; +brīvlēba+N:brīv#lēiba N_LĒBA "almu" ; brīz+N:brīz N_FAKT "heikko merituuli" ; brīõz+N:brīõz N_NȬŖKÕZ "vapaus" ; brūik+N:brūik N_IRM "tapa" ; @@ -991,7 +991,7 @@ drukpūmpar+N:druk#pūmpar N_PĒGAL "painonappi" ; druktõbkuodā+N:druktõb#kuoʼddā N_PADĀ "kirjapaino" ; druktīe+N:druk#tīʼe N_TĪE "painostyö" ; drukvigā+N:druk#viʼg N_TUBĀ "painovirhe" ; -druppõnlēba+N:druppõn#leib N_LĒBA "leivänmuruja" ; +druppõnlēba+N:druppõn#lēiba N_LĒBA "leivänmuruja" ; dräggõn+N:dräʼggõn N_ǬʼRÕN "kosteikko" ; drāmateātõr+N:drāma#teātõr N_KĪNDÕR "draamateatteri" ; drēgõd+N:drēgõ N_VȬRÕZ-PL "" ; @@ -1776,7 +1776,7 @@ jagūvõtāji+N:jagū#võtāji N_SĒJI "osallistuja" ; jak+N:jak N_TUP "jakku" ; jakt+N:jakt N_MAKS "jahti" ; jaktsport+N:jakt#sport N_FAKT "urheilumetsästys" ; -jalgrujād+N:jalg#ruʼjā N_TUBĀ-PL "kuolio" ; +jalgrujād+N:jalg#ruʼj N_TUBĀ-PL "kuolio" ; jalgteb+N:jalg#teʼbb N_KIʼV "iskias" ; janvār+N:janvār N_SIDĀM "tammikuu" ; japs+N:japs N_MAKS "" ; @@ -1939,7 +1939,7 @@ jumāl+N:jumāl N_TIDĀR "jumala" ; jumālit+N:jumālit N_AMĀT "jumaluus" ; jumālkartõks+N:jumāl#kartõks N_ĀNDÕKS "jumalanpelko" ; jumālkīeldiji+N:jumāl#kīeldiji N_AKKIJI "jumalankieltäjä" ; -jumāllēba+N:jumāl#leib N_LĒBA "ehtoollisleipä" ; +jumāllēba+N:jumāl#lēiba N_LĒBA "ehtoollisleipä" ; jumāllōda+N:jumāl#lōuda N_RŌDA "ehtoollinen" ; jumāļi+N:jumāļi N_AʼBLI "jumaluus" ; jupki+N:jupki N_TŪĻI "" ; @@ -1955,7 +1955,7 @@ jäpūks+N:jäpūks N_KATŪKS "varras" ; jõugõ+N:jȭugõ N_JÕUGÕ "hiekka" ; jõugõbūolgõz+N:jõugõ#būolgõ N_VȬRÕZ "sianpuolukka" ; jõugõd+N:jȭugõ N_JÕUGÕ-PL "" ; -jõugõiegāndõks+N:jõugõ#tiegāndõks N_LǬJA "murotaikina" ; +jõugõiegāndõks+N:jõugõ#tiegāndõks N_KĒRATÕKS "murotaikina" ; jõugõkast+N:jõugõ#kast N_MAKS "hiekkalaatikko" ; jõugõkiv+N:jõugõ#kiʼvv N_KIʼV "hiekkakivi" ; jõugõkīela+N:jõugõ#kīella N_KĒRA "hiekkakello" ; @@ -2418,7 +2418,7 @@ kilāaŗšt+N:kilā#aŗšt N_KAND "kylälääkäri" ; kilābūoḑ+N:kilā#būoḑ N_GĒRMAŅ "kyläkauppa" ; kilālagdõ+N:kilā#laʼgdõ N_NǬʼGÕ "kyläaukea" ; kilāli+N:kilāli N_AʼBLI "vieras" ; -kilālēba+N:kilā#leib N_LĒBA "tuliainen" ; +kilālēba+N:kilā#lēiba N_LĒBA "tuliainen" ; kilāmīez+N:kilā#mīʼez N_MĪEZ "kyläläinen" ; kilāndõks+N:kilāndõks N_KĒRATÕKS "kalina" ; kilānikā+N:kilānikkā N_KÄPĀ "kyläläinen" ; @@ -2512,7 +2512,7 @@ kleppõr+N:kleppõr N_KĪNDÕR "kompuroija" ; klepār+N:klepār N_TIDĀR "kompuroija" ; kleit+N:kleʼit N_NĪʼEM "leninki" ; klibā+N:kliʼbbā N_PADĀ "nilkku" ; -klijād+N:kliʼjā N_TUBĀ-PL "lese" ; +klijād+N:kliʼj N_TUBĀ-PL "lese" ; klink+N:klink N_SERK "ovenkahva" ; klutš+N:klutš N_OKŠ "pölkky" ; klub+N:kluʼb N_SUʼG "klubi" ; @@ -3061,7 +3061,7 @@ kārnaz+N:kārnaz N_ĀMBAZ "korppi" ; kārnaz+N:kārnaz N_ĀMBAZ "pata" ; kārpakalā+N:kārpa#kaʼl N_KALĀ "karppi" ; kāņḑigit+N:kāņḑigit N_AMĀT "munimiskyky" ; -kēja+N:keija N_LĒBA "tahko" ; +kēja+N:kēija N_LĒBA "tahko" ; kēk+N:kēk N_IRM "keittiö" ; kēkkombain+N:kēk#kombain N_ĀIGAST "yleiskone" ; kēkneitst+N:kēk#neits N_NEITST "keittiötyttö" ; @@ -3555,7 +3555,7 @@ liegā+N:lieʼggā N_PADĀ "kura" ; liegārastā+N:liegā#rastā N_MAKSĀ "kottarainen" ; liepapū+N:liepa#pū N_PŪ "leppä" ; lieppimi+N:lieppimi N_AʼBLI "sopimus" ; -liepā+N:liep N_LIEPĀ "leppä" ; +liepā+N:lieppā N_LIEPĀ "leppä" ; liepālind+N:liepā#lind N_KAND "perhonen" ; liepālinki+N:liepā#linki N_TŪĻI "perhonen" ; liepālinkizvõrgõ+N:liepā#linkiz#vȭrgõ N_VÕRGÕ "perhoshaavi" ; @@ -3646,7 +3646,7 @@ lotšākūora+N:lotšā#kūorra N_KĒRA "hörökorva" ; loul+N:loul N_LOUL "laulu" ; loulansambõl+N:loul#ansambõl N_APPÕN "lauluyhtye" ; loulkūoŗ+N:loul#kūoŗ N_GĒRMAŅ "laulukuoro" ; -loulpivād+N:loul#piʼvā N_TUBĀ-PL "laulujuhla" ; +loulpivād+N:loul#piʼv N_TUBĀ-PL "laulujuhla" ; loulrōntõz+N:loul#rǭntõ N_VȬRÕZ "laulukirja" ; loulsõbrā+N:loul#sõbrā N_SÕBRĀ "laulujen ystävä" ; loultūrgõz+N:loul#tūrgõ N_VȬRÕZ "" ; @@ -3734,8 +3734,8 @@ lāngkierā+N:lāng#kieʼrrā N_PADĀ "lankakerä" ; lānka+N:lānka N_ĀITA "luhtaniitty" ; lāškandiji+N:lāškandiji N_AKKIJI "laiskiainen" ; lāškandimi+N:lāškandimi N_AʼBLI "laiskottelu" ; -lēba+N:leib N_LĒBA "leipä" ; -lēba+N:leib N_LĒBA "hedelmä" ; +lēba+N:lēiba N_LĒBA "leipä" ; +lēba+N:lēiba N_LĒBA "hedelmä" ; lēbabūoḑ+N:lēba#būoḑ N_GĒRMAŅ "leipäkauppa" ; lēbadrok+N:lēbad#rok N_TUP "leipäkeitto" ; lēbaizā+N:lēba#iʼzzā N_IZĀ "elättäjä" ; @@ -3915,7 +3915,7 @@ lōtšõz+N:lǭʼtšõz N_LǬʼTŠÕZ "ruiskattara" ; lōḑ+N:lǭḑ N_GĒRMAŅ "lipas" ; lōḑig+N:lǭḑig N_KǬRAND "lasti" ; lȭda+N:lȭuda N_RŌDA "puulautanen" ; -lȭga+N:lȭga N_PǞVA "leuka" ; +lȭga+N:lȭuga N_PǞVA "leuka" ; lȭgalū+N:lȭga#lū N_PŪ "leukaluu" ; lȭgatutkām+N:lȭga#tutkām N_SIDĀM "leuankärki" ; lȭiga+N:lȭig N_ĀIGA "liika" ; @@ -3947,7 +3947,7 @@ mahhõr+N:mahhõr N_KĪNDÕR "mohair" ; mai+N:mai N_BRĪ "toukokuu" ; maijkū+N:maij#kū N_PŪ "toukokuu" ; mail+N:mail N_KAND "kalanpoikanen" ; -maipivād+N:mai#piʼvā N_TUBĀ-PL "vappu" ; +maipivād+N:mai#piʼv N_TUBĀ-PL "vappu" ; maipuțkõz+N:mai#puțkõ N_MÕTKÕZ "kielo" ; maiskõl+N:maiskõl N_APPÕN "riuku" ; maistōt+N:maistǭt N_KULTŪR "majesteetti" ; @@ -4239,7 +4239,7 @@ mustit+N:mustit N_ĀIGAST "lika" ; mustõr+N:mustõr N_KĪNDÕR "kuosi" ; mustāam+N:mustā#aʼm N_AʼM "mustakaapu" ; mustākēra+N:mustā#kērra N_KĒRA "konsepti" ; -mustālēba+N:mustā#leib N_LĒBA "ruisleipä" ; +mustālēba+N:mustā#lēiba N_LĒBA "ruisleipä" ; mustām+N:mustām N_SIDĀM "tahra" ; mustāmīez+N:mustā#mīʼez N_MĪEZ "paholainen" ; mustāmō+N:mustā#mǭ N_PŪ "mustamulta" ; @@ -5212,7 +5212,7 @@ pittõrnikā+N:pittõrnikkā N_KÄPĀ "pitrõgilainen" ; pitīdsiepā+N:pitīd#sieppā N_KÄPĀ "tynnyrintekijä" ; pitšop+N:pitšop N_ĀIGAST "leimasin" ; piuk+N:piuk N_SERK "piipahdus" ; -pivād+N:piʼvā N_TUBĀ-PL "iltama" ; +pivād+N:piʼv N_TUBĀ-PL "iltama" ; pivādvait+N:pivād#vaʼit N_NĪʼEM "juhlapyhien välinen aika" ; pivādāiga+N:pivād#āig N_ĀIGA "juhla-aika" ; pivādȭdõg+N:pivād#ȭʼdõg N_ȬʼDÕG "illanvietto" ; @@ -5318,7 +5318,7 @@ plūor+N:plūor N_IRM "huntu" ; plōkstõr+N:plǭkstõr N_KĪNDÕR "laastari" ; plōn+N:plǭn N_IRM "suunnitelma" ; plōț+N:plǭț N_GĒRMAŅ "leivinpelti" ; -plōțlēba+N:plǭț#leib N_LĒBA "peltipiirakka" ; +plōțlēba+N:plǭț#lēiba N_LĒBA "peltipiirakka" ; podā+N:poʼddā N_PADĀ "ryysy" ; pojēn+N:pojēn N_AMĀT "pioni" ; poligon+N:poligon N_AMĀT "ampumakenttä" ; @@ -5529,7 +5529,7 @@ pēgõz+N:pēʼgõ N_PŪʼDÕZ "pähkinä" ; pīedrõb+N:pīedrõb N_KǬRAND "luuva" ; pīelvežā+N:pīel#veʼžžā N_AŽĀ "märssykori" ; pīendrõks+N:pīendrõks N_ĀNDÕKS "pellonpiennar" ; -pīenlēba+N:pīen#leib N_LĒBA "" ; +pīenlēba+N:pīen#lēiba N_LĒBA "" ; pīentažā+N:pīent#aʼžžā N_AŽĀ "pikkuseikka" ; pīentimi+N:pīentimi N_AʼBLI "liudennus" ; pīentrō+N:pīent#rǭʼ N_RǬʼ "pikkuraha" ; @@ -5838,7 +5838,7 @@ pȭranddek+N:pȭrand#dek N_KIM "käytävämatto" ; pȭranddēļ+N:pȭrand#dēļ N_GĒRMAŅ "lattialauta" ; pȭrandlak+N:pȭrand#lak N_TUP "lattialakka" ; pȭrandlagtõb+N:pȭrand#laʼgtõb N_ȬʼDÕG "matto" ; -pȭrandlēba+N:pȭrand#leib N_LĒBA "" ; +pȭrandlēba+N:pȭrand#lēiba N_LĒBA "" ; pȭrandvait+N:pȭrand#vaʼit N_NĪʼEM "lattianrako" ; pȭrna+N:pȭrna N_ĀITA "perna" ; pȭzõ+N:pȭzõ N_SIELDÕ "pensas" ; @@ -5898,7 +5898,7 @@ razā+N:raʼzzā N_IZĀ "rasva" ; razādīḑ+N:razā#dīʼḑ N_BLĒʼḐ "talitiainen" ; razākudām+N:razā#kudām N_SIDĀM "rasvakudos" ; razākīņḑõl+N:razā#kīņḑõl N_APPÕN "talikynttilä" ; -razālēba+N:razā#leib N_LĒBA "rasvaleipä" ; +razālēba+N:razā#lēiba N_LĒBA "rasvaleipä" ; razāmag+N:razā#maʼg N_SUʼG "läskimaha" ; razārougõz+N:razā#roʼugõ N_ÄʼGGÕZ "talirauhanen" ; raņg+N:raņg N_KAND "juna" ; @@ -5963,8 +5963,8 @@ ridā+N:riʼddā N_PADĀ "roina" ; riek+N:riek N_TUP "tie" ; riekaigā+N:riek#aʼig N_AIGĀ "tienreuna" ; riekkēji+N:riek#kēʼji N_LĒʼJI "tien kulkija" ; -rieklēba+N:riek#leib N_LĒBA "eväs" ; -riekmerk+N:riek#merk N_RǬʼ "liikennemerkki" ; +rieklēba+N:riek#lēiba N_LĒBA "eväs" ; +riekmerk+N:riek#merk N_SERK "liikennemerkki" ; riekmīez+N:riek#mīʼez N_MĪEZ "vaeltaja" ; rieknägtiji+N:riek#näʼgtiji N_LĒʼJI "tiennäyttäjä" ; riekrō+N:riek#rǭʼ N_RǬʼ "matkaraha" ; @@ -6016,7 +6016,7 @@ rištīngsīezõr+N:rištīng#sīezõr N_KĪNDÕR "ihmiskirppu" ; rištīngtīe+N:rištīng#tīʼe N_TĪE "ihmistyö" ; rištīngtīp+N:rištīng#tīp N_IRM "henkilötyyppi" ; rištīngārmastimi+N:rištīng#ārmastimi N_AʼBLI "ihmisrakkaus" ; -riggilēba+N:riʼggi#leib N_LĒBA "ruisleipä" ; +riggilēba+N:riʼggi#lēiba N_LĒBA "ruisleipä" ; riggõdsandrok+N:riʼggõd#sand#rok N_TUP "ruispuuro" ; riggõkrīk+N:riʼggõ#krīk N_IRM "ruisrääkkä" ; riggõkōpkõz+N:riʼggõ#kǭpkõ N_VȬRÕZ "ruishiutale" ; @@ -6052,7 +6052,7 @@ rovkuodāndõm+N:roʼv#kuodāndõm N_KǬRAND "kansantalous" ; rovloul+N:roʼv#loul N_LOUL "kansanlaulu" ; rovlūol+N:roʼv#lūol N_IRM "kansanruno" ; rovmeldiņ+N:roʼv#meldiņ N_ĀNKAŖ "kansansävelmä" ; -rovpivād+N:roʼv#piʼvā N_TUBĀ-PL "kansanjuhla" ; +rovpivād+N:roʼv#piʼv N_TUBĀ-PL "kansanjuhla" ; rovrõkūd+N:roʼv#rõk N_TUP-PL "huhu" ; rovskūol+N:roʼv#skūol N_IRM "kansakoulu" ; rovsumār+N:roʼv#sumār N_TIDĀR "kansansirpale" ; @@ -6304,7 +6304,7 @@ sapspū+N:saps#pū N_PŪ "peräsinvarsi" ; sasprānga+N:sasprānga N_ĀITA "rinnustin" ; sastā+N:sastā N_MAKSĀ "pihka" ; saņț+N:sāņț N_NIŖȚ "rampa" ; -saņțlēba+N:saņț#leib N_LĒBA "köyhäinapu" ; +saņțlēba+N:saņț#lēiba N_LĒBA "köyhäinapu" ; saņțpalā+N:saņț#paʼl N_KALĀ "almu" ; saņțsovā+N:saņț#soʼvvā N_PADĀ "kainalosauva" ; saņțštok+N:saņț#štok N_TUP "kerjuusauva" ; @@ -6668,7 +6668,7 @@ supīn+N:supīn N_KULTŪR "supiini" ; suņḑ+N:sūņḑ N_NIŖȚ "rangaistus" ; suņḑiji+N:suņḑiji N_AKKIJI "rankaisija" ; suņḑimi+N:suņḑimi N_AʼBLI "rankaisu" ; -sušpivād+N:suš#piʼvā N_TUBĀ-PL "helluntai" ; +sušpivād+N:suš#piʼv N_TUBĀ-PL "helluntai" ; sušā+N:suššā N_SUŠĀ "pikkusisko" ; suțk+N:suțk N_KRUȚK "nuori sika" ; sudmaļ+N:suʼdmaļ N_ǬʼBIĻ "mylly" ; @@ -6692,7 +6692,7 @@ sugorgānõdteb+N:suʼg#orgānõd#teʼbb N_KIʼV "sukupuolitauti" ; sugpū+N:suʼg#pū N_PŪ "sukupuu" ; sugrovz+N:suʼg#roʼv N_ROʼVZ "sukukansa" ; sugveļ+N:suʼg#veʼļļ N_PIʼŅ "heimoveli" ; -suižpivād+N:suʼiž#piʼvā N_TUBĀ-PL "helluntai" ; +suižpivād+N:suʼiž#piʼv N_TUBĀ-PL "helluntai" ; sulli+N:suʼl N_PUʼNNI "renki" ; sullimi+N:suʼllimi N_LĒʼMI "sulautuminen" ; suž+N:suʼd N_SUʼŽ "susi" ; @@ -6740,7 +6740,7 @@ sõv+N:sõʼv N_SOʼV "kesä" ; sõvlimi+N:sõʼvlimi N_LĒʼMI "syyhyäminen" ; sõvlõm+N:sõʼvlõm N_ȬʼDÕG "kutina" ; sõvnikā+N:sõʼvnikkā N_KÄPĀ "kesäasukas" ; -sõvpivād+N:sõʼv#piʼvā N_TUBĀ-PL "helluntai" ; +sõvpivād+N:sõʼv#piʼv N_TUBĀ-PL "helluntai" ; sõvsidām+N:sõʼv#sidām N_SIDĀM "keskikesä" ; sõvskūol+N:sõʼv#skūol N_IRM "kesäkoulu" ; sõvteātõr+N:sõʼv#teātõr N_KĪNDÕR "kesäteatteri" ; @@ -6870,7 +6870,7 @@ sūol+N:sūol N_IRM "suola" ; sūolappõn+N:sūol#appõn N_APPÕN "suolahappo" ; sūoldteb+N:sūold#teʼbb N_KIʼV "suolistosairaus" ; sūolit+N:sūolit N_ĀIGAST "suolaisuus" ; -sūollēba+N:sūol#leib N_LĒBA "tupaantuliaiset" ; +sūollēba+N:sūol#lēiba N_LĒBA "tupaantuliaiset" ; sūolsiegā+N:sūol#sieʼggā N_PADĀ "suolaliuos" ; sūolvan+N:sūol#van N_KIM "suolakylpy" ; sūolvež+N:sūol#vieʼd N_VEʼŽ "suolaliemi" ; @@ -7062,7 +7062,7 @@ taļ+N:taļ N_PAŅ "navetta" ; taļmēstar+N:taļ#mēstar N_PĒGAL "tallimestari" ; taļpēļi+N:taļ#pēļi N_TŪĻI "" ; taļväg+N:taļ#väʼg N_NIʼM "lanta" ; -taļšpivād+N:taļš#piʼvā N_TUBĀ-PL "joulu" ; +taļšpivād+N:taļš#piʼv N_TUBĀ-PL "joulu" ; taļšpivādkīņḑõl+N:taļš#pivād#kīņḑõl N_APPÕN "joulukynttilä" ; taļšpivādvanā+N:taļš#pivād#vaʼn N_KALĀ "joulupukki" ; taņgõd+N:taņg N_FAKT-PL "pihdit" ; @@ -7130,7 +7130,7 @@ tierrit+N:tierrit N_ĀIGAST "kokonaisuus" ; tierā+N:tieʼrrā N_PADĀ "jyvä" ; tierā+N:tieʼrrā N_PADĀ "terä" ; tierābit+N:tierābit N_AMĀT "reippaus" ; -tierālēba+N:tierā#leib N_LĒBA "jyväleipä" ; +tierālēba+N:tierā#lēiba N_LĒBA "jyväleipä" ; tierāvīļa+N:tierā#vīļļa N_KĒRA "viljakasvi" ; tierōda+N:tie#rōuda N_RŌDA "teräs" ; tierōdadrōț+N:tie#rōda#drǭț N_GĒRMAŅ "teräslanka" ; @@ -7503,7 +7503,7 @@ tīemizshēm+N:tīemiz#shēm N_IRM "toimintakaava" ; tīemizsõnā+N:tīemiz#sõʼn N_KALĀ "teonsana" ; tīemīez+N:tīe#mīʼez N_MĪEZ "hiiva" ; tīemīez+N:tīe#mīʼez N_MĪEZ "työmies" ; -tīemīetiegāndõks+N:tīemīʼe#tiegāndõks N_LǬJA "hiivataikina" ; +tīemīetiegāndõks+N:tīemīʼe#tiegāndõks N_KĒRATÕKS "hiivataikina" ; tīepǟva+N:tīe#pǟuva N_PǞVA "työpäivä" ; tīerairg+N:tīera#irg N_KAND "terveys" ; tīeralug+N:tīera#luʼg N_SUʼG "kokonaisluku" ; @@ -7704,7 +7704,7 @@ umārdzapt+N:umārd#zapt N_MAKS "omenahillo" ; umārtarā+N:umār#taʼrrā N_PADĀ "omenapuutarha" ; umārz+N:umār N_UMĀRZ "omena" ; umārzappõn+N:umārz#appõn N_APPÕN "omenahappo" ; -umārzlēba+N:umārz#leib N_LĒBA "omenaleivos" ; +umārzlēba+N:umārz#lēiba N_LĒBA "omenaleivos" ; umārzpīrag+N:umārz#pīrag N_KǬRAND "omenapiirakka" ; umārzpū+N:umārz#pū N_PŪ "omenapuu" ; umārztarā+N:umārz#taʼrrā N_PADĀ "omenapuutarha" ; @@ -7947,7 +7947,7 @@ vejmi+N:veʼjmi N_SĒMI "kalanpyynti" ; vejmizāiga+N:veʼjmiz#āig N_ĀIGA "kalastuskausi" ; velbūom+N:veʼl#būom N_IRM "" ; ver+N:vīeʼr N_MEʼR "veri" ; -verlēba+N:veʼr#leib N_LĒBA "veripalttu" ; +verlēba+N:veʼr#lēiba N_LĒBA "veripalttu" ; veržimi+N:veʼržimi N_LĒʼMI "tärinä" ; veržtõks+N:veʼržtõks N_ÄʼBȚÕKS "väristys" ; veļ+N:veʼļļ N_PIʼŅ "veli" ; @@ -8119,7 +8119,7 @@ vāina+N:vāina N_ĀINA "lemu" ; vālda+N:vālda N_ĀITA "valta" ; vāldaalāb+N:vālda#alāb N_SIDĀM "valkosalava" ; vāldaaļtõmsȭira+N:vālda#aļtõm#sȭira N_ĀITA "valkohomejuusto" ; -vāldalēba+N:vālda#leib N_LĒBA "vehnäleipä" ; +vāldalēba+N:vālda#lēiba N_LĒBA "vehnäleipä" ; vāldamīez+N:vālda#mīʼez N_MĪEZ "mahtimies" ; vāldanodāl+N:vālda#nodāl N_TIDĀR "aitokissanminttu" ; vāldanodāl+N:vālda#nodāl N_TIDĀR "valkopeippi" ; @@ -8280,11 +8280,11 @@ vōdõz+N:vǭʼdõ N_PŪʼDÕZ "lumipyry" ; vōkīņḑõl+N:vǭʼ#kīņḑõl N_APPÕN "vahakynttilä" ; vōrgimi+N:vǭʼrgimi N_AʼBLI "sammuminen" ; vȭidag+N:vȭidag N_VȬIDAG "voi" ; -vȭidagslēba+N:vȭidags#leib N_LĒBA "voileipä" ; +vȭidagslēba+N:vȭidags#lēiba N_LĒBA "voileipä" ; vȭidagspäkā+N:vȭidags#päkkā N_KÄPĀ "voitatti" ; vȭidagsēņ+N:vȭidag#sīen N_SĒŅ "voitatti" ; vȭidagsōja+N:vȭidag#sǭija N_LǬJA "voipulla" ; -vȭidagtiegāndõks+N:vȭidag#tiegāndõks N_LǬJA "voitaikina" ; +vȭidagtiegāndõks+N:vȭidag#tiegāndõks N_KĒRATÕKS "voitaikina" ; vȭidagveis+N:vȭidag#vēis N_VEIS "voiveitsi" ; vȭlastõks+N:vȭlastõks N_KĒRATÕKS "aave" ; vȭlga+N:vȭlga N_ĀITA "velka" ; diff --git a/src/fst/morphology/stems/nouns.xml b/src/fst/morphology/stems/nouns.xml index 80587e27..757a692d 100644 --- a/src/fst/morphology/stems/nouns.xml +++ b/src/fst/morphology/stems/nouns.xml @@ -6270,7 +6270,7 @@ appõndlēba - appõnd#leib + appõnd#lēiba appõnd|lēba @@ -6295,7 +6295,7 @@ appõnlēba - appõn#leib + appõn#lēiba appõn|lēba @@ -7171,7 +7171,7 @@ armlēba - arm#leib + arm#lēiba arm|lēba @@ -13043,7 +13043,7 @@ biltlēba - bilt#leib + bilt#lēiba bilt|lēba @@ -15901,7 +15901,7 @@ brīvlēba - brīv#leib + brīv#lēiba brīv|lēba @@ -22154,7 +22154,7 @@ druppõnlēba - druppõn#leib + druppõn#lēiba druppõn|lēba @@ -39682,7 +39682,7 @@ jalgrujād - jalg#ruʼjā + jalg#ruʼj jalg|rujād @@ -43610,7 +43610,7 @@ jumāllēba - jumāl#leib + jumāl#lēiba jumāl|lēba @@ -43981,7 +43981,7 @@ jõugõiegāndõks - jõugõ#tiegāndõks + jõugõ#tiegāndõks @@ -54828,7 +54828,7 @@ kilālēba - kilā#leib + kilā#lēiba kilā|lēba @@ -57016,7 +57016,7 @@ klijād - kliʼjā + kliʼj klijād @@ -70097,7 +70097,7 @@ kēja - keija + kēija kēja @@ -81966,7 +81966,7 @@ liepā - liep + lieppā liepā @@ -84085,7 +84085,7 @@ loulpivād - loul#piʼvā + loul#piʼv loul|pivād @@ -86186,7 +86186,7 @@ lēba - leib + lēiba lēba 1 @@ -86210,7 +86210,7 @@ lēba - leib + lēiba lēba 2 @@ -90461,7 +90461,7 @@ lȭga - lȭga + lȭuga lȭga @@ -91169,7 +91169,7 @@ maipivād - mai#piʼvā + mai#piʼv mai|pivād @@ -97825,7 +97825,7 @@ mustālēba - mustā#leib + mustā#lēiba mustā|lēba @@ -120732,7 +120732,7 @@ pivād - piʼvā + piʼv pivād @@ -123276,7 +123276,7 @@ plōțlēba - plǭț#leib + plǭț#lēiba plǭț|lēba @@ -128230,7 +128230,7 @@ pīenlēba - pīen#leib + pīen#lēiba pīen|lēba @@ -135516,7 +135516,7 @@ pȭrandlēba - pȭrand#leib + pȭrand#lēiba pȭrand|lēba @@ -136955,7 +136955,7 @@ razālēba - razā#leib + razā#lēiba razā|lēba @@ -138444,7 +138444,7 @@ rieklēba - riek#leib + riek#lēiba riek|lēba @@ -138466,7 +138466,7 @@ riekmerk - riek#merk + riek#merk @@ -139716,7 +139716,7 @@ riggilēba - riʼggi#leib + riʼggi#lēiba riʼggi|lēba @@ -140528,7 +140528,7 @@ rovpivād - roʼv#piʼvā + roʼv#piʼv roʼv|pivād @@ -146471,7 +146471,7 @@ saņțlēba - saņț#leib + saņț#lēiba saņț|lēba @@ -155078,7 +155078,7 @@ sušpivād - suš#piʼvā + suš#piʼv suš|pivād @@ -155678,7 +155678,7 @@ suižpivād - suʼiž#piʼvā + suʼiž#piʼv suʼiž|pivād @@ -156835,7 +156835,7 @@ sõvpivād - sõʼv#piʼvā + sõʼv#piʼv sõʼv|pivād @@ -159877,7 +159877,7 @@ sūollēba - sūol#leib + sūol#lēiba sūol|lēba @@ -164317,7 +164317,7 @@ taļšpivād - taļš#piʼvā + taļš#piʼv taļš|pivād @@ -165960,7 +165960,7 @@ tierālēba - tierā#leib + tierā#lēiba tierā|lēba @@ -174595,7 +174595,7 @@ tīemīetiegāndõks - tīemīʼe#tiegāndõks + tīemīʼe#tiegāndõks @@ -179364,7 +179364,7 @@ umārzlēba - umārz#leib + umārz#lēiba @@ -185163,7 +185163,7 @@ verlēba - veʼr#leib + veʼr#lēiba veʼr|lēba @@ -189270,7 +189270,7 @@ vāldalēba - vālda#leib + vālda#lēiba vālda|lēba @@ -193077,7 +193077,7 @@ vȭidagslēba - vȭidags#leib + vȭidags#lēiba vȭidags|lēba @@ -193172,7 +193172,7 @@ vȭidagtiegāndõks - vȭidag#tiegāndõks + vȭidag#tiegāndõks diff --git a/src/fst/morphology/stems/nouns_newwords.lexc b/src/fst/morphology/stems/nouns_newwords.lexc index a33293f2..88ef39c8 100644 --- a/src/fst/morphology/stems/nouns_newwords.lexc +++ b/src/fst/morphology/stems/nouns_newwords.lexc @@ -11,6 +11,51 @@ test:test N_ "" ; !guessing? !< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž|a|ā|ä|ǟ|ü|ǖ|e|ē|i|ī|o|ō|ȯ|ȱ|ǫ|ǭ|ȭ|õ|B|C|Č|D|Ḑ|F|G|Ģ|H|J|K|Ķ|L|Ļ|M|N|Ņ|P|Q|R|Ŗ|S|Š|T|Ț|V|W|X|Z|Ž|A|Ā|Ä|Ǟ|Ü|Ǖ|E|Ē|I|Ī|O|Ō|Ȯ|Ȱ|Ǫ|Ǭ|Ȭ|Õ] [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž|a|ā|ä|ǟ|ü|ǖ|e|ē|i|ī|o|ō|ȯ|ȱ|ǫ|ǭ|ȭ|õ] ???> +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [ō:"ǭ"|ī|ē|ō|ū|ū o] "+N":0 "+N_12_puu":0 > N_PŪ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [ō:"ǭ"] ʼ "+N":0 "+N_13_rooq":0 > N_RǬʼ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [ǟ] "+N":0 "+N_14_paeae":0 > N_PǞ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [ī ʼ e] "+N":0 "+N_15_tiiqe":0 > N_TĪʼE ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [ī|e i| u o i|a i |ȯ i] "+N":0 "+N_16_brii":0 > N_BRĪ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [e i] "+N":0 "+N_17_tei":0 > N_TEI ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [a|i|o|õ|u] 0:"ʼ" [l|n|r] ā:"0" "+N":0 "+N_18_kalaa":0 > N_KALĀ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [a|i|o|õ|u] 0:"ʼ" [l|n|r] ē:"0" "+N":0 "+N_18a_iree":0 > N_IRĒ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [a|e|i|o|õ|u] 0:"ʼ" [b|g|j|m|v] ā:"0" "+N":0 "+N_19_tubaa":0 > N_TUBĀ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* a 0:"ʼ" m ā:"0" "+N":0 "+N_19a_amaa":0 > N_AMĀ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [a|e|i|o|õ|u] 0:"ʼ" i [b|g|j|m|v] ā:"0" "+N":0 "+N_20_aigaa":0 > N_AIGĀ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* ē 0:"i" [b|g|j|m|v] a "+N":0 "+N_21_leeba":0 > N_LĒBA ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* ǭ 0:"i" [b|g|j|m|v] a "+N":0 "+N_23_looja":0 > N_LǬJA ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [ǟ|ȭ] 0:"u" [b|g|j|m|v] a "+N":0 "+N_24_paeaeva":0 > N_PǞVA ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [a|i|o|ȯ|õ] 0:"ʼ" z 0:"z" ā "+N":0 "+N_25_izaa":0 > N_IZĀ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* i e 0:"ʼ" z 0:"z" ā "+N":0 "+N_25a_piezaa":0 > N_PIEZĀ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [a|e|ȯ|u] 0:"ʼ" ž 0:"ž" ā "+N":0 "+N_26_azhaa":0 > N_AŽĀ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [ā|ī] [ļ d|ņ d|r] ž a "+N":0 "+N_27_aaldzha":0 > N_ĀĻDŽA ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [u] k 0:"k" ā "+N":0 "+N_28_sukaa":0 > N_SUKĀ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [i e] [p 0:"p"|t 0:"t"|k 0:"k"] ā "+N":0 "+N_29_liepaa":0 > N_LIEPĀ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [a|i|o|õ] [p|t|k] s ā "+N":0 "+N_30_oksaa":0 > N_OKŠĀ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [ȱ] n t s ā "+N":0 "+N_31_voontsa":0 > N_VȰNTSA ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* i e s t ā "+N":0 "+N_32_liestaa":0 > N_LIESTAA ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [[ȭ|ū] [i|n|r]|ā [i|r]] g a:"0" "+N":0 "+N_33_aaiga":0 > N_AAIGA ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [ā] n g a:"0" "+N":0 "+N_33a_laanga":0 > N_LĀNGA ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž|a|ā|ä|ǟ|ü|ǖ|e|ē|i|ī|o|ō|ȯ|ȱ|ǫ|ǭ|ȭ|õ]* [ā|ī] l [g|m] a "+N":0 "+N_34_siilma":0 > N_SĪLMA ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž|a|ā|ä|ǟ|ü|ǖ|e|ē|i|ī|o|ō|ȯ|ȱ|ǫ|ǭ|ȭ|õ]* ǟ [l|n|r] g a "+N":0 "+N_35_kaeaenga":0 > N_KǞNGA ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž|a|ā|ä|ǟ|ü|ǖ|e|ē|i|ī|o|ō|ȯ|ȱ|ǫ|ǭ|ȭ|õ]* ā i n a "+N":0 "+N_36_aaina":0 > N_ĀINA ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž|a|ā|ä|ǟ|ü|ǖ|e|ē|i|ī|o|ō|ȯ|ȱ|ǫ|ǭ|ȭ|õ]* ē 0:"i" n a "+N":0 "+N_37_veena":0 > N_VĒNA ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž|a|ā|ä|ǟ|ü|ǖ|e|ē|i|ī|o|ō|ȯ|ȱ|ǫ|ǭ|ȭ|õ]* [ō|ȭ] 0:"u" [d|k] a "+N":0 "+N_38_rooda":0 > N_RŌDA ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž|a|ā|ä|ǟ|ü|ǖ|e|ē|i|ī|o|ō|ȯ|ȱ|ǫ|ǭ|ȭ|õ]* [a|e|i|i e|o|õ|u|u o|ä] 0:"ʼ" [b 0:"b"|d 0:"d"|g 0:"g"|j 0:"j"|l 0:"l"|m 0:"m"|n 0:"n"|ņ 0:"ņ"|r 0:"r"|ŗ 0:"ŗ"|v 0:"v"|z 0:"z"] ā "+N":0 "+N_39_padaa":0 > N_PADĀ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž|a|ā|ä|ǟ|ü|ǖ|e|ē|i|ī|o|ō|ȯ|ȱ|ǫ|ǭ|ȭ|õ]* [a|õ] 0:"ʼ" [b r|g m|z v] ā "+N":0 "+N_40_sobraa":0 > N_SÕBRĀ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž|a|ā|ä|ǟ|ü|ǖ|e|ē|i|ī|o|ō|ȯ|ȱ|ǫ|ǭ|ȭ|õ]* [a|ä|e|i|o|u|i e] [p 0:"p"|t 0:"t"| ț 0:"ț"| k 0:"k"|s 0:"s"|š 0:"š"] ā "+N":0 "+N_41_kaepaa":0 > N_KÄPĀ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž|a|ā|ä|ǟ|ü|ǖ|e|ē|i|ī|o|ō|ȯ|ȱ|ǫ|ǭ|ȭ|õ]* [a|e|i|o|õ|u|i e] [k l|k s|k t|p l|p ļ|p s n|p s t|p š|s k|s t|t k|t s|t š k|ț k|ț ļ] ā "+N":0 "+N_42_maksaa":0 > N_MAKSĀ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž|a|ā|ä|ǟ|ü|ǖ|e|ē|i|ī|o|ō|ȯ|ȱ|ǫ|ǭ|ȭ|õ]* [ē|ī|ū o|ī e|ǟ|ū] [l 0:"l"|ļ 0:"ļ"|m 0:"m"|n 0:"n"|ņ 0:"ņ"|r 0:"r"|ŗ 0:"ŗ"] a "+N":0 "+N_43_keera":0 > N_KĒRA ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž|a|ā|ä|ǟ|ü|ǖ|e|ē|i|ī|o|ō|ȯ|ȱ|ǫ|ǭ|ȭ|õ]* [ǭ|ī] [l 0:"l"|ļ 0:"ļ"|m 0:"m"|n 0:"n"|ņ 0:"ņ"|r 0:"r"|ŗ 0:"ŗ"] a "+N":0 "+N_44_joora":0 > N_JǬRA ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž|a|ā|ä|ǟ|ü|ǖ|e|ē|i|ī|o|ō|ȯ|ȱ|ǫ|ǭ|ȭ|õ]* [ā|ǟ|ī|ȱ|ȭ|ū|ō|ǭ|ū o] [i b|i g|i g m|i k|i m|i p|i r|i t|l b|l d|l m|l p|l t s|l z|ļ m|m p|n d|n g|n k|n d l|n t|ņ ḑ|ņ k|ņ ț|r b|r k|r d|r l|r n|r s|ŗ g|ŗ k|r p|r f|r z|i s k|r s k|s k|d] a "+N":0 "+N_46_aaita":0 > N_ĀITA ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž|a|ā|ä|ǟ|ü|ǖ|e|ē|i|ī|o|ō|ȯ|ȱ|ǫ|ǭ|ȭ|õ]* [ā|ū] 0:"i" š:"s" k a "+N":0 "+N_47_uushka":0 > N_ŪŠKA ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž|a|ā|ä|ǟ|ü|ǖ|e|ē|i|ī|o|ō|ȯ|ȱ|ǫ|ǭ|ȭ|õ]* [ō|ȭ] 0:"u" k a "+N":0 "+N_48_mooka":0 > N_MȬKA ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž|a|ā|ä|ǟ|ü|ǖ|e|ē|i|ī|o|ō|ȯ|ȱ|ǫ|ǭ|ȭ|õ]* [a|i|o] 0:"ʼ" d ž ā "+N":0 "+N_49_dadzhaa":0 > N_DADŽĀ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž|a|ā|ä|ǟ|ü|ǖ|e|ē|i|ī|o|ō|ȯ|ȱ|ǫ|ǭ|ȭ|õ]* [u] š 0:"š" ā "+N":0 "+N_50_sushaa":0 > N_SUŠĀ ; +< [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž|a|ā|ä|ǟ|ü|ǖ|e|ē|i|ī|o|ō|ȯ|ȱ|ǫ|ǭ|ȭ|õ]* [u] p š ā "+N":0 "+N_51_kupshaa":0 > N_KUPŠĀ ; + + + < [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]* [ä|i|ī|o|u] [l|ļ|m|n] "+N":0 "+N_99_ul":0 > N_UL ; < [b|c|č|d|ḑ|f|g|ģ|h|j|k|ķ|l|ļ|m|n|ņ|p|q|r|ŗ|s|š|t|ț|v|w|x|z|ž]^{0,3} ä:"ǭ" [m|p] "+N":0 "+N_101_täm":0 > N_TÄM ; diff --git a/src/fst/morphology/stems/propernouns.lexc b/src/fst/morphology/stems/propernouns.lexc index 4156c772..18c2e49b 100644 --- a/src/fst/morphology/stems/propernouns.lexc +++ b/src/fst/morphology/stems/propernouns.lexc @@ -2,7 +2,7 @@ LEXICON propernouns Abrig+N+Prop:Aʼbrig PROP_ȬʼDÕG "Abruka" ; -Aḑā+N+Prop:Aḑā PROP_PADĀ "Aģe-joki" ; +Aḑā+N+Prop:Aʼḑḑā PROP_PADĀ "Aģe-joki" ; Āfrik+N+Prop:Āfrik PROP_AMĀT "Afrikka" ; Amērik+N+Prop:Amērik PROP_AMĀT "Amerikka" ; Aņtš+N+Prop:Aņtš PROP_JAĻKŠ "Ance" ; @@ -18,9 +18,9 @@ Bosnij+N+Prop:Bosnij PROP_KǬJ "Bosnia" ; Brissõl+N+Prop:Brissõl PROP_APPÕN "Bryssel" ; Bulgārij+N+Prop:Bulgārij PROP_KǬJ "Bulgaria" ; Dēņmō+N+Prop:Dēņ#mǭ PROP_PŪ-SG "Tanska" ; -Dēvit% jōrad+N+Prop:Dēvit% jǭra PROP_JǬRA-PL "Dieviņi-järvet" ; -Dīeviņjōra+N+Prop:Dīʼeviņ#jǭra PROP_JǬRA "Dieviņi-järvet" ; -Dēvit% jōrad+N+Prop:Dēvit% jǭra PROP_JǬRA-PL "Dieviņi-järvet" ; +Dēvit% jōrad+N+Prop:Dēvit% jǭrra PROP_JǬRA-PL "Dieviņi-järvet" ; +Dīeviņjōra+N+Prop:Dīʼeviņ#jǭrra PROP_JǬRA "Dieviņi-järvet" ; +Dēvit% jōrad+N+Prop:Dēvit% jǭrra PROP_JǬRA-PL "Dieviņi-järvet" ; Dūmõl+N+Prop:Dūmõl PROP_APPÕN "Dūmele" ; Dūobõl+N+Prop:Dūobõl PROP_APPÕN "Dobele" ; Dūoņig+N+Prop:Dūoņig PROP_KǬRAND "Dundaga" ; @@ -36,14 +36,14 @@ Hapsal+N+Prop:Hapsal PROP_PĒGAL "Haapsalu" ; Helsinki+N+Prop:Helsinki PROP_TORĪ "Helsinki" ; Holand+N+Prop:Holand PROP_VȮŅ "Hollanti" ; Horvātij+N+Prop:Horvātij PROP_KǬJ "Kroatia" ; -Ikškilā+N+Prop:Ikš#kilā PROP_PADĀ "Ikšķile" ; +Ikškilā+N+Prop:Ikš#kiʼllā PROP_PADĀ "Ikšķile" ; Indij+N+Prop:Indij PROP_KǬJ "Intia" ; Indij% okeān+N+Prop:Indij% okeān PROP_KǬJ "Intian valtameri" ; -Īra+N+Prop:Īra PROP_JǬRA "Lielirbe" ; +Īra+N+Prop:Īrra PROP_JǬRA "Lielirbe" ; Irāj+N+Prop:Irāj PROP_SALĀJ-SG "Mazirbe" ; Īraj% joug+N+Prop:Īraj% joʼug PROP_JOʼUG "Mazirbe-joki" ; Īra% joug+N+Prop:Īra% joʼug PROP_JOʼUG "Irbe-joki" ; -Irē+N+Prop:Irē PROP_KALĀ-SG "Mazirbe" ; +Irē+N+Prop:Iʼr PROP_IRĒ-SG "Mazirbe" ; Irē% joug+N+Prop:Irē% joʼug PROP_JOʼUG "Mazirbe-joki" ; Īrõmō+N+Prop:Īrõ#mǭ PROP_PŪ-SG "Irlanti" ; Island+N+Prop:Island PROP_VȮŅ "Islanti" ; @@ -52,22 +52,22 @@ Izrael+N+Prop:Iʼzrael PROP_VAʼIT "Israel" ; Jālgab+N+Prop:Jālgab PROP_ĒTAM "Jelgava" ; Japān+N+Prop:Japān PROP_TIDĀR "Japani" ; Jeimer+N+Prop:Jei#meʼr PROP_MEʼR "Pohjoinen jäämeri" ; -Jougštūrga+N+Prop:Joʼugšt#ūrga PROP_ŪŠKA "Jougstu-puro" ; +Jougštūrga+N+Prop:Joʼugšt#ūrga PROP_ĀITA "Jougstu-puro" ; Kanād+N+Prop:Kanād PROP_VȮŅ "Kanada" ; Kāndab+N+Prop:Kāndab PROP_ĒTAM "Kandava" ; Karnõdmäg+N+Prop:Karnõd#mäʼg PROP_NIʼM "Vārnu-kukkula" ; -Kēņigtarā% ūrga+N+Prop:Kēņigtarā% ūrga PROP_ŪŠKA "Kēniņdārza-puro" ; +Kēņigtarā% ūrga+N+Prop:Kēņigtarā% ūrga PROP_ĀITA "Kēniņdārza-puro" ; Kikkõnjoug+N+Prop:Kikkõn#joʼug PROP_JOʼUG "Ķikānu-joki" ; Kikkõnmäg+N+Prop:Kikkõn#mäʼg PROP_NIʼM "Ķikane-kukkula" ; -Kīlmaūrga+N+Prop:Kīlma#ūrga PROP_ŪŠKA "Kīlmiņu-puro" ; +Kīlmaūrga+N+Prop:Kīlma#ūrga PROP_ĀITA "Kīlmiņu-puro" ; Kīnõ+N+Prop:Kīʼnõ PROP_NǬʼGÕ "Kihnu" ; Kīnõmō+N+Prop:Kīnõ#mǭ PROP_PŪ-SG "Kiina" ; Kõuvšt% nīt+N+Prop:Kõuvšt% nīt PROP_IRM "Kauštu-niitty" ; Krīevmō+N+Prop:Krīʼev#mǭ PROP_PŪ-SG "Venäjä" ; Kuldīg+N+Prop:Kuldīg PROP_SIDĀM "Kuldīga" ; Kūolka+N+Prop:Kūolka PROP_ĀITA "Kolka" ; -Kūolka% kõlā+N+Prop:Kūolka% kõlā PROP_PADĀ "Kolkanlahti" ; -Kūolka% nanā+N+Prop:Kūolka% nanā PROP_KALĀ "Kolkanniemi" ; +Kūolka% kõlā+N+Prop:Kūolka% kõʼllā PROP_PADĀ "Kolkanlahti" ; +Kūolka% nanā+N+Prop:Kūolka% naʼn PROP_KALĀ "Kolkanniemi" ; Kuoštrõg+N+Prop:Kuoštrõg PROP_KǬRAND-SG "Košrags" ; Kurāmō+N+Prop:Kurā#mǭ PROP_PŪ-SG "Kuurinmaa" ; Kurmō+N+Prop:Kuʼr#mǭ PROP_PŪ-SG "Kuurinmaa" ; @@ -81,15 +81,15 @@ London+N+Prop:London PROP_PĒGAL "Lontoo" ; Luksemburg+N+Prop:Luksemburg PROP_VȮŅ "Luxemburg" ; Lūž+N+Prop:Lūʼž PROP_RŪʼTŠ "Lūžņa" ; Lūž% joug+N+Prop:Lūʼž% joʼug PROP_JOʼUG "Lūžņa-joki" ; -Mägkilā+N+Prop:Mäʼg#kilā PROP_PADĀ "Uši" ; +Mägkilā+N+Prop:Mäʼg#kiʼllā PROP_PADĀ "Uši" ; Moldov+N+Prop:Moldov PROP_BIRKOV "Moldova" ; Moskov+N+Prop:Moskov PROP_BIRKOV "Moskova" ; Mustānum+N+Prop:Mustā#num PROP_KIM-SG "Melnsils" ; Nabāld+N+Prop:Nabāl PROP_TIDĀR-PL "Nabaļu-suo" ; -Nabāl% jōra+N+Prop:Nabāl% jǭra PROP_JǬRA "Nābeļa-järvi" ; +Nabāl% jōra+N+Prop:Nabāl% jǭrra PROP_JǬRA "Nābeļa-järvi" ; Nabālūrga+N+Prop:Nabāl#ūrga PROP_ĀITA "Nabeļvalks-puro" ; Norvēgij+N+Prop:Norvēgij PROP_KǬJ "Norja" ; -Nõvkilā+N+Prop:Nõʼv#kilā PROP_PADĀ "Neveja" ; +Nõvkilā+N+Prop:Nõʼv#kiʼllā PROP_PADĀ "Neveja" ; Ōst+N+Prop:Ōst PROP_FAKT-SG "Aizklāņi" ; Ōstūrga+N+Prop:Ōst#ūrga PROP_ĀITA "Aizklāņu-puro" ; Parīz+N+Prop:Parīz PROP_ĀIGAST "Pariisi" ; @@ -99,11 +99,11 @@ Päpmäg% joug+N+Prop:Päp#mäʼg% joʼug PROP_JOʼUG "Pepmegu-joki" ; Pǟrnov+N+Prop:Pǟrnov PROP_BIRKOV "Pärnu" ; Pēmpõd+N+Prop:Pēmpõd PROP_KAND "Pempi-suo" ; Pētõrgrād+N+Prop:Pētõrgrād PROP_IRM "Pietari" ; -Pētõr% jōrad+N+Prop:Pētõr% jǭrad PROP_JǬRA-PL "Pēterezeri-järvet" ; +Pētõr% jōrad+N+Prop:Pētõr% jǭrra PROP_JǬRA-PL "Pēterezeri-järvet" ; Piltõn+N+Prop:Piltõn PROP_APPÕN "Piltene" ; Pitrõg+N+Prop:Pitrõg PROP_KǬRAND-SG "Pitrags" ; Pitrõg% joug+N+Prop:Pitrõg% joʼug PROP_JOʼUG "Pitraga-joki" ; -Pizā+N+Prop:Pizā PROP_PADĀ "Miķeļtornis" ; +Pizā+N+Prop:Piʼzzā PROP_PADĀ "Miķeļtornis" ; Portugal+N+Prop:Portugal PROP_APPÕN "Portugali" ; Pūoip+N+Prop:Pūoip PROP_IRM "Pope" ; Pūojmer+N+Prop:Pūʼoj#meʼr PROP_MEʼR "Pohjanmeri" ; @@ -121,13 +121,13 @@ Rūotšmō+N+Prop:Rūotš#mǭ PROP_PŪ-SG "Ruotsi" ; Sabīl+N+Prop:Sabīl PROP_KULTŪR "Sabile" ; Saksāmō+N+Prop:Saksā#mǭ PROP_PŪ-SG "Saksa" ; Salāts+N+Prop:Salāts PROP_ĀIGAST "Salaca" ; -Sasmagā+N+Prop:Sasmagā PROP_PADĀ "Valdemārpils" ; +Sasmagā+N+Prop:Sasmaʼggā PROP_PADĀ "Valdemārpils" ; Sǟnag+N+Prop:Sǟnag PROP_TŪOITÕG-SG "Saunags" ; Sǟr+N+Prop:Sǟr PROP_SŪR "Sõrve" ; -Säskkilā+N+Prop:Säsk#kilā PROP_PADĀ "Sesku-kylä" ; +Säskkilā+N+Prop:Säsk#kiʼllā PROP_PADĀ "Sesku-kylä" ; Sibīrij+N+Prop:Sibīrij PROP_KǬJ "Siperia" ; Sīkrõg+N+Prop:Sīkrõg PROP_KǬRAND-SG "Sīkrags" ; -Siprikšvigā+N+Prop:Siprikš#vigā PROP_TUBĀ "Siprikšviga-laakso" ; +Siprikšvigā+N+Prop:Siprikš#viʼg PROP_TUBĀ "Siprikšviga-laakso" ; Slovakij+N+Prop:Slovakij PROP_KǬJ "Slovakia" ; Slovēnij+N+Prop:Slovēnij PROP_KǬJ "Slovenia" ; Sōrmō+N+Prop:Sǭr#mǭ PROP_PŪ-SG "Saarenmaa" ; @@ -159,23 +159,23 @@ Vāldakrīevmō+N+Prop:Vālda#krīʼev#mǭ PROP_PŪ-SG "Valko-Venäjä" ; Vanārūotš% joug+N+Prop:Vanā#rūotš% joʼug PROP_JOʼUG "Vecroču-joki" ; Vǟnta+N+Prop:Vǟnta PROP_ĀITA "Ventspils" ; Vǟnta+N+Prop:Vǟnta PROP_ĀITA "Venta-joki" ; -Vēna+N+Prop:Vēna PROP_VĒNA "Daugava" ; +Vēna+N+Prop:Vēina PROP_VĒNA "Daugava" ; Vidūmō+N+Prop:Vidū#mǭ PROP_PŪ-SG "Vidzeme" ; Vīḑõl+N+Prop:Vīḑõl PROP_APPÕN "Vīdale" ; Viļņ+N+Prop:Viļņ PROP_VIĻȚ "Vilna" ; Zemgal+N+Prop:Zemgal PROP_AMĀT "Zemgale" ; -Žūokkilā+N+Prop:Žūok#kilā PROP_PADĀ "Žocene" ; +Žūokkilā+N+Prop:Žūok#kiʼllā PROP_PADĀ "Žocene" ; Kaupo+N+Prop:Kaupo PROP_ "Kaupo" ; Brēmen+N+Prop:Brēmen PROP_PĒGAL "Bremen" ; Pētõr+N+Prop:Pētõr PROP_KĪNDÕR "Pētõr" ; Kōrli+N+Prop:Kōrli PROP_SĒMI "Kōrli" ; -Babā+N+Prop:Babā PROP_PADĀ "Babā" ; +Babā+N+Prop:Baʼbbā PROP_PADĀ "Babā" ; Pritš+N+Prop:Pritš PROP_DUŅTŠ "Pritš" ; Alfrēd+N+Prop:Alfrēd PROP_AMĀT "Alfrēd" ; -Didžā+N+Prop:Didžā PROP_DADŽĀ "Didžā" ; +Didžā+N+Prop:Diʼdžā PROP_DADŽĀ "Didžā" ; Didrõk+N+Prop:Didrõk PROP_TŪOITÕG "Didrõk" ; Katšī+N+Prop:Katšī PROP_TORĪ "Katšī" ; -Lēna+N+Prop:Lēna PROP_VĒNA "Lēna" ; +Lēna+N+Prop:Lēina PROP_VĒNA "Lēna" ; Dantsig+N+Prop:Dantsig PROP_KǬRAND "Danzig" ; Prūš+N+Prop:Prūš PROP_RŪʼTŠ "Preussi" ; Krim+N+Prop:Krim PROP_KIM "Krim" ; @@ -245,12 +245,12 @@ Paulus+N+Prop:Paulus PROP_ĀIGAST "Paavali" ; Koiva+N+Prop:Koiva PROP_KRǬIPA "Gauja-joki" ; Mõtsāpūol+N+Prop:Mõtsā#pūol PROP_PŪOL "Metsepole" ; Idūmō+N+Prop:Idū#mǭ PROP_PŪ "Idumea" ; -Kōla+N+Prop:Kǭla PROP_JǬRA "Salaspils" ; +Kōla+N+Prop:Kǭlla PROP_JǬRA "Salaspils" ; Ōdõz+N+Prop:Ōdõ PROP_PŪʼDÕZ "Ādaži" ; Krievõmō+N+Prop:Krievõ#mǭ PROP_PŪ "Venäjä" ; Krīevõmō+N+Prop:Krīʼevõ#mǭ PROP_PŪ "Venäjä" ; Norvēgmō+N+Prop:Norvēg#mǭ PROP_PŪ "Norja" ; -Tārkilā+N+Prop:Tār#kilā PROP_PADĀ "Tārgale" ; +Tārkilā+N+Prop:Tār#kiʼllā PROP_PADĀ "Tārgale" ; Pivājoug+N+Prop:Pivā#joʼug PROP_JOʼUG "Svētupe" ; Kīev+N+Prop:Kīev PROP_AMĀT "Kiova" ; Bizantij+N+Prop:Bizantij PROP_KǬJ "Bysantin valtakunta" ; diff --git a/src/fst/morphology/stems/propernouns.xml b/src/fst/morphology/stems/propernouns.xml index c1a0a4b0..4c861d66 100644 --- a/src/fst/morphology/stems/propernouns.xml +++ b/src/fst/morphology/stems/propernouns.xml @@ -27,7 +27,7 @@ Aḑā - Aḑā + Aʼḑḑā Prop @@ -429,7 +429,7 @@ Dēvit jōrad - Dēvit jǭra + Dēvit jǭrra Prop @@ -450,7 +450,7 @@ Dīeviņjōra - Dīʼeviņ#jǭra + Dīʼeviņ#jǭrra Prop @@ -471,7 +471,7 @@ Dēvit jōrad - Dēvit jǭra + Dēvit jǭrra Prop @@ -808,7 +808,7 @@ Ikškilā - Ikš#kilā + Ikš#kiʼllā Prop @@ -872,7 +872,7 @@ Īra - Īra + Īrra Prop @@ -961,7 +961,7 @@ Irē - Irē + Iʼr Prop @@ -1152,7 +1152,7 @@ Jougštūrga - Joʼugšt#ūrga + Joʼugšt#ūrga Prop @@ -1238,7 +1238,7 @@ Kēņigtarā ūrga - Kēņigtarā ūrga + Kēņigtarā ūrga Prop @@ -1304,7 +1304,7 @@ Kīlmaūrga - Kīlma#ūrga + Kīlma#ūrga Prop @@ -1454,7 +1454,7 @@ Kūolka kõlā - Kūolka kõlā + Kūolka kõʼllā Prop @@ -1476,7 +1476,7 @@ Kūolka nanā - Kūolka nanā + Kūolka naʼn Prop @@ -1785,7 +1785,7 @@ Mägkilā - Mäʼg#kilā + Mäʼg#kiʼllā Prop @@ -1894,7 +1894,7 @@ Nabāl jōra - Nabāl jǭra + Nabāl jǭrra Prop @@ -1957,7 +1957,7 @@ Nõvkilā - Nõʼv#kilā + Nõʼv#kiʼllā Prop @@ -2172,7 +2172,7 @@ Pētõr jōrad - Pētõr jǭrad + Pētõr jǭrra Prop @@ -2305,7 +2305,7 @@ Pizā - Pizā + Piʼzzā Prop @@ -2690,7 +2690,7 @@ Sasmagā - Sasmagā + Sasmaʼggā Prop @@ -2756,7 +2756,7 @@ Säskkilā - Säsk#kilā + Säsk#kiʼllā Prop @@ -2841,7 +2841,7 @@ Siprikšvigā - Siprikš#vigā + Siprikš#viʼg Prop @@ -3463,7 +3463,7 @@ Ūž$$kilā - Ūž$$kilā + Ūž$$kiʼllā Prop @@ -3613,7 +3613,7 @@ Vēna - Vēna + Vēina Prop @@ -3719,7 +3719,7 @@ Žūokkilā - Žūok#kilā + Žūok#kiʼllā Prop @@ -3757,13 +3757,13 @@ BrēmenBrēmenYYBremenBremenBrēmene PētõrPētõrYYPētõrPētõrPēteris KōrliKōrliYYKōrliKōrliKārlis -BabāBabāYYBabāBabāBabā +BabāBaʼbbāYYBabāBabāBabā PritšPritšYYPritšPritšFricis AlfrēdAlfrēdYYAlfrēdAlfrēdAlfrēds -DidžāDidžāYYDidžāDidžāDidzis +DidžāDiʼdžāYYDidžāDidžāDidzis DidrõkDidrõkYYDidrõkDidrõkDidriķis KatšīKatšīYYKatšīKatšīKačaKatrīna -LēnaLēnaYYLēnaLēnaLēna +LēnaLēinaYYLēnaLēnaLēna DantsigDantsigYYDanzigDanzigDanciga PrūšPrūšYYPreisimaaPreussiPrūsija KrimKrimYYKrimmKrimKrima @@ -3833,12 +3833,12 @@ KoivaKoivaYYKoivaGauja-jokiGauja MõtsāpūolMõtsā#pūolYYMetsapooleMetsepoleMetsepole IdūmōIdū#mǭYYIdumeaIdumeaIdumeja -KōlaKǭlaYYSalaspilsSalaspilsSalaspils +KōlaKǭllaYYSalaspilsSalaspilsSalaspils ŌdõzŌdõYYĀdažiĀdažiĀdaži KrievõmōKrievõ#mǭYYVenemaaVenäjäKrievija KrīevõmōKrīʼevõ#mǭYYVenemaaVenäjäKrievija NorvēgmōNorvēg#mǭYYNorraNorjaNorvēģija -TārkilāTār#kilāYYTārgaleTārgaleTārgale +TārkilāTār#kiʼllāYYTārgaleTārgaleTārgale PivājougPivā#joʼugYYPühajõgiSvētupeSvētupe KīevKīevYYKiievKiovaKijeva BizantijBizantijYYBütsantsBysantin valtakuntaBizantija diff --git a/src/fst/morphology/stems/quantifiers.lexc b/src/fst/morphology/stems/quantifiers.lexc index 742ad639..d2bcb6b3 100644 --- a/src/fst/morphology/stems/quantifiers.lexc +++ b/src/fst/morphology/stems/quantifiers.lexc @@ -50,10 +50,10 @@ kūžtuoistõn+Num:kūž#tuoistõn NUM_APPÕN "kuusitoista" ; miljard+Num:miljard NUM_ĀIGAST "miljardi" ; miljon+Num:miljon NUM_ĀIGAST "miljoona" ; mitskimdõ+Num:mits#kimdõ NUM_SIELDÕ "monta kymmentä" ; -nēļa+Num:nēļa NUM_KĒRA "neljä" ; +nēļa+Num:nēļļa NUM_KĒRA "neljä" ; nēļakimdõ+Num:nēļa#kimdõ NUM_SIELDÕ "neljäkymmentä" ; nēļakimdõz+A:nēļa#kimdõz A_VĪDÕZ "neljäskymmenes" ; -nēļasadā+Num:nēļa#sadā NUM_PADĀ "neljäsataa" ; +nēļasadā+Num:nēļa#saʼddā NUM_PADĀ "neljäsataa" ; nēļasadāz+A:nēļa#sadāz A_VĪDÕZ "neljässadas" ; nēļasaddõ+Num:nēļa#saʼddõ NUM_PADĀ "neljäsataa" ; nēļatuoistõn+Num:nēļa#tuoistõn NUM_APPÕN "neljätoista" ; @@ -66,7 +66,7 @@ pōrkimgõn+Num:pǭr#kimgõn QNT_APPÕN "parisenkymmentä" ; pūol+Num:pūol QNT_PŪOL "puoli" ; pūoltūoizta+Num:pūol#tūoizta NUM_NAI "puolitoista" ; pūoļ+Num:pūoļ NUM_TŪĻ "puoli" ; -sadā+Num:sadā NUM_PADĀ "sata" ; +sadā+Num:saʼddā NUM_PADĀ "sata" ; sadāz+A:sadāz A_VĪDÕZ "sadas" ; seis+Num:seis NUM_FAKT "seitsemän" ; seiskimdõ+Num:seis#kimdõ NUM_SIELDÕ "seitsemänkymmentä" ; @@ -74,7 +74,7 @@ seiskimdõz+A:seis#kimdõz A_VĪDÕZ "seitsemäskymmenes" ; seismi+Det:seismi DET_TŪĻI "seitsemäs" ; seismõz+A:seismõz A_VĪDÕZ "seitsemäs" ; seismõztuoistõnz+A:seismõz#tuoistõnz A_TUOISTÕNZ "seitsemästoista" ; -seissadā+Num:seis#sadā NUM_PADĀ "seitsemänsataa" ; +seissadā+Num:seis#saʼddā NUM_PADĀ "seitsemänsataa" ; seistuoistõn+Num:seis#tuoistõn NUM_APPÕN "seitsemäntoista" ; seistuoistõnz+A:seis#tuoistõnz A_TUOISTÕNZ "seitsemästoista" ; setkimdõ+Num:set#kimdõ NUM_SIELDÕ "monta kymmentä" ; diff --git a/src/fst/morphology/stems/quantifiers.xml b/src/fst/morphology/stems/quantifiers.xml index 73d67d04..a60d8a58 100644 --- a/src/fst/morphology/stems/quantifiers.xml +++ b/src/fst/morphology/stems/quantifiers.xml @@ -240,7 +240,7 @@ īdõkssadā - īʼdõks##sadā + īʼdõks##saʼddā īʼdõks||sadā @@ -601,7 +601,7 @@ kakšsadā - kakš##sadā + kakš##saʼddā kakš||sadā @@ -1041,7 +1041,7 @@ kōdõkssadā - kǭʼdõks##sadā + kǭʼdõks##saʼddā kǭʼdõks||sadā @@ -1573,7 +1573,7 @@ kuolmsadā - kuolm##sadā + kuolm##saʼddā kuolm||sadā @@ -1804,7 +1804,7 @@ kūžsadā - kūž##sadā + kūž##saʼddā kūž||sadā @@ -2002,7 +2002,7 @@ nēļa - nēļa + nēļļa nēļa @@ -2101,7 +2101,7 @@ nēļasadā - nēļa#sadā + nēļa#saʼddā nēļa|sadā @@ -2548,7 +2548,7 @@ sadā - sadā + saʼddā sadā @@ -2820,7 +2820,7 @@ seissadā - seis#sadā + seis#saʼddā seis|sadā @@ -3388,7 +3388,7 @@ vīžsadā - vīž##sadā + vīž##saʼddā vīž||sadā