-
Notifications
You must be signed in to change notification settings - Fork 0
/
node20.html
executable file
·249 lines (217 loc) · 10.4 KB
/
node20.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//FI">
<!--Converted with jLaTeX2HTML 2002 (1.62) JA patch-1.4
patched version by: Kenshi Muto, Debian Project.
LaTeX2HTML 2002 (1.62),
original version by: Nikos Drakos, CBLU, University of Leeds
* revised and updated by: Marcus Hennecke, Ross Moore, Herb Swan
* with significant contributions from:
Jens Lippmann, Marek Rouchal, Martin Wilck and others -->
<HTML>
<HEAD>
<TITLE>4.2 Word - sana</TITLE>
<META NAME="description" CONTENT="4.2 Word - sana">
<META NAME="keywords" CONTENT="annotation_guide">
<META NAME="resource-type" CONTENT="document">
<META NAME="distribution" CONTENT="global">
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=utf-8">
<META NAME="Generator" CONTENT="jLaTeX2HTML v2002 JA patch-1.4">
<META HTTP-EQUIV="Content-Style-Type" CONTENT="text/css">
<LINK REL="STYLESHEET" HREF="annotation_guide.css">
<LINK REL="next" HREF="node21.html">
<LINK REL="previous" HREF="node19.html">
<LINK REL="up" HREF="node18.html">
<LINK REL="next" HREF="node21.html">
</HEAD>
<BODY >
<!--Navigation Panel-->
<A NAME="tex2html1021"
HREF="node21.html">
<IMG WIDTH="37" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="next" SRC="next.png"></A>
<A NAME="tex2html1015"
HREF="node18.html">
<IMG WIDTH="26" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="up" SRC="up.png"></A>
<A NAME="tex2html1009"
HREF="node19.html">
<IMG WIDTH="63" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="previous" SRC="prev.png"></A>
<A NAME="tex2html1017"
HREF="node1.html">
<IMG WIDTH="65" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="contents" SRC="contents.png"></A>
<A NAME="tex2html1019"
HREF="node63.html">
<IMG WIDTH="43" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="index" SRC="index.png"></A>
<BR>
<!--End of Navigation Panel-->
<!--Table of Child-Links-->
<A NAME="CHILD_LINKS"><STRONG>Aliluvut</STRONG></A>
<UL>
<LI><A NAME="tex2html1023"
HREF="node20.html#SECTION03321000000000000000">Määritelmä ja käyttötarkoitus</A>
<LI><A NAME="tex2html1024"
HREF="node20.html#SECTION03322000000000000000">Paikantaminen ja rajaaminen</A>
<UL>
<LI><A NAME="tex2html1025"
HREF="node20.html#SECTION03322100000000000000">4.2.0.1 Geminaatta (kaksoiskonsonantti) sanarajalla</A>
<LI><A NAME="tex2html1026"
HREF="node20.html#SECTION03322200000000000000">4.2.0.2 Pitkä vokaali sanarajalla</A>
<LI><A NAME="tex2html1027"
HREF="node20.html#SECTION03322300000000000000">4.2.0.3 Puhunnoksenloppuiset/-alkuiset saneet</A>
</UL>
<BR>
<LI><A NAME="tex2html1028"
HREF="node20.html#SECTION03323000000000000000">Riippuvuudet muista yksiköistä</A>
<LI><A NAME="tex2html1029"
HREF="node20.html#SECTION03324000000000000000">Kuvauksen valinta</A>
</UL>
<!--End of Table of Child-Links-->
<HR>
<H1><A NAME="SECTION03320000000000000000"></A><A NAME="sub:Word-Sana"></A><A NAME="330"></A><A NAME="331"></A>
<BR>
4.2 Word - sana
</H1>
<P>
<H2><A NAME="SECTION03321000000000000000">
Määritelmä ja käyttötarkoitus</A>
</H2>
<P>
Puheen yksikkö, jolla on itsenäinen merkitys ja joka voi esiintyä
myös yksinään. Sanayksiköllä tarkoitetaan tässä itse asiassa kimppua
yhteen saneeseen liittyviä piirteitä. Saneeseen liittyy ensisijaisesti
sen lähes ortografinen litteraatti (ts. sama asu kuin foneettisen
puhunnoksen kuvauksessa), mutta yksiköstä voidaan annotaatiossa mainita
myös esimerkiksi fonologinen kuvaus, perusmuoto, morfologisia piirteitä,
vastaava sananmuoto kirjoitetussa kielessä jne. Puh-editorissa nämä
piirteet on kuitenkin määriteltävä erikseen.
<P>
<H2><A NAME="SECTION03322000000000000000">
Paikantaminen ja rajaaminen</A>
</H2>
<P>
Sanakerros on suositeltavaa nimikoida vasta foonikerroksen jälkeen
ja mieluiten tavukerroksen annotoinnin yhteydessä. Puh-editorilla
sanakerroksen pohja voidaan generoida myös jo annotoidusta puhunnoskerroksesta,
mikäli tämä on jo olemassa. Tällöin muodostuu ns. kelluvia<A NAME="334"></A>
(<I>floating</I><A NAME="336"></A>, ks. s. <A HREF="node11.html#Kelluva-yksikko">8</A>)
sanayksiköitä, joita ei ole kohdistettu oikeisiin aikaväleihin, vaan
jaettu tasaisesti kyseisen puhunnoksen ajalle.
<P>
Sanakerroksen rajan ei tarvitse välttämättä aina osua yksiin äännetason
rajan kanssa, mutta jokaisen sanarajan tulee osua yksiin jonkin tavurajan
kanssa, mikäli tavutaso on annotoitu.
<P>
<H3><A NAME="SECTION03322100000000000000">
4.2.0.1 Geminaatta (kaksoiskonsonantti) sanarajalla</A>
</H3>
<P>
Jos suomenkielisessä puheessa sanarajalla esiintyy geminaatta (kaksoiskonsonantti),
joka on selvästi seurausta alku- tai loppukahdennuksesta, koko konsonanttisegmentti
merkitään kuuluvaksi vain yhteen sanaan. Jos suomenkielisessä puheessa
sanarajalla esiintyy geminaatta (kaksoiskonsonantti), joka ei välttämättä
johdu em. kahdennuksesta, sanaraja merkitään joko keskelle konsonanttiäännettä
tai mahdollisuuksien mukaan jollakin akustisella kriteerillä perusteltuun
kohtaan konsonanttisegmentin sisällä.
<P>
<H3><A NAME="SECTION03322200000000000000">
4.2.0.2 Pitkä vokaali sanarajalla</A>
</H3>
<P>
Jos suomenkielisessä puheessa sanarajalla esiintyy pitkä vokaaliäänne
siten, että edellinen sana päättyy samaan vokaaliin jolla seuraava
alkaa: Etsi ensin akustisia vihjeitä sanarajasta vokaalisegmentin
keskeltä. Toisinaan sopivan sanarajakohdan voi löytää perustaajuusmuutosten
tai äänenlaatumuutosten perusteella. Rajalla voi olla esim. narinaa,
lievä puristussupistuma tai peräti glottaaliklusiili. Jos rajakohdan
paikkeilla on narinainen "kuoppa", merkitse raja
pisimmän äänihuuliperiodin jälkeen, juuri ennen kuin perustaajuus
alkaa jälleen nousta. Tällainen rajakohta heijastuu usein myös vokaalin
laatuun. Jos sanojen rajalla on glottaaliklusiili, glottaaliklusiilin
sulkeumavaihe kuuluu edelliseen sanaan ja sen jälkeinen "laukeama"
seuraavaan sanaan. Jos glottaaliklusiili on erittäin pitkä ja sanarajalla
tuntuu olevan esim. epäröintiä, älä merkitse glottaaliklusiilin sulkeumaa
kumpaankaan sanaan kuuluvaksi, vaan jätä se kokonaan sanojen ulkopuolelle.
Huom. Glottaaliklusiilin sulkeuma kuuluu kuitenkin puhunnokseen, sillä
se on selvästi puhujan tuottama artikulaatio! Jos mitään akustisia
vihjeitä ei löydy, merkitse sanaraja keskelle vokaalisegmenttiä.
<P>
<H3><A NAME="SECTION03322300000000000000">
4.2.0.3 Puhunnoksenloppuiset/-alkuiset saneet</A>
</H3>
<P>
Jos puhunnos päättyy soinnittomaan vaiheeseen ja viimeisen sanan lopussa
on [h]-mainen äänne, tämä merkitään kuuluvaksi puhunnokseen, muttei
viimeiseen saneeseen. Siihen saakka kun [h]-äänne on selvästi
viimeisen saneen viimeisen vokaalin värinen ("soinniton vokaali"),
se kuuluu myös saneeseen. Tällaisessa tapauksessa äänne segmentoidaan
myös osaksi puhunnoksen viimeistä vokaalisegmenttiä, mutta segmentin
soinniton osa merkitään äänenlaatutasolle soinnittomaksi.
<P>
<H2><A NAME="SECTION03323000000000000000">
Riippuvuudet muista yksiköistä</A>
</H2>
<P>
Puhunnos, fooniyksiköt ja tavut, mikäli ne ovat olemassa.
<P>
<H2><A NAME="SECTION03324000000000000000">
Kuvauksen valinta</A>
</H2>
<P>
Merkitään ainakin saneen lähes ortografinen litteraatti (ts. sama
asu kuin foneettisen puhunnoksen kuvauksessa); mahdollisesti myös
muita piirteitä. Sanarajat ylittäviä suomen ortografiassa näkymättömiä
assimilaatioita (esim. <I>poja</I><I><U>m</U></I> <I>pallo</I>)
ei tarvitse merkitä, sillä ne voidaan todeta äännekerroksen annotaatiosta
ja/tai tuottaa sääntöpohjaisesti. Keskeneräiseksi jääneen sanan loppuun
merkitään tavuviiva <I>-</I>.
<P>
Jollet käytä annotaatiossa Puh-editoria, merkitse kaikki sanayksikköön
liittyvät piirteet omiin kerroksiinsa. Esimerkiksi Praat-ohjelmalla
rajataan saneet yhteen IntervalTier-tyyppiseen kerrokseen ja kirjoitetaan
näiden nimikkeiksi saneen litteraatti. Sen jälkeen luodaan PointTier-tyyppinen
kerros esimerkiksi sanan perusmuodolle, ja lisätään tähän kerrokseen
yksi ankkuri (point) jokaisen saneen keskivaiheille. Ankkureiden nimikkeiksi
annetaan sitten ko. saneen perusmuoto ortografisessa asussaan.
<P>
Sanalle ei ole määritelty valmiiksi esimerkiksi ominaisuutta 'sanaluokka',
sillä ominaisuudet periytyvät kaikille yksikön aliyksiköille ja eri
tutkijoiden käsitykset sanaluokkien määrästä ja merkityksestä vaihtelevat
(esim. <A
HREF="node62.html#ISK">15</A> vs. erilaisten automaattisten morfologisten
analyysityökalujen käyttämät luokitukset). Mikäli sanaluokan annotointi
on tarpeen, kannattaa luoda Puh-editorissa sanayksikölle uusi aliyksikkö,
jolle määritellään sanaluokka-ominaisuus ja tälle puolestaan lista
haluttuja luokkanimikkeitä.
<P>
<HR>
<!--Navigation Panel-->
<A NAME="tex2html1021"
HREF="node21.html">
<IMG WIDTH="37" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="next" SRC="next.png"></A>
<A NAME="tex2html1015"
HREF="node18.html">
<IMG WIDTH="26" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="up" SRC="up.png"></A>
<A NAME="tex2html1009"
HREF="node19.html">
<IMG WIDTH="63" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="previous" SRC="prev.png"></A>
<A NAME="tex2html1017"
HREF="node1.html">
<IMG WIDTH="65" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="contents" SRC="contents.png"></A>
<A NAME="tex2html1019"
HREF="node63.html">
<IMG WIDTH="43" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="index" SRC="index.png"></A>
<BR>
<B> :</B> <A NAME="tex2html1022"
HREF="node21.html">4.3 Syllable - tavu</A>
<B> :</B> <A NAME="tex2html1016"
HREF="node18.html">4. Lingvistiset yksiköt</A>
<B> :</B> <A NAME="tex2html1010"
HREF="node19.html">4.1 Phoneme - foneemi</A>
  <B> <A NAME="tex2html1018"
HREF="node1.html">Sisältö</A></B>
  <B> <A NAME="tex2html1020"
HREF="node63.html">Hakemisto</A></B>
<!--End of Navigation Panel-->
<ADDRESS>
Mietta Lennes
2005-05-11
</ADDRESS>
</BODY>
</HTML>