-
Notifications
You must be signed in to change notification settings - Fork 1
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
No analysis for "#" at beginning of sentence #22
Comments
Keine ahnung... This must be looked into. |
Here is another example:
|
It seems however, that is not just at the beginning of sentence. "#" is not analysed at all, even when alone:
|
Problemet er Det har ikkje vore eit problem tidlegare - teikn som Det grunnleggjande problemet er at vi nyttar vanlege teikn som spesialteikn i lexc. Eitt mogleg svar på det som eg har tenkt på er at vi bør endra alle slike spesialsymbol (typisk for ulike slag morfemgrenser) til alltid å vera eit multicharsymbol. Dvs noko i stil med:
Då treng vi ikkje handtera dei same teikna i vanleg tekst på ein spesiell måte, og problem som dei du har rapportert her vil forsvinna. Kva synest @Trondtr @flammie og andre? (Det er ein stor jobb å endra alle, og tilsvarande endringar må gjerast i alle filter, så endringa må planleggjast nøye.) |
mm, # er ganske mest overloaded symbol også i xerox systemer... den ligger allerede i
men
men vi kanske vill også ha hashtaggar som url-guesser eller likadant? |
Ok, eg ser at du har sjekka inn #7 som Multichar. Så skriv du: |
Den står alt i |
mm ja æ pushte den i lang-sme sin root.lexc og i giella-shared in i |
"#" doesn't get an analysis at the beginning of a sentence:
The text was updated successfully, but these errors were encountered: