Termín:token³: Rozdiel medzi revíziami
Z STD
(Vytvorená stránka „{{Term |Name=token³ |Definition=najmenší segment textu v jazykovom korpuse |Field=lingvistika, strojový preklad, editovanie textov |Related terms=tokenizácia |Bibli…“) |
|||
(11 medziľahlých úprav od 3 ďalších používateľov nie je zobrazených) | |||
Riadok 1: | Riadok 1: | ||
{{Term | {{Term | ||
|Name=token³ | |Name=token³ | ||
− | |Definition= | + | |Definition=znak alebo súbor (postupnosť) znakov formálne oddelených od iného znaku alebo súboru znakov napr. medzerou |
− | |Field=lingvistika, strojový preklad | + | |Field=lingvistika, informačná technológia a spracovanie údajov, strojový preklad |
− | |Related terms= | + | |Related terms=tokenizácia¹, tokenizácia², tag |
− | |Bibliography= | + | |Synonyms=textová jednotka, pozícia¹ |
+ | |Bibliography=Šimková, M.: Výberový slovník termínov a pojmov z korpusovej lingvistiky. In: Šimková, M. – Gajdošová, K. – Kmeťová, B. – Debnár, M.: Slovenský národný korpus. Texty, anotácie, vyhľadávania. Bratislava: Jazykovedný ústav Ľ. Štúra SAV – Vydavateľstvo Mikula 2017. | ||
|Translations={{Translation | |Translations={{Translation | ||
|Language=cs | |Language=cs | ||
Riadok 14: | Riadok 15: | ||
|Acceptability=Odporúčaný | |Acceptability=Odporúčaný | ||
|URL=https://sk.wikipedia.org/wiki/Token_(text) | |URL=https://sk.wikipedia.org/wiki/Token_(text) | ||
+ | |Comment=Ide o základnú jednotku korpusu, ktorou môže byť slovo, tvar slova, interpunkčné znamienko, číslica a pod. | ||
}} | }} | ||
+ | [[Category:Korpusová lingvistika]] | ||
[[Category:It]] | [[Category:It]] |
Aktuálna revízia z 20:53, 22. apríl 2021
Odporúčaný termín [?]
Oblasť: | lingvistika, informačná technológia a spracovanie údajov, strojový preklad |
Definícia: | znak alebo súbor (postupnosť) znakov formálne oddelených od iného znaku alebo súboru znakov napr. medzerou |
Zdroj: | Šimková, M.: Výberový slovník termínov a pojmov z korpusovej lingvistiky. In: Šimková, M. – Gajdošová, K. – Kmeťová, B. – Debnár, M.: Slovenský národný korpus. Texty, anotácie, vyhľadávania. Bratislava: Jazykovedný ústav Ľ. Štúra SAV – Vydavateľstvo Mikula 2017. |
Synonymum: | textová jednotka, pozícia¹ |
Príbuzné termíny: | tokenizácia¹, tokenizácia², tag |
Cudzojazyčný ekvivalent: | cs: token, en: token |
Poznámka: | Ide o základnú jednotku korpusu, ktorou môže byť slovo, tvar slova, interpunkčné znamienko, číslica a pod. |
URL: | https://sk.wikipedia.org/wiki/Token (text) |