Till sidans topp

Sidansvarig: Webbredaktion
Sidan uppdaterades: 2012-09-11 15:12

Tipsa en vän
Utskriftsversion

Bootstrapping Language De… - Göteborgs universitet Till startsida
Webbkarta
Till innehåll Läs mer om hur kakor används på gu.se

Bootstrapping Language Description: The case of Mpiemo (Bantu A, Central African Republic)

Paper i proceeding
Författare Harald Hammarström
Christina Thornell
Malin Petzell
Torbjörn Westerlund
Publicerad i Proceedings of the 6th edition of the Language Resources and Evaluation Conference (LREC 2008), 28-30 may 2008, Marrakech, Morocco,
Publiceringsår 2008
Publicerad vid Institutionen för data- och informationsteknik, datavetenskap (GU)
Institutionen för orientaliska och afrikanska språk
Språk en
Länkar www.lrec-conf.org/proceedings/lrec2...
Ämnesord Acquisition, Machine Learning, Endangered languages, Language modelling
Ämneskategorier Datavetenskap (datalogi), Afrikanska språk

Sammanfattning

Linguists have long been producing grammatical decriptions of yet undescribed languages. This is a time-consuming process, which has already adapted to improved technology for recording and storage. We present here a novel application of NLP techniques to bootstrap analysis of collected data and speed-up manual selection work. To be more precise, we argue that unsupervised induction of morphology and part-of-speech analysis from raw text data is mature enough to produce useful results. Experiments with Latent Semantic Analysis were less fruitful. We exemplify this on Mpiemo, a so-far essentially undescribed Bantu language of the Central African Republic, for which raw text data was available.

Sidansvarig: Webbredaktion|Sidan uppdaterades: 2012-09-11
Dela:

På Göteborgs universitet använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor.  Vad är kakor?