Till sidans topp

Sidansvarig: Webbredaktion
Sidan uppdaterades: 2012-09-11 15:12

Tipsa en vän
Utskriftsversion

Neural context embeddings… - Göteborgs universitet Till startsida
Webbkarta
Till innehåll Läs mer om hur kakor används på gu.se

Neural context embeddings for automatic discovery of word senses

Paper i proceeding
Författare Mikael Kågebäck
Fredrik Johansson
Richard Johansson
Devdatt Dubhashi
Publicerad i Proceedings of the 1st Workshop on Vector Space Modeling for Natural Language Processing. Denver, United States
Sidor 25-32
Publiceringsår 2015
Publicerad vid Institutionen för svenska språket
Sidor 25-32
Språk en
Länkar aclweb.org/anthology/W/W15/W15-1504...
Ämnesord språkteknologi, lexikal semantik, ordbetydelser, korpusar, distributionella metoder
Ämneskategorier Data- och informationsvetenskap, Språkteknologi (språkvetenskaplig databehandling), Datorlingvistik

Sammanfattning

Word sense induction (WSI) is the problem of automatically building an inventory of senses for a set of target words using only a text corpus. We introduce a new method for embedding word instances and their context, for use in WSI. The method, Instance-context embedding (ICE), leverages neural word embeddings, and the correlation statistics they capture, to compute high quality embeddings of word contexts. In WSI, these context embeddings are clustered to find the word senses present in the text. ICE is based on a novel method for combining word embeddings using continuous Skip-gram, based on both se- mantic and a temporal aspects of context words. ICE is evaluated both in a new system, and in an extension to a previous system for WSI. In both cases, we surpass previous state-of-the-art, on the WSI task of SemEval-2013, which highlights the generality of ICE. Our proposed system achieves a 33% relative improvement.

Sidansvarig: Webbredaktion|Sidan uppdaterades: 2012-09-11
Dela:

På Göteborgs universitet använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor.  Vad är kakor?