Till sidans topp

Sidansvarig: Webbredaktion
Sidan uppdaterades: 2012-09-11 15:12

Tipsa en vän
Utskriftsversion

An Arabic Tweets Sentimen… - Göteborgs universitet Till startsida
Webbkarta
Till innehåll Läs mer om hur kakor används på gu.se

An Arabic Tweets Sentiment Analysis Dataset (ATSAD) using Distant Supervision and Self Training

Paper i proceeding
Författare Chatrine (kathrein) Qwaider (abu kwaik)
Stergios Chatzikyriakidis
Simon Dobnik
Richard Johansson
Motaz Saad
Publicerad i Proceedings of the 4th Workshop on Open-Source Arabic Corpora and Processing Tools with a Shared Task on Offensive Language Detection (OSACT4-2020) at Language Resources and Evaluation Conference (LREC 2020)
ISBN 979-10-95546-51-1
Förlag European Language Resources Association (ELRA)
Förlagsort Marseille, France
Publiceringsår 2020
Publicerad vid Institutionen för data- och informationsteknik (GU)
Institutionen för filosofi, lingvistik och vetenskapsteori
Språk en
Länkar edinburghnlp.inf.ed.ac.uk/workshops...
https://www.aclweb.org/anthology/20...
https://gup.ub.gu.se/file/208188
Ämnesord natural language processing, sentiment analysis, distant supervision, self training
Ämneskategorier Datorlingvistik, Lingvistik, Arabiska

Sammanfattning

As the number of social media users increases, they express their thoughts, needs, socialise and publish their opinions. For good social media sentiment analysis, good quality resources are needed, and the lack of these resources is particularly evident for languages other than English, in particular Arabic. The available Arabic resources lack of from either the size of the corpus or the quality of the annotation. In this paper, we present an Arabic Sentiment Analysis Corpus collected from Twitter, which contains 36K tweets labelled into positive and negative. We employed distant supervision and self-training approaches into the corpus to annotate it. Besides, we release an 8K tweets manually annotated as a gold standard. We evaluated the corpus intrinsically by comparing it to human classification and pre-trained sentiment analysis models. Moreover, we apply extrinsic evaluation methods exploiting sentiment analysis task and achieve an accuracy of 86%.

Sidansvarig: Webbredaktion|Sidan uppdaterades: 2012-09-11
Dela:

På Göteborgs universitet använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor.  Vad är kakor?