Please wait a minute...
 首页  期刊介绍 期刊订阅 联系我们 横山亮次奖 百年刊庆
 
最新录用  |  预出版  |  当期目录  |  过刊浏览  |  阅读排行  |  下载排行  |  引用排行  |  横山亮次奖  |  百年刊庆
清华大学学报(自然科学版)  2017, Vol. 57 Issue (2): 197-201    DOI: 10.16511/j.cnki.qhdxxb.2017.22.014
  信息工程 本期目录 | 过刊浏览 | 高级检索 |
类别区分词与情感词典相结合的维吾尔文句子情感分类
阿不都萨拉木·达吾提1, 于斯音·于苏普2, 艾斯卡尔·艾木都拉2
1. 新疆大学 软件学院, 乌鲁木齐 830046;
2. 新疆大学 信息科学与工程学院, 乌鲁木齐 830046
Emotion recognition from Uyghur sentences based on combinations of class discrimination words and a sentiment dictionary
Abdusalam Dawut1, Hussein Yusuf2, Askar Hamdulla2
1. School of Software, Xinjiang University, Urumqi 830046, China;
2. School of Information Science and Engineering, Xinjiang University, Urumqi 830046, China
全文: PDF(1047 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 该文在类别区分词特征选择方法的基础上,针对维吾尔文中的生气、高兴、难过、惊讶等句子的情感类别提出了类别区分词与情感词典相结合的方法,进行了句子情感分类研究。结合维吾尔语文本句子中的情感表达特点,利用类别区分词特征选择方法,提取了最有类别区分能力的特征词,并进行了情感分类。通过人工抽取方法收集了维吾尔文句子中能表达情感的关键词,并建立了一个基础情感词典。将该词典与类别区分词结合在一起作为特征,对维吾尔文句子的情感类型有效地进行了分类。实验结果表明类别区分词与情感词典相结合方法的分类效率优于只用类别区分词特征选择方法。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
关键词 类别区分词情感词典句子情感情感分类维吾尔语    
Abstract:This paper presents a recognition method for Uyghur sentence sentiments, such as anger, happiness, sadness and wonder based on combining class-discrimination words (CDW) and a sentiment dictionary. The sentiment expression characteristics in the Uyghur sentence text are identified from features extracted using a CDW feature selection method for the emotion recognition. A set of emotional words is collected manually and put into a sentiment dictionary which is combined with the CDW feature words for the emotion recognition. Tests show that the combined method is more effective than only the CDW feature based method.
Key wordsclass discrimination word    sentiment dictionary    sentence sentiment    emotion recognition    Uyghur
收稿日期: 2016-06-22      出版日期: 2017-02-15
ZTFLH:  TP391.1  
通讯作者: 艾斯卡尔·艾木都拉,教授,E-mail:askar@xju.edu.cn     E-mail: askar@xju.edu.cn
引用本文:   
阿不都萨拉木·达吾提, 于斯音·于苏普, 艾斯卡尔·艾木都拉. 类别区分词与情感词典相结合的维吾尔文句子情感分类[J]. 清华大学学报(自然科学版), 2017, 57(2): 197-201.
Abdusalam Dawut, Hussein Yusuf, Askar Hamdulla. Emotion recognition from Uyghur sentences based on combinations of class discrimination words and a sentiment dictionary. Journal of Tsinghua University(Science and Technology), 2017, 57(2): 197-201.
链接本文:  
http://jst.tsinghuajournals.com/CN/10.16511/j.cnki.qhdxxb.2017.22.014  或          http://jst.tsinghuajournals.com/CN/Y2017/V57/I2/197
  表1 维吾尔文文本情感例句
  表2 维吾尔语文本预处理中的停用词表
  图1 维吾尔文句子情感分类的系统结构图
  表3 平衡数据集的情感分类结果
  表4 非平衡数据集的情感分类结果
[1] 宗成庆. 统计自然语言处理[M]. 北京:清华大学出版社, 2013.ZONG Chengqing. Statistical Natural Language Processing[M]. Beijing:Tsinghua University Press, 2013. (in Chinese)
[2] 代大明, 王中卿, 李寿山, 等. 基于情绪词的非监督中文情感分类方法研究[J]. 中文信息学报, 2012, 26(4):103-108. DAI Daming, WANG Zhongqing, LI Shoushan, et al. Unsupervised Chinese sentiment classification with emotion words[J]. Journal of Chinese Information Processing, 2012, 26(4):103-108. (in Chinese)
[3] 赵志伟. 中文文本倾向性分析研究[D]. 合肥:安徽大学, 2012.ZHAO Zhiwei. Chinese Text Orientation Analysis[D]. Hefei:Anhui University, 2012. (in Chinese)
[4] Yang T-H, Hsieh C-T, Soo V-W. Towards text-based emotion detection[C]//International Conference on Information Management and Engineering. Kuala Lumpur, Malaysia, 2009.
[5] 李寿山. 情感文本分类方法研究[D]. 北京:中国科学院自动化研究所, 2008.LI Shoushan. Research on Sentiment Classification Method[D]. Beijing:Institute of Automation, Chinese Academy of Sciences, 2008. (in Chinese)
[6] 秀段婷, 何婷婷, 宋乐. 基于PMI-IR算法的Blog情感分类研究[C]//第5届全国青年计算语言学研讨会论文集. 武汉:华中师范大学, 2010.XIU Duanting, HE Tingting, SONG Le. Blog sentiment classification based on PMI-IR algorithm[C]//5th National Conference on Computational Linguistics for Young Fellows. Wuhan:Huazhong Normal University China, 2010. (in Chinese)
[7] 杨鼎, 阳爱民. 一种基于情感词典和朴素贝叶斯的中文文本情感分类方法[J]. 计算机应用研究, 2010, 27(10):3737-3743.YANG Ding, YANG Aimin. Classification approach of Chinese texts sentiment based on semantic lexicon and naive Bayesian[J]. Application Research of Computers, 2010, 27(10):3737-3743. (in Chinese)
[8] 张靖, 金浩. 汉语词语情感倾向自动判断研究[J]. 计算机工程, 2010, 36(23):194-196.ZHANG Jing, JIN Hao. Study on Chinese word sentiment polarity automatic estimation[J]. Computer Engineering, 2010, 36(23):194-196. (in Chinese)
[9] 潘文彬. 基于情感词词典的中文句子情感倾向性分析[D]. 北京:北京邮电大学, 2011.FAN Wenbin. Sentiment Orientation Analysis of Chinese Sentences Based on Sentiment Word Dictionary[D]. Beijing:Beijing University of Posts and Telecommunications, 2011. (in Chinese)
[10] 王素格, 杨安娜, 李德玉. 基于汉语情感词表的句子情感倾向分类研究[J]. 计算机工程与应用, 2009, 45(24):153-155.WANG Suge, YANG Anna, LI Deyu. Research on sentence sentiment classification based on Chinese sentiment word table[J]. Computer Engineering and Applications, 2009, 45(24):153-155. (in Chinese)
[11] 夏睿. 基于语言知识和集成学习的情感文本分类方法研究[D]. 北京:中国科学院自动化研究所, 2011.XIA Rui. Emotional Text Categorization Based on Language Knowledge and Integrated Learning[D]. Beijing:Institute of Automation, Chinese Academy of Sciences, 2011. (in Chinese)
[12] 黄俊, 田生伟, 禹龙, 等. 基于维吾尔语情感词的句子情感分析[J]. 计算机工程, 2012, 38(9):183-185.HUANG Jun, TIAN Shengwei, YU Long, et al. Sentence sentiment analysis based on Uyghur sentiment word[J]. Computer Engineering, 2012, 38(9):183-185. (in Chinese)
[13] 于斯音·于苏普,艾斯卡尔·艾木都拉.基于情感词典的维吾尔语文本句子情感分类[J].电脑知识与技术, 2014(10):2371-2374. Hussein Yusuf, Askar Hamdulla. Sentiment database based sentiment classification from Uyghur text[J]. Computer Knowledge and Technology, 2014(10):2371-2374. (in Chinese)
[14] 冯冠军, 禹龙, 田生伟. 基于CRFs自动构建维吾尔语情感词语料库[J]. 现代图书情报技术, 2011(3):17-21.FENG Guanjun, YU Long, TIAN Shengwei. Auto construction of Uyghur emotional words corpus based on CRFs[J]. New Technology of Library and Information Service, 2011(3):17-21. (in Chinese)
[15] 热依莱木·帕尔哈提, 孟祥涛, 艾斯卡尔·艾木都拉.基于区分性关键词模型的维吾尔文本情感分类[J]. 计算机工程, 2014, 40(10):132-136.Rayila Parhat, MENG Xiangtao, Askar Hamdulla. Discriminative keyword model based sentiment classification from Uyghur text[J]. Computer Engineering, 2014, 40(10):132-136. (in Chinese)
[16] 周奇年, 张振浩, 徐登彩. 用于中文文本分类的基于类别区分词的特征选择方法[J]. 计算机应用与软件, 2013, 30(3):193-195.ZHOU Qinian, ZHANG Zhenhao, XU Dengcai. Feature selection method for Chinese text categorization based on class discriminating words[J]. Computer Applications and Software, 2013, 30(3):193-195. (in Chinese)
[17] 祖丽湖玛尔·马木提江. 维吾尔语区分性关键词提取应用软件开发及其性能分析[D]. 乌鲁木齐:新疆大学, 2013.Zulhumar Mamutjan. Uyghur Discriminative Keyword Extraction Software Development[D]. Urumqi:Xinjiang University, 2013. (in Chinese)
[18] 周茜, 赵明生, 扈旻. 中文文本分类中的特征选择研究[J]. 中文信息学报, 2004, 18(3):17-23.ZHOU Qian, ZHAO Mingsheng, HU Min. Study on feature selection in Chinese text categorization[J]. Journal of Chinese Information Processing, 2004, 18(3):17-23. (in Chinese)
[19] 张玉芳, 王勇, 刘明, 等. 新的文本分类特征选择方法研究[J]. 计算机工程与应用, 2013, 49(5):132-135.ZHANG Yufang, WANG Yong, LIU Ming, et al. New feature selection approach for text categorization[J]. Computer Engineering and Applications, 2013, 49(5):132-135. (in Chinese)
[20] 王志昊, 王中卿, 李寿山, 等. 不平衡情感分类中的特征选择方法研究[J]. 中文信息学报, 2013, 27(4):113-118.WANG Zhihao, WANG Zhongqing, LI Shoushan, et al. Feature selection for imbalanced sentiment classification[J]. Journal of Chinese Information Processing, 2013, 27(4):113-118. (in Chinese)
[1] 努尔麦麦提·尤鲁瓦斯, 刘俊华, 吾守尔·斯拉木, 热依曼·吐尔逊, 达吾勒·阿布都哈依尔. 跨语言声学模型在维吾尔语语音识别中的应用[J]. 清华大学学报(自然科学版), 2018, 58(4): 342-346.
[2] 哈里旦木·阿布都克里木, 刘洋, 孙茂松. 神经机器翻译系统在维吾尔语-汉语翻译中的性能对比[J]. 清华大学学报(自然科学版), 2017, 57(8): 878-883.
[3] 阿布都克力木·阿布力孜, 江铭虎, 姚登峰, 哈里旦木·阿布都克里木. 形态复杂词加工的认知神经机制[J]. 清华大学学报(自然科学版), 2017, 57(4): 393-398.
[4] 米吉提·阿不里米提, 艾克白尔·帕塔尔, 艾斯卡尔·艾木都拉. 基于层次化结构的语言模型单元集优化[J]. 清华大学学报(自然科学版), 2017, 57(3): 257-263.
[5] 赛牙热·依马木, 热依莱木·帕尔哈提, 艾斯卡尔·艾木都拉, 李志军. 基于不同关键词提取算法的维吾尔文本情感辨识[J]. 清华大学学报(自然科学版), 2017, 57(3): 270-273.
[6] 艾斯卡尔·肉孜, 殷实, 张之勇, 王东, 艾斯卡尔·艾木都拉, 郑方. THUYG-20:免费的维吾尔语语音数据库[J]. 清华大学学报(自然科学版), 2017, 57(2): 182-187.
[7] 热合木·马合木提, 于斯音·于苏普, 张家俊, 宗成庆, 艾斯卡尔·艾木都拉. 基于模糊匹配与音字转换的维吾尔语人名识别[J]. 清华大学学报(自然科学版), 2017, 57(2): 188-196.
[8] 哈妮克孜·伊拉洪, 古力米热·依玛木, 玛依努尔·阿吾力提甫, 姑丽加玛丽·麦麦提艾力, 艾斯卡尔·艾木都拉. 维吾尔语感叹句语调起伏度[J]. 清华大学学报(自然科学版), 2017, 57(12): 1254-1258.
[9] 古力米热·依玛木, 姑丽加玛丽·麦麦提艾力, 玛依努尔·阿吾力提甫, 艾斯卡尔·艾木都拉. 维吾尔语韵律建模[J]. 清华大学学报(自然科学版), 2017, 57(12): 1259-1264.
[10] 哈里旦木·阿布都克里木, 程勇, 刘洋, 孙茂松. 基于双向门限递归单元神经网络的维吾尔语形态切分[J]. 清华大学学报(自然科学版), 2017, 57(1): 1-6.
[11] 王丙坤, 黄永峰, 李星. 基于多粒度计算和多准则融合的情感分类[J]. 清华大学学报(自然科学版), 2015, 55(5): 497-502.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 《清华大学学报(自然科学版)》编辑部
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn