Please wait a minute...
 首页  期刊介绍 期刊订阅 联系我们 横山亮次奖 百年刊庆
 
最新录用  |  预出版  |  当期目录  |  过刊浏览  |  阅读排行  |  下载排行  |  引用排行  |  横山亮次奖  |  百年刊庆
清华大学学报(自然科学版)  2017, Vol. 57 Issue (3): 270-273    DOI: 10.16511/j.cnki.qhdxxb.2017.26.008
  计算机科学与技术 本期目录 | 过刊浏览 | 高级检索 |
基于不同关键词提取算法的维吾尔文本情感辨识
赛牙热·依马木, 热依莱木·帕尔哈提, 艾斯卡尔·艾木都拉, 李志军
新疆大学 信号与信息处理重点实验室, 乌鲁木齐 830046
Keyword extraction algorithms for emotion recognition from Uyghur text
IMAM Seyyare, PARHAT Rayilam, HAMDULLA Askar, LI Zhijun
Key Laboratory of Signal and Information Processing, Xinjiang University, Urumqi 830046, China
全文: PDF(957 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 该文在研究不同的关键词提取方法的基础上,针对维吾尔语文本中的生气、高兴等常见情感类型进行情感辨识研究。结合维吾尔文本句子中的情感表达特点,用TextRank、稀疏判别分析(sparse discriminant analysis,SDA)和稀疏支持向量机(sparse support vector machine,Sparse SVM)等提取方法得到具有代表性的关键词集,并基于这些关键词集进行特征提取和情感模型构造。该文从电影电视剧中演员的维吾尔语台词、小说等文本中选取含有生气和高兴2种情感文本的句子,构造实验数据集并验证所提出的文本情感倾向性分析方法的有效性。实验结果表明:该文用多种方法所提取的关键词集都能有效地对维吾尔语文本句子进行情感分类,尤其是基于Sparse SVM的稀疏性分析的关键词提取方法在少量关键词语集上能有效地进行较高准确率的情感分类。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
关键词 TextRank稀疏判别分析(SDA)稀疏支持向量机(Sparse SVM)情感识别维吾尔语    
Abstract:This paper describes sentiment classification research on Uyghur text using different keyword extraction methods to recognize common emotions like anger and happiness. The keywords expressing happiness and anger are extracted using the TextRank, sparse discriminant analysis (SDA) and sparse support vector machine (Sparse SVM) methods to train feature extraction and sentiment models. A sentiment text database was built by excerpting the anger and happiness sentiments from Uyghur movies and novels with several validation experiments based on those text databases. The tests show that the keyword extraction methods presented in this paper are effective for emotion classification from Uyghur sentences. The Sparse SVM method is robustness and has higher accuracy in recognition tests with a smaller number of keywords extracted.
Key wordsTextRank    sparse discriminant analysis(SDA)    sparse support vector machine(Sparse SVM)    emotion recognition    Uyghur
收稿日期: 2016-06-18      出版日期: 2017-03-15
ZTFLH:  TP391.1  
通讯作者: 艾斯卡尔·艾木都拉,教授,E-mail:askar@xju.edu.cn     E-mail: askar@xju.edu.cn
引用本文:   
赛牙热·依马木, 热依莱木·帕尔哈提, 艾斯卡尔·艾木都拉, 李志军. 基于不同关键词提取算法的维吾尔文本情感辨识[J]. 清华大学学报(自然科学版), 2017, 57(3): 270-273.
IMAM Seyyare, PARHAT Rayilam, HAMDULLA Askar, LI Zhijun. Keyword extraction algorithms for emotion recognition from Uyghur text. Journal of Tsinghua University(Science and Technology), 2017, 57(3): 270-273.
链接本文:  
http://jst.tsinghuajournals.com/CN/10.16511/j.cnki.qhdxxb.2017.26.008  或          http://jst.tsinghuajournals.com/CN/Y2017/V57/I3/270
  表1 基于TextRank的情感分类效果
  表2 基于SDA 的情感分类结果
  表3 基于SparseSVM 的情感分类结果
[1] 谢晋. 基于词跨度的中文文本关键词提取及在文本分类中的应用[D]. 杭州:浙江工业大学, 2011. XIE Jin. Chinese Keyword Extraction Method Based on Word Span and Its Application in Text Classification[D]. Hangzhou:Zhejiang University of Technology, 2011. (in Chinese)
[2] 张彦博. 文本情感分类的研究[D]. 北京:北京交通大学, 2010. ZHANG Yanbo. Research of Text Sentiment Classification[D]. Beijing:Beijing Jiaotong University, 2010. (in Chinese)
[3] 李寿山. 情感文本分类方法研究[D]. 北京:中国科学院自动化研究所, 2008. LI Shoushan. Research on Sentiment Classification Method[D]. Beijing:Institute of Automation, Chinese Academy of Sciences, 2008. (in Chinese)
[4] 杨鼎, 阳爱民. 一种基于情感词典和朴素贝叶斯的中文文本情感分类方法[J]. 计算机应用研究, 2010, 27(10):3737-3743. YANG Ding, YANG Aimin. Classification approach of Chinese texts sentiment based on semantic lexicon and naive Bayesian[J]. Application Research of Computers, 2010, 27(10):3737-3743. (in Chinese)
[5] 潘文彬. 基于情感词词典的中文句子情感倾向性分析[D]. 北京:北京邮电大学, 2011. PAN Wenbin. The Sentimental Orientation Analysis of Sentence Based on Sentiment Dictionary[D]. Beijing:Beijing University of Posts and Telecommunications, 2011. (in Chinese)
[6] 张靖, 金浩. 汉语词语情感倾向自动判断研究[J]. 计算机工程, 2010, 36(23):194-196. ZHANG Jing, JIN Hao. Study on Chinese word sentiment polarity automatic estimation[J]. Computer Engineering, 2010, 36(23):194-196. (in Chinese)
[7] 黄俊, 田生伟, 禹龙, 等. 基于维吾尔语情感词的句子情感分析[J]. 计算机工程, 2012, 38(9):183-185. HUANG Jun, TIAN Shengwei, YU Long, et al. Sentence sentiment analysis based on Uyghur sentiment word[J]. Computer Engineering, 2012, 38(9):183-185. (in Chinese)
[8] 禹龙, 田生伟, 冯冠军. 维吾尔语情感词汇自动识别[J]. 计算机工程, 2011, 37(7):213-215. YU Long, TIAN Shengwei, FENG Guanjun. Automatic recognition of Uyghur emotional words[J]. Computer Engineering, 2011, 37(7):213-215. (in Chinese)
[9] LI Juanzi, FAN Qi'na, ZHANG Kuo. Keyword extraction based on tf/idf for Chinese news document[J]. Wuhan University Journal of Natural Sciences, 2007, 5:917-921.
[10] 祖丽湖玛尔·马木提江. 维吾尔语区分性关键词提取应用软件开发及其性能分析[D]. 乌鲁木齐:新疆大学, 2013. Mamut Zulhumar. Research on Uyghur Discriminative Keyword Extraction Algorithm and Its Performance Analysis[D]. Urumqi:Xinjiang University, 2013. (in Chinese)
[11] 热依莱木·帕尔哈提, 孟祥涛, 艾斯卡尔·艾木都拉. 基于区分性关键词模型的维吾尔语文本情感分类[J]. 计算机工程, 2014, 40(10):132-136, 142. Rayila Parhat, MENG Xiangtao, Askar Hamdulla. Uyghur text sentiment classification based on discriminative keyword model[J]. Computer Engineering, 2014, 40(10):132-136, 142. (in Chinese)
[12] Mihalcea R, Tarau P. TextRank:Bringing order into texts[C]//Empirical Methods in Natural Language Processing 2004. Barcelona, Spain, 2004:404-410.
[13] 陈小冬, 林焕祥. 稀疏判别分析[J]. 计算机应用, 2013, 32(4):1017-1021. CHEN Xiaodong, LIN Huanxiang. Sparse discriminant analysis[J]. Journal of Computer Applications, 2012, 32(4):1017-1021. (in Chinese)
[14] Bi J, Bennett K, Embrechts M, et al. Dimensionality reduction via sparse support vector machines.[J]. Journal of Machine Learning Research, 2003, 3(3):1229-1243.
[15] 热依莱木·帕尔哈提. 文本关键词提取技术及其应用研究[D]. 乌鲁木齐:新疆大学, 2014. Rayila Parhat. The Effective Text Keyword Extraction Technologies and Their Applications[D]. Urumqi:Xinjiang University, 2014. (in Chinese)"
[1] 努尔麦麦提·尤鲁瓦斯, 刘俊华, 吾守尔·斯拉木, 热依曼·吐尔逊, 达吾勒·阿布都哈依尔. 跨语言声学模型在维吾尔语语音识别中的应用[J]. 清华大学学报(自然科学版), 2018, 58(4): 342-346.
[2] 宋鹏, 郑文明, 赵力. 基于子空间学习和特征选择融合的语音情感识别[J]. 清华大学学报(自然科学版), 2018, 58(4): 347-351.
[3] 哈里旦木·阿布都克里木, 刘洋, 孙茂松. 神经机器翻译系统在维吾尔语-汉语翻译中的性能对比[J]. 清华大学学报(自然科学版), 2017, 57(8): 878-883.
[4] 阿布都克力木·阿布力孜, 江铭虎, 姚登峰, 哈里旦木·阿布都克里木. 形态复杂词加工的认知神经机制[J]. 清华大学学报(自然科学版), 2017, 57(4): 393-398.
[5] 米吉提·阿不里米提, 艾克白尔·帕塔尔, 艾斯卡尔·艾木都拉. 基于层次化结构的语言模型单元集优化[J]. 清华大学学报(自然科学版), 2017, 57(3): 257-263.
[6] 艾斯卡尔·肉孜, 殷实, 张之勇, 王东, 艾斯卡尔·艾木都拉, 郑方. THUYG-20:免费的维吾尔语语音数据库[J]. 清华大学学报(自然科学版), 2017, 57(2): 182-187.
[7] 热合木·马合木提, 于斯音·于苏普, 张家俊, 宗成庆, 艾斯卡尔·艾木都拉. 基于模糊匹配与音字转换的维吾尔语人名识别[J]. 清华大学学报(自然科学版), 2017, 57(2): 188-196.
[8] 阿不都萨拉木·达吾提, 于斯音·于苏普, 艾斯卡尔·艾木都拉. 类别区分词与情感词典相结合的维吾尔文句子情感分类[J]. 清华大学学报(自然科学版), 2017, 57(2): 197-201.
[9] 哈妮克孜·伊拉洪, 古力米热·依玛木, 玛依努尔·阿吾力提甫, 姑丽加玛丽·麦麦提艾力, 艾斯卡尔·艾木都拉. 维吾尔语感叹句语调起伏度[J]. 清华大学学报(自然科学版), 2017, 57(12): 1254-1258.
[10] 古力米热·依玛木, 姑丽加玛丽·麦麦提艾力, 玛依努尔·阿吾力提甫, 艾斯卡尔·艾木都拉. 维吾尔语韵律建模[J]. 清华大学学报(自然科学版), 2017, 57(12): 1259-1264.
[11] 哈里旦木·阿布都克里木, 程勇, 刘洋, 孙茂松. 基于双向门限递归单元神经网络的维吾尔语形态切分[J]. 清华大学学报(自然科学版), 2017, 57(1): 1-6.
[12] 宋鹏, 郑文明, 赵力. 基于特征迁移学习方法的跨库语音情感识别[J]. 清华大学学报(自然科学版), 2016, 56(11): 1179-1183.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 《清华大学学报(自然科学版)》编辑部
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn