赵传君, 武美龄, 申利华, 上官学奎, 王彦婕, 李杰, 王素格, 李德玉
用于文本情感分析的深度学习模型如递归神经网络等参数较多, 因此需要大量高质量标记训练数据对模型进行训练和优化。 在实际应用中, 特定领域难以获取高质量带情感标签评论数据。 在跨领域文本情感分类任务中, 针对不同领域数据分布差异性, 提出了基于句法结构迁移和领域融合的跨领域文本情感分类方法, 可以解决特定领域对带标签数据依赖问题。 句法结构迁移方面, 将依存语法特征加入到递归神经网络中, 设计了一种可迁移的依存句法递归神经网络模型, 通过句法结构迁移有效地迁移跨领域结构信息, 为情感迁移提供支撑。 领域融合方面, 在传统的最大均值差异领域度量方法上细化了跨领域同类别距离度量信息。 通过约束源领域和目标领域的分布, 可以保证2个领域距离在学习过程中尽可能减小, 有效地提取领域通用特征。 实验结果表明, 该方法比已有方法有效提高了跨领域情感分类准确率。