Journal of Computer Applications ISSN 1001—9081 2015 05 10 计算机应用,2015,35(5):1310—1313,1319 C0DEN JYIIDU http://www.joca.cn 文章编号:1001—9081(2015)05—1310—04 doi:10.1 1772/j.issn.1001—9081.2015.05.1310 基于情感角色模型的文本情感分类方法 胡 杨 ,戴 丹 ,刘 骊 ,冯旭鹏 ,刘利军 ,黄青松 (1.昆明理工大学信息工程与自动化学院,昆明650500; 2.昆明理工大学教育技术与网络中心,昆明650500; 3.云南省计算机技术应用重点实验室,昆明650500) ( 通信作者电子邮箱kmustailab@hotmail.tom) 摘要:针对传统情感分类方法因情感项指向不明引发的误判和隐藏观点遗漏等问题,提出一种基于评价对象 情感角色模型的文本情感分类方法。该方法首先识别文本中的潜在评价对象,通过局部语义分析对潜在评价对象所 在语句进行情感标注,确定潜在评价对象所在语句的正负极性,并定义其情感角色;然后,改进特征权值计算方法,将 情感角色对应的倾向值融入模型特征空间中;最后,通过特征聚合对特征空间实现模型降维。实验结果表明,所提方 法与提取强主观性情感项作为特征的情感分类方法相比,分类准确率约提高3.2%,可有效改善文本情感分类效果。 关键词:文本情感分类;向量空间模型;局部语义分析;情感角色;特征聚合 中图分类号:TP391 文献标志码:A Classiifcation method of text sentiment based on emotion role model HU Yang ,DAI Dan ,LIU Li ,FENG Xupeng ,LIU Lijun ,HUANG Qingsong ’ (1.Faculty of Information Engineering and Automation,Kunming University of Science and Technology,Kunming Yunnan 650500,China; 2.Educational technology and Network Center,Kunming University of Science and Technology,Kunming Yunnan 650500,China; 3.Yunnan Key Laboratory of Computer Technology Applications,Kunming Yunnan 650500,China) Abstract:In order to solve the problem of misjudgment which due to emotion point to an unknown and missing hidden vi‘ew in traditional emotion classiifcation method.a text sentiment classification method based on emotional role modeling was proposed. I’}le method firstly identiifed evaluation objects in the text.and it used the measure based on local semantic analysis to tag the sentence emotion which had potentila evaluation object.Then it distinguished the positive and negative polarity of evaluation objects in this paper by deifning its emotional role.And it let the tendency value of emotional role integrate into feature space to improve the feature weight computation method.Finally.it proposed the concept named”features converge”to reduce the dimension of mode1.The experimentla results show that the proposed method can improve the effect and accuracy of 3.2%for text sentiment classiifcation effectively compared with other approaches which tend to pick the strong subjective emotional items as features. Key words:text sentiment classification;Vector Space Model(VSM);local semantic analysis;emotion role;feature converge 0 引言 体库,提供语义相似度和语义相关场两种方法计算词语与褒 贬基准词的相关性;闻斌等 利用HowNet计算与情感种子 文本情感分析又称意见挖掘,是对带有情感色彩的主观 词的相似度以获得扩展情感词的情感值,制定关于否定副词 性文本进行分析、处理、归纳和推理的过程…。文本情感分 和程度副词的规则计算文本整体倾向值;汝承森等 提出基 析在评论挖掘、舆情分析、不良信息识别、医疗服务评价等领 于评价搭配模板的评价搭配抽取和倾向性判定方法。基于情 域被广泛地应用并显示出良好效果。对于文本的情感分类是 感知识的情感分类方法已有不错的效果,但需要制定复杂的 将文本的极性分为褒义和贬义两类,可分为两种研究思路:基 规则或模板来分析文本句法。 于情感知识的方法以及基于特征分类的方法 J。 选取主观性强的情感项作为特征建立向量空间模型是基 基于情感知识的方法,借助自然语言知识库作为种子,扩 于特征分类方法的重要建模手段。Pang等 将此方法引入 展情感词典并计算词语情感值,由情感词推出句子及篇章的 关于电影评论的情感分类任务,随后,Pang等 又使用基于 倾向性。Tumey等 使用点互信息(Ponit.wise Mutual 图分类的方法对文本进行主客观分类,过滤客观性文本提高 Information—Information Retireval,PMI—IR)的方法计算词语与 了情感分类的准确率;丁宵云等 比较了词频、开方检验、信 种子词的相关性,扩展情感词典;朱嫣岚等 借助HowNet本 息增益三种方法,并对其进行改进以优化特征向量空间,使用 收稿日期:2014-l1—26;修回日期:2014—12.25。 基金项目:国家自然科学基金资助项目(81360230);科技部科技型中小企业技术创新基金资助项目(13c26215305404)。 作者简介:胡杨(1991一),男,江苏南通人,硕士研究生,主要研究方向:机器学习、文本情感分析;戴丹(1992一),女,江西永新人,硕士研 究生,主要研究方向:机器学习、自然语言处理;刘骊(1979一),女,重庆人,副教授,博士,主要研究方向:机器学习、嵌入式技术、计算机图形处 理;冯旭鹏(1986一),男,河南郑州人,助理实验师,硕士,主要研究方向:搜索引擎技术;刘利军(1978一),男,河南辉县人,讲师,硕士,主要 研究方向:医疗信息服务; 黄青松(1962一),男,湖南长沙人,教授,主要研究方向:智能信息系统、信息检索。 第5期 胡杨等:基于情感角色模型的文本情感分类方法 1311 支持向量机(Suppo ̄Vector Machine,SVM)分类算法对不良信 息进行过滤;陈涛等 通过句法分析建立情感句模,将多标 签文本情感分类问题转化为对于句模的情感分类问题;Prem 等… 借助基于词典的情感倾向和训练语料上下文等逻辑知 识进行有监督的情感分类;吴琼等 利用热传导模型,提出 一处标记为正极角色,情感值加入平滑因子1;反之标记为负极 角色,平滑因子为一1。如果名词在句中情感值为0,那么其 在句中为两个角色实体,情感值分别为一1和1。经以上 操作,名词的正负角色实体在篇章中相互,形成全文正负 极角色集合 +和 一,同一名词的正角色在文中出现的情感 种跨领域的情感分类方法。目前的研究常常忽略评价对象 值总和作为其篇章正情感值,负角色同理。计算属于集合 + 和 一的某角色实体W 在文本d中情感值SO(W ,d)的公式 如下: so(W ,d)= 本身在文本中扮演的情感角色,导致标记“惩恶”为消极,“扬 恶”为积极的误判情形和较多隐藏倾向因素的忽略,影响了 分类效果。 针对上述问题,本文提出以向量空间模型为基础,提取文 ∑SO(w ) 本中的潜在评价对象,分析评价对象所在句的倾向性,将其分 为“正”和“负”两个的情感角色,计算其情感影响值作为 特征值的一部分,建立情感角色模型。将模型用于篇章级的 文本情感分类任务,实验表明本文方法可有效提升文本情感 分类的效果。 1 生成评价对象的情感角色 1.1潜在评价对象的选取 从各大门户、论坛、博客等网站搜集常被用作评论对象的 名词、短语,建立初始的评价对象本体库,并细分为政治人物、 公众人物、历史事件、热点事件、别名外号、敏感短语等几大 类,称为本体库A。 由于人工搜集的本体库A远不足以覆盖所有实验文本的 领域范围,所以需要对其进行补充,补充方法如下:对文本进 行分词并标注词性,提取文本中出现的所有名词、动名词形成 潜在评价对象词库,称为词库B。将本体库A与词库曰去重合 并,形成完整的潜在评价对象词库C。在后文中,词库C中元 素也称“潜在评价对象名词”或“名词”。 真实语料中常使用代词来指代评价对象,如果忽视这些 评价对象,将导致大量信息的丢失,影响分类准确度。为解决 这一问题,需对文中出现的代词进行“名词化”操作:寻找每 个代词前第一个名词替换该代词,如不成功,则向后寻找第一 个名词。实验中,均采用经过“名词化”操作处理过的文本作 为实验数据。 1.2情感角色生成及情感值计算 本文使用了大连理工大学信息检索研究室的情感词汇本 体¨ ,将其中包含的词语称为情感词。在文献[5]提出方法 的基础上加以改进,收集否定副词与程度副词以及常用的转 折词。设置否定副词权值为一1.0,转折词权值为~0.5,程度 副词权值从0.3到3.0不等,具体如表1所列。 计算名词所在句的倾向值。用标点符号对文本分句,在 每个句子中根据情感词汇本体设置的极性强度和极性标签设 置情感词的初始倾向值,设定每个情感词之前的所有否定词、 转折词和最近的程度副词来修饰该情感词,考虑这些因素计 算其最终倾向值,将旬中所有情感词的倾向值求和作为整句 倾向值,计算公式如下: SO(sentence)= n m ∑((Hvl 1 J=1 alue alue础。Sentibility(w )) (1) 式中:n表示情感词的数量,m表示句中修饰情感词的否定副 词及转折词数量,将整句情感值作为句中潜在评价对象的情 感值,并执行如下操作:如果句中名词的情感值为正,其在该 …max (2 SO(w ))’ (2) 1∑SO(w )1 max( … 一 fSO(wl)f ’ 上述操作,通过分析句子倾向性,对词库C中的潜在评价 对象名词进行正负极标记,生成名词的情感角色如图1所示, 并记录其情感值。 表1 副词转折词权值映射表 集合0+ 甲 甲 甲… 匦 白 … 日 集合0一 图1情感角色生成示意图 2 情感角色模型的建立与优化 2.1 情感角色模型建立及特征权值计算 经过对潜在评价对象名词正负角色标注,文本转化为名 词的情感角色实体集合,采用信息增益的方法从中提取特征, 信息增益公式如下: IG(t)=一∑P(Ci)lgP(c )+ P( )∑P(c It)lg P(c It)+ 1312 计算机应用 第35卷 P(i)∑尸(c )lg P(c ) (3) 的领袖代表度卢(W ),n+m为特征项总数,卢(w )的计算公 式如下: 其中:P(C )表示类别C 文档出现的概率,P(t)和P(-t)分别 代表文档包含词条t和不包含词条t的概率,P(el it)和 (( + )/2) P(Ci l£)分别代表文档包含和不包含词条t时属于类别c 的 条件概率。从语料库中按照信息增益递减排序选取2000个 名词情感角色实体作为特征项,形成名词正负角色实体混合 特征集F,其中一部分实体的词源是事先准备的评价对象本 计算所有特征项的领袖代表度,取领袖代表度最大的前t 个特征项形成领袖特征集合 ,其余特征组成非领袖特征集 合R:。将任意两个特征项的归一化点互信息记为: P (W , wj)。假设特征项W 是领袖特征,其特征值计算公式如下: 体库A,对这些角色实体设置较高的影响因子 ( >1), 默认其余特征项影响因子 =1。计算不同特征项影响因子 的公式如下: :{ , 。 。 ‘埘^’’ Wk c4 其中:rank(W )是词条所在本体集合的等级权值, 是缩放 变量。情感角色词源对应的等级权值如表2所列。 表2本体库词条等级权重表 考虑角色实体的文档词频和其在文档中的情感值 SO( ,d)、影响因子 等因素,计算出其在文档中的情感影 响值ep ( ),如式(5)所示: , 、 l SO(W ,d)I’ ‘ d(彬 ) , 印 L J —— 可一 【 ) wi F 文献[14]提出将情感词本身的情感值融人特征值,这里 将角色实体的情感影响值考虑入特征权值计算中,改进TF— IDF(Term Frequency—Inverse Document Frequency)公式如式 (6): :. Weightd(Wk): (6) √∑(V”i d ( )・ 。))。 经过上述操作,情感角色模型形态如式(7): d=( 一, d, , 一, ,d.) (7) 其中:a和m分别为模型中名词正负角色特征数。 2.2特征聚合与情感角色模型空间降维 实验中采用信息增益方法提取情感角色特征,设定宽范 围获得高维特征以保护文本信息的完整,但同时也容易造成 “维灾”。为解决此问题提出特征聚合的概念,即在所有特征 项中选出领袖特征,并整合其余特征的特征值。将同为正角 色或同为负角色的特征称为同态特征。本节以下的描述假定 在原模型中正角色特征的范围内执行。基于文献[2]中点互 信息的方法计算词条之间的相似度,其计算方法如下: PMI(wordI,word2) ( ) (8) 计算某特征项W 与其余特征项的点互信息,并归一化至 [0,1]范围内,设为特征项之间的相似度。将原始向量空间 中各特征项与其他同态特征的相似度求和,所得结果称为W ( .a+∑NPMI(w ,Wi) )‘Size(R・) ——— —一; ∈R】 (10) 对于负角色特征项,执行同样操作。至此完成对大规模 情感角色模型的特征聚合,并保持形态如式(7)所表示的形 态不变。 3 实验 3.1 实验数据与预处理 实验从互联网上选取宣传社会和谐和字数在 300~800的文本共812篇,宣扬淫秽暴力和诽谤的同等 字数规模文本共781篇分别作为正负实验语料,统称语料集 X,从中各选正负语料160篇作为测试集,其余为训练集。 为了进一步验证本文方法的分类性能,选取COAE2014 (http://www.1iip.en/CCIR2014/pc.htm1)提供的测试语料,包 含门户网站、博客和论坛中的新闻性文章,作为语料集Y,从 中选取与语料集X同等数量规模的文本分别作为测试集与训 练集参加实验,并按照评测提供的倾向性判定标准进行人工 标注。 将上述数据集去停用词,使用中国科学院的中文分词工 具ICTCLAS(http://ictclas.nlpir.org)进行分词并标注词性, 建立情感角色模型,初始采用信息增益提取的特征规模为 2 0{30,经过特征聚合将数据规模控制为500。 3.2实验结果与分析 实验中选用SVM分类算法,SVM在文本分类任务中已 经展现出了良好的性能,Pang等 使用SVM分类算法执行 对于电影评论的情感分类任务,并与朴素贝叶斯分类算法 (Native Bayes)和最大熵分类算法对比,结果显示SVM算法 的分类效果最佳。对于SVM算法的实现使用工具LibSVM (http://www.csie.ntu.edu.tw/一ejlin/libsvm)。 同时,选用情感分类的准确率(Precision)和召回率 (Recal1)作为实验结果的评价标准。设tp是判定为正极性实 际为正极性的篇章数量,,p是判定为正极性实际为负极性的 篇章数量, 是判定为负极性实际为正极性的篇章数量,tn 是判定为负极性实际为负极性的篇章数量,准确率和召回率 的计算公式如下: Precisi0,z:f、 + + ‘,n+tn, 1/2 (11) Reeall=f、 +,n+ ,p+tn/1 /z (12) 实验l为在使用语料集x进行实验时,缩放变量 的选 取实验。测试在计算特征词条影响因子时缩放变量oL的设定 对分类准确度的影响,测试结果如图2所示,从测试结果看出 随着 值的变大,分类准确率持续上升,但d值达到2.4时准 第5期 胡杨等:基于情感角色模型的文本情感分类方法 1313 确率趋于稳定并达到峰值,o/值继续变大会导致准确率下降。 于是选取2.4作为缩放变量o/的固定值。由于针对语料集y 并未准备评价对象本体库及对应的等级权值,所以后面实验 中对于语料集l,中的词条均不设定影响因子,即影响因子为 果的提升更为明显;3)传统的建模方法在规模数据缩小的情况 下,分类效果会大幅度下降,本文提出的情感角色模型和特征 聚合降维方法可使分类器分类效果得到较好的保持。 表5不同分类方法在语料集l,上的性能对比 % 默认值1。 奄{L 器 礤 墼 缩放变量 图2缩放变量o/与准确率的关系(语料集 ) 实验2为影响因子作用测试,不设置影响因子时假定所 有词条影响因子均为1。在两个语料集上分别计算是否设置 影响因子时,情感角色模型进行特征聚合前后情感分类的准 确率和召回率,使用微平均方法计算全局准确率和召回率。 实验结果如表3所示,可以看出:在语料集 上经过特征聚合 数据规模为500的情况下,对评价对象本体库A中词条设置 影响因子比不设置影响因子分类准确率和召回率都有一定提 升,相比特征规模为2000且设置影响因子的情况下两项指标 略有下降,但仍在理想范围内;在语料集y上两种数据规模的 测试结果比在语料集 上不设置影响因子的测试结果略好。 可知:1)本文方法对于评价对象本体库及其配套的影响因子 有一定依赖性,但依赖性不大;2)特征聚合效果良好,能够有 效降低特征空间维度并使分类性能维持在高水平。 表3影响因子设置与否与数据规模不同情况对比% 数据集鬟翌 吾 譬 语料集y不设置影响因子 79.32 75.93 84.89 84.16 语料集 不设置影响因子77.63 75.91 84.77 84.2O 语料集 设置影响因子 86.06 85.15 89.26 85.25 实验3为本文方法与传统方法的情感分类性能对比。使 用本文描述的方法结合SVM(Mixed.SVM),使用信息增益提 取文本情感特征结合SVM(Common.SVM)和朴素贝叶斯 (Naive Bayes),共3种方法分别对上述两个语料集训练分类, 比较3种方法在原始规模数据和特征聚合数据下的分类性 能。实验结果如表4、表5所示,表中将各指标表现最佳的实 验结果加下划线显示。 表4不同分类方法在语料集 上的性能对比 % 分析可得:1)在两种特征规模下,朴素贝叶斯算法显示出 来的分类性能较低,不再纳入比较;2)同样使用SVM算法分 类,本文提出的建模方法在不同数据集的两种数据规模下比提 取情感项作为特征的传统方法准确率和召回率均有一定提高, 在配合评价对象本体库和对应影响因子的语料集 上,分类效 4 结语 本文提出的方法将评价对象分为正负两个的角色并 融人其情感值,使模型中的特征项更好地保存了文本的特征, 可以有效地发现隐藏情感信息,同时减少了模型中“离群点” 的出现,在利用SVM算法进行分类的实验中可以控制松弛变 量在一个理想的范围内,从而得到更好的分类效果。今后的 工作重点是:1)减少本文方法对预先准备的评价对象本体库 及配套设置的影响因子的依赖性;2)降低特征聚合降维时的 特征损失度;进一步提升情感分类器的性能。 参考文献: [1 J HATZIVASSILOGLOU V,MCKEOWN K.Predicting the semantic orientation of adjectives[C1//Proceedings of the 35th Annum Meet. ing of the Association for Computational Linguistics.Stmudsburg: Association for Computation Linguistics,1997:174—181. 【2J ZHAO Y,QIN B,LIU T,et a1.Sentiment analysis【J].Joumal of Software,2010,21(8):1834~1848.(赵妍妍,秦兵,刘挺,等.文 本情感分析【J].软件学报,2010,21(8):1834—1848.) [3)TURNEY P,LITrMAN M L.Measuring praise and criticism:infer— ence of semantic orientation from association【J】.ACM Transactions on Information Systems,2003,21(4):315—346. [41 ZHU Y,MIN J,ZHOU Y,et a1.Semantic orientation computing based oil HowNet【J].Journal of Chinese Information Processing, 2006,20(1):14—20.(朱嫣岚,闵锦,周雅倩,等.基于HowNet 的词汇语义倾向计算[J】.中文信息学报,2006,20(1):14— 2O.、 [5】 WEN B,HE T,LUO L,et a1.Text sentiment classiifcation re— search based oil semantic comprehension[J].Computer Science, 2010,37(6):261—264 (闻彬,何婷婷,罗乐,等.基于语义理解 的文本情感分类方法研究【J】.计算机科学,2010,37(6):261 —264.) [6】 RU C,RAO L,WANG T,et a1.Opinion combination recognition and orientation judgment of network information[J】.Computer Sci— ence,2013,40(7):162—166.(汝承森,饶岚,王挺,等.网络信 息中评价搭配识别及倾向性判断[J】.计算机科学,2013,40 (7):162—166.) (7】PANG B,LILIAN L,SHIVAKUMAR V.Thumbs up?sentiment classiifcation using machine learning techniques[C]//Proceedings of the ACL-02 Conference on Empiircal Methods in Natural Lan— guage Processing.Stroudsburg:Association for Computational Lin‘ guisties.2002:79—86. 【8]PANG B,LEE L.A sentimentla education:sentiment analysis u— sing subjectivity summarization based on minimum cuts[C】//Pro— ceedings of Meeting of hte Association ofr Computational Linguistics. Storudsburg:Association for Computational Linguistics,2004:271 —278. (下转第13l9页) 第5期 王荣波等:基于多元判别分析的汉语句群自动划分方法 13l9 of word representations in vector space[C/OL】.[2014—04—2O】. http://arxiv.org/pdf/1301.3781.pdf. based on tree kernel[J].Journal of Software,2013,24(5):1022 —1035.(徐凡,朱巧明,周国栋.基于树核的隐式篇章关系识 [4】 WANG Y.The analysis of English sentence group[J].Journal f U・o niversity of Shanghai for Science aI1 Technology:Social Sciences, 别【J].软件学报,2013,24(5):1022—1035.) [16] ZHOU X,HONG Y,CHE T,et a1.Implicit discourse relation in・ ferenee based parallel arguments【J].Computer Applications and 2004,26(2):30~32.(王跃洪.英语句群分析[J】.上海理工大 学学报:社会科学版,2004,26(2):30—32.) scussion on using sentences group as valid basic unit for [5】 LUO T.DiSoftware,2012,29(9):57—61.(周小佩,洪宇,车婷婷,等. 基于平行论元的隐式篇章关系推理研究【J].计算机应用与软 件,2012,29(9):57—61.) [17] ZHANG Y,LU R,SHEN L.A hybrid method for automatic chi— nese discourse structure analysis[J】.Journal of Software,2000,l1 translation from Chinese to English[J】.Journal of Southeast Univer- sity:Philosophy and Socila Science,2006,8(3):110—113.(罗天 妮.论以句群为汉英翻译的有效基本单位[J].东南大学学报: 哲学社会科学版,2006,8(3):110一l13.) [6] XU F,ZHU Q,ZHOU G.Survey of discourse analysis methods[J]. Journal of Chinese Information Processing,2013,27(3):20—32. (11):1527—1533.(张益民,陆汝占,沈李斌.一种混合型的 汉语篇章结构自动分析方法[J】.软件学报,2000,11(11): 1527—1533.) (徐凡,朱巧明,周国栋.篇章分析技术综述【J】.中文信息学 报,2013,27(3):20—32.) orical structure theory:a the- 【7】 MANN W C,THOMPSION S A.Rhet[18] wu C,ZHANG Q.Research on rules for detecting Chinese sen— tence groups in nature language processing[J].Computer Engi- ory of text organization【J].Text,1988,3(8):243—281. LTAG:extending lexiealized TAG to discourse【J]. [8] WEBBER B.D-Cognitive Science,2004,28(5):751—779. neering,2007,33(4):157—159 (吴晨,张全.自然语言处理 中旬群划分及其判定规则研究f J】.计算机工程,2007,33 (4):157—159.) [19] MIAO J,ZHANG Q.The study of sentence group based on the HNC context theory[C]//The Research on Content Computing nd Itas Applications:9th Chinese National Conference on Compu— nese sentence group[M】.Beijing:The Com- 【9] WU W,TIAN X.Chimercial Press,2000:81—88.(吴为章,田小琳.汉语句群[M】. 北京:商务印书馆,2000:81—88.) [1O】 HAO C.Text paragraph knowledge[M】.Bering:Beijing Press, 1983:l一29.(郝长留.语段知识[M].北京:北京出版社, 1983:1—29.、 tational Linguistics.Beijing:Tsinghua University Press,2007:258 —263.(缪建明,张全.基于HNC语境理论的句群处理研究 CAO Z.Primary research on sentences groups[M】.Hangzhou: [c]//内容计算的研究与应用前沿:第九届全国计算语言学 学术会议.北京:清华大学出版社,2007:258—263.) [20] CHEN Y,SHI X.Automatic partition of Chinese sentence group Zhejiang Education Publishing House,1984:15—17.(曹政.句 群初探[M】.杭州:浙江教育出版社,1984:15—17.) ical stuctrure theory and sentences group analysis [12】 CHEN L.Rhetor[J].Journal of DonghHa University:English Edition,2010,27 (2):177—180. [21】BENGIO Y,SCHWENK H,SENECAL J S,et a1.A neural proba。 bilistic language model[J].Journal of Machine Learning Research, 2003,3(2):1137—1155. [22] BEEFERMAN D,BERGER A,LAFFERTY J.Statistical models 【J】.Journal of Suzhou University:Philosophy and Social Science, 2008,29(4):118—121.(陈莉萍.修辞结构理论与句群研究 【J].苏州大学学报:哲学社会科学版,2008,29(4):118— 121.) oring the rhetorical form of Chinese discourse stnc—r 【l3】 GAO Y.Explture from the angle of SDRT[D】.Chongqing:Southwest Universi— ty,2011,(高芸.从SDRT的视角探析汉语话语结构的修辞格 式[D】.重庆:西南大学,2011.) DE.Logics of conversation【M].London: 【14] ASHER N,LASEARICambridge University Press.2003:6—35. for text segmentation[J].Machine Leaming,1999,34(1/2/3): 177—210. 【23]HEARST L P M.A critique and improvement of an evaluation met。 ric for text segmentation[J】.Computational Linguistics,2002,28 (1):19—36. icit discourse relation recognition 【15】 XU F,ZHU Q,ZHOU G.Impl(上接第1313页) [9]DING X,LIU G,MENG K,et a1.Research and improvement of ilfter algorithm of malicious information based on one—class SVM ACM,2009:1275—1283. a1.A uniifed framework for CroSS- [12] WU Q.LIU Y.SHEN H,etdomain sentiment clssiaifcation『J].Journal of Computer Research [J].Computer Science,2013,40(z2):86—90.(丁霄云,刘功 申,孟魁,等.基于一类SVM的不良信息过滤算法改进[J].计 算机科学,2013,40(Z2):86—90.) [1O] cHEN T,XU R,WU M,et a1.A sentiment classiifcation ad Develnopment,2013,50(8):1683—1689.(吴琼,刘悦,沈 华伟,等.面向跨领域情感分类的统一框架[J].计算机研究 与发展,2013,50(8):1683—1689.) [13] XU L.LIN H,PAN Y,et a1.Constuctring the affective lexicdn approach based on sentiment sentence framework[J].Joumal of Chinese Information Processing,2013,27(5):67—74.(陈涛, 徐睿峰,吴明芬,等.一种基于情感句模的文本情感分类方法 [J]中文信息学报,2013,27(5):67—74.) [1 1]PREM M,WOJCIECH G,RICHARD D.Sentiment analysis of blogs by combining lexieal knowledge with text classiifcation ontology[J].Joumal of the China Society for Scientiifc and Technical Ifnomatrion,2008,27(2):180—185.(徐琳宏,林鸿 飞,潘宇,等.情感词汇本体的构造[J].情报学报,2008,27 (2):180—185.) [14] MA H.UU Y。WANG L,et a1.An analysis and comparison of three methods for document semantic orientation recognition l J J. New Technology of Library and Information Service,2007(4):43 [C]//Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery nd Dataa Mining.New York: 47.(马海兵,刘永丹,王兰成,等.三种文档语义倾向性识 别方法的分析与比较[J].现代图书情报技术,2007(4):43— —47.