基于社交网络的谣言检测综述梁兆君,但志平*,李奥,刘龙文,吴汶奇(三峡大学计算机与信息学院,湖北宜昌443002)摘要院随着互联网技术的飞速发展,互联网的言论自由、资源共享、信息交互等特性,滋生了大量虚假信息和谣言,网络谣言传播影响人们正常的生活秩序,有效并快速检测网络谣言并抑制其传播至关重要。对当前国内络谣言检测工作进行了综述,对网络谣言检测研究中特征及分类模型的选取进行了分析总结,并对未来网络谣言检测提出了建议。关键词院网络谣言;谣言检测;综述1概述的正确率分别达75%尧73%袁性能优于PTK袁由此可见上下文敏感的PTK对不同类型的谣言都是有效的遥2.3基于网络特征的谣言检测在线社交平台允许用户转发消息袁以微博为例袁当近些年来各大网站都在建立自己的辟谣网站袁但网络辟谣平台需要用户举报及各个领域专家的审查和判别袁消耗大量人力尧时间且准确度不足遥而网络谣言的提前判别至关重要袁谣言爆发早期以较高的检测准确率识别谣言是目前谣言检测面临的诸多挑战之一遥转发他人微博时袁会有野@***冶的标签提醒袁用来区分原始用户和转发用户遥Qazvinian[3]等人提出网络特征袁当用户Ub转发用户Ua发布的消息M时袁若转发用户Ub或原始用户Ua之前发布或者转发过谣言袁则消息M是谣言的可能性非常大遥实验结果显示基于网络特征的谣言检测平均精确率约90%以上袁平均召回率约70%以上袁分析可知引入网络特征可以调高谣言检测性能遥2基于特征的网络谣言检测根据网络谣言信息的不同特点袁研究者们选用不同的特征进行谣言检测工作袁对网络谣言检测的特征进行总结遥2.1基于用户特征的谣言检测用户是谣言传播的媒介袁用户特征包括用户昵称尧注册时间和粉丝数等遥Liang[1]等人研究了消息原创用户及消息读者用户的特征遥分析发现普通用户日发帖量远高于谣言用户袁作者训练了支持向量机等5个分类器袁实验结果显示袁相较于其他基线特征袁基于用户特征的谣言检测模型的准确率和F1值分别提高了13.14%和16.68%遥分析可知基于用户行为特征的谣言模型不仅提高了预测的准确性袁而且比基线方法能检测到更多的谣言遥2.2基于传播特征的谣言检测Ma[2]等人提出传播树内核渊propagationTreekernel,3基于分类模型的网络谣言检测基于分类的谣言检测借助自然语言处理尧机器学习等技术方法袁从谣言内容尧用户及传播中提取或挖掘显著信息袁并将它们应用到谣言检测中遥在传统方法的基础上要提高检测的准确率袁需要对谣言检测分类模型进一步改进袁现有分类模型主要分为传统机器学习模型和深度学习模型遥3.1基于传统机器学习方法的谣言检测Kwon等人[4]提出一种随机森林分类器渊RandomFor鄄PTK冤袁将传播特征主要集中传播结构上而非时间特征出了上下文敏感的PTK渊cPTK冤袁并实验于数据集Twit鄄ter15和Twitter16遥estClassifier袁RFC冤袁作者使用3种参数来拟合随机推文体积曲线并分别建立了基于决策树尧随机森林尧SVM3个分类器袁作用于时间尧结构和语言特征遥实验显示此可见当特征尧数据集相同时袁分类器的选择对于谣言作者简介:梁兆君渊1995-冤袁女袁硕士袁研究方向院自然语言处理曰但志平渊1976-冤袁男袁通讯作者袁教授袁硕士生导师袁研究方向院模式识别尧自然语言处理遥随机森林分类器的表现最好袁精确率达到了93.5%遥由上遥由于传播树内核忽略了子树外的线索袁所以作者提实验结果显示作者提出的PTK谣言检测模型袁分别比基线方法中表现最好的GRU模型检测精确度提高了6.4%尧8.9%袁可以看出传播结构在谣言检测中的重要性袁而cPTK在实验24小时内袁在Twitter15尧16上12020.04识别的结果影响很大遥3.2由于传统采用手工制作特征的模型基于深度学习方法的谣言检测袁在学习深层潜在特征及各个特征之间的相关性方面受到袁所以提出基于深度学习方法的谣言检测模型遥谣言袁Ma[5]等人提出利用循环神经网络渊RNN冤检测微博并分别在Twitter和微博数据集上进行实验袁并与SVM-TS作者提出的模型在等手工制作特征模型进行比较Twitter尧微博数据集上优于所有基线遥实验结果表明方法袁其中GRU-2在Twitter和微博数据集上的准确率分别为88.1%和91.0%袁实验结果分析可知循环神经网络的序列结构非常适合谣言检测任务袁检测准确率有大幅提升遥刘[6]等人采用卷积神经网络渊CNN冤检测微博谣言袁模型包含一个卷积层和一个池化层袁使用Doc2Vec训练向量矩阵遥此模型与RNN模型进行比较袁精确率提高了10.2%袁间关系来构造特征由此可见由于袁比CNNRNN模型通过发现微博谣言事件模型更适合进行谣言检测遥现有模型多倾向于捕捉先验事件的特定特征袁从而降低了对新出现的突发谣言事件的检测率袁因此分类模型需要学习所有事件之间的共性特征遥2018年Wang[7]等人提出一种事件生成对抗网络渊EANN冤用来检测新出现的假新闻遥此模型可以获得事件的固定特征袁作者将EANNRNN模型的正确率模型与att-RNN尧F进行比较袁实验显示EANN比att-1分别提高了10.3%尧16.5%遥作者去除EANN模型中的事件鉴别器袁生成变体渊EANN-冤袁在Twitter数据集上实验结果显示EANN模型的精确率和F1值比EANN-分别提高了1.2%和10.2%袁分析可知引入事件共享特征可在一定程度上提高网络谣言检测的准确率遥针对现有工作中的不足袁Ma等人提出基于RNN的生成对抗网络渊GAN冤谣言检测模型[8]拟谣言在时序上的无关特征变化袁可以有效训练模型的袁通过生成器模关键特征提取能力遥该模型利用GRU对文本序列进行特征学习袁采用对抗式训练来提高判别器的分类能力袁在4Twitter研究挑战及展望数据集上的该模型表现优于其他基线模型遥社交网络上的谣言每时每刻都在影响者大众的日常生活和网民对网络的信任度袁社交网络谣言检测是个机遇也是个挑战袁未来社交网络谣言检测面临的挑战有院渊1冤自动谣言检测不灵活遥并及时遏制其传播渊2冤实时检测遥袁谣言传播潜伏期检测核实谣言事件能让公众信服需要证明此事件是谣言的证据渊3冤获取谣言证据袁判断一个事件是否为谣言袁这样才使袁并网络谣言检测过程严谨遥参考文献[1]gingLiang,systemsGang,onComputationalbasedetal.Rumoronusers爷identificationinmicroblog鄄Socialbehavior.Systems2.3IEEE(2015)Trans鄄99-108.actions:[2]JinginmicroblogMa,WeipostsGao,usingandKam-FaipropagationWong.Detectrumorsnellearning.InProceedingsofthe55thstructureAnnualviaMeet鄄ker鄄ingoftheAssociationPapers)for.volumeComputational1,pagesLinguistics2017.(Volume1:Long708-717.[3]Qazvinianhasit:identifyingV,RosengrenmisinformationE,RadevinDmicroblogsR,etal.RumorEmnlp,2011:15-1599.[J].[4]KwonRumorSPropagation,ChaM,JunginOnlineK,etSocialal.ProminentMedia[C]Features.IEEEof[5]InternationalMaJ,GaoW,ConferenceMitrarecurrentP,onetDataneuralal.DetectingMining.IEEE,2013.networksrumors[C]//Ijcai.from[6]2016:microblogs刘政3818-3824.with测[J],卫志华.计算机应用,张韧弦,2017,.基于卷积神经网络的谣言检37(11):3053-3056.[7]Wang,worksoftheforYaqing,24thmulti-modaletal.Eann:acmsigkddfakeEventadversarialneuralnet鄄internationalnewsdetection.Proceedingsknowledgediscovery&datamining.2018.conferenceon[8]MabyPromotingJ,GaoW,InformationWongK-F.CampaignsDetectRumorswithGenerativeonTwitterAdversarialference,2019:Learning3049-3055.[C]//TheWorldWideWebCon鄄2020.04155