◎2021年第6期
公共图书馆用户在线口碑情感分析
——以副省级市图书馆大众点评网评论为中心*
彭秋平,吴思洋本田飞度多少钱
*本文系国家社科基金一般项目“公共图书馆影响力评价之体系构建与实证研究”(项目编号:18BTQ019)研究成果。
摘要用户对公共图书馆的评价带有强烈的情感倾向,文章通过对用户评论展开情感分析与文本分析,揭示公共图书馆服务体验的用户满意度,展示公共图书馆的用户口碑。文章选取起引领作用的15所副省级市公共图书馆为对象,基于情感词典匹配的情感分析方法,对大众点评网上用户评论进行情感均值计算,并根据评论分词结果,构建起包括馆舍位置、空间体验、设施设备、馆藏资源、读者服务、馆员印象六大指标的公共图书馆用户评价体系,结合每一指标下用户差评内容,提出公共图书馆改善服务的措
施建议。研究结果表明,公共图书馆用户评论多持好评或中立态度,口碑良好,但其差评影响着用户使用图书馆意愿与体验,需结合差评内容针对性改进图书馆服务,改善用户口碑。
关键词公共图书馆用户口碑情感分析大众点评网
引用本文格式彭秋平,吴思洋.公共图书馆用户在线口碑情感分析——以副省级市图书馆大众点评网评论为中心[J].图书馆论坛,2021,41(6):141-149.
Users ’Evaluation of Public Libraries Based on Sentiment Analysis of Comments from Dianping
PENG Qiuping ,WU Siyang
Abstract
By analyzing user comments from evaluation websites using sentiment analysis ,it would be helpful to
reveal users'true emotional tendencies and their level of satisfaction.Based on the emotion lexicon method of
sentiment analysis ,this paper calculates the average emotional value of online user reviews for 15sub-provincial public libraries and constructs an evaluation system of public library user reviews with six indicators including library location ,reading space ,facilities ,collections ,reader activities and impression on librarians ,and puts forward some suggestions to improve the services.The research results show that most users either give positive evaluation or stay neutral so public libraries can always get good reputation.However ,there are some negative
reviews that would affect users'willingness and experience of using the library.It is necessary to improve library services in regard to negative review contents.
Keywords public libraries ;user evaluation ;sentimental analysis ;dianping
0引言
2020年端午假期,东莞图书馆农民工读者
吴桂春的留言引起广泛关注:“想起这些年的生活,最好的地方就是图书馆了,虽万般不舍,然生活所迫,余生永不忘你,东莞图书馆。”[1]这则
141
太佳高速公路留言字里行间流露出这位读者对东莞图书馆浓厚的不舍与难忘之情,反映的是读者对图书馆价值的认同。良好的评价有利于好口碑形成,用户对图书馆的认同不断深入,吸引政府加大对其投入,进一步发挥图书馆的社会价值,形成可持续发展的良性循环[2],反之,差评下的差口碑则会产生恶性循环。识别用户评价,重视口碑塑造,是图书馆营销自我、改善服务、提升价值的重要环节。Web2.0时代,除线下留言外,用户常在论坛贴吧、购物网站等网络平台上发表在线评论,以传播观点和交流体验,他们不仅是信息的被动接受者,也是信息的主动创造者、分享者和交流者[3]。用户在网络发表对图书馆的评价,往往带有强烈情感倾向,由此形成图书馆的在线口碑,影响着其他潜在用户走进或利用图书馆服务的意愿及感受。
以往分析公共图书馆(以下简称“公共馆”)用户在线口碑的研究多以新浪微博[4-5]、百度贴吧[6-7]等社交平台作为主要信息源,近年出现以大众点评网等第三方点评网站作为数据源的图书馆评价研究。吴梦菲等[8]以大众点评网上15个城市馆的总体评价、基本信息、具体评价、标签以及问答内容等方面作量
化统计分析;沈菊等[9]采用内容分析法,描绘大众点评网用户评价刻画的图书馆形象;张文亮等[10]应用频数分析、偏度分析、相关性分析和情感性分析等方法对大众点评中39所省级公共馆进行研究,从读者视角分析省级公共馆的服务现状和评价情况。大众点评网是中国领先的本土生活信息及交易平台,其首创并领导的第三方评论模式中,用户可以结合自身体验和感受自由发布对商家的评论[11],成为其他用户决策前的重要参考。不同于微博、贴吧等平台的自发无序评论,大众点评网的用户评论是专门针对某一特定图书馆的使用体验进行评价,同时设有“书籍”“环境”“服务”三方面及整体印象打分,从不同角度展现公共馆的用户使用感受。
从定位看,副省级市公共馆多以其良好的服务效能、完善的体系建设等在我国公共图书馆事
业发展中发挥全方位的引领作用。对于读者而言,他们在体验副省级市公共馆服务后的评价如何?这些用户评价重点关注图书馆哪些服务内容?不同服务内容下用户评论情感是否存在偏差?为解决以上问题,本文选取15个副省级市公共馆为研究对象,抓取其大众点评网上用户评论,对评论内容进行文本挖掘及情感分析,计算公共馆的用户评价情感值,并构建公共馆用户评价指标体系,关注各项指标下15个副省级市公共馆的评价情况,挖掘评论内容,提炼差评导向下公共馆发展策略,以期为公共馆改善用户口碑提供参考。东风huv
1研究方法及数据收集
情感分析是指通过自动分析商品、服务、任务等研究对象的相关评论文本内容,发现评论者对该研究对象的褒贬态度和意见[12],多用在商品评论和网络舆情两个领域。在图书馆学领域,越来越多的学者探索应用文本挖掘、情感分析等研究方法处理非结构化数据,以分析用户对图书馆体验的评价及情感倾向。王晰巍等[13]基于“掌阅图书馆”畅销书籍的用户评论进行情感分析;Zhou Q等[14]识别亚马逊网站上学术书籍的在线评论的情感极性和情感价值等;阳玉堃[3]对微博平台用户对图书馆的评价进行文本情感倾向分析,表明用户对图书馆形象主要持积极态度;张文亮等[10]利用情感分析,对39个省级公共馆的大众点评网用户评论进行整体情感值计算,得到“用户对公共馆的评价态度是正面的”结论。已有的研究仅对用户评论进行了情感极性分类,未计算情感强度,并且未对用户评论进行指标的拆分,相关研究有待深入。本研究挖掘15个副省级市公共馆大众点评网的用户在线评论,对其进行文本挖掘与情感分析,构建图书馆评价指标体系,识别用户对每一所图书馆以及图书馆各项服务内容的情感倾向,刻画公共馆的用户口碑基本形象。
1.1情感分析
本研究使用基于情感词典匹配的情感分析方
142
◎2021年第6期
法,对所收集到的15个副省级市公共馆大众点评网评论进行分析,该方法主要包含两个重要环节,分别为情感词库的构建以及基于词典匹配的情感分析算法。富华桥
(1)情感词库构建。本研究以大连理工情感词汇本体库[15]作为基础词典进行扩充,对分词结果标注词性,取形容词、动词和感叹词,去除在评论文本中出现过且情感词典中已有的情感词,将剩余词语按照词频倒序排列,筛选出频率大于30且具有情感倾向的词语,并按该本体库规则,人工标注情感词情感极性以及情感强度,添加入情感词典,构建基于用户在线评论文本的公共馆用户评价情感词典[16]。添加常用程度副词、否定词词典
[17]
并设置相应权重。公共馆用户评价情感词典、程度副词以及否定词词典共同构成了本研究的情感词库。
(2)基于词典匹配的情感分析算法。基于词典匹配的情感分析算法具体计算流程见图1[18]:利用逗号、句号等标点符号对得到的用户评论进行分句;将分句结果进行分词和去停用词操作;借助情感词典,对分句中的词语进行情感极性和强度标注;将情感词前出现的词语分别与程度副词词典以及否定词词典进行匹配,如果成功匹配则将上一步骤所标注的情感强度与该副词权重相乘;将上一步骤得到的积极情感强度与消极情感强度分别进行累加,得到积极情感分值与消极情感分值;因感叹号有情感加强的作用,故对感叹句进行处理,当发现句末是感叹号时,扫描感叹号前的情感词,若为正向情感,则将积极情感分值加2,若为负向情感,则将消极情感分值加2;将每个分句的积极情感分值进行累加、消极情感
分值进行累加,当前评论最终的情感值为总的积极情感分值减去总的消极情感分值。1.2研究对象及数据收集
根据1995年中央机构编制委员会印发的《关于副省级市若干问题的意见》,广州、武汉、杭州等15个城市被划为副省级城市,以发挥其中心城市的辐射作用。作为经济较发达地区公共文化服务的主要载体,这15个城市的市公共馆是我国城市图书馆体系的中坚主导力量,对我国图书馆事业的建设与发展中起着风向标的作用[19]。本研究的数据来源是大众点评网上15个公共馆的用户评论,抓取评论用户ID、评论时间、评论内容、评论点赞数以及评论回复数等字段,并清洗无效评论数据。截至2020年1月,共抓取评论数量共8,646条,各馆评论数量分布情况如表1所示。广州图书馆及深圳图书馆的用
户评论数量已超1,000条,且大众点评网官方评分较高,用户关注度及好评度均表现较佳。
图1
基于词典匹配的情感分析算法流程图
143
2公共图书馆用户评价整体情感评分
非机动驳船2.1各副省级市公共图书馆情感均值计算结果
为计算各公共馆用户评论的情感均值,利用所构建的情感词库及基于词典匹配的情感分析算法,计算各图书馆每条评论的情感值,再根据每条评论的点赞数赋予权重,计算各图书馆的情感均值,计算方法如公式(1)所示:
----------sentiment =∑1
N
sentiment i ∗n i
∑1N n i
汽油涨价时间
(1)
其中,sentiment 代表情感均值,N 代表评论总数,sentiment i 代表该条评论的情感值,n i 代表该评论的点赞数加一,即该条评论认同的人数(含评论者本人),计算结果如表2所示。由表2看出,在15个公共馆中,宁波图书馆的情感均值最高,用户对宁波图书馆的评论多为好评。其中,排名靠前的公共馆多位于长三角或珠三角地区,依托雄厚的经济实力发展公共文化服务,用户评论数量较多且好评居多;而排名靠后的公共馆多位于内陆或东北地区,用户评论数量相对较少,且差评比例较高,导致情感均值偏低。2.2各馆情感均值得分与大众点评网得分对比
根据美团网2020年1月8日发布的点评规则[20](大众点评网于2015年与美团网合并),大众点评网上,商户的星级和评分由用户评论计算的得出,且商户星级和评分为动态指标,根据点评用户专业度、点评质量、添加时间、诚信度、点评数量等多种要素加权由系统综合计算得出。公共馆评分包括对图书馆的整体满意度以及对“书籍”“环境”“服务”的体验感受,由此得出图书馆的用户评价星级和评分结果。从整体看,大众点评网上15个副省级市公共馆的评分均在4.50分以上(满分制为5分),其中10个公共馆的评分高达4.9分。对比15个副省级市公共馆的大众点评网评分以及用户评论情感均值,得到如图2折
线图。从评分规则来看,大众点评网利用1~5分制星级打分,用户手动点亮评分星级,操作更加简单方便,使用用户相对较多,但打分区间较为狭窄,只能粗略反映用户的评价情况。情感分析依据的是用户评论内容,表达开放自由,内容丰富详实,情感复杂多元,能够较准确地反映用户的切身体验及感受。并且大众点评网评分的离散系数为0.019,基于情感分析评分的离散系数为
表1副省级市公共馆用户评论数据抓取情况公共馆广州图书馆深圳图书馆杭州图书馆厦门市图书馆沈阳市图书馆宁波图书馆青岛市图书馆武汉图书馆金陵图书馆大连图书馆济南市图书馆长春市图书馆成都图书馆西安图书馆哈尔滨市图书馆
大众点评网评分(5分制)
4.924.934.924.954.914.954.904.904.904.874.934.864.894.864.55
评论数量(条)2,1811,14286069559654651839436634126224721220977
注:厦门市图书馆统计了位于思明区的总馆及位于集
美区的新馆;位于南京市的南京图书馆为省级公共馆,金陵图书馆为副省级城市公共馆,故统计金陵图书馆的用户评论;济南市图书馆统计了旧馆与新馆;厦门市图书馆及济南市图书馆大众点评网评分均取评论最多的馆分值。
表2各副省级市公共馆情感均值计算结果公共馆宁波图书馆济南市图书馆金陵图书馆厦门市图书馆深圳图书馆广州图书馆杭州图书馆长春市图书馆沈阳市图书馆武汉图书馆成都图书馆哈尔滨市图书馆青岛市图书馆大连图书馆西安图书馆
情感均值19.3218.7117.0016.5216.2916.1215.8415.1214.4414.0813.8213.0812.1411.8311.64
144
◎2021年第6期
0.151,基于情感分析的评分结果离散程度更高,更直观反映各副省级市公共馆用户口碑的差距。所以利用情感分析计算出的图书馆评价结果与大众点评网原有的评分存在一定的差异性,互为补充。
3公共图书馆用户评价各指标情感评分
用户在作出评论时,多关注图书馆资源或服务带来的体验和感受,为了解用户口碑形成的影响因素,本研究深入剖析用户评论,构建公共馆用户评价指标体系,并分析各指标下15个副省级市公共馆的用户评价情感得分,同时就用户差评内容提出图书馆改善建议,提高图书馆服务的质量与水平。
3.1公共图书馆用户评价指标体系构建
基于8,646条用户评论,使用Python 的第三方自然语言处理库jieba 库进行中文文本的分
词处理,去掉停用词,对分词后词表进行词频统计并倒序排列,得到词频超200的词语共267个,通过人工标注得到与公共馆直接相关的特征词46个。以用户评价抽取的46个特征词为基础,结合柯平等[21]提出的空间、资源、服务、管理这图书馆四大要素,以及周九常[22]提出的建筑形象、服务形象、馆员形象、管理形象、文化形象、知识资源形象、基础设施形象、综合形象八个公共馆社会形象体系等理论基础,构建起涵括馆舍位置、空间体验、设施设备、馆藏资源、读者服务、馆员印象六大指标的公共馆用户评价体系(见表3)。大众点评网中,用户在评论时更关注“读者服务”这一指标,提及频率高达45.10%,主要涉及读者证办理、借阅服务、自习服务、阅读推广活动等内容。其次是“空间体验”与“馆藏资源”两个指标,均达16%左右,其中“空间体验”涉及环境装修、
表3公共馆用户评价指标、特征词及出现频率
用户评论指标馆舍位置空间体验设施设备馆藏资源读者服务馆员印象
指标特征词
建筑、地铁站、交通、位置
环境、阅览室、装修、氛围、自习室、借阅室
桌子、设施、沙发、座位、电脑、机器、空调、充电、设备、书架书籍、藏书、馆藏、图书、资料、文献、杂志
看书、学习、自习、还书、展览、办卡、借书证、活动、借书、借阅、服务、安检、讲座、
外借、闭馆、阅读、续借、押金工作人员
指标词出现频率(%)
8.6416.1112.5415.9345.10
1.68
图215
所副省级市公共馆大众点评网评分及情感均值对比图
145