我选用了综合排名第一的悦花来獲取评论
因为天猫的评论只能抓取99页所以一共有1980条数据,删除无效数据后有1700条左右
数据量比较少,分析结果可能不准确仅供参考
用sonwnlp進行情感分析并绘制情感分布直方图(以0.6为界限,0.6分以上认为是积极的0.6分以下是负面的)
情感分布如图所示,可以看出评分为0附近(极差评)的数量还是很多的从0.6这个界限看,好评稍稍多余差评但是总体来看评价并不高,有点出乎意料
我对评论进行了词频统计(代碼参照之前的文章),发现排名在前四的几种花分别为玫瑰、康乃馨、睡莲、百合所以又分别对出现这四种花的评论进行统计绘制直方圖。
分布与总体类似都呈现凹字形,因为样本太少不做具体分析
总结:作为花花爱好者,曾对这种包月鲜花非常感兴趣除了花加还囿花点时间等等。因为不知道会收到什么样的鲜花所以收到花时既有惊喜也有失望,个人感觉失望的情况比较多比如花花不是自己喜歡的品种,花花的状态不好花的数量少等各种情况。我认为这是包月鲜花这种非标准化商品有如此多负面评价的原因之一