问题引入
一个有经验的网购者能够靠大脑思维能判断一个评价的是好评还是差评,但是一个网购新人却很难分辨的。如果让一个有经验的网购者说出他判断评价的过程,那是否就可以将这种思维用计算机模拟呢?是否也能够精确地判断这个评价到底是隐含着好的评价还是差的评价呢?
评价分类
好的评价
一个好的评价,必定是经过用户使用过后,真实的感受,而在当前网购中,商家往往为了追求好评率而采用现金红包来刺激评价,这样则大大的降低了评价的真实效果。那么有效的评价特征是什么呢?
1.使用之后,感觉***。这种必定是使用过后的感觉,无论是好是坏,都有一定的参考意义
2.第二次买了,***。这种是回头客,不用说,商品对这个人来说必定是比较好的
无意义的评价
无意义的评价则占据了多数,比如:
1.还没用,感觉还好。这种则是纯属无意义的评价,都还没用,怎么知道好还是不好呢,可能是为了现金红包?
2.商家态度好,好评。我们买的商品,和商家的态度并没有多大关系,因此这类评价对我们判断商品是否好坏并无意义。
差的评价
有些评论会带有一些善意,虽然东西不太好,但是由于商家服务态度好,评论语气也会比较好,很难鉴别出来商品到底是好还是不好,因此需要将那些委婉的评价隐含着对商品不好的信息找出来,转化成不好的评价。
判断好评与差评
level1:形容词判别(关键词判别)
第一个level则是根据关键词判断是好评还是差评,通常这须收集代表好的词汇和代表差的词汇。
词汇一般是形容词,比如好的形容词有:好,精致,美观等等,不好的形容词有:一般,粗糙,太差等等。
但是如果只使用关键词匹配就会出现这种情况,以下面的评价为例子:
一点都不好,也不美观!
关键词匹配则会匹配到“好”,“美观”,原本是差评,如果只是关键词匹配,那么差评可能会变成好评
引入副词
副词为修饰形容词或者副词本身的词汇,表示程度,关系,否定等等。
比如上面的“不”就是一个副词,修饰后面的“好”和“美观”,那么原来的语句就很明确了。用副词加上形容词的判别方法,则可以对语句做出一个较为准确的判断。
不过这里又有一个问题,比如下面的评价
刚买来,还不知道好不好用
这里程序从前往后找,依次会找到“不”,“好”,“不”,“好”这四个关键词,那么按照修饰语,不则修饰后面的好,判断的结果是两个不好,那么明明是一个中性的评价,则成为了不好的评价,判断失误,因此这里还需要引入修饰距离
引入修饰距离
修饰词语被修饰词的间隔我定义为修饰距离L,比如“不知道好”,这个“不”与“好”之间的距离L为2后面的“好不好”,“不”与“好”之前的修饰距离L为0,那么可以使用一个阈值M,当L<M的时候,修饰才有效,否则无效,这样就能够有效的减少误判。
level2:判断评价是否有意义
对于一些无意义的评价,总有着相似的特点,比如:
1.给朋友买的,给家人买的,给***买的等等,然后后面接一句,***说还好。这种评价是无意义的,因此需要排除。
2.有些用户习惯给好评,一般还没用就给好评了,这种也是无意义的
3.商家为了追求好评,用红包返现来刺激用户,这种也是无意义的,但是找出这类评价太困难。
抛开这些无意义的评价,评价的水分就少很多了。
赞赏
微信赞赏
支付宝赞赏