如何解决页面相似度过高的问题?
发布日期:2015/6/29 17:11:51     点击率:     
[导读] 一些相似度高的词或重复结果的词如果要做,就看id集合的数量了,假设结果有100个,每页显示20个 你可以把其中5个词只显示1页的数据,确保不重复。..
    如何解决页面相似度过高的问题?
  1、获取词相关的内容集合,可以把id聚合在列表,进行倒排序;
  2、对id集合进行去重,或相似度高的去重处理;
  3、根据剩下的id集合,进行关键词的筛选,取出合适的做;
  剩下的一些相似度高的词或重复结果的词如果要做,就看id集合的数量了,假设结果有100个,每页显示20个 你可以把其中5个词只显示1页的数据,确保不重复。当然如果进行适当的混淆,还可以再多点的词。
  如果有分页,nofollow去掉分页。
  4、增加页面的评论功能;
  5、增加随机文章页面;
  6、TAG标签;
  7、“热门文章”、“本周热门文章”、“统计热门排行”等。
    如何解决页面相似度过高的问题?
  1、获取词相关的内容集合,可以把id聚合在列表,进行倒排序;
  2、对id集合进行去重,或相似度高的去重处理;
  3、根据剩下的id集合,进行关键词的筛选,取出合适的做;
  剩下的一些相似度高的词或重复结果的词如果要做,就看id集合的数量了,假设结果有100个,每页显示20个 你可以把其中5个词只显示1页的数据,确保不重复。当然如果进行适当的混淆,还可以再多点的词。
  如果有分页,nofollow去掉分页。
  4、增加页面的评论功能;
  5、增加随机文章页面;
  6、TAG标签;
  7、“热门文章”、“本周热门文章”、“统计热门排行”等。
更多推荐
© 2019 兰州微亿网络科技有限公司版权所有   陇ICP备14001630号-4 

甘公网安备 62010202000838号

 
XML