算法识别互联网新闻趋势引导者

2012-07-09 10:46:04来源:solidot作者:

互联网上的大部分信息要么是复制拷贝粘贴,要么是重复使用或修改措辞。因此同一类信息会有许多新闻报道,这种现象被称为趋势,但谁是趋势的引导者(即信息的最早发布者)则是网络数据挖掘的关键问题。德国柏林工业大

互联网上的大部分信息要么是复制拷贝粘贴,要么是重复使用或修改措辞。因此同一类信息会有许多新闻报道,这种现象被称为趋势,但谁是趋势的引导者(即信息的最早发布者)则是网络数据挖掘的关键问题。德国柏林工业大学的研究人员利用算法识别趋势的引导者,他们的方法本质上是根据关键词生成新闻网站的即时快照,然后比较结果寻找最早的报道源头。

研究人员在2011年监视了96个科技新闻网站,识别出了10大趋势引导者:

  • businessinsider
  • arstechnica
  • engadget
  • techcrunch
  • mashable
  • venturebeat
  • techdirt
  • theregister
  • forbes
  • guardian
关键词:互联网新闻

赞助商链接: