Posts

所有分类

algorithm centos coding docker golang leetcode life mongodb mysql nginx 网络IO
2018-04-21 / / algorithm

2007年,GoogleMoses Charikar发表的一篇论文“detecting near-duplicates for web crawling”中提出了simhash算法,这也是google出品的用于海量网页去重的一个局部敏感哈希算法。