Posts

所有标签

Redis algorithm beego centos coding docker mysql nginx 分布式 性能调优 技术 数据处理 生活 笔记 算法 网络IO 职场
2018-04-21 / / algorithm

2007年,GoogleMoses Charikar发表的一篇论文“detecting near-duplicates for web crawling”中提出了simhash算法,这也是google出品的用于海量网页去重的一个局部敏感哈希算法。