Posts

2019-01-13 / / coding

Websocket是实现了客户端与服务端完全全双工通讯的一种协议,支持服务端和客户端之间的互相交互,它是在Http协议的基础之上扩展而来。

2018-12-23 / / life

我在2018年的末尾,回首过往,也反思自我。

2018-12-10 / / life

生活有些时候就像是一潭死水,有时候又像是波涛滚滚的大江。死水里的鱼在吃着腐肉,长江里的鱼在跃龙门。

2018-11-29 / / life

即将离开,蓦地舍不得。

2018-04-21 / / algorithm

2007年,GoogleMoses Charikar发表的一篇论文“detecting near-duplicates for web crawling”中提出了simhash算法,这也是google出品的用于海量网页去重的一个局部敏感哈希算法。

2018-04-12 / / mongodb

最近在使用LSI进行海量去重时发现效率及其低下,所以采用了mongodb内置的mapreduce来提升海量数据筛选的速度和性能。