stackoverflow的离线版本

stackoverflow的离线版本

前不久亚马逊s3宕机了几小时,再前不久gitlab也宕机了。这些服务从条款,功能的描述上来说,这样的宕机是不可能发生的!当然已经发生了,这对程序员群体的影响还是挺大的。本来我是很支持互联网是很脆弱的这一说法的,这些事件,当然不止这里提到的两个,不断的印证这一观点。然而我们却很难在短时间能有很好的办法应对。

很早以前我就在朋友圈里面调侃兜售S.O的离线版本,当然这肯定是开玩笑的。没有尝试过写爬虫去抓取内容,如果没有撒反爬虫机制的话,应该也不困难,就是很难想象我要用大的硬盘来存储这些数据。

之所以有来个真的离线版我其实也是有我的思考的。我一般到达S.O都是首先通过google的,google擅长什么啊?搜索,那么我如果光有个离线数据,没有google的搜索能力,有什么用?

等我空了研究一下,看看自己搞一个搜索的难度,如果能够达到80% google的效果,我觉得应该还是可以使用的一个程度。

发表评论

电子邮件地址不会被公开。 必填项已用*标注