博主大过年的鼓捣上了 磁力种子搜索技术。白天喝点,晚上搞搞站点,买了一千多的服务器。最近稍微了解了下 磁力链接的原理,搞了个bt搜索站,在这里贴上站点地址BtGoogle.net com 域名被人家注册了,发现net域名毫不犹豫抢注了,感觉btgoogle的域名能沾点google的光,哈哈。恰巧工作中 也是做搜索相关的工作。因为对bt站这种本身技术和时间投入性价比不是很高, 所以没有太深入去搞, 不过确实感觉这个技术想做大还是没有天花板的, 博主搞的源码实现是 nginx + mysql+ python + sphinx + coreseek。服务器配置 G口带宽(实际也就5M,坑死) + 64G SSD + 4T 硬盘 + 8GRAM。每天爬取最新种子10w——20w条之间。配置在有钱人看来 算是很低了。现在也就采集一千四百多万条种子。咨询过一些 bt 搜索领域的前辈, 这种站,见过流量过4M的 站长,普遍反应很是涉及版权问题。流量大起来,各种版权投诉,不解决,云服务商就会k站。当然咱还没走到那一步。其实博主的站从架构上很有扩展性,myql 因为数据量上千万太大,分库分表是趋势,可以尝试最新的TiDB技术来解决分库分表的痛点。sphinx虽然索引速度快,但是实时性和高可用性不如elasticsearch,web端的迭代等等等等有很多可以优化的地方。不过没有时间去搞这些东西。从内容维度来考虑,急需开发垃圾信息召回过滤功能,机器学习那一套东西又派上用场了;还可以用推荐算法去搞一搞基于用户的推荐技术;基于用户反馈的版权信息识别技术。
今年一直到 6月底,没有其他事儿,打算去运营一些站,圆了一直以来的站长梦想, 毕竟工作以后 没有时间去搞运营了。前段时间注册了个 itzyshare.com 的域名,打算做一个IT资源分享站。discuz刚升级到3.4,来配合qq互联的第三方登陆。改段时间会试着上线运营。博主最近心累啊,脖子颈椎不好,天天陪客,酒厂里各种礼数太费脑子,倒是因为年龄增长,感觉自己有所担当了,也了解了很多乡里乡亲各种家长里短,以及情理方面的事情。
谈一谈最近的规划:
- 驾照还有两科快到期了
- 《时间简史》读完它
- 数学
- 金融