29 Responses

  1. 天一
    天一 2013 年 9 月 2 日 at 23:34 | | Reply

    单引号目测是中文格式的。。。

  2. 肖松
    肖松 2013 年 9 月 3 日 at 09:46 | | Reply

    学习了!

  3. 秣马儿
    秣马儿 2013 年 9 月 3 日 at 11:05 | | Reply

    好奇博主拿到所有专辑干什么用

  4. 窝窝头
    窝窝头 2013 年 9 月 3 日 at 13:12 | | Reply

    加锁是一个瓶颈,多线程50个也是一个瓶颈,我觉得使用无锁数据结构,加上内存缓存,以及,client端按照事件驱动的方式进行设计性能会非常好,几个核就起几个进程。进程之间独立,将搜索的数据区间分段到每个独立绑定到核上的进程。

  5. 天边的云
    天边的云 2013 年 9 月 3 日 at 23:27 | | Reply

    这个怎么用,向高人请教!

  6. 于哲
    于哲 2013 年 11 月 11 日 at 21:03 | | Reply

    之前也写过一个爬豆瓣专辑的虫子,通过api调用有每分钟40个查询的限制。看见你模拟googlebot,好用么?

  7. XSS
    XSS 2019 年 9 月 14 日 at 23:30 | | Reply

    学长 这个 完整的源代码,请参考: https://github.com/lijiejie/scan-douban-ids
    现在无法获取了 是不是因为涉及到非法抓取数据 你担心越线 删除了?
    真想研究一下你的源码 可惜现在没了 你能给私下发一下吗?
    我的邮箱:sanuo111@outlook.com

Leave a Reply