Python 中使用 MongoDB 存储爬虫数据

清华大佬耗费三个月吐血整理的几百G的资源,免费分享!....>>>

现在在做一个简单的搜索引擎,使用今日头条的新闻数据作为数据源。这些数据都是非结构性的,比较适合用 MongoDB 来进行存储。

以下为简单使用的示例。

#!/usr/bin/python
# -*- coding:utf-8 -*-

import pymongo

class documentManager(object):
    def __init__(self):
        pass

    def connect_mongo(self):
        client = pymongo.Connection("127.0.0.1",27017)
        db = client.data_db
        collection = db.data_collection
        mydict = {"name":"Lucy", "sex":"female","job":"nurse"}
        collection.insert(mydict)

        for i in collection.find({"name":"Lucy"}):
            print i

if __name__ == '__main__':
    manager = documentManager()
    manager.connect_mongo()

来自:http://my.oschina.net/lvyi/blog/599719