博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
芝麻HTTP: Scrapy小技巧
阅读量:6830 次
发布时间:2019-06-26

本文共 1159 字,大约阅读时间需要 3 分钟。

hot3.png

这两天上班接手,别人留下来的爬虫发现一个很好玩的 SQL脚本拼接。

只要你的Scrapy Field字段名字和 数据库字段的名字 一样。那么恭喜你你就可以拷贝这段SQL拼接脚本。进行MySQL入库处理。

具体拼接代码如下:

def process_item(self, item, spider):        if isinstance(item, WhoscoredNewItem):            table_name = item.pop('table_name')            col_str = ''            row_str = ''            for key in item.keys():                col_str = col_str + " " + key + ","                row_str = "{}'{}',".format(row_str, item[key] if "'" not in item[key] else item[key].replace("'", "\\'"))                sql = "insert INTO {} ({}) VALUES ({}) ON DUPLICATE KEY UPDATE ".format(table_name, col_str[1:-1], row_str[:-1])            for (key, value) in six.iteritems(item):                sql += "{} = '{}', ".format(key, value if "'" not in value else value.replace("'", "\\'"))            sql = sql[:-2]            self.cursor.execute(sql) #执行SQL            self.cnx.commit()# 写入操作

这个SQL拼接实现了,如果数据库存在相同数据则 更新,不存在则插入 的SQL语句

具体实现就是第一个for循环,获取key作为MySQL字段名字、VALUES做为SQL的VALUES(拼接成一个插入的SQL语句)

第二个for循环,实现了 字段名 = VALUES的拼接。

和第一个for循环的中的sql就组成了 insert into  XXXXX   on duplicate key update 这个。存在则更新 不存在则插入的SQL语句。

 

转载于:https://my.oschina.net/u/3720876/blog/1614748

你可能感兴趣的文章
iOS helper
查看>>
Linux下配置VSftp服务器八步搞定
查看>>
常用MySQL的命令集锦
查看>>
疗伤之设计模式
查看>>
SUN U45 B150 B2500 V240 V440 V880 V890服务器
查看>>
Elasticsearch——多索引的使用
查看>>
sparkJavaApi逐个详解
查看>>
错误:Could not find an available JavaScript runtime
查看>>
在 SQL2005 使用行转列或列转行
查看>>
我的友情链接
查看>>
最让人感触的100句经典爱情歌词
查看>>
WebBrowser控件
查看>>
我的友情链接
查看>>
Windows Server 2012 R2 新功能体验——工作文件夹(Work Folders)
查看>>
ubuntu11.10的root密码
查看>>
django python 文件上传【Part 5】
查看>>
【模板】最小费用最大流
查看>>
五周第一次课(1月8日)
查看>>
解决vsftpd编译时的错误:could not read symbols: File in wrong format
查看>>
NHibernate学习总结
查看>>