Python

pip离线打包与安装python库

1、从本机导出第三方库列表 pip freeze > requirements.txt 2、根据列表从网络下载第三方库安装包 pip download -d packages -r requirements.txt 理论上pip download命令 […]

pyinstaller打包py程序

1. 基本语法 pyinstaller命令行的语法是: pyinstaller [options] script [script …] | specfile 通常情况只需要将命令行移动到需要打包的脚本根目录下,然后运行: # 打包myscript.py脚本 […]

pyqt5

这两个礼拜做一个报文发送的后台守护程序,用到了pyqt5做用户界面。 1.简单窗口 import sys from PyQt5.QtWidgets import QApplication, QMainWindow def main(): # 生成QAppl […]

windows下部署django项目

一、iis+wfastcgi 1. 安装wfastcgi pip install wfastcgi   2. 启用wfastcgi 使用管理员权限打开cmd,输入如下命令: wfastcgi-enable 该命令会输出如下信息: C:\Windo […]

pymssql 2.1.4 ImportError: DLL load failed

最近有个工作需要用python读写sqlserver数据库,就用到了pymssql库。结果在离线的生产环境部署脚本的时候,发现报错: ImportError: DLL load failed: The specified module could not […]

破解geetest的拖动验证码

最近有个项目需要爬取“国家企业信用信息公示系统”的数据,在该网站点击搜索按钮时,会弹出极验(geetest)的拖动式验证码。 遂一番google之,发现果然有哥们已经破解了这套验证码系统,甚至放出源码来了。学以致用。 原理很简单,首先定位缺口的位置,然后驱 […]

用 Python 装饰器写一个single instance

一、关于python的装饰器 python装饰器的形式有点像java的注解、用处有点像java的切面。可以简单的理解为一个函数如果被装饰器注解了,那么在运行该函数之前,会先调用装饰器函数。 具体的参考如下两篇文章: https://www.zhihu.co […]

pytesseract识别验证码

验证码破解是做爬虫经常要面对的问题。对于一般字符串或者算式的验证码,可以使用网页截图,然后OCR识别的方式来识别出验证码字符串来。 网页截图可以使用selenium的save_screenshot()方法; 用PIL图像处理库来截取验证码图片; 用Tess […]

爬虫遭遇http error 521

最近做了个爬虫需要用到代理ip,然后想去快代理上爬点代理ip下来用。 结果使用urllib2访问http://www.kuaidaili.com/proxylist/1时候发现总是返回521错误。 使用HTTPError的read方法可以打印出HTTP的返 […]

Scroll to Top