分类
大小:150 KB
语言:简体中文系统:WinXP, Win2003, Vista, Win7, Win8, Win10
类别:网络辅助时间:2018-05-02
Beautiful Soup4是基于python推出的一款HTML/XML解析器,拥有强大的解析功能,可以方便的处理不规范标记并生成剖析树,自动将输入文档转换成Unicode编码,适用于抓取网站数据,大大提高工作效率,需要的朋友不要错过!
1.Beautiful Soup提供了一些简单的方法和Python术语,用于检索和修改语法树:一个用于解析文档并提取相关信息的工具包。这样你写一个应用不需要写很多代码。
2.Beautiful Soup自动将输入文档转换为Unicode编码,并将输出文档转化为UTF-8编码。你不需要考虑编码,除非输入文档没有指出其编码并且Beautiful Soup无法自动检测到,这时你需要指出原来的编码方式。
3.Beautiful Soup位于一些流行的Python解析器比如lxml和html5lib的上层,这允许你使用不同的解析策略或者牺牲速度来换取灵活性。
1、解压文件
将下载得到的压缩包解压到任意文件夹,路径不含中文
2、打开cmd命令提示符
win+r,输入cmd,回车
进入解压后的目录,我这里是C:\Python27\bs4\beautifulsoup4-4.3.2
所以使用
cd C:\Python27\bs4\beautifulsoup4-4.3.2
然后
setup.py build
接着
setup.py install
完成安装
3、测试
python
import bs4
没有提示错误,成功!
展开