博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python3.X爬虫
阅读量:5061 次
发布时间:2019-06-12

本文共 902 字,大约阅读时间需要 3 分钟。

1、Python很有名,但是一直没在实际项目中用过,今天花30分钟学习下。

去Python官网

2、2.X与3.X版本相差比较大,新手用最新的3.6.4。
3、下载安装。
4、安装BeautifulSoup,CMD进入C:\Users\xxx\AppData\Local\Programs\Python\Python36-32\Scripts,运行 pip install bs4.
5、桌面建一个记事本test.py,去网上找例子,注意3.x与2.x语法不一样下面代码是3.x下可以使用的。

#!/usr/bin/python  # -*- coding: utf-8 -*-  from bs4 import BeautifulSoup  import  urllib.request  url = r'http://douban.com'  res = urllib.request.urlopen(url)  html = res.read().decode('utf-8')   html_doc = """ The Dormouse's story  

The Dormouse's story

Once upon a time there were three little sisters; and their names were Elsie, Lacie and Tillie; and they lived at the bottom of a well.

...

""" #获取BeautifulSoup对象并按标准缩进格式输出,下面用html,或者html_doc一个是本地,一个是远程。 soup = BeautifulSoup(html,"html.parser") print(soup.prettify()) print(soup.title)

6、右键Edit with IDE,Run、Run Moudle,输出结果了吧,入门就这么简单。

转载于:https://www.cnblogs.com/zhaogaojian/p/8372892.html

你可能感兴趣的文章
POJ3250 Bad Hair Day(单调栈)
查看>>
[No0000195]NoSQL还是SQL?这一篇讲清楚
查看>>
IOS开发UI篇--UITableView的自定义布局==xib布局
查看>>
【深度学习】caffe 中的一些参数介绍
查看>>
Python-Web框架的本质
查看>>
Unrecognized Windows Sockets error: 0: JVM_Bind 异常解决办法
查看>>
struts2中<s:form>的应用
查看>>
QML学习笔记之一
查看>>
7NiuYun云存储UploadPicture
查看>>
Window 的引导过程
查看>>
python与 Ajax跨域请求
查看>>
Java实体书写规范
查看>>
App右上角数字
查看>>
从.NET中委托写法的演变谈开去(上):委托与匿名方法
查看>>
六、PowerDesigner 正向工程 和 逆向工程 说明
查看>>
小算法
查看>>
201521123024 《java程序设计》 第12周学习总结
查看>>
贪吃蛇游戏改进
查看>>
新作《ASP.NET MVC 5框架揭秘》正式出版
查看>>
“前.NET Core时代”如何实现跨平台代码重用 ——源文件重用
查看>>