为了把从网页中解析的数据存储起来,便于存档和查询,可以把数据存放在数据库中,也可以以文件的方式存储,还可以存储为网络应用程序,即html文件或者CSV格式文件。本文引用一个例子,看看如何将网页的解析数据存储为html文件。
from bs4 import BeautifulSoup
import requests
#前置标签
pre_html = '''
<!DOCTYPE HTML>
<html>
<head>
<!--meta charset = 'utf-8'-->
<title>油价历史数据</title>
</head>
<body>
<h2>自去年11月份以来的油价数据(取自本例网站)</h2>
<table width=600 border=1>
<tr><td>日期</td><td>92#无铅</td><td>95#无铅</td><td>98#无铅</td></tr>
'''
#后置标签
post_html = """
</table>
</body>
</html>
"""
url = 'http://new.cpc.com.tw/division/mb/oil-more4.aspx'
src = requests.get(url)
#src.encoding = "bgk"
html = src.text
bs = BeautifulSoup(html, 'html.parser')
data = bs.find_all('span' ,{'id':'Showtd'} )
rows = data[0].find_all('tr')
prices = li

本文介绍如何利用Python将从网页解析得到的数据存储为HTML文件,以实现存档和查询的目的。

2250

被折叠的 条评论
为什么被折叠?



