将网页的解析数据存储为html文件

最新推荐文章于 2025-04-14 09:57:05 发布

原创

最新推荐文章于 2025-04-14 09:57:05 发布 · 2.4k 阅读

标签

#Python #html

收录于

本文介绍如何利用Python将从网页解析得到的数据存储为HTML文件，以实现存档和查询的目的。

为了把从网页中解析的数据存储起来，便于存档和查询，可以把数据存放在数据库中，也可以以文件的方式存储，还可以存储为网络应用程序，即html文件或者CSV格式文件。本文引用一个例子，看看如何将网页的解析数据存储为html文件。

from bs4 import BeautifulSoup
import requests

#前置标签
pre_html = '''
<!DOCTYPE HTML>
<html>
<head>
<!--meta charset = 'utf-8'-->
<title>油价历史数据</title>
</head>
<body>
<h2>自去年11月份以来的油价数据（取自本例网站）</h2>
<table width=600 border=1>
<tr><td>日期</td><td>92#无铅</td><td>95#无铅</td><td>98#无铅</td></tr>
'''
#后置标签
post_html = """
</table>
</body>
</html>
"""

url = 'http://new.cpc.com.tw/division/mb/oil-more4.aspx'
src = requests.get(url)
#src.encoding = "bgk"
html = src.text
bs = BeautifulSoup(html, 'html.parser')
data = bs.find_all('span' ,{'id':'Showtd'} )
rows = data[0].find_all('tr')

prices = li