进行数据处理时数据量一大,excel文件就力不从心。
这次对三个文件格式的读取速度做大比拼。
# -*- coding: UTF-8 -*-
import time
import pandas as pd
"""
csv
excel
pkl
速度大比拼
"""
start = time.clock()
df = pd.read_pickle('table.pkl')
elapsed = (time.clock()
本文对比了使用pickle、csv和excel三种格式进行大数据处理的速度,结果显示pickle格式在数据读取速度上远超其他两种格式,适合大数据量的处理任务。
进行数据处理时数据量一大,excel文件就力不从心。
这次对三个文件格式的读取速度做大比拼。
# -*- coding: UTF-8 -*-
import time
import pandas as pd
"""
csv
excel
pkl
速度大比拼
"""
start = time.clock()
df = pd.read_pickle('table.pkl')
elapsed = (time.clock()
2959
9280
776
2472
1105

被折叠的 条评论
为什么被折叠?
