datetime模块
datetime主要由五个模块组成:
- datetime.date:表示日期的类。常用的属性有year, month, day。
- datetime.time:表示时间的类。常用的属性有hour, minute, second, microsecond
- datetime.datetime:表示日期+时间。
- datetime.timedelta:表示时间间隔,即两个时间点之间的长度,常常用来做时间的加减。
- datetime.tzinfo:与时区有关的相关信息。
在datetime中,使用的最多的就是datetime.datetime模块,而datetime.timedelta常常被用来修改时间。
datetime 是 Python 中处理日期的标准模块,它提供了 4 种对日期和时间进行处理的类:datetime、date、time 和 timedelta。
1. datetime类
class datetime(date):
def __init__(self, year, month, day, hour, minute, second, microsecond, tzinfo)
pass
def now(cls, tz=None):
pass
def timestamp(self):
pass
def fromtimestamp(cls, t, tz=None):
pass
def date(self):
pass
def time(self):
pass
def year(self):
pass
def month(self):
pass
def day(self):
pass
def hour(self):
pass
def minute(self):
pass
def second(self):
pass
def isoweekday(self):
pass
def strftime(self, fmt):
pass
def combine(cls, date, time, tzinfo=True):
pass
datetime.now(tz=None)获取当前的日期时间,输出顺序为:年、月、日、时、分、秒、微秒。datetime.timestamp()获取以 1970年1月1日为起点记录的秒数。datetime.fromtimestamp(tz=None)使用 unixtimestamp 创建一个 datetime。
【例子】如何创建一个 datetime 对象?
import datetime
dt = datetime.datetime(year=2020, month=6, day=25, hour=11, minute=23, second=59)
print(dt) # 2020-06-25 11:23:59
print(dt.timestamp()) # 1593055439.0
dt = datetime.datetime.fromtimestamp(1593055439.0)
print(dt) # 2020-06-25 11:23:59
print(type(dt)) # <class 'datetime.datetime'>
dt = datetime.datetime.now()
print(dt) # 2020-06-25 11:11:03.877853
print(type(dt)) # <class 'datetime.datetime'>
datetime.strftime(fmt)格式化 datetime 对象。
| 符号 | 说明 |
|---|---|
%a | 本地简化星期名称(如星期一,返回 Mon) |
%A | 本地完整星期名称(如星期一,返回 Monday) |
%b | 本地简化的月份名称(如一月,返回 Jan) |
%B | 本地完整的月份名称(如一月,返回 January) |
%c | 本地相应的日期表示和时间表示 |
%d | 月内中的一天(0-31) |
%H | 24小时制小时数(0-23) |
%I | 12小时制小时数(01-12) |
%j | 年内的一天(001-366) |
%m | 月份(01-12) |
%M | 分钟数(00-59) |
%p | 本地A.M.或P.M.的等价符 |
%S | 秒(00-59) |
%U | 一年中的星期数(00-53)星期天为星期的开始 |
%w | 星期(0-6),星期天为星期的开始 |
%W | 一年中的星期数(00-53)星期一为星期的开始 |
%x | 本地相应的日期表示 |
%X | 本地相应的时间表示 |
%y | 两位数的年份表示(00-99) |
%Y | 四位数的年份表示(0000-9999) |
%Z | 当前时区的名称(如果是本地时间,返回空字符串) |
%% | %号本身 |
【例子】如何将 datetime 对象转换为任何格式的日期?
import datetime
dt = datetime.datetime(year=2020, month=6, day=25, hour=11, minute=51, second=49)
s = dt.strftime("'%Y/%m/%d %H:%M:%S")
print(s) # '2020/06/25 11:51:49
s = dt.strftime('%d %B, %Y, %A')
print(s) # 25 June, 2020, Thursday
【练习】如何将给定日期转换为 “mmm-dd, YYYY” 的格式?
# 输入
d1 = datetime.date('2010-09-28')
# 输出
'Sep-28,2010'
【参考答案】
import datetime
d1 = datetime.date(2010, 9, 28)
print(d1.strftime('%b-%d,%Y'))
# Sep-28,2010
datetime.date()Return the date part.datetime.time()Return the time part, with tzinfo None.datetime.year年datetime.month月datetime.day日datetime.hour小时datetime.minute分钟datetime.second秒datetime.isoweekday星期几
【例子】datetime 对象包含很多与日期时间相关的实用功能。
import datetime
dt = datetime.datetime(year=2020, month=6, day=25, hour=11, minute=51, second=49)
print(dt.date()) # 2020-06-25
print(type(dt.date())) # <class 'datetime.date'>
print(dt.time()) # 11:51:49
print(type(dt.time())) # <class 'datetime.time'>
print(dt.year) # 2020
print(dt.month) # 6
print(dt.day) # 25
print(dt.hour) # 11
print(dt.minute) # 51
print(dt.second) # 49
print(dt.isoweekday()) # 4
在处理含有字符串日期的数据集或表格时,我们需要一种自动解析字符串的方法,无论它是什么格式的,都可以将其转化为 datetime 对象。这时,就要使用到 dateutil 中的 parser 模块。
parser.parse(timestr, parserinfo=None, **kwargs)
【例子】如何在 python 中将字符串解析为 datetime对象?
from dateutil import parser
s = '2020-06-25'
dt = parser.parse(s)
print(dt) # 2020-06-25 00:00:00
print(type(dt)) # <class 'datetime.datetime'>
s = 'March 31, 2010, 10:51pm'
dt = parser.parse(s)
print(dt) # 2010-03-31 22:51:00
print(type(dt)) # <class 'datetime.datetime'>
【练习】如何将字符串日期解析为 datetime 对象?
# 输入
s1 = "2010 Jan 1"
s2 = '31-1-2000'
s3 = 'October10, 1996, 10:40pm'
# 输出
2010-01-01 00:00:00
2000-01-31 00:00:00
2019-10-10 22:40:00
【参考答案】
from dateutil import parser
s1 = "2010 Jan 1"
s2 = '31-1-2000'
s3 = 'October10, 1996, 10:40pm'
dt1 = parser.parse(s1)
dt2 = parser.parse(s2)
dt3 = parser.parse(s3)
print(dt1) # 2010-01-01 00:00:00
print(dt2) # 2000-01-31 00:00:00
print(dt3) # 1996-10-10 22:40:00
【练习】计算以下列表中连续的天数。
# 输入
['Oct, 2, 1869', 'Oct, 10, 1869', 'Oct, 15, 1869', 'Oct, 20, 1869','Oct, 23, 1869']
# 输出
[8, 5, 5, 3]
【参考答案】
import numpy as np
from dateutil import parser
dateString = ['Oct, 2, 1869', 'Oct, 10, 1869', 'Oct, 15, 1869', 'Oct, 20, 1869', 'Oct, 23, 1869']
dates = [parser.parse(i) for i in dateString]
td = np.diff(dates)
print(td)
# [datetime.timedelta(days=8) datetime.timedelta(days=5)
# datetime.timedelta(days=5) datetime.timedelta(days=3)]
d = [i.days for i in td]
print(d) # [8, 5, 5, 3]
numpy.diff(a, n=1,axis=-1)
# 沿着指定轴计算第N维的离散差值
# 参数:
# a:输入矩阵
# n:可选,代表要执行几次差值
# axis:默认是最后一个轴
2. date类
class date:
def __init__(self, year, month, day):
pass
def today(cls):
pass
date.today()获取当前日期信息。
【例子】如何在 Python 中获取当前日期和时间?
import datetime
d = datetime.date(2020, 6, 25)
print(d) # 2020-06-25
print(type(d)) # <class 'datetime.date'>
d = datetime.date.today()
print(d) # 2020-06-25
print(type(d)) # <class 'datetime.date'>
【练习】如何统计两个日期之间有多少个星期六?
# 输入
d1 = datetime.date(1869, 1, 2)
d2 = datetime.date(1869, 10, 2)
# 输出
40
【参考答案】
import datetime
d1 = datetime.date(1869, 1, 2)
d2 = datetime.date(1869, 10, 2)
dt = (d2 - d1).days
print(dt)
print(d1.isoweekday()) # 6
print(dt // 7 + 1) # 40
3. time类
class time:
def __init__(self, hour, minute, second, microsecond, tzinfo):
pass
【例子】如何使用 datetime.time() 类?
import datetime
t = datetime.time(12, 9, 23, 12980)
print(t) # 12:09:23.012980
print(type(t)) # <class 'datetime.time'>
注意:
- 1秒 = 1000 毫秒(milliseconds)
- 1毫秒 = 1000 微妙(microseconds)
【练习】如何将给定日期转换为当天开始的时间?
# 输入
import datetime
date = datetime.date(2019, 10, 2)
# 输出
2019-10-02 00:00:00
【参考答案】
import datetime
date = datetime.date(2019, 10, 2)
dt = datetime.datetime(date.year, date.month, date.day)
print(dt) # 2019-10-02 00:00:00
dt = datetime.datetime.combine(date, datetime.time.min)
print(dt) # 2019-10-02 00:00:00
4. timedelta类
timedelta 表示具体时间实例中的一段时间。你可以把它们简单想象成两个日期或时间之间的间隔。
它常常被用来从 datetime 对象中添加或移除一段特定的时间。
class timedelta(SupportsAbs[timedelta]):
def __init__(self, days, seconds, microseconds, milliseconds, minutes, hours, weeks,):
pass
def days(self):
pass
def total_seconds(self):
pass
【例子】如何使用 datetime.timedelta() 类?
import datetime
td = datetime.timedelta(days=30)
print(td) # 30 days, 0:00:00
print(type(td)) # <class 'datetime.timedelta'>
print(datetime.date.today()) # 2020-07-01
print(datetime.date.today() + td) # 2020-07-31
dt1 = datetime.datetime(2020, 1, 31, 10, 10, 0)
dt2 = datetime.datetime(2019, 1, 31, 10, 10, 0)
td = dt1 - dt2
print(td) # 365 days, 0:00:00
print(type(td)) # <class 'datetime.timedelta'>
td1 = datetime.timedelta(days=30) # 30 days
td2 = datetime.timedelta(weeks=1) # 1 week
td = td1 - td2
print(td) # 23 days, 0:00:00
print(type(td)) # <class 'datetime.timedelta'>
如果将两个 datetime 对象相减,就会得到表示该时间间隔的 timedelta 对象。
同样地,将两个时间间隔相减,可以得到另一个 timedelta 对象。
【练习】
- 距离你出生那天过去多少天了?
- 距离你今年的下一个生日还有多少天?
- 将距离你今年的下一个生日的天数转换为秒数。
# 输入
bday = 'Oct 2, 1969'
【参考答案】
from dateutil import parser
import datetime
bDay = 'Oct 2, 1969'
dt1 = parser.parse(bDay).date()
dt2 = datetime.date.today()
dt3 = datetime.date(dt2.year, dt1.month, dt1.day)
print(dt1) # 1969-10-02
print(dt2) # 2020-07-01
print(dt3) # 2020-10-02
td = dt2 - dt1
print(td.days) # 18535
td = dt3 - dt2
print(td.days) # 93
print(td.days * 24 * 60 * 60) # 8035200
print(td.total_seconds()) # 8035200.0
练习题:
1、假设你获取了用户输入的日期和时间如2020-1-21 9:01:30,以及一个时区信息如UTC+5:00,均是str,请编写一个函数将其转换为timestamp:
题目说明:
"""
Input file
example1: dt_str='2020-6-1 08:10:30', tz_str='UTC+7:00'
example2: dt_str='2020-5-31 16:10:30', tz_str='UTC-09:00'
Output file
result1: 1590973830.0
result2: 1590973830.0
"""
def to_timestamp(dt_str, tz_str):
# your code here
pass
参考链接:正则表达式
2、编写Python程序以选择指定年份的所有星期日。
题目说明:
"""
Input file
2020
Output file
2020-01-05
2020-01-12
2020-01-19
2020-01-26
2020-02-02
-----
2020-12-06
2020-12-13
2020-12-20
2020-12-27
"""
def all_sundays(year):
# your code here
from datetime import date, timedelta
def all_sundays(year):
year = int(year)
year_start = date(year, 1, 1)
# 找出第一个星期天
year_start += timedelta(days=(7-year_start.isoweekday()))
while year_start.year == year:
print(year_start)
year_start += timedelta(days=7)
all_sundays(2020)
正则表达式
1.match()
import re
re.match(regex, str) # regex参数表示匹配的正则表达式,str表示字符串
match()方法会尝试从字符串的起始位置匹配正则表达式,如果匹配,就返回匹配成功的结果;如果不匹配,就返回None。第一个参数regex参数表示匹配的正则表达式,第二个参数str表示字符串。
(1)取出匹配得到的字符串
import re
content = 'Hello 123 4567 World_This is a Regex Demo'
print(len(content))
# 41
result = re.match('^Hello\s\d\d\d\s\d{4}\s\w{10}', content)
print(result) # <re.Match object; span=(0, 25), match='Hello 123 4567 World_This'>
print(result.group()) # Hello 123 4567 World_This
print(result.span()) # (0, 25)
打印输出结果,可以看到结果是Match对象,这证明成功匹配。该对象有两个方法:group()方法可以输出匹配到的内容,结果是Hello 123 4567 World_This,这恰好是正则表达式规则所匹配的内容;span()方法可以输出匹配的范围,结果是(0, 25),这就是匹配到的结果字符串在原字符串中的位置范围。
(2)提取字符串中的部分内容,匹配目标
使用()将想要提取的字符串括起来,()标记了一个子表达式的开始和结束位置,被标记的子表达式依次对应一个分组,调用group()方法传入分组的索引获取内容。
import re
content = 'Hello 1234567 World_This is a Regex Demo'
result = re.match('^Hello\s(\d+)\sWorld', content)
print(result) # <re.Match object; span=(0, 19), match='Hello 1234567 World'>
print(result.group()) # Hello 1234567 World
print(result.group(1)) # 1234567
print(result.span()) # (0, 19)
上述例子提取字符串中的1234567,这里用group(1),与group()的不同之处是,group()会输出完整的匹配结果,group(1)输出最外层被()包围的匹配结果。
(3)贪婪模式与非贪婪模式
Python 的正则表达式默认是“贪心”的,这表示在有二义的情况下,它们会尽可能匹配最长的字符串。注意,问号在正则表达式中可能有两种含义:声明非贪心匹配或表示可选的分组。这两种含义是完全无关的。
- 举例一:
import re
str = "neuedunnnnnn"
regex = ".*(n.{2}n).*" # 此处表示贪婪模式(从右到左匹配)任意字符要出现2次
obj = re.match(regex, str) # 得到object对象
if obj:
print(obj.group(1)) # nnnn
import re
str = "neuedunnnnnn"
regex = ".*(n.{2,}n).*" # 此处表示贪婪模式(从右到左匹配)任意字符要至少出现2次
obj = re.match(regex, str) # 得到object对象
if obj:
print(obj.group(1)) # nnnn
import re
str = "neuedunnnnnn"
regex = ".*(n.{2,5}n).*" # 此处表示贪婪模式(从右到左匹配)任意字符要出现2次-5次
obj = re.match(regex, str) # 得到object对象
if obj:
print(obj.group(1)) # nnnn
# {2}、{2,}、{2,5}都是按照最低的次数进行匹配
贪婪模式,匹配最大长度的子串(从后往前匹配),{2}、{2,}、{2,5}都是按照最低的次数进行匹配
- 举例二:
# 贪心模式和非贪心模式
import re
regex = '((Ha){3,5})'
regex1 = '((Ha){3,5}?)'
str = 'HaHaHaHaHa'
result = re.match(regex, str)
if result:
print(result)
print(result.group())
print(result.group(1))
result = re.match(regex1, str)
if result:
print(result)
print(result.group())
print(result.group(1))
运行结果
<re.Match object; span=(0, 10), match='HaHaHaHaHa'>
HaHaHaHaHa
HaHaHaHaHa
<re.Match object; span=(0, 6), match='HaHaHa'>
HaHaHa
HaHaHa
贪婪模式 .*
非贪婪模式 .*?
import re
content = 'Hello 1234567 World_This is a Regex Demo'
result = re.match('^He.*(\d+).*Demo$', content)
print(result)
print(result.group(1)) # 7
在贪婪匹配下,.*会匹配尽可能多的字符。正则表达式中.*后面是\d+,也就是至少一个数字,并没有指定具体多少个数字,因此,.*就尽可能匹配多的字符,这里就把123456匹配了,给\d+留下一个可满足条件的数字7,最后得到的内容就只有数字7了。
非贪婪匹配的写法是.*?,多了一个?。
import re
content = 'Hello 1234567 World_This is a Regex Demo'
result = re.match('^He.*?(\d+).*Demo$', content)
print(result)
print(result.group(1)) # 1234567
贪婪匹配是尽可能匹配多的字符,非贪婪匹配就是尽可能匹配少的字符。当.?匹配到Hello后面的空白字符时,再往后的字符就是数字了,而\d+恰好可以匹配,那么这里.?就不再进行匹配,交给\d+去匹配后面的数字。所以这样.*?匹配了尽可能少的字符,\d+的结果就是1234567了。
注意,如果匹配的结果在字符串结尾,.*?就有可能匹配不到任何内容了,因为它会匹配尽可能少的字符。例如:
import re
content = 'http://weibo.com/comment/kEraCN'
result1 = re.match('http.*?comment/(.*?)', content)
result2 = re.match('http.*?comment/(.*)', content)
print('result1', result1.group(1)) # result1
print('result2', result2.group(1)) # result2 kEraCN
观察到:.*?没有匹配到任何结果,而.*则尽量匹配多的内容,成功得到了匹配结果。
1. .匹配任意除换行符“\n”外的字符;
2. *表示匹配前一个字符0次或无限次;
3. +或*后跟?表示非贪婪匹配,即尽可能少的匹配,如*?重复任意次,但尽可能少重复;
4. .*? 表示匹配任意数量的重复,但是在能使整个匹配成功的前提下使用最少的重复。
如:a.*?b匹配最短的,以a开始,以b结束的字符串。如果把它应用于aabab的话,它会匹配aab和ab。
参考链接:
Python3正则表达式(三)贪婪模式与非贪婪模式
Python 正则表达式:re 模块【一篇就够了】
python 从字符串中提取数字 re.findall()
本文详细介绍Python的datetime模块,包括datetime、date、time和timedelta类的使用方法,以及如何解析和格式化日期时间字符串。

1325

被折叠的 条评论
为什么被折叠?



