Task08：datetime模块

最新推荐文章于 2024-11-15 11:46:23 发布

原创最新推荐文章于 2024-11-15 11:46:23 发布 · 406 阅读

0 ·

本内容遵循CC 4.0 BY-SA版权协议

Datawhale学习专栏收录该内容

17 篇文章

订阅专栏

本文详细介绍Python的datetime模块，包括datetime、date、time和timedelta类的使用方法，以及如何解析和格式化日期时间字符串。

datetime模块

datetime主要由五个模块组成：

datetime.date：表示日期的类。常用的属性有year, month, day。
datetime.time：表示时间的类。常用的属性有hour, minute, second, microsecond
datetime.datetime：表示日期+时间。
datetime.timedelta：表示时间间隔，即两个时间点之间的长度，常常用来做时间的加减。
datetime.tzinfo：与时区有关的相关信息。

在datetime中，使用的最多的就是datetime.datetime模块，而datetime.timedelta常常被用来修改时间。

datetime 是 Python 中处理日期的标准模块，它提供了 4 种对日期和时间进行处理的类：datetime、date、time 和 timedelta。

1. datetime类

class datetime(date):
    def __init__(self, year, month, day, hour, minute, second, microsecond, tzinfo)
        pass
    def now(cls, tz=None):
        pass
    def timestamp(self):
        pass
    def fromtimestamp(cls, t, tz=None):
        pass
    def date(self):
        pass
    def time(self):
        pass
    def year(self):
        pass
    def month(self):
        pass
    def day(self):
        pass
    def hour(self):
        pass
    def minute(self):
        pass
    def second(self):
        pass
    def isoweekday(self):
        pass
    def strftime(self, fmt):
        pass
    def combine(cls, date, time, tzinfo=True):
        pass

datetime.now(tz=None) 获取当前的日期时间，输出顺序为：年、月、日、时、分、秒、微秒。
datetime.timestamp() 获取以 1970年1月1日为起点记录的秒数。
datetime.fromtimestamp(tz=None) 使用 unixtimestamp 创建一个 datetime。

【例子】如何创建一个 datetime 对象？

import datetime

dt = datetime.datetime(year=2020, month=6, day=25, hour=11, minute=23, second=59)
print(dt)  # 2020-06-25 11:23:59
print(dt.timestamp())  # 1593055439.0

dt = datetime.datetime.fromtimestamp(1593055439.0)
print(dt)  # 2020-06-25 11:23:59
print(type(dt)) # <class 'datetime.datetime'>

dt = datetime.datetime.now()
print(dt)  # 2020-06-25 11:11:03.877853
print(type(dt))  # <class 'datetime.datetime'>

datetime.strftime(fmt) 格式化 datetime 对象。

符号	说明
`%a`	本地简化星期名称（如星期一，返回 Mon）
`%A`	本地完整星期名称（如星期一，返回 Monday）
`%b`	本地简化的月份名称（如一月，返回 Jan）
`%B`	本地完整的月份名称（如一月，返回 January）
`%c`	本地相应的日期表示和时间表示
`%d`	月内中的一天（0-31）
`%H`	24小时制小时数（0-23）
`%I`	12小时制小时数（01-12）
`%j`	年内的一天（001-366）
`%m`	月份（01-12）
`%M`	分钟数（00-59）
`%p`	本地A.M.或P.M.的等价符
`%S`	秒（00-59）
`%U`	一年中的星期数（00-53）星期天为星期的开始
`%w`	星期（0-6），星期天为星期的开始
`%W`	一年中的星期数（00-53）星期一为星期的开始
`%x`	本地相应的日期表示
`%X`	本地相应的时间表示
`%y`	两位数的年份表示（00-99）
`%Y`	四位数的年份表示（0000-9999）
`%Z`	当前时区的名称（如果是本地时间，返回空字符串）
`%%`	%号本身

【例子】如何将 datetime 对象转换为任何格式的日期？

import datetime

dt = datetime.datetime(year=2020, month=6, day=25, hour=11, minute=51, second=49)
s = dt.strftime("'%Y/%m/%d %H:%M:%S")
print(s)  # '2020/06/25 11:51:49

s = dt.strftime('%d %B, %Y, %A')
print(s)  # 25 June, 2020, Thursday

【练习】如何将给定日期转换为 “mmm-dd, YYYY” 的格式？

# 输入
d1 = datetime.date('2010-09-28')

# 输出
'Sep-28,2010'

【参考答案】

import datetime

d1 = datetime.date(2010, 9, 28)
print(d1.strftime('%b-%d,%Y'))
# Sep-28,2010

datetime.date() Return the date part.
datetime.time() Return the time part, with tzinfo None.
datetime.year 年
datetime.month 月
datetime.day 日
datetime.hour 小时
datetime.minute 分钟
datetime.second 秒
datetime.isoweekday 星期几

【例子】datetime 对象包含很多与日期时间相关的实用功能。

import datetime

dt = datetime.datetime(year=2020, month=6, day=25, hour=11, minute=51, second=49)
print(dt.date())  # 2020-06-25
print(type(dt.date()))  # <class 'datetime.date'>
print(dt.time())  # 11:51:49
print(type(dt.time()))  # <class 'datetime.time'>
print(dt.year)  # 2020
print(dt.month)  # 6
print(dt.day)  # 25
print(dt.hour)  # 11
print(dt.minute)  # 51
print(dt.second)  # 49
print(dt.isoweekday())  # 4

在处理含有字符串日期的数据集或表格时，我们需要一种自动解析字符串的方法，无论它是什么格式的，都可以将其转化为 datetime 对象。这时，就要使用到 dateutil 中的 parser 模块。

parser.parse(timestr, parserinfo=None, **kwargs)

【例子】如何在 python 中将字符串解析为 datetime对象？

from dateutil import parser

s = '2020-06-25'
dt = parser.parse(s)
print(dt)  # 2020-06-25 00:00:00
print(type(dt))  # <class 'datetime.datetime'>

s = 'March 31, 2010, 10:51pm'
dt = parser.parse(s)
print(dt)  # 2010-03-31 22:51:00
print(type(dt))  # <class 'datetime.datetime'>

【练习】如何将字符串日期解析为 datetime 对象？

# 输入
s1 = "2010 Jan 1"
s2 = '31-1-2000'
s3 = 'October10, 1996, 10:40pm'

# 输出
2010-01-01 00:00:00
2000-01-31 00:00:00
2019-10-10 22:40:00

【参考答案】

from dateutil import parser

s1 = "2010 Jan 1"
s2 = '31-1-2000'
s3 = 'October10, 1996, 10:40pm'

dt1 = parser.parse(s1)
dt2 = parser.parse(s2)
dt3 = parser.parse(s3)

print(dt1)  # 2010-01-01 00:00:00
print(dt2)  # 2000-01-31 00:00:00
print(dt3)  # 1996-10-10 22:40:00

【练习】计算以下列表中连续的天数。

# 输入
['Oct, 2, 1869', 'Oct, 10, 1869', 'Oct, 15, 1869', 'Oct, 20, 1869','Oct, 23, 1869']

# 输出
[8, 5, 5, 3]

【参考答案】

import numpy as np
from dateutil import parser

dateString = ['Oct, 2, 1869', 'Oct, 10, 1869', 'Oct, 15, 1869', 'Oct, 20, 1869', 'Oct, 23, 1869']
dates = [parser.parse(i) for i in dateString]
td = np.diff(dates)
print(td)
# [datetime.timedelta(days=8) datetime.timedelta(days=5)
#  datetime.timedelta(days=5) datetime.timedelta(days=3)]
d = [i.days for i in td]
print(d)  # [8, 5, 5, 3]

numpy.diff(a, n=1,axis=-1)
# 沿着指定轴计算第N维的离散差值 
# 参数： 
# a：输入矩阵 
# n：可选，代表要执行几次差值 
# axis：默认是最后一个轴

2. date类

class date:
    def __init__(self, year, month, day):
        pass
    def today(cls):
        pass

date.today() 获取当前日期信息。

【例子】如何在 Python 中获取当前日期和时间？

import datetime

d = datetime.date(2020, 6, 25)
print(d)  # 2020-06-25
print(type(d))  # <class 'datetime.date'>

d = datetime.date.today()
print(d)  # 2020-06-25
print(type(d))  # <class 'datetime.date'>

【练习】如何统计两个日期之间有多少个星期六？

# 输入
d1 = datetime.date(1869, 1, 2)
d2 = datetime.date(1869, 10, 2)

# 输出
40

【参考答案】

import datetime

d1 = datetime.date(1869, 1, 2)
d2 = datetime.date(1869, 10, 2)
dt = (d2 - d1).days
print(dt)
print(d1.isoweekday())  # 6
print(dt // 7 + 1)  # 40

3. time类

class time:
    def __init__(self, hour, minute, second, microsecond, tzinfo):
        pass

【例子】如何使用 datetime.time() 类？

import datetime

t = datetime.time(12, 9, 23, 12980)
print(t)  # 12:09:23.012980
print(type(t))  # <class 'datetime.time'>

注意：

1秒 = 1000 毫秒（milliseconds）
1毫秒 = 1000 微妙（microseconds）

【练习】如何将给定日期转换为当天开始的时间？

# 输入
import datetime
date = datetime.date(2019, 10, 2)

# 输出
2019-10-02 00:00:00

【参考答案】

import datetime

date = datetime.date(2019, 10, 2)
dt = datetime.datetime(date.year, date.month, date.day)
print(dt)  # 2019-10-02 00:00:00

dt = datetime.datetime.combine(date, datetime.time.min)
print(dt)  # 2019-10-02 00:00:00

4. timedelta类

timedelta 表示具体时间实例中的一段时间。你可以把它们简单想象成两个日期或时间之间的间隔。

它常常被用来从 datetime 对象中添加或移除一段特定的时间。

class timedelta(SupportsAbs[timedelta]):
    def __init__(self, days, seconds, microseconds, milliseconds, minutes, hours, weeks,):
        pass
    def days(self):
        pass
    def total_seconds(self):
        pass

【例子】如何使用 datetime.timedelta() 类？

import datetime

td = datetime.timedelta(days=30)
print(td)  # 30 days, 0:00:00
print(type(td))  # <class 'datetime.timedelta'>
print(datetime.date.today())  # 2020-07-01
print(datetime.date.today() + td)  # 2020-07-31

dt1 = datetime.datetime(2020, 1, 31, 10, 10, 0)
dt2 = datetime.datetime(2019, 1, 31, 10, 10, 0)
td = dt1 - dt2
print(td)  # 365 days, 0:00:00
print(type(td))  # <class 'datetime.timedelta'>

td1 = datetime.timedelta(days=30)  # 30 days
td2 = datetime.timedelta(weeks=1)  # 1 week
td = td1 - td2
print(td)  # 23 days, 0:00:00
print(type(td))  # <class 'datetime.timedelta'>

如果将两个 datetime 对象相减，就会得到表示该时间间隔的 timedelta 对象。

同样地，将两个时间间隔相减，可以得到另一个 timedelta 对象。

【练习】

距离你出生那天过去多少天了？
距离你今年的下一个生日还有多少天？
将距离你今年的下一个生日的天数转换为秒数。

# 输入
bday = 'Oct 2, 1969'

【参考答案】

from dateutil import parser
import datetime

bDay = 'Oct 2, 1969'
dt1 = parser.parse(bDay).date()
dt2 = datetime.date.today()
dt3 = datetime.date(dt2.year, dt1.month, dt1.day)
print(dt1)  # 1969-10-02
print(dt2)  # 2020-07-01
print(dt3)  # 2020-10-02

td = dt2 - dt1
print(td.days)  # 18535
td = dt3 - dt2
print(td.days)  # 93
print(td.days * 24 * 60 * 60)  # 8035200
print(td.total_seconds())  # 8035200.0

练习题：

1、假设你获取了用户输入的日期和时间如2020-1-21 9:01:30，以及一个时区信息如UTC+5:00，均是str，请编写一个函数将其转换为timestamp：

题目说明:

"""
   
Input file
example1: dt_str='2020-6-1 08:10:30', tz_str='UTC+7:00'
example2: dt_str='2020-5-31 16:10:30', tz_str='UTC-09:00'
   
Output file
result1: 1590973830.0
result2: 1590973830.0
"""
   
   
def to_timestamp(dt_str, tz_str):
    # your code here
        pass

参考链接：正则表达式

2、编写Python程序以选择指定年份的所有星期日。

题目说明:

"""
   
Input file
   2020
   
Output file
   2020-01-05                         
   2020-01-12              
   2020-01-19                
   2020-01-26               
   2020-02-02     
   -----
   2020-12-06               
   2020-12-13                
   2020-12-20                
   2020-12-27 
"""
   
def all_sundays(year):
    # your code here

from datetime import date, timedelta

def all_sundays(year):
    year = int(year)
    year_start = date(year, 1, 1)
    # 找出第一个星期天
    year_start += timedelta(days=(7-year_start.isoweekday()))
    while year_start.year == year:
        print(year_start)
        year_start += timedelta(days=7)
        
all_sundays(2020)

正则表达式

1.match()

import re
re.match(regex, str) # regex参数表示匹配的正则表达式，str表示字符串

match()方法会尝试从字符串的起始位置匹配正则表达式，如果匹配，就返回匹配成功的结果；如果不匹配，就返回None。第一个参数regex参数表示匹配的正则表达式，第二个参数str表示字符串。
(1)取出匹配得到的字符串

import re

content = 'Hello 123 4567 World_This is a Regex Demo'

print(len(content))
# 41

result = re.match('^Hello\s\d\d\d\s\d{4}\s\w{10}', content)

print(result)  # <re.Match object; span=(0, 25), match='Hello 123 4567 World_This'>

print(result.group())  # Hello 123 4567 World_This

print(result.span())   # (0, 25)

打印输出结果，可以看到结果是Match对象，这证明成功匹配。该对象有两个方法：group()方法可以输出匹配到的内容，结果是Hello 123 4567 World_This，这恰好是正则表达式规则所匹配的内容；span()方法可以输出匹配的范围，结果是(0, 25)，这就是匹配到的结果字符串在原字符串中的位置范围。

(2)提取字符串中的部分内容，匹配目标

使用()将想要提取的字符串括起来，()标记了一个子表达式的开始和结束位置，被标记的子表达式依次对应一个分组，调用group()方法传入分组的索引获取内容。

import re

content = 'Hello 1234567 World_This is a Regex Demo'

result = re.match('^Hello\s(\d+)\sWorld', content)

print(result)   # <re.Match object; span=(0, 19), match='Hello 1234567 World'>

print(result.group())   #  Hello 1234567 World

print(result.group(1))  #  1234567

print(result.span())    #  (0, 19)

上述例子提取字符串中的1234567，这里用group(1)，与group()的不同之处是，group()会输出完整的匹配结果，group(1)输出最外层被()包围的匹配结果。

(3)贪婪模式与非贪婪模式
Python 的正则表达式默认是“贪心”的，这表示在有二义的情况下，它们会尽可能匹配最长的字符串。注意，问号在正则表达式中可能有两种含义：声明非贪心匹配或表示可选的分组。这两种含义是完全无关的。

举例一：

import re
str = "neuedunnnnnn"
regex = ".*(n.{2}n).*"    # 此处表示贪婪模式（从右到左匹配）任意字符要出现2次
obj = re.match(regex, str)   # 得到object对象
if obj:
    print(obj.group(1))   # nnnn

import re
str = "neuedunnnnnn"
regex = ".*(n.{2,}n).*"    # 此处表示贪婪模式（从右到左匹配）任意字符要至少出现2次
obj = re.match(regex, str)   # 得到object对象
if obj:
    print(obj.group(1))     # nnnn

import re
str = "neuedunnnnnn"
regex = ".*(n.{2,5}n).*"    # 此处表示贪婪模式（从右到左匹配）任意字符要出现2次-5次
obj = re.match(regex, str)   # 得到object对象
if obj:
    print(obj.group(1))     # nnnn

# {2}、{2,}、{2,5}都是按照最低的次数进行匹配

贪婪模式，匹配最大长度的子串(从后往前匹配)，{2}、{2,}、{2,5}都是按照最低的次数进行匹配

举例二：

#  贪心模式和非贪心模式
import re
regex = '((Ha){3,5})'
regex1 = '((Ha){3,5}?)'
str = 'HaHaHaHaHa'

result  = re.match(regex, str)
if result:
    print(result)
    print(result.group())
    print(result.group(1))
    
result  = re.match(regex1, str)
if result:
    print(result)
    print(result.group())   
    print(result.group(1))

运行结果
<re.Match object; span=(0, 10), match='HaHaHaHaHa'>
HaHaHaHaHa
HaHaHaHaHa
<re.Match object; span=(0, 6), match='HaHaHa'>
HaHaHa
HaHaHa

贪婪模式   .* 
非贪婪模式 .*?

import re

content = 'Hello 1234567 World_This is a Regex Demo'

result = re.match('^He.*(\d+).*Demo$', content)

print(result)

print(result.group(1))   # 7

在贪婪匹配下，.*会匹配尽可能多的字符。正则表达式中.*后面是\d+，也就是至少一个数字，并没有指定具体多少个数字，因此，.*就尽可能匹配多的字符，这里就把123456匹配了，给\d+留下一个可满足条件的数字7，最后得到的内容就只有数字7了。

非贪婪匹配的写法是.*?，多了一个?。

import re

content = 'Hello 1234567 World_This is a Regex Demo'

result = re.match('^He.*?(\d+).*Demo$', content)

print(result)

print(result.group(1))   # 1234567

贪婪匹配是尽可能匹配多的字符，非贪婪匹配就是尽可能匹配少的字符。当.?匹配到Hello后面的空白字符时，再往后的字符就是数字了，而\d+恰好可以匹配，那么这里.?就不再进行匹配，交给\d+去匹配后面的数字。所以这样.*?匹配了尽可能少的字符，\d+的结果就是1234567了。

注意，如果匹配的结果在字符串结尾，.*?就有可能匹配不到任何内容了，因为它会匹配尽可能少的字符。例如：

import re

content = 'http://weibo.com/comment/kEraCN'

result1 = re.match('http.*?comment/(.*?)', content)

result2 = re.match('http.*?comment/(.*)', content)

print('result1', result1.group(1))  #  result1

print('result2', result2.group(1))  #  result2 kEraCN

观察到：.*?没有匹配到任何结果，而.*则尽量匹配多的内容，成功得到了匹配结果。

1. .匹配任意除换行符“\n”外的字符；
2. *表示匹配前一个字符0次或无限次；
3. +或*后跟？表示非贪婪匹配，即尽可能少的匹配，如*？重复任意次，但尽可能少重复；
4. .*? 表示匹配任意数量的重复，但是在能使整个匹配成功的前提下使用最少的重复。
如：a.*?b匹配最短的，以a开始，以b结束的字符串。如果把它应用于aabab的话，它会匹配aab和ab。