Task08:datetime模块

本文详细介绍Python的datetime模块,包括datetime、date、time和timedelta类的使用方法,以及如何解析和格式化日期时间字符串。

datetime模块

datetime主要由五个模块组成:

  • datetime.date:表示日期的类。常用的属性有year, month, day。
  • datetime.time:表示时间的类。常用的属性有hour, minute, second, microsecond
  • datetime.datetime:表示日期+时间。
  • datetime.timedelta:表示时间间隔,即两个时间点之间的长度,常常用来做时间的加减。
  • datetime.tzinfo:与时区有关的相关信息。

在datetime中,使用的最多的就是datetime.datetime模块,而datetime.timedelta常常被用来修改时间。

datetime 是 Python 中处理日期的标准模块,它提供了 4 种对日期和时间进行处理的类:datetimedatetimetimedelta


1. datetime类

class datetime(date):
    def __init__(self, year, month, day, hour, minute, second, microsecond, tzinfo)
        pass
    def now(cls, tz=None):
        pass
    def timestamp(self):
        pass
    def fromtimestamp(cls, t, tz=None):
        pass
    def date(self):
        pass
    def time(self):
        pass
    def year(self):
        pass
    def month(self):
        pass
    def day(self):
        pass
    def hour(self):
        pass
    def minute(self):
        pass
    def second(self):
        pass
    def isoweekday(self):
        pass
    def strftime(self, fmt):
        pass
    def combine(cls, date, time, tzinfo=True):
        pass
  • datetime.now(tz=None) 获取当前的日期时间,输出顺序为:年、月、日、时、分、秒、微秒。
  • datetime.timestamp() 获取以 1970年1月1日为起点记录的秒数。
  • datetime.fromtimestamp(tz=None) 使用 unixtimestamp 创建一个 datetime。

【例子】如何创建一个 datetime 对象?

import datetime

dt = datetime.datetime(year=2020, month=6, day=25, hour=11, minute=23, second=59)
print(dt)  # 2020-06-25 11:23:59
print(dt.timestamp())  # 1593055439.0

dt = datetime.datetime.fromtimestamp(1593055439.0)
print(dt)  # 2020-06-25 11:23:59
print(type(dt)) # <class 'datetime.datetime'>

dt = datetime.datetime.now()
print(dt)  # 2020-06-25 11:11:03.877853
print(type(dt))  # <class 'datetime.datetime'>
  • datetime.strftime(fmt) 格式化 datetime 对象。
符号说明
%a本地简化星期名称(如星期一,返回 Mon)
%A本地完整星期名称(如星期一,返回 Monday)
%b本地简化的月份名称(如一月,返回 Jan)
%B本地完整的月份名称(如一月,返回 January)
%c本地相应的日期表示和时间表示
%d月内中的一天(0-31)
%H24小时制小时数(0-23)
%I12小时制小时数(01-12)
%j年内的一天(001-366)
%m月份(01-12)
%M分钟数(00-59)
%p本地A.M.或P.M.的等价符
%S秒(00-59)
%U一年中的星期数(00-53)星期天为星期的开始
%w星期(0-6),星期天为星期的开始
%W一年中的星期数(00-53)星期一为星期的开始
%x本地相应的日期表示
%X本地相应的时间表示
%y两位数的年份表示(00-99)
%Y四位数的年份表示(0000-9999)
%Z当前时区的名称(如果是本地时间,返回空字符串)
%%%号本身

【例子】如何将 datetime 对象转换为任何格式的日期?

import datetime

dt = datetime.datetime(year=2020, month=6, day=25, hour=11, minute=51, second=49)
s = dt.strftime("'%Y/%m/%d %H:%M:%S")
print(s)  # '2020/06/25 11:51:49

s = dt.strftime('%d %B, %Y, %A')
print(s)  # 25 June, 2020, Thursday

【练习】如何将给定日期转换为 “mmm-dd, YYYY” 的格式?

# 输入
d1 = datetime.date('2010-09-28')

# 输出
'Sep-28,2010'

【参考答案】

import datetime

d1 = datetime.date(2010, 9, 28)
print(d1.strftime('%b-%d,%Y'))
# Sep-28,2010
  • datetime.date() Return the date part.
  • datetime.time() Return the time part, with tzinfo None.
  • datetime.year
  • datetime.month
  • datetime.day
  • datetime.hour 小时
  • datetime.minute 分钟
  • datetime.second
  • datetime.isoweekday 星期几

【例子】datetime 对象包含很多与日期时间相关的实用功能。

import datetime

dt = datetime.datetime(year=2020, month=6, day=25, hour=11, minute=51, second=49)
print(dt.date())  # 2020-06-25
print(type(dt.date()))  # <class 'datetime.date'>
print(dt.time())  # 11:51:49
print(type(dt.time()))  # <class 'datetime.time'>
print(dt.year)  # 2020
print(dt.month)  # 6
print(dt.day)  # 25
print(dt.hour)  # 11
print(dt.minute)  # 51
print(dt.second)  # 49
print(dt.isoweekday())  # 4

在处理含有字符串日期的数据集或表格时,我们需要一种自动解析字符串的方法,无论它是什么格式的,都可以将其转化为 datetime 对象。这时,就要使用到 dateutil 中的 parser 模块。

  • parser.parse(timestr, parserinfo=None, **kwargs)

【例子】如何在 python 中将字符串解析为 datetime对象?

from dateutil import parser

s = '2020-06-25'
dt = parser.parse(s)
print(dt)  # 2020-06-25 00:00:00
print(type(dt))  # <class 'datetime.datetime'>

s = 'March 31, 2010, 10:51pm'
dt = parser.parse(s)
print(dt)  # 2010-03-31 22:51:00
print(type(dt))  # <class 'datetime.datetime'>

【练习】如何将字符串日期解析为 datetime 对象?

# 输入
s1 = "2010 Jan 1"
s2 = '31-1-2000'
s3 = 'October10, 1996, 10:40pm'

# 输出
2010-01-01 00:00:00
2000-01-31 00:00:00
2019-10-10 22:40:00

【参考答案】

from dateutil import parser

s1 = "2010 Jan 1"
s2 = '31-1-2000'
s3 = 'October10, 1996, 10:40pm'

dt1 = parser.parse(s1)
dt2 = parser.parse(s2)
dt3 = parser.parse(s3)

print(dt1)  # 2010-01-01 00:00:00
print(dt2)  # 2000-01-31 00:00:00
print(dt3)  # 1996-10-10 22:40:00

【练习】计算以下列表中连续的天数。

# 输入
['Oct, 2, 1869', 'Oct, 10, 1869', 'Oct, 15, 1869', 'Oct, 20, 1869','Oct, 23, 1869']

# 输出
[8, 5, 5, 3]

【参考答案】

import numpy as np
from dateutil import parser

dateString = ['Oct, 2, 1869', 'Oct, 10, 1869', 'Oct, 15, 1869', 'Oct, 20, 1869', 'Oct, 23, 1869']
dates = [parser.parse(i) for i in dateString]
td = np.diff(dates)
print(td)
# [datetime.timedelta(days=8) datetime.timedelta(days=5)
#  datetime.timedelta(days=5) datetime.timedelta(days=3)]
d = [i.days for i in td]
print(d)  # [8, 5, 5, 3]
numpy.diff(a, n=1,axis=-1)
# 沿着指定轴计算第N维的离散差值 
# 参数: 
# a:输入矩阵 
# n:可选,代表要执行几次差值 
# axis:默认是最后一个轴 

2. date类

class date:
    def __init__(self, year, month, day):
        pass
    def today(cls):
        pass
  • date.today() 获取当前日期信息。

【例子】如何在 Python 中获取当前日期和时间?

import datetime

d = datetime.date(2020, 6, 25)
print(d)  # 2020-06-25
print(type(d))  # <class 'datetime.date'>

d = datetime.date.today()
print(d)  # 2020-06-25
print(type(d))  # <class 'datetime.date'>

【练习】如何统计两个日期之间有多少个星期六?

# 输入
d1 = datetime.date(1869, 1, 2)
d2 = datetime.date(1869, 10, 2)

# 输出
40

【参考答案】

import datetime

d1 = datetime.date(1869, 1, 2)
d2 = datetime.date(1869, 10, 2)
dt = (d2 - d1).days
print(dt)
print(d1.isoweekday())  # 6
print(dt // 7 + 1)  # 40

3. time类

class time:
    def __init__(self, hour, minute, second, microsecond, tzinfo):
        pass

【例子】如何使用 datetime.time() 类?

import datetime

t = datetime.time(12, 9, 23, 12980)
print(t)  # 12:09:23.012980
print(type(t))  # <class 'datetime.time'>

注意:

  • 1秒 = 1000 毫秒(milliseconds)
  • 1毫秒 = 1000 微妙(microseconds)

【练习】如何将给定日期转换为当天开始的时间?

# 输入
import datetime
date = datetime.date(2019, 10, 2)

# 输出
2019-10-02 00:00:00

【参考答案】

import datetime

date = datetime.date(2019, 10, 2)
dt = datetime.datetime(date.year, date.month, date.day)
print(dt)  # 2019-10-02 00:00:00

dt = datetime.datetime.combine(date, datetime.time.min)
print(dt)  # 2019-10-02 00:00:00

4. timedelta类

timedelta 表示具体时间实例中的一段时间。你可以把它们简单想象成两个日期或时间之间的间隔。

它常常被用来从 datetime 对象中添加或移除一段特定的时间。

class timedelta(SupportsAbs[timedelta]):
    def __init__(self, days, seconds, microseconds, milliseconds, minutes, hours, weeks,):
        pass
    def days(self):
        pass
    def total_seconds(self):
        pass

【例子】如何使用 datetime.timedelta() 类?

import datetime

td = datetime.timedelta(days=30)
print(td)  # 30 days, 0:00:00
print(type(td))  # <class 'datetime.timedelta'>
print(datetime.date.today())  # 2020-07-01
print(datetime.date.today() + td)  # 2020-07-31

dt1 = datetime.datetime(2020, 1, 31, 10, 10, 0)
dt2 = datetime.datetime(2019, 1, 31, 10, 10, 0)
td = dt1 - dt2
print(td)  # 365 days, 0:00:00
print(type(td))  # <class 'datetime.timedelta'>

td1 = datetime.timedelta(days=30)  # 30 days
td2 = datetime.timedelta(weeks=1)  # 1 week
td = td1 - td2
print(td)  # 23 days, 0:00:00
print(type(td))  # <class 'datetime.timedelta'>

如果将两个 datetime 对象相减,就会得到表示该时间间隔的 timedelta 对象。

同样地,将两个时间间隔相减,可以得到另一个 timedelta 对象。

【练习】

  1. 距离你出生那天过去多少天了?
  2. 距离你今年的下一个生日还有多少天?
  3. 将距离你今年的下一个生日的天数转换为秒数。
# 输入
bday = 'Oct 2, 1969'

【参考答案】

from dateutil import parser
import datetime

bDay = 'Oct 2, 1969'
dt1 = parser.parse(bDay).date()
dt2 = datetime.date.today()
dt3 = datetime.date(dt2.year, dt1.month, dt1.day)
print(dt1)  # 1969-10-02
print(dt2)  # 2020-07-01
print(dt3)  # 2020-10-02

td = dt2 - dt1
print(td.days)  # 18535
td = dt3 - dt2
print(td.days)  # 93
print(td.days * 24 * 60 * 60)  # 8035200
print(td.total_seconds())  # 8035200.0

练习题

1、假设你获取了用户输入的日期和时间如2020-1-21 9:01:30,以及一个时区信息如UTC+5:00,均是str,请编写一个函数将其转换为timestamp:

题目说明:

"""
   
Input file
example1: dt_str='2020-6-1 08:10:30', tz_str='UTC+7:00'
example2: dt_str='2020-5-31 16:10:30', tz_str='UTC-09:00'
   
Output file
result1: 1590973830.0
result2: 1590973830.0
"""
   
   
def to_timestamp(dt_str, tz_str):
    # your code here
        pass

参考链接:正则表达式

2、编写Python程序以选择指定年份的所有星期日。

题目说明:

"""
   
Input file
   2020
   
Output file
   2020-01-05                         
   2020-01-12              
   2020-01-19                
   2020-01-26               
   2020-02-02     
   -----
   2020-12-06               
   2020-12-13                
   2020-12-20                
   2020-12-27 
"""
   
def all_sundays(year):
    # your code here
    
from datetime import date, timedelta

def all_sundays(year):
    year = int(year)
    year_start = date(year, 1, 1)
    # 找出第一个星期天
    year_start += timedelta(days=(7-year_start.isoweekday()))
    while year_start.year == year:
        print(year_start)
        year_start += timedelta(days=7)
        
all_sundays(2020)

正则表达式

1.match()

import re
re.match(regex, str) # regex参数表示匹配的正则表达式,str表示字符串

match()方法会尝试从字符串的起始位置匹配正则表达式,如果匹配,就返回匹配成功的结果;如果不匹配,就返回None。第一个参数regex参数表示匹配的正则表达式,第二个参数str表示字符串。
(1)取出匹配得到的字符串

import re

content = 'Hello 123 4567 World_This is a Regex Demo'

print(len(content))
# 41

result = re.match('^Hello\s\d\d\d\s\d{4}\s\w{10}', content)

print(result)  # <re.Match object; span=(0, 25), match='Hello 123 4567 World_This'>

print(result.group())  # Hello 123 4567 World_This

print(result.span())   # (0, 25)

打印输出结果,可以看到结果是Match对象,这证明成功匹配。该对象有两个方法:group()方法可以输出匹配到的内容,结果是Hello 123 4567 World_This,这恰好是正则表达式规则所匹配的内容;span()方法可以输出匹配的范围,结果是(0, 25),这就是匹配到的结果字符串在原字符串中的位置范围。

(2)提取字符串中的部分内容,匹配目标

使用()将想要提取的字符串括起来,()标记了一个子表达式的开始和结束位置,被标记的子表达式依次对应一个分组,调用group()方法传入分组的索引获取内容。

import re

content = 'Hello 1234567 World_This is a Regex Demo'

result = re.match('^Hello\s(\d+)\sWorld', content)

print(result)   # <re.Match object; span=(0, 19), match='Hello 1234567 World'>

print(result.group())   #  Hello 1234567 World

print(result.group(1))  #  1234567

print(result.span())    #  (0, 19)

上述例子提取字符串中的1234567,这里用group(1),与group()的不同之处是,group()会输出完整的匹配结果,group(1)输出最外层被()包围的匹配结果。

(3)贪婪模式与非贪婪模式
Python 的正则表达式默认是“贪心”的,这表示在有二义的情况下,它们会尽可能匹配最长的字符串。注意,问号在正则表达式中可能有两种含义:声明非贪心匹配或表示可选的分组。这两种含义是完全无关的。

  • 举例一:
import re
str = "neuedunnnnnn"
regex = ".*(n.{2}n).*"    # 此处表示贪婪模式(从右到左匹配)任意字符要出现2次
obj = re.match(regex, str)   # 得到object对象
if obj:
    print(obj.group(1))   # nnnn
import re
str = "neuedunnnnnn"
regex = ".*(n.{2,}n).*"    # 此处表示贪婪模式(从右到左匹配)任意字符要至少出现2次
obj = re.match(regex, str)   # 得到object对象
if obj:
    print(obj.group(1))     # nnnn
import re
str = "neuedunnnnnn"
regex = ".*(n.{2,5}n).*"    # 此处表示贪婪模式(从右到左匹配)任意字符要出现2次-5次
obj = re.match(regex, str)   # 得到object对象
if obj:
    print(obj.group(1))     # nnnn

# {2}、{2,}、{2,5}都是按照最低的次数进行匹配

贪婪模式,匹配最大长度的子串(从后往前匹配),{2}、{2,}、{2,5}都是按照最低的次数进行匹配

  • 举例二:
#  贪心模式和非贪心模式
import re
regex = '((Ha){3,5})'
regex1 = '((Ha){3,5}?)'
str = 'HaHaHaHaHa'

result  = re.match(regex, str)
if result:
    print(result)
    print(result.group())
    print(result.group(1))
    
result  = re.match(regex1, str)
if result:
    print(result)
    print(result.group())   
    print(result.group(1))

运行结果
<re.Match object; span=(0, 10), match='HaHaHaHaHa'>
HaHaHaHaHa
HaHaHaHaHa
<re.Match object; span=(0, 6), match='HaHaHa'>
HaHaHa
HaHaHa

贪婪模式   .* 
非贪婪模式 .*? 
import re

content = 'Hello 1234567 World_This is a Regex Demo'

result = re.match('^He.*(\d+).*Demo$', content)

print(result)

print(result.group(1))   # 7

在贪婪匹配下,.*会匹配尽可能多的字符。正则表达式中.*后面是\d+,也就是至少一个数字,并没有指定具体多少个数字,因此,.*就尽可能匹配多的字符,这里就把123456匹配了,给\d+留下一个可满足条件的数字7,最后得到的内容就只有数字7了。

非贪婪匹配的写法是.*?,多了一个?。

import re

content = 'Hello 1234567 World_This is a Regex Demo'

result = re.match('^He.*?(\d+).*Demo$', content)

print(result)

print(result.group(1))   # 1234567

贪婪匹配是尽可能匹配多的字符,非贪婪匹配就是尽可能匹配少的字符。当.?匹配到Hello后面的空白字符时,再往后的字符就是数字了,而\d+恰好可以匹配,那么这里.?就不再进行匹配,交给\d+去匹配后面的数字。所以这样.*?匹配了尽可能少的字符,\d+的结果就是1234567了。

注意,如果匹配的结果在字符串结尾,.*?就有可能匹配不到任何内容了,因为它会匹配尽可能少的字符。例如:

import re

content = 'http://weibo.com/comment/kEraCN'

result1 = re.match('http.*?comment/(.*?)', content)

result2 = re.match('http.*?comment/(.*)', content)

print('result1', result1.group(1))  #  result1

print('result2', result2.group(1))  #  result2 kEraCN

观察到:.*?没有匹配到任何结果,而.*则尽量匹配多的内容,成功得到了匹配结果。

1. .匹配任意除换行符“\n”外的字符;
2. *表示匹配前一个字符0次或无限次;
3. +*后跟?表示非贪婪匹配,即尽可能少的匹配,如*?重复任意次,但尽可能少重复;
4. .*? 表示匹配任意数量的重复,但是在能使整个匹配成功的前提下使用最少的重复。
如:a.*?b匹配最短的,以a开始,以b结束的字符串。如果把它应用于aabab的话,它会匹配aab和ab。

参考链接:
Python3正则表达式(三)贪婪模式与非贪婪模式
Python 正则表达式:re 模块【一篇就够了】
python 从字符串中提取数字 re.findall()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值