0


人工智能数据分析Python常用库 01 time、random、collections、itertools库

文章目录

一、time库

1、获取现在时间

import time

# 结构化时间print(time.localtime())# 本地时间print(time.gmtime())# UTC世界统一时间# 北京时间比统一时间UTC早8个小时print(time.ctime())# Sun Mar 17 15:25:51 2024 返回本地时间的字符串

2、时间戳与计时器

time.time():float型,返回从19700101 00:00:00开始的秒数
time.perf_counter():float型,随意选取一个时间点,记录现在时间到该时间点的间隔秒数,记录sleep
time.process_time():float型,随意选取一个时间点,记录现在时间到该时间点的间隔秒数,不记录sleep
time.perf_counter()比time()精度更高一些

import time

t1_start = time.time()
t2_start = time.perf_counter()
t3_start = time.process_time()print(t1_start)print(t2_start)print(t3_start)

res =0for i inrange(100000):
    res += i
time.sleep(5)
t1_end = time.time()
t2_end = time.perf_counter()
t3_end = time.process_time()print("t1:",t1_end-t1_start)print("t2:",t2_end-t2_start)print("t3:",t3_end-t3_start)'''
1710695283.7847786
0.6724354
0.671875
t1: 5.0264506340026855
t2: 5.026069
t3: 0.015625
'''

3、格式化

print(
    time.strftime("%X",time.localtime()))# 01:13:08

4、睡眠

time.sleep(秒数)

二、random库

random库提供了各种伪随机数。

1、随机种子

(1)相同种子会产生相同的随机数。
(2)如果不设置随机种子,以系统当前时间为默认值

from random import*
seed(10)print(random())# 0.5714025946899135
seed(10)print(random())# 0.5714025946899135print(random())# 0.4288890546751146

2、产生随机整数

(1)randint(a,b) 产生[a,b]之间的随机整数
(2)randrange(a) 产生[0,a)之间的随机整数
(3)randrange(a,b,step) 产生(a,b)之间以step为步长的随机整数

from random import*

nums1 =[randint(1,4)for i inrange(5)]print(nums1)# [2, 3, 3, 4, 1]

nums2 =[randrange(1,4)for i inrange(5)]print(nums2)# [1, 2, 2, 1, 1]

nums3 =[randrange(1,4,2)for i inrange(5)]print(nums3)# [1, 1, 1, 3, 3]

3、产生随机浮点数

(1)random() 产生[0.0, 1.0)之间的随机浮点数
(2)uniform(a, b) 产生[a,b]之间的随机浮点数

from random import*

nums1 =[random()for i inrange(3)]print(nums1)# [0.8185405295924474, 0.3084685502649297, 0.6473292231282459]

nums2 =[uniform(1,2)for i inrange(3)]print(nums2)# [1.5584797693674464, 1.7587782534434675, 1.7008288028686036]

4、随机序列

(1)choice(seq) 从序列类型中随机返回一个元素
(2)choices(seq, weights= None, k) 对序列进行k次有放回采样,可设置权重
(3)shuffle(seq) 将序列中元素随机排列,返回打乱后的序列
(4)sample(seq,k) 从seq中随机选取k个元素,无放回采样,以列表类型返回。

from random import*

seq1 = choice(["win","lose","draw"])print(seq1)# lose

seq2 = choices(["win","lose","draw"],[4,4,2],k=5)print(seq2)# ['lose', 'win', 'win', 'draw', 'win']

ls =["win","lose","draw"]
shuffle(ls)print(ls)# ['win', 'draw', 'lose']

seq4 = sample(["win","lose","draw"],3)print(seq4)# ['draw', 'win', 'lose']

5、概率分布——以高斯分布为例

gauss(mean, std) 产生一个平均值mean,标准差std,符合高斯分布的随机数

from random import*import matplotlib.pyplot as plt
res =[gauss(0,1)for i inrange(10000)]

plt.hist(res, bins=1000)# bins=1000表示将数据分成1000个区间统计
plt.show()

在这里插入图片描述

三、collections库——容器数据类型

1、namedtuple——具名元组

就是给元组起个名字。namedtuple是元组的子类。

(1)定义方法

namedtuple(typename, field_names, *, rename=False, defaults=None, module=None)
typename:元组名字 field_names:域名

import collections

Pont = collections.namedtuple("Point",["x","y"])
p = Pont(1,y=2)print(p)# Point(x=1, y=2)

(2)可以调用属性

print(p.x)# 1

(3)有元组的性质

print(p[1])# 2
a,b = p
print(a,b)# 1 2

(4)是元组的子类

print(isinstance(p,tuple))# True

2、Counter——计数器工具

(1)示例

from collections import Counter

s ="我爱人人人人爱我"
cnt_s = Counter(s)print(cnt_s)# Counter({'人': 4, '我': 2, '爱': 2})

(2)是字典的一个子类

print(isinstance(cnt_s,dict))# True

(3)统计最常见元素

cmmn = cnt_s.most_common(2)print(cmmn)# [('人', 4), ('我', 2)]

(4)元素展开

print(list(cnt_s.elements()))# ['我', '我', '爱', '爱', '人', '人', '人', '人']

(5)加减操作

s1 = Counter(a=1,b=3)
s2 = Counter(a=2,c=4)
s3 = s1+s2
print(s3)# Counter({'c': 4, 'a': 3, 'b': 3})

3、deque——双向队列

双向队列可以方便地在队列两边高效、快速地增加和删除元素

from collections import deque

d = deque("cde")

d.append("1")# 右端增加
d.append("2")# 右端增加
d.appendleft("a")# 左端增加
d.appendleft("b")# 左端增加print(d)# deque(['b', 'a', 'c', 'd', 'e', '1', '2'])

d.pop()# 右端删除
d.popleft()# 左端删除print(d)# deque(['a', 'c', 'd', 'e', '1'])

四、itertools库——迭代器

1、排列组合迭代器

(1)product——笛卡尔积

import itertools

for i in itertools.product("ABC","01"):print(i)'''
('A', '0')
('A', '1')
('B', '0')
('B', '1')
('C', '0')
('C', '1')
'''
import itertools

for i in itertools.product("AB",repeat=3):print(i)'''
('A', 'A', 'A')
('A', 'A', 'B')
('A', 'B', 'A')
('A', 'B', 'B')
('B', 'A', 'A')
('B', 'A', 'B')
('B', 'B', 'A')
('B', 'B', 'B')
'''

(2)permutations——排列

import itertools

for i in itertools.permutations("ABC",2):# 2是排列的长度print(i)'''
('A', 'B')
('A', 'C')
('B', 'A')
('B', 'C')
('C', 'A')
('C', 'B')
'''
import itertools

for i in itertools.permutations(range(3)):# 不指定长度,默认是第一个参数的长度print(i)'''
(0, 1, 2)
(0, 2, 1)
(1, 0, 2)
(1, 2, 0)
(2, 0, 1)
(2, 1, 0)
'''

(3)combinations——组合

import itertools

for i in itertools.combinations("ABCD",2):# 2是组合的长度print(i)'''
('A', 'B')
('A', 'C')
('A', 'D')
('B', 'C')
('B', 'D')
('C', 'D')
'''
import itertools

for i in itertools.combinations(range(4),2):print(i)'''
(0, 1)
(0, 2)
(0, 3)
(1, 2)
(1, 3)
(2, 3)
'''

(4)combinations_with_replacement——元素可重复组合

import itertools

for i in itertools.combinations_with_replacement("ABC",2):# 2是组合的长度print(i)'''
('A', 'A')
('A', 'B')
('A', 'C')
('B', 'B')
('B', 'C')
('C', 'C')
'''
import itertools

for i in itertools.product("ABC",repeat=2):print(i)'''
('A', 'A')
('A', 'B')
('A', 'C')
('B', 'A')
('B', 'B')
('B', 'C')
('C', 'A')
('C', 'B')
('C', 'C')
'''

2、拉链

(1)zip——短拉链

长度不一时,执行到最短的对象处,就停止

for i inzip("ABCD","012","xyz"):# zip是python内置函数print(i)'''
('A', '0', 'x')
('B', '1', 'y')
('C', '2', 'z')
'''

(2)zip_longest——长拉链

长度不一致时,执行到最长的对象处,就停止,缺省元素用None或指定字符替代。

import itertools

for i in itertools.zip_longest("ABC","01"):print(i)'''
('A', '0')
('B', '1')
('C', None)
'''
import itertools

for i in itertools.zip_longest("ABC","01",fillvalue="*"):print(i)'''
('A', '0')
('B', '1')
('C', '*')
'''

3、无穷迭代器

(1)count(start=0,step=1)——计数

创建一个迭代器,它从start值开始,返回均匀间隔的值

import itertools

it = itertools.count(step=2)print(it.__next__())# 0print(it.__next__())# 2print(it.__next__())# 4

(2)cycle(iterable)——循环

创建一个迭代器,返回iterable中所有元素,无限重复

import itertools

it = itertools.cycle("AB")print(it.__next__())# Aprint(it.__next__())# Bprint(it.__next__())# A

(3)repeat(object [,times])——重复

创建一个迭代器,不断重复object,除非设定参数times,否则将无限重复

import itertools

it = itertools.repeat(4,3)print(it.__next__())# 4print(it.__next__())# 4print(it.__next__())# 4print(it.__next__())# 触发异常 StopIteration

4、其他

(1)chain(iterables)——锁链

把一组迭代对象串联起来,形成一个更大的迭代器

import itertools

for i in itertools.chain("ABC",[1,2]):print(i)'''
A
B
C
1
2
'''

(2)enumerate(iterable,start=0)——枚举(python内置)

产出由两个元素组成的元组,结构是(index, item),其中index从start开始,item从iterable中取。

for i inenumerate("ABC",start=1):print(i)'''
(1, 'A')
(2, 'B')
(3, 'C')
'''

(3)groupby(iterable, key=None)——分组

创建一个迭代器,按照key指定的方式,返回iterable中连续的键和组
一般来说,要预先对数据进行排序
key为None,默认把连续重复元素分组

import itertools

animals =["duck","eagle","rat","giraffe","bear"\
           "bat","dolphin","shark","lion"]
animals.sort(key=len)# 元素按长度排序for key, group in itertools.groupby(animals, key=len):print(key,list(group))'''
3 ['rat']
4 ['duck', 'lion']
5 ['eagle', 'shark']
7 ['giraffe', 'bearbat', 'dolphin']
'''

本文转载自: https://blog.csdn.net/weixin_42830015/article/details/136783015
版权归原作者 撸码侠 所有, 如有侵权,请联系我们删除。

“人工智能数据分析Python常用库 01 time、random、collections、itertools库”的评论:

还没有评论