pandas中的随机排序和抽样

1.随机重排序

使用take()随机排序

如:

df.take([54])   #采取索引为54的数据

可以借助np.random.permutation()函数随机排序

permutation()函数是指产生0~n-1的所有整数的随机排列

如:对索引为0~10的数据进行随机排序

df.take(np.random.permutation(10))

(部分)

2.随机抽样:

当dataframe样本数据足够多时,对数据进行随机采样。

方法一:

使用np.random.randint()配合take()函数进行随机抽样

方法二:

使用sample(n)函数

n:是采样个数。

格式:df.sample(n)

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注