首页 > python如何随机且有放回地从训练集中的抽取N个训练样本

python如何随机且有放回地从训练集中的抽取N个训练样本

训练集数据类型为DataFrame,请问在numpy或者pandas中是否有现成的方法?即使用bootstrap抽样方法

df = pd.read_csv('D:\\waveform-+noise.csv', index_col = 0)
data = pd.DataFrame()
for i in range(0,5000):
    j = random.randint(1,5000)
    data = data.append(df.iloc[j-1:j,:],ignore_index=True)
x = data.iloc[0:5000, 0:39]
y = data.iloc[0:5000, 39:40]

自己写了一个,大概需要5秒,是否又更好的办法?训练集行数为5000


用 pandas.DataFrame.sample

df.sample(n=5000, replace=True)
【热门文章】
【热门文章】