因此,您正在执行的 *** 作是append和concat 几乎
等效。区别在于空的Dataframe。由于某些原因,这会导致严重的减速,不确定确切的原因,必须要考虑一下。以下是对您所做工作的基本介绍。
我几乎总是使用concat(尽管在这种情况下,它们是等效的,除了空白框);如果您不使用空框,则它们的速度相同。
In [17]: df1 = pd.Dataframe(dict(A = range(10000)),index=pd.date_range('20130101',periods=10000,freq='s'))In [18]: df1Out[18]: <class 'pandas.core.frame.Dataframe'>DatetimeIndex: 10000 entries, 2013-01-01 00:00:00 to 2013-01-01 02:46:39Freq: SData columns (total 1 columns):A 10000 non-null valuesdtypes: int64(1)In [19]: df4 = pd.Dataframe()The concatIn [20]: %timeit pd.concat([df1,df2,df3])1000 loops, best of 3: 270 us per loopThis is equavalent of your appendIn [21]: %timeit pd.concat([df4,df1,df2,df3])10 loops, best of 3: 56.8 ms per loop
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)