第一种:read()
read()是最悔逗兆简单的一种方法,一次性读取文件的所有内容放在一个大字符串中,即内存中。
read()的好处:方便、简单,一次性读出文件放在一个大字符串中,速度最快。
read()的坏处:文件过大的时候,占用内存会过大。
第二种:readline()
readline()逐碧租行读取文本,结果是一个list。
readline()的好处:占用内存小,逐行读取。
readline()的坏处:逐行读取,速度比较慢。
第三种:readlines()
readlines()一次性读取文本的所有内容指旦,结果是一个list。
readlines()的好处:一次性读取文本内容,速度比较快。
readlines()的坏处:随着文本的增大,占用内存会越来越多。
import pandas as pd
import os
data=pd.read_excel('/Users/kelan/Downloads/2月5日/安徽.xlsx')
a=data.columns
df_empty=pd.DataFrame(columns=a)
for parents,adds,filenames in os.walk('/Users/kelan/Downloads/2月5日'):
for filename in filenames:
#print(os.path.join(parents,filename))
data = pd.read_excel(os.path.join(parents,filename))
df_empty=df_empty.append(data,ignore_index=True)
df_empty.to_excel('/Users/kelan/Downloads/2月5日/11.xlsx')
注意中文写乎辩贺入,os.walk会返回3个参数,分别是路径,目录list,文件list,取第一灶饥个和最后一个,最后一个遍历。ignore_index可以忽略索引。开始先在pandas中建一个dataframe,岁派columns中填写行标
/python通过解释器内置的open()函数打开一个文件,并实现该文件与一个程序变量的关联,open()函数格式如下:
/open()函数包含有两个参数:文件名和打开模式.当文件与执行文件在同一大厅文件夹中,直接输入文件名,亦可输入文件的完整路径.打开模式是指以何种方式打开文件,python提供了7种打开模式.
/r/w/x/a模式与b/t/+模式可以组合使悉仿悄用,比如'rt'为文睁渣本只读.'rb'为二级制只读.
/文件使用结束后,需要使用close()关闭文件使用权限,释放内存.
/当文件使用文本格式打开时,读写按照字符串方式,采用计算机当前编码或指定编码.
/当文件以二进制方式打开时,读写按照字节流方式.
/python本身将文件读取为一个行序列.
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)