博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python批量读取txt文件为DataFrame
阅读量:5143 次
发布时间:2019-06-13

本文共 1071 字,大约阅读时间需要 3 分钟。

    我们有时候会批量处理同一个文件夹下的文件,并且希望读取到一个文件里面便于我们计算操作。比方我有下图一系列的txt文件,我该如何把它们写入一个txt文件中并且读取为DataFrame格式呢?

首先我们要用到glob模块,这个python内置的模块可以说是非常的好用。

glob.glob('*.txt')
得到如下结果:

all.txt是我最后得到的结果文件。可以见返回的是一个包含txt文件名称的列表,当然如果你的文件夹下面只有txt文件,那么你用os.listdir()可以得到一个一样的列表

然后读取的时候只要注意txt文件的编码格式(可以用notepad++打开记事本查看)和间隔符的形式就好了,完整的代码如下:

import osimport pandasimport codecsimport globimport pandas as pdos.getcwd()os.chdir('D:\AAAASXQ\python study\data preprocessing')def txtcombine():        files = glob.glob('*.txt')        all = codecs.open('all.txt','a')        for filename in flist:          print(filename)          fopen=codecs.open(filename,'r',encoding='utf-8')          lines=[]          lines=fopen.readlines()          fopen.close()          i=0          for line in lines:                for x in line:                  all.write(x)        #读取为DataFrame格式        all1 = pd.read_csv('all.txt',sep=' ',encoding='GB2312')        #保存为csv格式        all1.to_csv('all.csv',encoding='GB2312')        if __name__ == '__main__':      txtcombine()

转载于:https://www.cnblogs.com/mtcnn/p/9411634.html

你可能感兴趣的文章
Java虚拟机(JVM)默认字符集详解
查看>>
Java Servlet 过滤器与 springmvc 拦截器的区别?
查看>>
(tmp >> 8) & 0xff;
查看>>
linux命令之ifconfig详细解释
查看>>
NAT地址转换
查看>>
Nhibernate 过长的字符串报错 dehydration property
查看>>
Deque - leetcode 【双端队列】
查看>>
gulp插件gulp-ruby-sass和livereload插件
查看>>
免费的大数据学习资料,这一份就足够
查看>>
clientWidth、clientHeight、offsetWidth、offsetHeight以及scrollWidth、scrollHeight
查看>>
企业级应用与互联网应用的区别
查看>>
itext jsp页面打印
查看>>
Perl正则表达式匹配
查看>>
DB Change
查看>>
nginx --rhel6.5
查看>>
Eclipse Python插件 PyDev
查看>>
selenium+python3模拟键盘实现粘贴、复制
查看>>
网站搭建(一)
查看>>
Spring JDBCTemplate
查看>>
Iroha and a Grid AtCoder - 1974(思维水题)
查看>>