那些年向前冲python办公自动化|批量处理文件,一学就会( 二 )


with open(file) as f:lines = f.readlines()lines = [i.strip() for i in lines] #去除空字符data = http://news.hoteastday.com/a/list(filter(None, lines))del data[0]data = data[0:100]date = re.findall('年(.+)2',str(file))[0]content = data[::2] #奇偶分割rank = data[1::2]#提取内容与排名for i in range(len(content)):content[i] = re.findall('、(.+)',content[i])[0]for i in range(len(rank)):rank[i] = re.findall(' (.+)',rank[i])[0]最后只需要写一个循环遍历每一天的文件并进行清洗 , 再创建一个DataFrame用于存储每天的数据即可 。
那些年向前冲python办公自动化|批量处理文件,一学就会
本文插图
可以看到 , 并没有使用太复杂的代码就成功实现了我们的需求!
结束语
以上就是使用Python再一次解放双手并成功偷懒的案例 , 可能读取Markdown文件在你的日常工作中并用不到 , 但是通过本案例希望你能学会如何批量处理文件夹 , 批量读取清洗数据 。 更重要的是在你的工作学习中 , 遇到需要重复操作的任务时 , 是否能够想起使用Python来自动化解决!拜拜 , 我们下个案例见~


推荐阅读