如何用python实现自动化办公

docx模块简要介绍 

如何用python实现自动化办公

文章插图
 
Python-docx包 , 可以用来创建docx文档
包含段落、分页符、表格、图片、标题、样式等几乎所有的word文档中能常用的功能 。
 
但只对windows系统电脑的docx后缀文档有效
 
Python-docx的安装非常简单 , 如下图所示
pip install python-docx就可以安装python-docx了
添加标题
用add_heading()方法
添加正文
用add_paragraph()方法
 
from docx import Document#创建一个Document对象document = Document()#标题document.add_heading('中学生必读书籍')#加上段落(正文)document.add_paragraph('《石头记》')document.add_paragraph('《钢铁是怎样炼成的》')document.save(r"D:doctest.docx")#生成文档截图生成文档截图
如何用python实现自动化办公

文章插图
 
add_run()方法可以在目前段落后添加内容的同时还可以设置字体的样式
 
第12~15行添加个空段落 , 赋值为p , 然后在此空段落后面添加粗体字和斜体字
如何用python实现自动化办公

文章插图
【如何用python实现自动化办公】 
生成文档截图
如何用python实现自动化办公

文章插图
 
添加图片
用到add_picture()方法
默认插入是图片原大小 , 若果要调整大小 , 则需要在参数上写上长宽大小
document.add_picture(r"D:dochusky.png", width=Inches(1.0), height=Inches(1.0))下方代码 , 我插入了一只哈士奇图片
如何用python实现自动化办公

文章插图
 
生成文档截图
如何用python实现自动化办公

文章插图
 
添加分页符
用到add_page_break()方法
并在新页面添加了新的正文
如何用python实现自动化办公

文章插图
 
可见 , 添加分页符后 , 文档有两页纸了
如何用python实现自动化办公

文章插图
 
利用python查询文件编码在处理一些csv和Excel格式文件
在读取中文的情况下 , 通常会遇到一些编码的问题
传统方法都是尝试用utf-8和gbk打开
然后都打不开(如以下两图)
如何用python实现自动化办公

文章插图
 

如何用python实现自动化办公

文章插图
 
上网翻阅了资料 , 见到推荐说多尝试其他文字编码
比如说GB2312编码、GB18030编码 , 但都不可以打开
我当时就想 , 与其猜灯谜般尝试这么多编码 , 不如看看有没有方法直接知道这个文件是什么编码
在搜索引擎的结果中 , 推荐了chardet库来查看编码方式的 。
如何用python实现自动化办公

文章插图
 
把文件解释成二进制 , 再调用chardet模块的detect方法读取这个文件数据就知道这个文件是用什么编码了 。
如何用python实现自动化办公

文章插图
 
可以看到 , 这个文件是用utf-16编码格式的
用utf-16编码 , 就能打开这个csv文件了
 
会持续更新 , 敬请期待 , 要源码的可以私我




    推荐阅读