最全总结 | 聊聊 Python 办公自动化之 PDF(上)

1. 前言

自动化办公,非 Python 莫属!

从本篇文章开始,我们继续聊聊自动化办公中另外一个常用系列:PPT

2. 准备一下

Python 操作 PPT 最强大的依赖库是:python-pptx

所以,在开始操作之前,我们需要在虚拟环境下安装这个依赖库

# 安装依赖
pip3 install python-pptx

3. PPT 结构

首先,我们需要了解一个 PPT 文档的页面结构

  • 一个 PPT 文档对应一个 Presentation 对象

  • 一个 Presentation 包含多个 Slide 对象,每一个 Slide 代表一个幻灯片

  • 每一张幻灯片的内容都是由各种形状 Shape 组成

其次,PPT 中的内容元素都是由各种形状构成

比如:文字框、图片、占位符、表格、普通形状等

通过翻看源码,发现他们都定义在 MSO_SHAPE_TYPE  类中

最后,我们需要了解一下 PPT 中的 版式模板

使用 Presentation 对象的 属性方法 slide_layouts 可以获取内置的 11 种母版样式

# 使用Presentation获取PPT内置的11种版式样式
# 版式索引从0开始
slide_layout = presentation.slide_layouts[slide_style_index]

他们分别是:

  • Title Slide 标题幻灯片

  • Title and Content    标题和内容幻灯片

  • Section Header    节标题幻灯片

  • Two Content    两栏内容幻灯片

  • Comparison    比较幻灯片

  • Title Only    仅标题的幻灯片

  • Blank    空白幻灯片

  • Content with Caption    内容和标题的幻灯片

  • Picture with Caption    图片和标题的幻灯片

  • Title and Vertical Text 标题和竖排内容

  • Vertical Title and Text 竖排标题和文本

当然,也可以在 Microsoft PPT / WPS 中查看对应母版的样式

这里补充一下,除了内置的版式样式,也可以通过占位符 PlaceHolder 去自定义母版,满足一些特定的场景需求

4. 幻灯片管理

一个 PPT 文件是由一个或多张幻灯片组成

1-1  那如何添加一张一张幻灯片呢?

这里,只需要通过下面 3 个步骤

  • 实例化一个 Presentation 对象

  • 通过内置的版本样式,新建一个版本样式 Layout

  • 通过版本样式 Layout,添加一张幻灯片

def add_slide(presentation, slide_style_index):
"""
在PPT文档中,以内置的版式添加幻灯片
:param presentation:文档对象
:param slide_style_index:版式索引
:return:
"""
# PPT版式样式
# 内置有11种版式样式
# 0:Title Slide 标题幻灯片
# 1:Title and Content  标题和内容
# 2:Section Header   节标题
# 3:Two Content   两栏内容
# 4:Comparison  比较
# 5:Title Only  仅标题
# 6:Blank  空白
# 7:Content with Caption   内容和标题
# 8:Picture with Caption   图片和标题
# 9:Title and Vertical Text  标题和竖排内容
# 10:Vertical Title and Text  竖排标题和文本
slide_layout = presentation.slide_layouts[slide_style_index]
# 通过样式Layout,新增一张幻灯片
slide = presentation.slides.add_slide(slide_layout)
return slide
# 1.1 新增幻灯片
slide1 = add_slide(self.presentation, 0)
slide2 = add_slide(self.presentation, 1)
slide3 = add_slide(self.presentation, 2)
slide4 = add_slide(self.presentation, 3)

1-2  获取已有的幻灯片或某一张幻灯片?

Presentation 对象的 slides 属性 会返回当前 PPT 文档中所有的幻灯片对象列表

def get_slides(presentation):
"""
获取所有的幻灯片
:param presentation:
:return:
"""
# 所有幻灯片
slides = presentation.slides
# 幻灯片数目
slide_num = len(slides)
return slides, slide_num
def get_slide(presentation, slide_index):
"""
根据索引,获取某一个幻灯片
:param presentation:
:param slide_index:页面索引,从0开始
:return:
"""
slides, slide_num = get_slides(presentation=presentation)
return slides[slide_index]
# 1.2.1 获取所幻灯片
slides, slide_num = get_slides(self.presentation)
print('现有幻灯片:', slides)
print('幻灯片数目:', slide_num)
# 1.2.2 获取某一个幻灯片
slide = get_slide(self.presentation, 1)
print(slide.shapes)

1-3  如果需要删除某一张幻灯片,如何破?

这个也简单,只需要先获取目前幻灯片对象,然后使用下面方法移除即可

def del_slide(presentation, slide_index=0):
"""
删除某一张幻灯片
:param presentation:
:param slide_index: 索引
:return:
"""
# 所有幻灯片的列表
slides = list(presentation.slides._sldIdLst)
# 根据索引,删除某一张幻灯片
presentation.slides._sldIdLst.remove(slides[slide_index])
# 1.3 根据索引,删除PPT文档中某一张幻灯片
# 比如:删除第4张幻灯片
del_slide(self.presentation, 3)

5. 文字及段落

我们首先需要指定一个幻灯片对象 Slide,它可以是已有的幻灯片,也可以是新建的一张幻灯片

接着,使用幻灯片对象的 slide.shapes 属性,获取当前幻灯片中的所有形状 Shape 组成的队列

最后利用形状队列的下面这个函数添加一个文本框,函数返回值为一个:文本框对象

add_textbox( left , top , width , height )

该函数参数分别为:

  • left  左边距

  • top  上边距

  • width  文字框宽度

  • height  文字框高度

这里需要引出另外一个概念:文字形状

PS:文字形状便于在文字框中添加段落和设置样式,通过「文本框对象」的属性函数 text_frame 获取

def insert_textbox(slide, left, top, width, height, unit=Inches):
"""
幻灯片中添加文本框
:param unit: 单元,默认设置为Inches
:param slide: 幻灯片对象
:param left: 左边距
:param top:  上边距
:param width: 宽度
:param height: 高度
:return:
"""
# 文本框
textbox = slide.shapes.add_textbox(left=unit(left),
top=unit(top),
width=unit(width),
height=unit(height))
# 文本框形状
tf = textbox.text_frame
return textbox, tf

为了便于使用,我对幻灯片中插入文字框这一动作进行了一次封装

长度单位默认设置为:Inches,也可以自定义为厘米等单位

接下来,我们来操作文字框及段落的常见操作

1-1  插入文本框,并设置默认段落内容

插入文本框的同时,文本框形状对象会自带一个段落,可以对这个段落设置内容

# 2、往幻灯片中插入一个文本框,返回一个文本框对象和一个文本框形状对象
textbox, tf = insert_textbox(slide, 8, 2, 10, 4, unit=Cm)
# 2.1 默认的段落
paragraph_default = tf.paragraphs[0]
paragraph_default.text = "设置段落默认的内容"

1-2  文本框中新增一个段落

查看源码发现,文本框形状对象是 TextFrame 的子类,因此可以使用 TextFrame 类中的 add_paragraph() 函数添加一个新的段落

# 2.2 添加一个新的段落
paragraph_new = tf.add_paragraph()
# 2.3 给段落设置内容
paragraph_new.text = "欢迎关注公众号:AirPython\n每周分享 Python 原创技术干货!"

1-3  设置段落及文字样式

和 Word 一样,使用 python-pptx 同样可以设置 PPT 文档的段落样式

其中

对齐方式:对齐方式是针对段落的,只需要指定段落对象的 alignment 的属性值即可

def set_parg_font_style(paragraph, font_name=None, font_color=None, font_size=-1, font_bold=False, font_italic=False,
paragraph_alignment=PP_ALIGN.CENTER):
"""
设置段落中文本的样式,包含:字体名称、颜色、大小、是否加粗、是否斜体
:param paragraph_alignment: 段落对齐方式
:param paragraph:
:param font_name:
:param font_color:
:param font_size:
:param font_bold:
:param font_italic:
:return:
"""
# 对齐方式
# 注意:对齐方式是针对段落的
paragraph.alignment = paragraph_alignment
# 获取段落中字体对象
font = paragraph.font
# 设置字体样式
set_font_style(font, font_name, font_color, font_size, font_bold, font_italic)
return font

段落文字属性:使用段落对象的 font 属性获取字体对象,接着设置字体名称、大小、颜色、是否斜体、加粗

def set_font_style(font, font_name=None, font_color=None, font_size=-1, font_bold=False, font_italic=False):
"""
设置字体样式
:param font:
:param font_name:
:param font_color:
:param font_size:
:param font_bold:
:param font_italic:
:return:
"""
# 字体名称
if font_name:
font.name = font_name
# 字体颜色
if font_color and len(font_color) == 3:
font.color.rgb = RGBColor(font_color[0], font_color[1], font_color[2])
# 字体大小
if font_size != -1:
font.size = Pt(font_size)
# 是否加粗,默认不加粗
font.bold = font_bold
# 是否倾斜,默认不倾斜
font.italic = font_italic

1-4  设置文字框的背景颜色

设置文字框背景颜色只需要 2 步

  • 将形状的填充类型设置为纯色

  • 设置文字框的背景颜色

def set_widget_bg(widget, bg_rgb_color=None):
"""
设置【文本框textbox/单元格/形状】的背景颜色
:param widget:文本框textbox、单元格、形状
:param bg_rgb_color:背景颜色值
:return:
"""
if bg_rgb_color and len(bg_rgb_color) == 3:
# 1、将形状填充类型设置为纯色
widget.fill.solid()
# 2、设置文本框的背景颜色
widget.fill.fore_color.rgb = RGBColor(bg_rgb_color[0], bg_rgb_color[1], bg_rgb_color[2])
# 4、设置文字框的背景颜色
set_widget_bg(textbox, [0, 255, 0])

需要指出的是,该方法同样适用于设置表格单元格、普通形状的背景颜色

1-5 文本框的自动对齐

一旦文本框设置一段很长的文字,单行可能显示不完全

这时候,我们只需要设置文字形状的 word_wrap 值为 True,则可以让文本框的文字自动换行显示

# 5、设置文本框的文字自动对齐
tf.word_wrap = True

6. 最后

受限于篇幅,本篇文章仅聊到了 PPT 的结构、幻灯片管理、段落及文字;更多复杂操作、项目实战,会在后面的文章中进行说明

要获取全部源码,关注公众号「 AirPython 」,后台回复「  ppt 」即可获得全部源码

如果你觉得文章还不错,请大家 点赞、分享、留言 下,因为这将是我持续输出更多优质文章的最强动力!

博客园精华区
我还没有学会写个人说明!
上一篇

小鹅花钱使用场景丰富,更有亿元免息天天领

下一篇

公益践行,四三九九入选2020游戏公益典型案例

你也可能喜欢

评论已经被关闭。

插入图片