计算机视觉

发布日期: 2020-12-02

文章字数: 6.7k

阅读时长: 28 分

阅读次数:

1 PIL介绍

图像库PIL(Python Image Library)是Python的第三方图像处理库，但是由于其强大的功能与众多的使用人数，几乎已经被认为是python官方图像处理库了。PIL历史悠久，原来是只支持python2.x的版本的，后来出现了移植到python3的库pillow，pillow号称是friendly fork for PIL，其功能和PIL差不多，但是支持python3。本文主要介绍PIL那些最常用的特性与用法，具体函数和使用实例见https://pillow.readthedocs.io/en/stable/reference/Image.html

PIL可以做的事情：

图像归档(Image Archives)。PIL非常适合于图像归档以及图像的批处理任务。你可以使用PIL创建缩略图，转换图像格式，打印图像等等。

图像展示(Image display)。PIL较新的版本支持包括Tk PhotoImage，BitmapImage还有windows DIB等接口。PIL支持众多的GUI框架接口，可以用于图像展示。

图像处理(Image Processing)。PIL包括了基础的图像处理函数，包括对点的处理，使用众多的卷积核(convolution kernels)做过滤(filter),还有颜色空间的转换。PIL库同样支持图像的大小转换，图像旋转，以及任意的仿射变换。PIL还有一些直方图的方法，允许你展示图像的一些统计特性。这个可以用来实现图像的自动对比度增强，还有全局的统计分析等。

2 PIL中的Image类及其常用方法

Image类是PIL中的核心类，你有很多种方式来对它进行初始化，比如从文件中加载一张图像，处理其他形式的图像，或者是从头创造一张图像等。Image模块操作的基本属性和方法都包含于此模块内。如size、model、format等属性；open、save、conver、show等方法。下面是PIL的 Image类中常用的属性和方法:

2.1 基本属性

2.1.1 format属性

im.format ⇒ string or None

这个属性标识了图像来源，如果图像不是从文件读取它的值就是None。

from PIL import Image
im = Image.open("3d.jpg")
print(im.format) #打印出格式信息
im.show()

2.1.2 mode属性

im.mode ⇒ string

图像的模式，常见的mode 有 “L” (luminance) 表示灰度图像，“RGB”表示真彩色图像，和 “CMYK” 表示出版图像，表明图像所使用像素格式。如下为常见的mode描述：

“1”表示1位像素，黑白图像，存成8位像素

“L”表示8位像素，黑白图像

“P”表示9位像素，使用调色板映射到任何其他模式

“RGB”表示3*8位像素，彩色图像

“RGBA”表示4*8位像素，彩色图像+透明通道

“CMYK”表示4*8位像素，印刷四色模式或彩色印刷模式

“YCbCr”表示3*8位像素，色彩视频格式

“I”表示32位整型像素

“F”表示33位浮点型像素

代码实例如下：

from PIL import Image
im = Image.open("3d.jpg")
print(im.mode) #打印模式属性
im.show()

2.1.3 size属性

im.size ⇒ (width, height)

图像的尺寸，按照像素数计算，它的返回值为宽度和高度的二元组（width, height）。

from PIL import Image
im = Image.open("3d.jpg")
print(im.size) ## 打印图像尺寸
im.show()

命令行输出图片的尺寸为426×306。

2.1.4 palette属性

im.palette ⇒ palette or None

颜色调色板表格。如果图像的模式是“P”，则返回Image Palette类的实例；否则，将为None。

如下为对非“P”模式下的图像进行palette信息显示：

from PIL import Image
im = Image.open("3d.jpg")
print(im.palette)

返回值为none，对图像进行convert操作，转换成“P”模式：

from PIL import Image
im = Image.open("3d.jpg")
new_im = im.convert('P')
print(new_im.mode)
print(new_im.palette)

返回值为ImagePalette类的实例。

2.1.5 info属性

im.info ⇒ dictionary

存储图像相关数据的字典。文件句柄使用该字典传递从文件中读取的各种非图像信息。大多数方法在返回新的图像时都会忽略这个字典；因为字典中的键并非标准化的，对于一个方法，它不知道自己的操作如何影响这个字典。如果用户需要这些信息，需要在方法open()返回时保存这个字典。

from PIL import Image
im = Image.open("3d.jpg")
print(im.info)

2.2 基本方法

2.2.1 open方法

Image.open(file) ⇒ image 
Image.open(file, mode) ⇒ image

要从文件加载图像，使用open()函数，在Image模块代码如下:

from PIL import Image           #调用库，包含图像类
im = Image.open("3d.jpg")       #文件存在的路径，如果没有路径就是当前目录下文件
im.show()

需要知道的是在win的环境下im.show的方式为win自带的图像显示应用，打开并确认给定的图像文件。

该函数只会读文件头，而真实的图像数据直到试图处理该数据时才会从文件读取（调用load()方法将强行加载图像数据）。如果变量mode被设置，那必须是“r”。用户可以使用一个字符串（表示文件名称的字符串）或者文件对象作为变量file的值。文件对象必须实现read()，seek()和tell()方法，并且以二进制模式打开。

2.2.2 save方法

im.save(outfile,options…)
im.save(outfile, format, options…)

用Image类的save()方法保存文件，使用给定的文件名保存图像。如果变量format缺省，则从文件名称的扩展名判断文件的格式，该方法返回为空。关键字options为文件编写器提供一些额外的指令。如果编写器不能识别某个选项，它将忽略它。用户可以使用文件对象代替文件名称。在这种情况下，用户必须指定文件格式。文件对象必须实现seek()、tell()和write()方法，且其以二进制模式打开。

如果方法save()因为某些原因失败，这个方法将产生一个异常（通常为IOERROR异常）。如果发生了异常，该方法也有可能已经创建了文件，并向文件写入了一些数据。如果需要的话，用户的应用程序可以删除这个不完整的文件。

2.2.3 jpg转换成png方法

from PIL import Image
im = Image.open("3d.jpg")
print(im)
im.save("3d.png")  #将"3d.jpg"保存为3d.png"
im = Image.open("3d.png")  #打开新的png图片
print(im.format, im.size, im.mode)

2.2.4 convert方法

①im.convert(mode)⇒ image

将当前图像转换为其他模式，并且返回新的图像。当从一个调色板图像转换时，这个方法通过这个调色板来转换像素。如果不对变量mode赋值，该方法将会选择一种模式，在没有调色板的情况下，使得图像和调色板中的所有信息都可以被表示出来。

当从一个颜色图像转换为黑白图像时，PIL库使用ITU-R601-2 luma转换公式：L = R * 299/1000 + G * 587/1000 + B * 114/1000

当转换为2位图像（模式“1”）时，源图像首先被转换为黑白图像。结果数据中大于127的值被设置为白色，其他的设置为黑色；这样图像会出现抖动。如果要使用其他阈值，更改阈值127，可以使用方法point()。为了去掉图像抖动现象，可以使用dither选项。

from PIL import Image
im = Image.open("3d.jpg")
new_im = im.convert('P')
print(new_im.mode)
new_im.show()

②P模式：im.convert(“P”,**options) ⇒ image

这个与第一个方法定义一样，但是当“RGB”图像转换为8位调色板图像时能更好的处理。可供选择的选项为：

Dither=. 控制颜色抖动。默认是FLOYDSTEINBERG，与邻近的像素一起承担错误。不使能该功能，则赋值为NONE。

palette=. 控制调色板的产生。默认是WEB，这是标准的216色的“web
palette”。要使用优化的调色板，则赋值为adaptive。

colors=. 当选项palette为ADAPTIVE时，控制用于调色板的颜色数目。默认是最大值，即256种颜色

③im.convert(mode,matrix) ⇒ image

使用转换矩阵将一个“RGB”图像转换为“L”或者“RGB”图像，变量matrix为4或者16元组。

from PIL import Image
im = Image.open("3d.jpg")
print(im.mode)
rgb2xyz = (0.412453,0.357580, 0.180423, 0,
  0.212671,0.715160, 0.072169, 0,
  0.019334,0.119193, 0.950227, 0 )
new_im = im.convert("L", rgb2xyz)
print(new_im.mode)
new_im.show()

2.2.5 new方法

Image.new(mode,size) ⇒ image
Image.new(mode, size,color) ⇒ image

使用给定的变量mode和size生成新的图像。size是给定的宽/高二元组，这是按照像素数来计算的。对于单通道图像，变量color只给定一个值；对于多通道图像，变量color给定一个元组（每个通道对应一个值）。

在版本1.1.4及其之后，用户也可以用颜色的名称，比如给变量color赋值为“red”。如果没有对变量color赋值，图像内容将会被全部赋值为0（为黑色）。如果变量color是空，图像将不会被初始化，即图像的内容全为0，这对向该图像复制或绘制某些内容是有用的。

下面将图像设置为128x128大小的红色图像：

from PIL import Image
im = Image.open("3d.jpg")
n_im= Image.new("RGB", (128, 128), "#FF0000")
n_im.show()

生成的图像为128x128大小的黑色图像，因为变量color不赋值的话，图像内容被设置为0，即黑色：

from PIL import Image
im = Image.open("3d.jpg")
n_im= Image.new("RGB", (128, 128))
n_im.show()

生成的图像为128x128大小的绿色图像：

from PIL import Image
im = Image.open("3d.jpg")
n_im= Image.new("RGB", (128, 128),"green")
n_im.show()

2.2.6 copy方法

im.copy() ⇒ image

拷贝这个图像。如果用户想粘贴一些数据到这张图，可以使用这个方法，但是原始图像不会受到影响。

from PIL import Image
im = Image.open("3d.jpg")
im_copy = im.copy()

图像im_copy和im完全一样。

2.2.7 crop方法

im.crop(box) ⇒ image

从当前的图像中返回一个矩形区域的拷贝。变量box是一个四元组，定义了左、上、右和下的像素坐标。用来表示在原始图像中截取的位置坐标，如box(100,100,200,200)就表示在原始图像中以左上角为坐标原点，截取一个100*100（像素为单位）的图像，对源图像的改变可能或者可能不体现在裁减下来的图像中。为了获取一个分离的拷贝，对裁剪的拷贝调用方法load()。

from PIL import Image
im = Image.open("3d.jpg")
box = (20, 30, 300, 200)  #确定拷贝区域大小
region = im.crop(box)  #将im表示的图片对象拷贝到region中，大小为box
region.show()

2.2.8 paste方法

im.paste(image,box)

将一张图粘贴到另一张图像上。变量box或者是一个给定左上角的2元组，或者是定义了左，上，右和下像素坐标的4元组，或者为空（与（0，0）一样）。如果给定4元组，被粘贴的图像的尺寸必须与区域尺寸一样。如果模式不匹配，被粘贴的图像将被转换为当前图像的模式。

from PIL import Image
im = Image.open("3d.jpg")
box=[0,0,100,100]
im_crop = im.crop(box)
print(im_crop.size,im_crop.mode)
im.paste(im_crop, (100,100)) #(100,100,0,0)
im.paste(im_crop, (400,400,500,500))
im.show()

2.2.9 filter方法

im.filter(filter) ⇒ image

返回一个使用给定滤波器处理过的图像的拷贝。具体参考图像滤波在ImageFilter 模块的应用，在该模块中，预先定义了很多增强滤波器，可以通过filter( )函数使用，预定义滤波器包括：BLUR、CONTOUR、DETaiL、EDGE_ENHANCE、EDGE_ENHANCE_MORE、EMBOSS、FIND_EDGES、SMOOTH、SMOOTH_MORE、SHARPEN。其中BLUR就是均值滤波，CONTOUR找轮廓，FIND_EDGES边缘检测，使用该模块时，需先导入。

from PIL import Image
from PIL import ImageFilter #调取ImageFilter
imgF = Image.open("3d.jpg")
bluF = imgF.filter(ImageFilter.BLUR)#均值滤波
conF = imgF.filter(ImageFilter.CONTOUR) #找轮廓
edgeF = imgF.filter(ImageFilter.FIND_EDGES) #边缘检测
imgF.show()
bluF.show()
conF.show()
edgeF.show()

2.2.10 blend方法

Image.blend(image1,image2, alpha) ⇒ image

使用给定的两张图像及透明度变量alpha，插值出一张新的图像。这两张图像必须有一样的尺寸和模式。

合成公式为：out = image1 (1.0 - alpha) + image2 alpha

若变量alpha为0.0，返回第一张图像的拷贝。若变量alpha为1.0，将返回第二张图像的拷贝。对变量alpha的值无限制。

from PIL import Image
im1 = Image.open("3d.jpg")
im2 = Image.open("3dd.jpg")
print(im1.mode,im1.size)
print(im2.mode,im2.size)
im = Image.blend(im1, im2, 0.40)
im.show()

需保证两张图像的模式和大小是一致的。im1按照40%的透明度，im2按照60%的透明度，合成为一张。

2.2.11 split方法

im.split() ⇒ sequence

返回当前图像各个通道组成的一个元组。例如，分离一个“RGB”图像将产生三个新的图像，分别对应原始图像的每个通道（红，绿，蓝）。

from PIL import Image
im = Image.open("3d.jpg")
r,g,b = im.split()
print(r.mode)
print(r.size)
print(im.size)

2.2.12 composite方法

Image.composite(image1,image2, mask) ⇒ image

复合类使用给定的两张图像及mask图像作为透明度，插值出一张新的图像。变量mask图像的模式可以为“1”，“L”或者“RGBA”。所有图像必须有相同的尺寸。

from PIL import Image
im1 = Image.open("3d.jpg")
im2 = Image.open("3dd.jpg")
r,g,b = im1.split() #分离出r，g，b
print(b.mode)
print(im1.mode,im1.size)
print(im2.mode,im2.size)
im = Image.composite(im1,im2,b)
im.show()

b.mode为”L”，两图尺寸一致。

2.2.13 eval方法

Image.eval(image,function) ⇒ image

使用变量function对应的函数（该函数应该有一个参数）处理变量image所代表图像中的每一个像素点。如果变量image所代表图像有多个通道，那变量function对应的函数作用于每一个通道。注意：变量function对每个像素只处理一次，所以不能使用随机组件和其他生成器。

from PIL import Image
im = Image.open("3d.jpg")
def fun1(x):
   return x*0.3
def fun2(y):
   return y*2.0
im1_eval = Image.eval(im, fun1)
im2_eval = Image.eval(im, fun2)
im1_eval.show()
im2_eval.show()

2.2.14 merge方法

Image.merge(mode,bands) ⇒ image

合并类使用一些单通道图像，创建一个新的图像。变量bands为一个图像的元组或者列表，每个通道的模式由变量mode描述。所有通道必须有相同的尺寸。
变量mode与变量bands的关系：len(ImageMode.getmode(mode).bands)= len(bands)

from PIL import Image
im1 = Image.open("3d.jpg")
im2 = Image.open("3dd.jpg")
r1,g1,b1 = im1.split()
r2,g2,b2 = im2.split()
print(r1.mode,r1.size,g1.mode,g1.size)
print(r2.mode,r2.size,g2.mode,g2.size)
new_im=[r1,g2,b2]
print(len(new_im))
im_merge = Image.merge("RGB",new_im)
im_merge.show()

2.2.15 draft方法

im.draft(mode,size)

代码示例如下：

from PIL import Image
im = Image.open("3d.jpg")
print(im.size,im.mode)
new_im = im.draft("L", (200,200))
print(new_im.size,new_im.mode)
new_im.show()

关键信息显示。

2.2.16 getbands方法

im.getbands()⇒ tuple of strings

返回包括每个通道名称的元组。例如，对于RGB图像将返回（“R”,“G”,“B”）。

from PIL import Image
im = Image.open("3d.jpg")
print(im.getbands())

2.2.17 getbbox方法

im.getbbox() ⇒ 4-tuple or None

计算图像非零区域的包围盒。这个包围盒是一个4元组，定义了左、上、右和下像素坐标。如果图像是空的，这个方法将返回空。

from PIL import Image
im = Image.open("3d.jpg")
print(im.getbbox())

2.2.18 getdata方法

im.getdata() ⇒ sequence

以包含像素值的sequence对象形式返回图像的内容。这个sequence对象是扁平的，以便第一行的值直接跟在第零行的值后面，等等。这个方法返回的sequence对象是PIL内部数据类型，它只支持某些sequence操作，包括迭代和基础sequence访问。使用list(im.getdata())，将它转换为普通的sequence。Sequence对象的每一个元素对应一个像素点的R、G和B三个值。

from PIL import Image
im = Image.open("3d.jpg")
sequ = im.getdata()
sequ0 = list(sequ)
print(sequ0[0])
print(sequ0[1])
print(sequ0[2])

2.2.19 getextrema方法

im.getextrema() ⇒ 2-tuple

返回一个2元组，包括该图像中的最小和最大值

from PIL import Image
im = Image.open("3d.jpg")
print(im.getextrema())

该方法返回了R/G/B三个通道的最小和最大值的2元组。

2.2.20 getpixel方法

im.getpixel(xy) ⇒ value or tuple

返回给定位置的像素值。如果图像为多通道，则返回一个元组。该方法执行比较慢；如果用户需要使用python处理图像中较大部分数据，可以使用像素访问对象（见load），或者方法getdata()。

from PIL import Image
im = Image.open("3d.jpg")
print(im.getpixel((0,0)))
print(im.getpixel((4,0)))
r,g,b = im.split()
print(b.getpixel((11,8)))

2.2.21 histogram方法

①im.histogram()⇒ list

返回一个图像的直方图。这个直方图是关于像素数量的list，图像中的每个象素值对应一个成员。如果图像有多个通道，所有通道的直方图会连接起来（例如，“RGB”图像的直方图有768个值)。二值图像（模式为“1”）当作灰度图像（模式为“L”）处理。

from PIL import Image
im = Image.open("3d.jpg")
imhis = im.histogram()
print(len(imhis))
print(imhis[0])
print(imhis[150])
print(imhis[300])

②im.histogram(mask)⇒ list

返回图像中模板图像非零地方的直方图。模板图像与处理图像的尺寸必须相同，并且要么是二值图像（模式为“1”），要么为灰度图像（模式为“L”）。

from PIL import Image
im = Image.open("3d.jpg")
r,g,b = im.split()
imhis = im.histogram()
print(r.mode)
print(len(imhis))
print(imhis[0])
print(imhis[150])
print(imhis[300])

2.2.22 load方法

im.load()

为图像分配内存并从文件中加载它（或者从源图像，对于懒操作）。正常情况下，用户不需要调用这个方法，因为在第一次访问图像时，Image类会自动地加载打开的图像。目前的版本，方法load()返回一个用于读取和修改像素的像素访问对象。这个访问对象像一个二维队列，如：

pix = im.load()
print(pix[x, y])

其中pix[x, y] =value，通过这个对象访问比方法getpixel()和putpixel()快很多。

from PIL import Image
im = Image.open("3d.jpg")
pix = im.load()
print(pix[0,2])

2.2.23 paste方法

①im.paste(colour,box)

使用同一种颜色填充变量box对应的区域。对于单通道图像，变量colour为单个颜色值；对于多通道，则为一个元组。

from PIL import Image
im = Image.open("3d.jpg")
im.paste((256,256,0),(0,0,100,100))#(256,256,0)表示黄色
im.show()

from PIL import Image
im = Image.open("3d.jpg")
im.paste("blue",(0,0,100,100))#或者“blue”
im.show()

②im.paste(image,box, mask)

使用变量mask对应的模板图像来填充所对应的区域。可以使用模式为“1”、“L”或者“RGBA”的图像作为模板图像。模板图像的尺寸必须与变量image对应的图像尺寸一致。如果变量mask对应图像的值为255，则模板图像的值直接被拷贝过来；如果变量mask对应图像的值为0，则保持当前图像的原始值。变量mask对应图像的其他值，将对两张图像的值进行透明融合,如果变量image对应的为“RGBA”图像，即粘贴的图像模式为“RGBA”，则alpha通道被忽略。用户可以使用同样的图像作为原图像和模板图像。

from PIL import Image
im = Image.open("3d.jpg")
box=[300,300,400,400]
im_crop =im.crop(box)
r,g,b =im_crop.split()
im.paste(im_crop, (200,200,300,300), r)
im.show()

2.2.24 putdata方法

im.putdata(data)
im.putdata(data, scale, offset)

从sequence对象中拷贝数据到当前图像，从图像的左上角（0，0）位置开始。变量scale和offset用来调整sequence中的值：pixel = value*scale + offset

如果变量scale忽略，则默认为1.0。如果变量offset忽略，则默认为0.0。

from PIL import Image
im = Image.open("3d.jpg")
r, g, b = im.split()
print(r.getpixel((0, 0)),r.getpixel((1, 0)),r.getpixel((2, 0)),r.getpixel((3, 0)),r.putdata([1, 2, 3, 4]),r.getpixel((0, 0)),r.getpixel((1, 0)),r.getpixel((2, 0)),r.getpixel((3, 0)),

2.2.25 resize方法

im.resize(size) ⇒ image
im.resize(size, filter) ⇒ image

返回改变尺寸的图像的拷贝。变量size是所要求的尺寸，是一个二元组：（width, height）。变量filter为NEAREST、BILINEAR、BICUBIC或者ANTIALIAS之一。如果忽略，或者图像模式为“1”或者“P”，该变量设置为NEAREST。在当前的版本中bilinear和bicubic滤波器不能很好地适应大比例的下采样（例如生成缩略图）。用户需要使用ANTIALIAS，除非速度比质量更重要。

from PIL import Image
im = Image.open("3d.jpg")
region = im.resize((400, 400)) #重新设定大小
region.show()

2.2.26 rotate方法

im.rotate(angle) ⇒ image
im.rotate(angle,filter=NEAREST, expand=0) ⇒ image

返回一个按照给定角度顺时钟围绕图像中心旋转后的图像拷贝。变量filter是NEAREST、BILINEAR或者BICUBIC之一。如果省略该变量，或者图像模式为“1”或者“P”，则默认为NEAREST。变量expand，如果为true，表示输出图像足够大，可以装载旋转后的图像。如果为false或者缺省，则输出图像与输入图像尺寸一样大。

from PIL import Image
im = Image.open("3d.jpg")
im_45 = im.rotate(45)
im_30 = im.rotate(30, Image.NEAREST,1)
print(im_45.size,im_30.size)
im_45.show()
im_30.show()

2.2.27 seek方法

im.seek(frame)

在给定的文件序列中查找指定的帧。如果查找超越了序列的末尾，则产生一个EOFError异常。当文件序列被打开时，PIL库自动指定到第0帧上。

from PIL import Image
im_gif = Image.open("miaomiao.gif")
print(im_gif.mode)
im_gif.show()#第0帧
im_gif.seek(1)
im_gif.show()
im_gif.seek(3)
im_gif.show()

2.2.28 tell方法

im.tell() ⇒ integer

返回当前帧所处位置，从0开始计算。

from PIL import Image
im_gif = Image.open("3d.gif")
print(im_gif.tell())
im_gif.seek(8)
print(im_gif.tell())

2.2.29 thumbnail方法

im.thumbnail(size)
im.thumbnail(size, filter)

修改当前图像，使其包含一个自身的缩略图，该缩略图尺寸不大于给定的尺寸。该方法计算一个合适的缩略图尺寸，使其符合当前图像的宽高比，调用方法draft()配置文件读取器，最后改变图像的尺寸。变量filter应该是NEAREST、BILINEAR、BICUBIC或者ANTIALIAS之一。如果省略该变量，则默认为NEAREST。

注意：在当前PIL的版本中，滤波器bilinear和bicubic不能很好地适应缩略图产生。用户应该使用ANTIALIAS，图像质量最好。如果处理速度比图像质量更重要，可以选用其他滤波器。这个方法在原图上进行修改。如果用户不想修改原图，可以使用方法copy()拷贝一个图像。这个方法返回空。

from PIL import Image
im = Image.open("3d.jpg")
im.thumbnail((100,100))

2.2.30 transform方法

①

im.transform(size,method, data) ⇒ image
im.transform(size, method, data, filter) ⇒ image

用给定的尺寸生成一张新的图像，与原图有相同的模式，使用给定的转换方式将原图数据拷贝到新的图像中。

在当前的PIL版本中，参数method为EXTENT（裁剪出一个矩形区域），AFFINE（仿射变换），QUAD（将正方形转换为矩形），MESH（一个操作映射多个正方形）或者PERSPECTIVE。

变量filter定义了对原始图像中像素的滤波器。在当前的版本中，变量filter为NEAREST、BILINEAR、BICUBIC或者ANTIALIAS之一。如果忽略，或者图像模式为“1”或者“P”，该变量设置为NEAREST。

from PIL import Image
im = Image.open("3d.jpg")
print(im.size)
imtra = im.transform((200, 200), Image.EXTENT, (0, 0, 300, 300))
print(imtra.size)
imtra.show()

②

im.transform(size,EXTENT, data) ⇒ image
im.transform(size, EXTENT, data, filter) ⇒ image

从图像中裁剪一个区域。变量data为指定输入图像中两个坐标点的4元组(x0,y0,x1,y1)。输出图像为这两个坐标点之间像素的采样结果。例如，如果输入图像的(x0,y0)为输出图像的(0，0)点，(x1,y1)则与变量size一样。

这个方法可以用于在当前图像中裁剪，放大，缩小或者镜像一个任意的长方形。它比方法crop()稍慢，但是与resize操作一样快。

③

im.transform(size, AFFINE, data) ⇒ image
im.transform(size, AFFINE,data, filter) ⇒ image

对当前的图像进行仿射变换，变换结果体现在给定尺寸的新图像中。变量data是一个6元组(a,b,c,d,e,f)，包含一个仿射变换矩阵的第一个两行。输出图像中的每一个像素（x，y），新值由输入图像的位置（ax+by+c, dx+ey+f）的像素产生，使用最接近的像素进行近似。

这个方法用于原始图像的缩放、转换、旋转和裁剪。

from PIL import Image
im = Image.open("3d.jpg")
print(im.size)
imtra = im.transform((200, 200), Image.AFFINE, (1,2,3,2,1,4))
print(imtra.size)
imtra.show()

④

im.transform(size,QUAD, data) ⇒ image
im.transform(size, QUAD, data, filter) ⇒ image

输入图像的一个四边形（通过四个角定义的区域）映射到给定尺寸的长方形。变量data是一个8元组(x0,y0,x1,y1,x2,y2,x3,y3)，它包括源四边形的左上，左下，右下和右上四个角。

from PIL import Image
im = Image.open("3d.jpg")
print(im.size)
imtra = im.transform((200, 200), Image.QUAD, (0,0,0,500,600,500,600,0))
print(imtra.size)
imtra.show()

⑤

im.transform(size,PERSPECTIVE, data) ⇒ image
im.transform(size, PERSPECTIVE, data, filter) ⇒ image

对当前图像进行透视变换，产生给定尺寸的新图像。变量data是一个8元组(a,b,c,d,e,f,g,h)，包括一个透视变换的系数。对于输出图像中的每个像素点，新的值来自于输入图像的位置的(a x + b y + c)/(g x + h y + 1), (d x+ e y + f)/(g x + h y + 1)像素，使用最接近的像素进行近似。

这个方法用于原始图像的2D透视。

from PIL import Image
im = Image.open("3d.jpg")
print(im.size)
imtra = im.transform((200, 200), Image.PERSPECTIVE, (1,2,3,2,1,6,1,2))
print(imtra.size)
imtra.show()

2.2.31 transpose方法

im.transpose(method)⇒ image

返回当前图像的翻转或者旋转的拷贝。变量方法的取值为：FLIP_LEFT_RIGHT，FLIP_TOP_BOTTOM，ROTATE_90，ROTATE_180，或ROTATE_270。

from PIL import Image
im = Image.open("3d.jpg")
im.show()
im1=im.rotate(45)
im1.show()#逆时针旋转 45 度角。
im2=im.transpose(Image.FLIP_LEFT_RIGHT)#左右对换
im2.show()
im3=im.transpose(Image.FLIP_TOP_BOTTOM)#上下对换。
im3.show()
im4=im.transpose(Image.ROTATE_90)#旋转 90 度角。
im4.show()
im5=im.transpose(Image.ROTATE_180)#旋转 180 度角。
im5.show()
im6=im.transpose(Image.ROTATE_270)#旋转 270 度角。
im6.show()

BoBoRing

http://boboring.github.io/2020/12/02/My-Post4/

本博客所有文章除特別声明外，均采用 CC BY 4.0 许可协议。转载请注明来源 BoBoRing !

Python 图像处理

研一前半学期学习总结

2020-12-31 笔记

学习记录

图像分类性能提升方案

2020-11-23 计算机视觉

图像分类

Python PIL库进行图像处理

1 PIL介绍

2 PIL中的Image类及其常用方法

2.1 基本属性

2.1.1 format属性

2.1.2 mode属性

2.1.3 size属性

2.1.4 palette属性

2.1.5 info属性

2.2 基本方法

2.2.1 open方法

2.2.2 save方法

2.2.3 jpg转换成png方法

2.2.4 convert方法

2.2.5 new方法

2.2.6 copy方法

2.2.7 crop方法

2.2.8 paste方法

2.2.9 filter方法

2.2.10 blend方法

2.2.11 split方法

2.2.12 composite方法

2.2.13 eval方法

2.2.14 merge方法

2.2.15 draft方法

2.2.16 getbands方法

2.2.17 getbbox方法

2.2.18 getdata方法

2.2.19 getextrema方法

2.2.20 getpixel方法

2.2.21 histogram方法

2.2.22 load方法

2.2.23 paste方法

2.2.24 putdata方法

2.2.25 resize方法

2.2.26 rotate方法

2.2.27 seek方法

2.2.28 tell方法

2.2.29 thumbnail方法

2.2.30 transform方法

2.2.31 transpose方法