一、实验目的

1、熟悉并掌握MATLAB工具的使用; 
2、实现图像的读取、显示、存储、平移、镜像、放大、缩小及旋转操作;
3、掌握常用的插值方法,并了解其优缺点。

二、实验环境

Matlab 2020B

三、实验内容

题目

1、读入一幅RGB图像,变换为灰度图像和二值图像,并在同一个窗口内分别显示RGB图像和灰度图像,注上文字标题,并将结果以文件形式存到磁盘上。
2、对图像执行平移、镜像(水平镜像、垂直镜像)放大、缩小及旋转操作,其中放大、旋转操作分别采用最近邻插值及双线性插值方法实现,要求根据算法自己编写代码实现,并分析两种插值方法的优缺点。

相关知识

在matlab环境中,调用imread()函数可读入图像,默认的存储方式为的矩阵,分RGB三个通道。值类型为uint8,即取值范围为0~255。

rgb2gray()函数将RGB三个通道存储的图像消除色调和饱和度,保留亮度,将RGB图像转为灰度图。
im2bw(I,level)函数基于阈值将图像转化为二值图像。输入图像可以为RGB图像,也可以为灰度图像。level参数为阈值取值范围为0到1之间的小数,将大于阈值的像素点变为白色(1),其他像素点变为黑色(0)。

图像平移时,设某个像素点坐标为 ( x 0 , y 0 ) (x_0,y_0) (x0,y0),经过平移 ( t x , t y ) (t_x,t_y) (tx,ty),达到坐标为 ( x 1 , y 1 ) (x_1,y_1) (x1,y1)。该关系可记为: { x 1 = x 0 + t x y 1 = y 0 + t y \begin{cases}x_1=x_0+t_x\\y_1=y_0+t_y\end{cases} {x1=x0+txy1=y0+ty,用矩阵形式可以记作: ( x 1 y 1 1 ) = ( x 0 y 0 1 ) ( 1 0 0 0 1 0 t x t y 1 ) \begin{pmatrix}x_1&y_1&1\end{pmatrix}=\begin{pmatrix}x_0&y_0&1\end{pmatrix}\begin{pmatrix}1&0&0\\0&1&0\\t_x&t_y&1\end{pmatrix} (x1y11)=(x0y01) 10tx01ty001 。在实现时,记图像的高为 h h h,宽为 w w w,需要判断 x 1 , y 1 x_1,y_1 x1,y1 h , w h,w h,w的大小关系,不能发生下标越界。

图像水平镜像时,记图像宽为 w w w。则原像素点 ( x 0 , y 0 ) (x_0,y_0) (x0,y0)变为 ( w − x 0 , y 0 ) (w-x_0,y_0) (wx0,y0),即: { x 1 = w − x 0 y 1 = y 0 \begin{cases}x_1=w-x_0\\y_1=y_0\end{cases} {x1=wx0y1=y0。用矩阵形式记作: { x 1 = x 0 + t x y 1 = y 0 + t y \begin{cases}x_1=x_0+t_x\\y_1=y_0+t_y\end{cases} {x1=x0+txy1=y0+ty,用矩阵形式可以记作: ( x 1 y 1 1 ) = ( x 0 y 0 1 ) ( − 1 0 0 0 1 0 w 0 1 ) \begin{pmatrix}x_1&y_1&1\end{pmatrix}=\begin{pmatrix}x_0&y_0&1\end{pmatrix}\begin{pmatrix}-1&0&0\\0&1&0\\w&0&1\end{pmatrix} (x1y11)=(x0y01) 10w010001

图像垂直镜像时,记图像高为 h h h。则原像素点 ( x 0 , y 0 ) (x_0,y_0) (x0,y0)变为 ( x 0 , h − y 0 ) (x_0,h-y_0) (x0,hy0),即: { x 1 = x 0 y 1 = h − y 0 \begin{cases}x_1=x_0\\y_1=h-y_0\end{cases} {x1=x0y1=hy0。用矩阵形式记作: ( x 1 y 1 1 ) = ( x 0 y 0 1 ) ( 1 0 0 0 − 1 0 0 h 1 ) \begin{pmatrix}x_1&y_1&1\end{pmatrix}=\begin{pmatrix}x_0&y_0&1\end{pmatrix}\begin{pmatrix}1&0&0\\0&-1&0\\0&h&1\end{pmatrix} (x1y11)=(x0y01) 10001h001

图像放大分为两个步骤:1.创建新的像素点位。2.给新的像素点位的对应位置赋值。

在使用最近邻插值法时,直接用原图中最近的像素点位给新图赋值。

在使用双线性插值法时,记原图大小 m ∗ n m*n mn,新图大小 a ∗ b a*b ab,则新图的坐标 ( x 0 ′ , y 0 ′ ) (x_0',y_0') (x0,y0)对应原图 ( x 0 , y 0 ) = ( x 0 ′ ∗ m / a , y 0 ′ ∗ n / b ) (x_0,y_0)=(x_0'*m/a,y_0'*n/b) (x0,y0)=(x0m/a,y0n/b)。找到与 ( x 0 , y 0 ) (x_0,y_0) (x0,y0)最近的四个整数点位记作 ( x 1 , y 1 ) , ( x 1 , y 2 ) , ( x 2 , y 1 ) , ( x 2 , y 2 ) (x_1,y_1),(x_1,y_2),(x_2,y_1),(x_2,y_2) (x1,y1),(x1,y2),(x2,y1),(x2,y2),其对应点位上的灰度值记为 P 11 , P 12 , P 21 , P 22 P_{11},P_{12},P_{21},P_{22} P11,P12,P21,P22
( x 0 ′ , y 0 ′ ) (x_0',y_0') (x0,y0)的灰度值为
y 2 − y 0 y 2 − y 1 ( x 2 − x 0 x 2 − x 1 P 11 + x 0 − x 1 x 2 − x 1 P 21 ) + y 0 − y 1 y 2 − y 1 ( x 2 − x 0 x 2 − x 1 P 12 + x 0 − x 1 x 2 − x 1 P 22 ) \frac{y_2-y_0}{y_2-y_1}(\frac{x_2-x_0}{x_2-x_1}P_{11}+\frac{x_0-x_1}{x_2-x_1}P_{21})+\frac{y_0-y_1}{y_2-y_1}(\frac{x_2-x_0}{x_2-x_1}P_{12}+\frac{x_0-x_1}{x_2-x_1}P_{22}) y2y1y2y0(x2x1x2x0P11+x2x1x0x1P21)+y2y1y0y1(x2x1x2x0P12+x2x1x0x1P22)

在实现时,可能需要去掉边框上的像素点值,以防止下标越界等情况。若 ( x 0 , y 0 ) = ( x 0 ′ ∗ m / a , y 0 ′ ∗ n / b ) (x_0,y_0)=(x_0'*m/a,y_0'*n/b) (x0,y0)=(x0m/a,y0n/b)为整数,则直接取该点灰度值赋给 ( x 0 ′ , y 0 ′ ) (x_0',y_0') (x0,y0)而无需进行双线性插值。

图像缩小算法与放大类似,只要新图像大小 a ∗ b a*b ab小于原图像大小 m ∗ n m*n mn即可。

在对图像进行旋转时,为了对图像中心进行旋转,需要先把坐标系平移到中心。记原中心点 ( x ′ , y ′ ) = ( 0 , 0 ) (x',y')=(0,0) (x,y)=(0,0),则变换后的中心点 ( x , y ) (x,y) (x,y)与原中心点关系为 ( x y 1 ) = ( x ′ y ′ 1 ) ( 1 0 0 0 − 1 0 − 0.5 w 0.5 h 1 ) \begin{pmatrix}x&y&1\end{pmatrix}=\begin{pmatrix}x'&y'&1\end{pmatrix}\begin{pmatrix}1&0&0\\0&-1&0\\-0.5w&0.5h&1\end{pmatrix} (xy1)=(xy1) 100.5w010.5h001 .则旋转分为三个步骤:将 x ′ o ′ y x'o'y xoy变成 x o y xoy xoy,将该点顺时针转 α \alpha α度,最后将 x o y xoy xoy变回 x ′ o ′ y ′ x'o'y' xoy。则完整的变换为:
( x y 1 ) = ( x ′ y ′ 1 ) = ( 1 0 0 0 − 1 0 − 0.5 w o l d 0.5 h o l d 1 ) ( cos ⁡ α − sin ⁡ α 0 sin ⁡ α cos ⁡ α 0 0 0 1 ) ( 1 0 0 0 − 1 0 − 0.5 w n e w 0.5 h n e w 1 ) \begin{pmatrix}x&y&1\end{pmatrix}=\begin{pmatrix}x'&y'&1\end{pmatrix}=\begin{pmatrix}1&0&0\\0&-1&0\\-0.5w_{old}&0.5h_{old}&1\end{pmatrix}\begin{pmatrix}\cos\alpha&-\sin\alpha&0\\\sin\alpha&\cos\alpha&0\\0&0&1\end{pmatrix}\begin{pmatrix}1&0&0\\0&-1&0\\-0.5w_{new}&0.5h_{new}&1\end{pmatrix} (xy1)=(xy1)= 100.5wold010.5hold001 cosαsinα0sinαcosα0001 100.5wnew010.5hnew001
由于前后图像大小不一定相等。所以需要进行插值处理,可以使用上文中提到的两种插值算法。新图像宽为 w ′ = ∣ cos ⁡ α ∣ ∗ w + ∣ sin ⁡ α ∣ ∗ h w'=|\cos\alpha|*w+|\sin\alpha|*h w=cosαw+sinαh。新图像的高为 h ′ = ∣ sin ⁡ α ∣ ∗ w + ∣ cos ⁡ α ∣ ∗ h h'=|\sin\alpha|*w+|\cos\alpha|*h h=sinαw+cosαh

部分核心代码

I_0=imread("test.jpg");
I_1=rgb2gray(I_0);
I_2=im2bw(I_0,0.5);
%figure('P1','P2','P3','P4')
title("实验1-1")
subplot(1,3,1);imshow(I_0);title('原图')
subplot(1,3,2);imshow(I_1);title('灰度图')
subplot(1,3,3);imshow(I_2);title('二值化')
savefig("lab1_1.fig")

完成了读入一幅RGB图像,变换为灰度图像和二值图像,并在同一个窗口内分别显示RGB图像和灰度图像,注上文字标题,并将结果以文件形式存到磁盘上。

I=imread("test.jpg");
[R,C,color]=size(I);
res=zeros(R,C,color);
for color=1:3
    for i=1:R
        for j=1:C
            newx=i+60;
            newy=j+60;
            if ((newx<=R) && (newy<=C))
                res(newx,newy,color)=I(i,j,color);
            end
        end
    end
end
imshow(uint8(res)) 

完成了对图像的平移操作,对图像向右下平移60个像素。对于每个像素点,先平移,再判断下标是否越界,最后将像素点填入。

I=imread("test.jpg");
[R,C,ch]=size(I);
res=zeros(R,C,ch);
for color=1:3
    for i=1:R
        for j=1:C-1
            res(i,j,color)=I(i,C-j,color);
        end
    end
end
imshow(uint8(res))

完成了对图像的垂直翻转操作。没有使用矩阵运算。

I=imread("test.jpg");
[R,C,ch]=size(I);
res=zeros(R,C,ch);
for color=1:3
    for i=1:R-1
        for j=1:C
            res(i,j,color)=I(R-i,j,color);
        end
    end
end
imshow(uint8(res))

完成了对图像的水平翻转操作。没有使用矩阵运算。

I=imread("test2.jpg");
[h,w,ch]=size(I);
height=1500;
width=1500;
newimg=zeros(height,width);
multh=height/h;
multw=width/w;
for i=1:height
    for j=1:width
        for c=1:3
            oldi=round(i/multh);
            oldj=round(j/multw);
            if (oldi>=1&&oldi<=h&&oldj>=1&&oldj<=w)
                newimg(i,j,c)=I(oldi,oldj,c);
            end
            
         end
    end
end
imshow(uint8(newimg))

完成了对图像的放大/缩小操作。使用最近邻插值法。先把新图中的像素点除以放大倍数映射得到其在原图中的位置,将该位置值四舍五入找到最近邻,直接将最近邻的值填入。

I=imread('test2.jpg');
[m,n,ch]=size(I);
width=100;
height=100;
newimg = uint8(zeros(width,height,3));
% 计算放大/缩小倍数
widthScale = m/width;
heightScale = n/height;  
for ch=1:3
    for x = 1:width - 1
        for y = 1:height - 1 
            xx = x * widthScale;%新图像位置对应原图像位置 
            yy = y * heightScale;%新图像位置对应原图像位置 
            if (xx/double(uint16(xx)) == 1.0) && (yy/double(uint16(yy)) == 1.0)
                newimg(x,y,ch) = I(int16(xx),int16(yy),ch);%若正好对应到整数点,则直接赋值,不插值
            else 
                a = double(uint16(xx));%找整数点
                b = double(uint16(yy));
                if a==0||b==0||a>=m||b>=n%下标不能越界
                    continue;
                end
                x11 = double(I(a,b,ch)); % x11 = I(a,b)
                x12 = double(I(a,b+1,ch)); % x12 = I(a,b+1)
                x21 = double(I(a+1,b,ch)); % x21 =I(a+1,b)
                x22 = double(I(a+1,b+1,ch)); % x22 = I(a+1,b+1)
                newimg(x,y,ch) = uint8( (b+1-yy) * ((xx-a)*x21 + (a+1-xx)*x11) + (yy-b) * ((xx-a)*x22 +(a+1-xx) * x12));
            end
        end
    end
end
imshow(newimg);

完成了对图像的放大/缩小操作。使用双线性插值法。先把新图中的像素点除以放大倍数映射得到其在原图中的位置,如果是整数则直接填入,如果不是整数则找到与其相邻的四个点,按照上文中的公式进行插值,将该值填入。

I=imread("test2.jpg");
angle=30;
[h,w,d]=size(I);
theta=angle/180*pi;
cos_val = cos(theta);
sin_val = sin(theta);
 
w2=round(abs(cos_val)*w+h*abs(sin_val));
h2=round(abs(cos_val)*h+w*abs(sin_val));
img_rotate  = uint8(zeros(h2,w2,3));    %像素是整数
 
 
for x=1:w2
    for y=1:h2
        x0 = uint32(x*cos_val + y*sin_val -0.5*w2*cos_val-0.5*h2*sin_val+0.5*w);%展开矩阵乘法
        y0 = uint32(y*cos_val - x*sin_val +0.5*w2*sin_val-0.5*h2*cos_val+0.5*h);%展开矩阵乘法
        
        x0=round(x0);         %最近邻
        y0=round(y0);         %最近邻
        if x0>=1 && y0>=1&&  x0<=w && y0<=h %检测下标不能越界
            img_rotate(y,x,:) = I(y0,x0,:);
        end
    end
end
imshow(img_rotate)

完成了对图像的旋转操作。对于图像大小会发生变化的情况,使用最近邻插值法处理缩放。同理,按四舍五入方式找到最近邻。

angle=45;                   
I=imread('test2.jpg');     
imshow(I);                   
[h,w,d]=size(I);
theta=angle/180*pi;
M=[cos(theta) -sin(theta) 0;sin(theta) cos(theta) 0;0 0 1];
leftup=[1 1 1]*M;               %新图左上角
rightup=[1 w 1]*M;               %新图右上角
leftdown=[h 1 1]*M;               %新图左下角
rightdown=[h w 1]*M;               %新图右下角
cos_val = cos(theta);
sin_val = sin(theta);
 
w2=round(abs(cos_val)*w+h*abs(sin_val));%新图宽度
h2=round(abs(cos_val)*h+w*abs(sin_val));%新图高度
img_rotate=uint8(zeros(h2,w2,3));
dy=abs(min([leftup(1) rightup(1) leftdown(1) rightdown(1)]));            %取得y方向的负轴超出的偏移量
dx=abs(min([leftup(2) rightup(2) leftdown(2) rightdown(2)]));            %取得x方向的负轴超出的偏移量
 
for i=1-dy:h2-dy
    for j=1-dx:w2-dx
        pix=[i j 1]/M;                                %用变换后图像的点的坐标去寻找原图像点的坐标,
        yy=pix(1)-floor(pix(1));
        xx=pix(2)-floor(pix(2));
        if pix(1)>=1 && pix(2)>=1 && pix(1) <= h && pix(2) <= w
            x11=floor(pix(1));        %四个相邻的点
            y11=floor(pix(2));
            x12=floor(pix(1));
            y12=ceil(pix(2));
            x21=ceil(pix(1));
            y21=floor(pix(2));
            x22=ceil(pix(1));
            y22=ceil(pix(2));
 
            value_leftup=(1-xx)*(1-yy);              %计算临近四个点在双线性插值中的权重
            value_rightup=xx*(1-yy);
            value_leftdown=(1-xx)*yy;
            value_rightdown=xx*yy;
 
            img_rotate(i+dy,j+dx,:)=value_leftup*I(x11,y11,:)+value_rightup*I(x12,y12,:)+ value_leftdown*I(x21,y21,:)+value_rightdown*I(x22,y22,:);
        end
    end
end
 
imshow(uint8(img_rotate))

完成了对图像的旋转操作。对于图像大小会发生变化的情况,使用双线性插值法处理缩放。同理,先找到新图中某点坐标对应原图位置(利用矩阵除法),找到其相邻的四个点位,按照上文中的公式进行插值。

实验结果

图1 题目1实验结果
对于题目1,完成了对图片的读取、灰度化、二值化操作。还生成了可以被matlab打开的.fig文件。
图2 平移实验结果
对于平移,正确地实现了图像的平移,并且对其余部分补上黑色边框。
图3 左右翻转实验结果
对于左右镜像翻转,正确地实现了图像的左右镜像翻转。
图4 上下翻转实验结果
对于上下镜像翻转,正确地实现了图像的上下镜像翻转。
图5 放大实验结果
成功将图像放大,利用最近邻插值。可以看到,放大的结果存在一定的锯齿与马赛克的现象。
图6 缩小实验结果
成功将图像缩小,利用最近邻插值。
图7 放大实验结果2
成功将图像放大,利用双线性插值。可以看到,放大的结果比起最近邻插值更为平滑,没有存在严重的锯齿现象。
图8 缩小实验结果2
成功将图像缩小,利用双线性插值。可以看到,利用双线性插值进行缩小时也没有出现失真现象。
在这里插入图片描述
图9、图10 旋转实验结果1、2
利用最近邻插值法与双线性插值法分别对图像进行旋转45°操作,并对其余区域填充为黑色。

分析:两种插值法优缺点

最近邻插值法优点:实现简单,运行速度快。缺点:在放大图像时可能出现锯齿现象,图像中一些曲线的边缘不平滑。在放大后缩小回去还会出现一定的失真现象,使图像看起来变得模糊了,像马赛克。
双线性插值法优点:一定程度上缓解了最近邻插值法缺点出现的情况。放大图像后图像中的一些曲线看起来更平滑,对一张图像反复放大缩小后失真现象不严重,处理效果较好。缺点:处理速度慢,在matlab2020B实验环境中往往需要对一张图像处理约3秒左右。对于图像的最外圈边缘也难以处理。

四、实验心得

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐