📜  使用 OpenCV 和深度学习对黑白图像进行着色

📅  最后修改于: 2022-05-13 01:54:24.722000             🧑  作者: Mango

使用 OpenCV 和深度学习对黑白图像进行着色

在本文中,我们将创建一个程序来将黑白图像(即灰度图像)转换为彩色图像。我们将为这个程序使用 Caffe 着色模型。并且您应该熟悉基本的 OpenCV 功能和使用,例如读取图像或如何使用 dnn 模块加载预训练模型等。现在让我们讨论实现程序的过程。

脚步:

  1. 加载模型和卷积/内核点
  2. 读取和预处理图像
  3. 使用输入图像的L 通道生成模型预测
  4. 使用输出 -> ab 通道创建结果图像

L通道和ab通道是什么?基本上就像RGB颜色空间,还有类似的东西,称为Lab 颜色空间。这是我们计划的基础。让我们简要讨论一下它是什么:

什么是实验室色彩空间?

与 RGB 一样,实验室颜色具有 3 个通道 L、a 和 b。但这里不是像素值,而是具有不同的意义,即:

  • L通道:光强
  • a通道:绿红编码
  • b通道:蓝红编码

在我们的程序中,我们将使用图像的 L 通道作为模型的输入来预测 ab 通道值,然后将其与 L 通道重新连接以生成最终图像。

下面是我上面提到的所有步骤的实现。

执行:

Python3
import numpy as np
import cv2
from cv2 import dnn
 
#--------Model file paths--------#
proto_file = 'Model\colorization_deploy_v2.prototxt'
model_file = 'Model\colorization_release_v2.caffemodel'
hull_pts = 'Model\pts_in_hull.npy'
img_path = 'images/img1.jpg'
#--------------#--------------#
 
#--------Reading the model params--------#
net = dnn.readNetFromCaffe(proto_file,model_file)
kernel = np.load(hull_pts)
#-----------------------------------#---------------------#
 
#-----Reading and preprocessing image--------#
img = cv2.imread(img_path)
scaled = img.astype("float32") / 255.0
lab_img = cv2.cvtColor(scaled, cv2.COLOR_BGR2LAB)
#-----------------------------------#---------------------#
 
# add the cluster centers as 1x1 convolutions to the model
class8 = net.getLayerId("class8_ab")
conv8 = net.getLayerId("conv8_313_rh")
pts = kernel.transpose().reshape(2, 313, 1, 1)
net.getLayer(class8).blobs = [pts.astype("float32")]
net.getLayer(conv8).blobs = [np.full([1, 313], 2.606, dtype="float32")]
#-----------------------------------#---------------------#
 
# we'll resize the image for the network
resized = cv2.resize(lab_img, (224, 224))
# split the L channel
L = cv2.split(resized)[0]
# mean subtraction
L -= 50
#-----------------------------------#---------------------#
 
# predicting the ab channels from the input L channel
 
net.setInput(cv2.dnn.blobFromImage(L))
ab_channel = net.forward()[0, :, :, :].transpose((1, 2, 0))
# resize the predicted 'ab' volume to the same dimensions as our
# input image
ab_channel = cv2.resize(ab_channel, (img.shape[1], img.shape[0]))
 
 
# Take the L channel from the image
L = cv2.split(lab_img)[0]
# Join the L channel with predicted ab channel
colorized = np.concatenate((L[:, :, np.newaxis], ab_channel), axis=2)
 
# Then convert the image from Lab to BGR
colorized = cv2.cvtColor(colorized, cv2.COLOR_LAB2BGR)
colorized = np.clip(colorized, 0, 1)
 
# change the image to 0-255 range and convert it from float32 to int
colorized = (255 * colorized).astype("uint8")
 
# Let's resize the images and show them together
img = cv2.resize(img,(640,640))
colorized = cv2.resize(colorized,(640,640))
 
result = cv2.hconcat([img,colorized])
 
cv2.imshow("Grayscale -> Colour", result)
 
cv2.waitKey(0)



输出:

图像源 pexels -免费素材图片

下一步是什么?

您可以尝试阅读实现此技术的原始研究论文——http://richzhang.github.io/colorization/,或者,您可以创建自己的模型,而不是使用预先训练的模型。