任务 1:目标识别/分类
神经网络:MobileNet - V1 | CPU, NPU, DSP
图像分辨率:224 x 224 px
ImageNet 准确率:69.7%。
这是一个非常基础但很强大的神经网络,能够基于一张照片识别 1000 个不同的对象类别,准确率约为 70%。经过量化,其大小可小于 5Mb,再加上低耗内存,它可在几乎所有现有智能手机上使用。
任务 2:目标识别/分类
神经网络:Inception - V3 | CPU, NPU, DSP
图像分辨率:346 x 346 px
ImageNet 准确率:78.0 %
这是对上一个网络的进一步扩展:更加精确,但代价是规模是原来的 4 倍且对计算的要求较高。一个明显的优势是——它可以处理分辨率更高的图像,这意味着更精确的识别和更小目标的检测。
任务 3:人脸识别
神经网络:Inception - Resnet - V1 |CPU
图像分辨率:512x512 px
LFW 得分:0.987
这个任务无需过多介绍:根据人脸照片识别出这个人。实现方式如下:对于每个人脸图像,神经网络会对人脸编码并生成一个 128 维的特征向量,该特征向量不随缩放、移动或旋转而改变。然后,在数据库中检索和此向量最匹配的特征向量(以及对应的身份),数据库里包含数亿个此类信息。
任务 4:图像去模糊
神经网络:SRCNN 9-5-5 | CPU, NPU, DSP
图像分辨率:300 x 300 px
Set-5 得分 (x3):32.75 dB
还记得用手机拍出的模糊照片吗?这个任务就是:让图片变得清晰。在最简单的情况下,这种失真是通过对未损坏的图像应用高斯模糊来建模的,然后尝试使用神经网络来恢复它们。在这个任务中,模糊是通过一种最原始、最简单、最轻量级的神经网络 SRCNN(只有 3 个卷积层)去除的。但是即便如此,它仍然显示出相当令人满意的结果。
任务 5:图像超分辨率
神经网络:VGG - 19 | CPU, NPU, DSP
图像分辨率:192 x 192 px
Set-5 得分 (x3):33.66 dB
你有过缩放照片的经历吗?缩放时是不是会有失真、细节丢失或清晰度下降的问题?这项任务就是让缩放过的照片看起来和原图一样。在本任务中,网络被训练用于完成一项等效的任务:将给定的缩小后图像(如缩小四倍)恢复至原图。此处我们使用一个 19 层的 VGG-19 网络。尽管目前来看,该网络的表现并不惊艳,也不能重建高频部分,但它对于绘画仍是理想的解决方案:该网络可以让图像变得更加清晰、平滑。
任务 6:图像超分辨率
神经网络:SRGAN | 仅 CPU