3月21日,2015 IDG中美校园创业大赛复旦大学宣讲会在复旦大学光华楼吴文政报告厅举行,SenseTime联合创始人徐冰在宣讲会上介绍了SenseTime的技术成果,并介绍了该公司的创业支持计划。
“计算机视觉领域是技术含量非常高的领域,如果你知道怎么用这些人脸相关技术来做某一项应用,面向终端用户也好、面向Business也好,用来解决特定的社会问题我们是可以提供这些核心的技术,我们团队的核心业务包括这些技术的研发以及把这些技术打包成为SDK(SoftwareDevelopmentKit, 软件开发工具包)给这些人群使用。”徐冰表示。
SenseTime联合创始人徐冰
以下为部分演讲实录:
我们是一家专注于计算机视觉和深入学习原创技术的公司,这是一个非常技术驱动的领域。我们公司提供的技术包括人脸识别、物体识别以及首饰识别,还有一些图像的增强以及关于人群监控方面的(人群)技术。
计算机视觉是把摄像头作为计算机的眼睛,想办法通过一些复杂的模型让计算机理解和看懂这个世界。这个技术的局限还是非常之多的,包括之前计算机的计算能力和储存能力,还有视觉图像这种东西需要的储存空间是比较大的,不仅仅需要储存,同时还需要网络的传输,这些都是十几年之前存在的限定。
2014年是计算机视觉的爆发年,因为在这三年之内有许多计算机视觉相关的东西发生了质的变化,包括大数据和定型计算。
计算机理解这个世界需要大量的图像数据,这在几年之前是很难拿到的。计算机去看这个世界的传输点仅仅局限在电脑的摄像头以及一些摄像机上面,因而网络上的图像都是有限的。移动互联网的时代,每个人手头都有手机,手机上有一个摄像头以便来拍东西,这变成了计算机视觉图像的进入点,使我们有大量的图像或者视频的数据可以识别。
定型计算也是近三年之内成熟的。三年之前并行计算的存在就让计算机视觉的处理发生了很大的变化,两张图像之间的处理可以并行来做,而不是串行来做,使得计算的速度有几何数量级的提升。现在我们去做一个非常复杂模型的处理和训练的时候往往只需要几个小时的时间。
综合大数据和并行计算使得另外一个最新的比较火的技术成为了可能,就是深度学习。百度、谷歌、Facebook这些大公司都在做深度学习方面的研究,而我们团队可能是最早在计算机视觉领域使用深度学习做相关研究的一个华人团队。
我们在2011年深度学习刚刚萌芽、很多研究者都对深度学习这项技术存在一些疑惑的时候就投入了精英团队进行深度学习的研究。综合我们在计算机视觉长达十五年的研究背景和深度学习这项非常强的新技术,在2014年获得了计算机科学多个领域的突破。
我们在计算视觉方面的累积主要是在哪些方面?
计算机视觉用摄像头去拍到的信息来讲往往拍到的环境并不是固定的,光线、摄像头角度等等会在拍摄过程中让真实的环境产生扭曲的信息储存,用户真正看到这些信息时往往体验比较差。关于这个部分的图象处理算法,我们提供场景识别、图像去雾、图像裁剪、图像超清晰优化等功能,在这个基础上大家就可以构思一些新Idea来应用这些底层的技术做一些创业项目,当然,我们也做过几个手机APP更好地展示这些图象处理的技术。
上述是把捕捉到的图像进行增强处理,接下来就是如何理解和分析这些图像当中的信息。这要求计算机有一个类似于人脑的视觉中枢,能够理解清楚计算机捕捉到的东西,这相对来说是比较困难的事情。比如,人脸识别这项技术也是需要计算机分辨不同的人,戴眼镜和不戴眼镜的时候可以认出来,本身的技术复杂程度是非常之高的。
监控的行业里面自动地去Identify自己监控场所里面的异常行为也是比较重要的。这些底层的技术上面的想像空间非常大,创业团队可以构思一些比较有趣的应用出来。
我们一项比较重要的技术、也是投入了一半的研究力量的技术一定程度上就可以解决人群管理的问题。这项技术通过几样的细分领域的小技术(,)将整个人群管理做成了一套完整的系统,包括人群的检测和分割、人群的混乱程度、静止人群的检测等等。这些技术组成了完整的人群智能分析系统,监控人员只需要在一些特定的场景下对这个系统进行预警,或者在人群达到了一定峰值时关闭一些入口打开一些出口,就可以进行人流疏导。
最后再讲一讲我们的创业支持计划,如果大家想对这个计划了解更多的话可以访问我们的官网。为什么需要提供这样的创业支持计划?因为计算机视觉领域是技术含量非常高的领域,如果你知道怎么用这些人脸相关技术来做某一项应用,面向终端用户也好、面向Business也好,用来解决特定的社会问题也好,我们可以提供这些核心的技术。我们团队的核心业务包括这些技术的研发以及把这些技术打包成为SDK给这些人群使用。我们也希望研发的这些技术能够有更多的团队应用起来,然后让更多的人享受到我们研发出来的这些技术带来的各种生活上的变化,让大家一起来用计算机视觉感应世界。