我相信大家也注意到了,我们演讲的时候会有一个同步的实时显示文字的技术。就是说我在上面讲话的同时,文字出来了,对你们(记者)来说是最有用的。这个产品马上就要开发出来了,最理想的状态就是我在这边说话,你们的屏幕上就能实时显示出来我讲的内容。
在去年的发布会上,我们发布了这个功能以后。大家可以看到,今年阿里和搜狗都展示了同样的技术。这也代表了一个发展方向。这个方向可能和语音交互是没有关系的,但和语音(技术)有关系。
我们谈到iPhone和Android的时候,它们的语音识别系统都是 闭系统,都是系统级别的。科大讯飞怎么解决这个问题?
胡郁:首先iPhone我们是搞不定的,除非破解它。iPhone本身就是一个垂直的生态。而且这个问题不仅仅是在中国,美国也是。但是iPhone自己的语音技术很差,导致它的用户体验相对于其他公司、产品会有劣势。
但对Android来讲,情况是不一样的。因为谷歌也知道Android有全球不通用的地方。比如说审美、风格,比如说语言相关的部分:输入法、交互。这就造成了Android系统在设计的时候就是一个比较开放的系统。
这就造成了第三方UI其实接管了中间层的一些功能,也导致了这些领域是可以进入的。而且现在很多的智能硬件,其实用的都是Android的操作系统。
我相信在将来的发展中,世界上会存在两种公司。一种公司是垂直产品型公司,比如说做手机,就一直做手机,手机技术不可能给别人用。世界上看起来,最多有8到9家这样的手机公司,加起来产量可能到全球的90%-到95%以上。
另外还有些公司,像谷歌这样,就是平台型的公司。我提供一些基础性的工作,给各个厂商都能用。但是做了平台之后就要面临控制权大小的问题。有可能控制权不在自己手上,而在手机厂商手上。
所以在未来的发展过程里,讯飞要做的不仅仅是手机,而是我刚才说的各个领域。这些领域里,有的是几家大公司联合垄断了市场,有的领域会是成千上万个公司来分享市场。比如说玩具、机器人,就是后面的这种。而且我相信现在这么多机器人公司,到最后也不会合并成大的公司,因为用户需要多样性的个性化产品。而手机这种产品,虽然有差异,但还是个工具性质的产品。
所以讯飞会成为一个平台型的公司,不仅帮平台上的公司提供核心技术,甚至可以帮它们整合各种各样的资源。我觉得我们是用这样一个思路来发展的。
成为平台型的公司,需要在不同的场景下提供基础性的通用解决方案,但是不同场景的使用特性是不一样的,科大讯飞准备怎么解决这个问题?
胡郁:场景的问题其实和刚才的问题,就是内容方面是非常有关系的。我们人在处理一件事的时候,你可以想象下你在订一张票,你所要和别人交谈的内容,嘴里面发出的指令,其实相对来讲不是开放的集合,是 闭的集合。
这里最难的问题就是怎么把它丰富起来,怎么让它多覆盖(些场景)。我们现在的做法就是一个点一个点去做。每做完一个点就拿到实际里去用。越来越多的人用了之后,语言的覆盖性就会越来越好,这个场景的问题就解决了。
那在这个过程里怎么加速这个问题呢?我们怎么在做一些场景的时候,其他场景也能变快呢?这就是我们为什么要做那些高考答题机器人的原因。它能学会系统学习的方法,当我们做了一两个场景之后,就能转移到其他很多场景上。这样能使我们的覆盖快速增加。我们通过这样的方式来解决这样的问题。
担心人工智能过热没有用,还不如肯“干活”
今年人工智能的概念快速火热了起来,您怎么看待这种现象?有没有担心过这种火热对人工智能技术的发展带来负面效果?
胡郁:当然担心,但担心了也没用。