车载电脑首要任务是整合传感器数据。它将采集激光器和摄像头的数据,并将它们整合成周围环境的视图,之后它将利用整合好的视图来定向(配合GPS)。
无人汽车团队软件主管迪米特里·多尔戈夫(Dmitri Dolgoy)表示:“我们可以将看到的景物与存储在地图中的数据相互匹配,以此来精准地确定我们在地图上的位置。一旦我们知道自己身处何处,所有编制在地图中道路的结构和语义数据都将为汽车所用。”
一旦知道自己处于何处,无人汽车就可以观察动态物体的行为并构建模型,包括其他汽车、自行车和行人。
在这里,谷歌采用另一种方法。多尔戈夫的团队利用机器学习算法创造路上其他人的模型。驾驶过程中的每英里路段信息都被输入计算机中,还要对不同类型的对象在不同环境中的表现进行分类。即便有些司机的行为已经进行硬编码(比如说“红灯变绿,汽车启动”),但他们并不照搬逻辑程序,而是学习司机的实际行为。
这样,我们就知道,一辆尾随在垃圾车身后的汽车,可能会换道绕过来。谷歌已经建成了70万英里的驾驶数据,它们将帮助谷歌算法理解汽车的行为。
谷歌的非理性效用
多数驾驶情况并不难以理解,不过要遇到棘手或突发的情况呢?谷歌目前采用的方案是让人类司机加以控制,安全驾驶汽车。不过,在人类驾驶员必须接管的情况下,谷歌汽车会记录驾驶员的行为,这样的话,工程师就可以测试出在极端情况下汽车如何不伤害公众。
每辆谷歌汽车记录着之前的驾驶数据——“爬遍天下”捕捉而来的图像和数据——以及计算输入的驾驶数据,包括其他驾驶员在行驶过程中应对各种情况的数据。
谷歌汽车的工作方式和我们大脑运作方式有些相似之处。我们在思考时接受感官输入的信息,动作会相应地做出反应。我们的大脑一直在作出判断,指导我们的认知。实际的感官信息——比如灯光打在视网膜细胞上——其地位仅次于之前大脑存储的各种体验。
谷歌自动驾驶汽车运用这一法则也不足为奇,他们为此取得了巨大成功同样也不足为奇。
谷歌人工智能主管彼得·诺维格(Peter Norvig)和他的两名同事创造了一个短语“数据的非理性效用(unreasonable effectiveness of data)”,它描述了海量数据对高难度人工智能问题的影响。
即便这意味着谷歌汽车将持续不停地跋涉400万英里的道路,并且手动处理大量的数据,他们也会坚持下来。
这就是谷歌的非理性效用。