2016年2月19日,清华大学-搜狗技术联合实验室因其在搜索引擎领域创新性研究成果《群体智能支撑的互联网搜索技术及其应用》,荣获北京市科学技术一等奖。作为产学研结合的代表机构,清华大学-搜狗技术联合实验室(下文简称“清华搜狗联合实验室”)一直以来科研成果傲人,获此奖项确为实至名归。
(清华搜狗联合实验室代表刘奕群参会领奖)
清华搜狗联合实验室的本次研究成果主要基于用户使用搜索引擎的痛点,解决“用户需求表述的歧义、模糊”及” 网络信息数据繁杂且质量参差不齐“两个核心问题,在搜索引擎产品对于用户需求的理解、资源质量的评估和搜索结果排序的优化3个方面取得了卓越成绩。而其研究成果不仅促进了搜索引擎技术相关领域的创新发展,更将技术实际应用于产品中让用户获益,并带来了良好的经济效益和社会效益,这正与北京市科学技术奖的宗旨如出一辙。而清华搜狗联合实验室这次获奖的背后,在多个层面上都有重要的贡献。
一方面,是在持之以恒的努力下取得了领先的科研成果。面对搜索引擎用户需求理解方面的技术挑战,清华搜狗联合实验室提出了基于用户查询行为结构图挖掘的查询推荐和信息需求分类算法。研究成果被来自微软研究院等机构的国际同行在论文中称该算法为 “Top achiever techniques”(顶尖技术),“the most effective”(最为有效),基于该算法的用户需求挖掘系统在国际著名的NTCIR评测中连续两届获得多项任务第一名。
面对用户需求与网络资源匹配的技术挑战,清华搜狗联合实验室在国内首次提出了将认知心理学成果融合进网络搜索技术研究的思路,深入研究了用户利用搜索引擎进行信息认知的过程,构建了基于眼动注视及鼠标移动等富交互行为推断用户认知检验过程的点击模型,利用用户群体智慧实现需求与资源的有效匹配。研究成果被ACM会士Thorsten Joachims教授、AAAI与IEEE会士Yang Qiang教授等在论文和专著中引述。此外,基于此项目,清华搜狗实验室发表了多篇高水平学术论文,受到国际学术界和产业界同行的认可。
另一方面,本次获奖的科研成果实际应用于产品实践后,也有效提升了互联网生态健康、互联网信息过滤及民众使用体验,与此同时,也为企业带来了巨大的经济效益,为北京市税收及社会发展做出了贡献。
互联网中有大量的网络欺诈、色情、侵犯隐私、侵犯知识产权、散布非法信息等犯罪行为,而清华大学搜狗技术联合实验室的研究成果极大地改善了互联网信息环境,对虚假、不良信息起到了清理过滤效果。相关技术也成功应用于人民日报社人民网搜索引擎系统、北京市工商行政管理局电子商务监管系统和北京市食品药品监督管理局食品药品互联网监测系统。
本次获北京市科学技术一等奖的科研成果已在搜狗搜索得到全面应用,协助其性能全面提升,扩大其用户使用体验、提升市场份额。相应算法应用于搜狗搜索引擎的查询推荐系统后,查询推荐结果的点击通过率提升了30%以上。目前搜狗搜索已有超过5亿用户,市场份额稳居国内搜索引擎产品第二位,并且不断缩小与第一位的差距,这种成果在很大程度上都取决于技术的进步。据了解,2012年-2014年3年间搜狗实现总营收约47亿,其中,主要在此项目技术推动下获得的收入约15亿!
除此之外,清华搜狗联合实验室还通过扎实的研究方法,建立了完善的基础资源、为国内外研究单位提供了研究范本,推动了整个搜索引擎领域的科技进步。为完善中文网络信息检索研究领域的基础资源建设,该项目申请单位于2008年推出了SogouT网络信息检索评测语料库。该语料库收集了超过1.3亿网页数据,总存储规模达到5T以上,同时推出了规模庞大的用于网络信息检索评测的标准评价集合。该语料向学术界免费开放,被全球100多个国内外研究单位广泛使用,并作为标准评测集应用于NTCIR和CLEF等国际著名信息检索评测。
这样效果的取得,正是清华大学·搜狗技术联合实验室”两栖创新生态系统“ 的成功。企业与学校合作并不是新鲜事,但是清华搜狗联合实验室的模式,则是比较鲜见的“共生、共享、共赢”的有效路径,正如中科院科技政策与管理科学研究所赵作权研究员指出的,这种合作模式“为我国高技术企业发展和科技体制改革提供了一个典型样板”。
(清华大学-搜狗技术联合实验室团队照片)
首先,合作双方方是中国在相关研究领域最领先的学校和企业。清华大学在互联网技术的领先实力和研发力量毋庸置疑,搜狗则是拥有超过5亿用户且以技术实力著称的互联网领军企业,两方在科技探索方面的意愿与实力恰好契合。
其次,双方全力投入,对联合实验室的重视度极高。清华和搜狗双方都是由最权威的代表参与到实验室中,清华大学方面带头人是清华大学计算机系马少平教授,并由刘奕群博士带领数十名清华博士研究生、硕士研究生参与项目研究。而搜狗公司则是由搜狗CEO 王小川亲自出马,公司所有技术方面高管均参与到了项目中来。物力方面,8年间双方也是给予了巨大的支持。
再次,也是极为重要的,在于双方的合作机制。两栖创新生态系统下技术分工十分清晰,研究者追求卓越、立足于技术创新和解决问题,而企业则洞察市场和用户需求,提出问题并将技术解决方案进行市场化应用实践。
清华搜狗联合实验室这种学校与企业深度结合的研究实验室,可强力驱动技术与社会发展,也是政府政策极为支持和鼓励的。而本次清华搜狗联合实验室获得北京市科学技术一等奖,是最权威的评奖机构对其科研能力和成果的认可,相信在良好的机制下,清华搜狗联合实验室在未来还会取得更好的成绩,为社会和科技进步而助力。