2018年11月,北京智源人工智能研究院揭牌
科技部和北京市委市政府指导支持,北京市科委和海淀区政府推动成立
依托北京大学、清华大学、中国科学院、百度、小米、字节跳动、美团点评、旷视科技等机构
2019年8月,智源人工智能联赛正式发布
十个赛道,百万奖金
覆盖多个人工智能学术领域和应用场景
智源人工智能联赛第一弹
智源·看山杯专家发现赛
联合主办:知乎
比赛背景
知识分享服务已经成为目前全球互联网的重要、最受欢迎的应用类型之一。在知识分享或问答社区中,问题数远远超过有质量的回复数。因此,如何连接知识、专家和用户,增加专家的回答意愿,成为了此类服务的中心课题。本次比赛旨在解决这一问题。
知乎是中文互联网知名的综合性社区平台。知乎自 2011 年创办至今,已经成为一个拥有 2.2 亿用户,每天有数以十万计的新问题以及 UGC 内容产生的网站。其中,如何高效的将这些用户新提出的问题邀请其他用户进行解答,以及挖掘用户有能力且感兴趣的问题进行邀请下发,优化邀请回答的准确率,提高问题解答率以及回答生产数,成为知乎最重要的课题之一。
任务描述
比赛将提供知乎上的问题、话题、用户画像和用户回答记录等数据。希望选手可以预测某个专家是否会接受某个用户就某个问题向他发出的回答邀请。
为了协助选手更好地搭建模型,本次比赛提供了10万个话题数据、180万个问题和475万个回答数据、190万个脱敏的用户画像和回答记录数据,以及1000万条邀请数据。
数据集
比赛将提供知乎的问题信息、用户画像、用户回答记录,以及用户接受邀请的记录,要求选手预测这个用户是否会接受某个新问题的邀请。
1、问题信息。包括<问题id、问题创建时间、问题的话题、问题的文本、问题的描述等>。
2、用户的回答。包括<回答id、问题id、作者id、回答的文本、回答时间、点赞数、收藏数、感谢数、评论数>等。
3、用户人画像数据。包括<用户id、性别、活跃频次、关注话题、长期兴趣、盐值>等。
4、数据。
5、最近一月的邀请数据包括<问题id、用户id、邀请时间、是否回答>。
关注智源