站长资讯网
最全最丰富的资讯网站

百度开放海量数据集 2018机器阅读理解技术竞赛让AI更“懂”你

  随着语言与智能领域的新发展,由中国中文信息学会(CIPS)、中国计算机学会(CCF)和百度公司联手举办的“2018机器阅读理解技术竞赛”将于2018年3月1日正式开启报名通道。报名地址及赛事详情请登录2018机器阅读理解技术竞赛官网http://mrc2018.cipsc.org.cn/。获胜团队将分享总额10万人民币的奖金,并将在第三届“语言与智能高峰论坛”上进行技术交流和颁奖。

百度开放海量数据集 2018机器阅读理解技术竞赛让AI更“懂”你

  机器阅读理解的任务就是让机器阅读文本,回答和阅读内容相关的问题,其中涉及到语言理解、知识推理、摘要生成等复杂技术,极具挑战。在当今互联网应用中,智能搜索、内容推荐、语音助手与智能客服等领域的发展,都大量依靠于机器阅读理解阅读真实问题、真实互联网材料,给出完整答案的AI能力。从海量真实数据中训练AI,是自然语言处理和人工智能领域的重要前沿课题。

  为此,本次竞赛中将提供面向真实应用场景的大规模中文阅读理解数据集。数据集包含来自百度搜索的30万个真实问题,每个问题对应5个候选文档文本,以及人工撰写的优质答案。竞赛任务是对于给定问题q及其对应的文本形式的候选文档集合D=d1, d2, …, dn,要求参评阅读理解系统自动对问题及候选文档进行分析,输出能够满足问题的文本答案a。为了便于参赛选手快速了解竞赛任务,竞赛还提供了两个开源的阅读理解基线系统,并采用ROUGH-L和BLEU作为评价指标。

  百度与CIPS、CCF联合举办2018机器阅读理解技术竞赛并开放数据集,旨在为研究者提供学术交流平台,进一步提升机器阅读理解技术的研究水平,并希望更多研究者能够利用数据集产出更好更优质的机器阅读理解模型,推动语言理解和人工智能领域技术研究和应用的发展。对此,百度自然语言处理首席科学家兼百度技术委员会主席吴华表示,“我们希望能够与领域内的其他同行者一起,推进机器阅读理解技术和应用的研究,使 AI 能够理解人类的语言、用自然语言与人类交流,让 AI 更‘懂’人类。”

  有数据显示,中国人工智能人才缺口超过500万,在自然语言处理技术成为人才竞争核心领域之一的今日,百度通过开展机器阅读理解技术竞赛、百度之星开发者大赛、PaddlePaddle AI大赛等多个人工智能行业竞赛并开放海量优质AI数据资源,正是希望携手并赋能AI行业的优质人才,进一步推动人工智能领域的技术交流和发展,为研究者提供强大的学习驱动力与创造力,培养与成就更多中国人工智能领域的精英技术人才,最终持续推进中国AI产业的发展,让越来越多的中国面孔亮相于人工智能领域的世界舞台。

  在此,百度诚邀所有对AI数据集有兴趣的技术人才了解和关注百度阅读理解数据集。已公开的阅读理解数据集可以自由下载https://ai.baidu.com/broad/introduction?dataset=dureader,并通过平台提交测试集结果进行系统效果测试。除了阅读理解数据集,百度AI公开数据集计划BROAD(Baidu Research Open-Access Dataset)还发布了视频和图像数据集,更多数据集参见:https://ai.baidu.com/broad。

  未来,百度将继续在AI人才培养中发挥重要作用,助力产学研各方开展研究,增强我国在机器阅读理解领域的影响力,让人才成为AI领域持续领跑的强力引擎。

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

赞(0)
分享到: 更多 (0)