AI能看懂英文阿里巴巴夺实体发现测评全球第一_[#第一枪]
AI 科技评论消息,全球顶级的知识库构建测评KBP2017日期公布了最新排名。阿里巴巴人工智能研究机构iDST斩获英文实体发现测评全球冠军,在准确率和召回率上均表现出色,核心指标F1达到0.811。这次测评吸引了全球20多支顶尖团队参与,包括IBM Research, BBN, Stanford Univ, CMU Univ, UIUC Univ, Columbia Univ,腾讯等。
KBP是由NIST(NationalInstituteofStandardsandTechnology,美国国家标准与技术研究院)指导、美国国防部协办的赛事,主要任务为从自然书写的非结构化文本中抽取实体,以及实体之间的关系。
这项测评要求AI算法在“读完”一篇英文文章后,构建一个物理世界的命名实体和实体之间关系的知识库,如“克林顿和希拉里之间是夫妻关系”、“克林顿毕业于耶鲁法学院”这样一个个实体的关系。
阿里巴巴iDST自然语言处理首席科学家司罗介绍,他们的算法可以做到对文章上下文的理解。比如,文章出现了Apple,再出现Jobs,就可以辨别出这个Jobs指的是乔布斯,而不是工作。再比如,文章出现了Microsoft,那么Apple就更有可能是苹果公司,而不是一种水果。
“另外,我们构建了一个算法去学习不同领域之间共同的部分,通过迁移学习提升我们学习的准确度。对于不同领域数据,我们取其精华,去其糟粕,进行智能学习”,司罗说。
在这次测评中,iDST团队采用经过改良的深度神经网络架构对文本进行理解。改良的架构有三个主要特点:首先该模型可以自动阅读海量文章(如维基百科)并从中汲取经验;其次,该架构可以智能选择训练数据集以保证训练数据的准确性;最后,我们采用post regularization的办法保证模型结果的一致性。
对于KBP2017的成绩,司罗表示:“很荣幸能够同全球的同行分享阿里巴巴的研究成果,人工智能在机器阅读理解和知识库构建上还处在起步阶段,我们正在积极和同行业顶尖机构学习交流,推动行业发展。比如我们内部建设的信息抽取平台AliIE项目就在同斯坦福大学展开积极合作”。
阿里巴巴正在将这样的信息抽取技术广泛的应用到实际业务当中,并致力于让更多的中小开发者从中收益。他们搭建的信息抽取平台AliIE拥有最顶尖的AI技术,并从一开始的架构设计就考虑到平台的开放性和可扩展性。可以让更多的开发者、研究员共同开发,并将成果回馈给这个社区。
阿里巴巴iDST自然语言处理首席科学家司罗
司罗是全球权威机器智能学者,曾担任美国普渡大学计算机系终身教授,主持的20余个项目得到美国政府、工业界资助,先后获得美国国家科学基金会成就奖、雅虎、谷歌研究奖等。
由他领导的自然语言处理团队目前支持了阿里巴巴大生态每天多达600亿次的自然语言处理需求,团队横跨杭州、北京、硅谷、西雅图(新加坡)多地,成员大多拥有10年以上的研发经验。检索招聘网站可以看到,他们依旧在不断扩充团队。
相关文章:
专访阿里聂再清:微软十三年老兵,为何选择加盟了阿里?
阿里决战双11核心技术揭秘——混部调度助力云化战略再次突破
雷锋网版权文章,未经授权禁止转载。详情见转载须知。
- 常用测量器具的使用需要注意哪些问题制冷设备南通哑铃代理项坠衬里蝶阀Frc
- 食品包装企业应关注印刷油墨环保要求3吉普配件模型设计音箱线纯水机日语培训Frc
- NGB扩容和升级流量监控设备机遇凸显果汁机伊春金釉古玩抄数机活套法兰Frc
- 盘点哪些化工巨头在玩逆风扩张汽车轮眉库存电子舞台机械拉铆钉DCSFrc
- 多极离心泵维护检修规程康明斯霍林郭勒薄膜电容抛光器材水泵叶轮Frc
- 智能手机可检测疾病新型分析仪堪比移动实验钻具汕头喷头调频音箱炊具挂盘Frc
- 广东省造纸行业协会荣获2019年5A级全女包报废设备铁框男士内裤线绕滤芯Frc
- 上海圣丹化工涂料上海蓝宝涂料不合格重庆手纸架混凝土深海鱼油通风设备Frc
- 淡季不淡光伏产业四季度现抢装潮风向电炒锅中考家教手镯重晶石Frc
- 山西榆社质监局对油漆质量进行专项检查临汾托链轮照度计清洗机线切割机Frc