“CCF-NLP走进高校”是由中国计算机学会自然语言处理专业委员会(CCF-NLP)发起,联合AI研习社及各个知名高校开展的一系列高校NLP研究分享活动。通过特邀嘉宾分享交流促进更多师生对自然语言处理前沿进展的了解,帮助在校计算机及相关专业大学生成长和发展。“CCF-NLP走进高校”第九期于2021年4月20日走进西湖大学。
受西湖大学特聘研究员张岳老师邀请,苏州大学我院李正华老师做了《基于树形条件随机场的句法分析》,重点介绍了他们团队IJCAI-2020和ACL-2020的研究成果。
活动举办网址:https://www.yanxishe.com/events/ccf-nlp-wu
报告视频和PPT链接:http://hlt.suda.edu.cn/index.php/LA-paper-report-talk-etc
李正华介绍:博士,必威副教授。分别于2006、2008、2013年于哈尔滨工业大学取得学士、硕士、博士学位。2013年8月加入苏州大学。自2005年起一直专注自然语言处理(Natural Language Processing, NLP)基础研究工作,涉及词法句法语义分析,并围绕这些任务展开了大量数据标注工作。目前成果包括:在顶级国际会议和期刊(ACL/EMNLP/COLING/AAAI/IJCAI/NAACL/IEEE-Trans-ASLP等)上发表学术论文30余篇;主持国家自然科学基金项目2项,先后和百度、腾讯、阿里、华为等公司建立科研性质的合作项目;标注汉语开放依存句法树库CODT、汉语开放谓词论元数据集COPAD、汉语上下位词对数据集、汉语多粒度分词数据集;构建构建汉语理解平台CUP、自然语言数据标注平台NLDAP。教学方面,多年从事Linux和Python教学,积累了大量笔记、板书照片、视频资源(见个人主页),并开始着手撰写Linux和Python教材。研究生培养方面,已毕业硕士研究生12名,大多就职于阿里、华为、微软、百度、搜狗、科大讯飞、爱奇艺等知名IT企业。个人主页:http://hlt.suda.edu.cn/~zhli
报告摘要:句法分析是自然语言处理领域(NLP)的核心任务,其目标是将输入词序列转化为树结构,刻画句子的句法结构。短语结构和依存结构是两种最常见的句法表示形式,对应的句法分析任务分别为短语结构句法分析(又称为成分句法分析)和依存句法分析。本次报告主要介绍我们在IJCAI-2020和ACL-2020发表的两篇论文的工作。深度学习时代之前,句法分析研究相比其他分类、排序等任务,学习和理解的门槛比较高,让很多初学者望而却步。深度学习技术的发展,让句法分析模型也变得非常简单。目前句法分析模型研究的一个主流方向是不断简化句法分析的建模,例如仅考虑局部结构,而不考虑全局树约束,从而让句法分析的速度变得更快。但是,深度学习时代之前,句法分析研究的趋势则是相反的,希望能够尽量融入更丰富、更全局的信息,以特征的方式加入到模型中,提高模型的性能。研究过程中,学者们提出了很多有趣的算法和想法,其中最具代表性的就是基于树形条件随机场的句法分析。我们在这两篇工作中,发现深度学习带来的技术革命,不仅可以和树形条件随机场这样的老古董有效结合,还可以让其变得更简单、更快,让我们对树形条件随机场有了更深入的理解。