您当前的位置：首页 > > 学术报告 > > 正文

基于预训练语言模型的无监督数据集合成

发布时间：2022-08-03 点击数：

报告题目：基于预训练语言模型的无监督数据集合成

主讲人：吴志勇

时间：2022年08月4日（星期四）早上10:00

地点：腾讯会议号697786106

摘要：

人工智能想要突破泛化瓶颈，低成本地赋能百行千业，收集标注数据是一道必须跨过的门槛。然而针对海量的任务和场景去标注特定的数据成本难以估量且耗时。如果能无监督地去合成带标注的数据，将极大提高AI系统在数据层面上的通用性，自下而上推动人工智能研究和产业应用的发展。本次分享将介绍我们在利用预训练语言模型进行无监督数据集合成上开展的几项研究工作，并对后续的研究进行展望。

报告人简介：

吴志勇博士，现上海人工智能实验室青年研究员，研究方向包括文本生成和可解释性。他2017年本科毕业于武汉大学，并于2021年从香港大学取得计算机博士学位。他在相关领域顶级会议/期刊发表论文7篇，并常年参与多个会议的评审工作。