正规白帽SEO,让排名更快速、客户更易找

15811308047

当前位置: 首页 >> 新闻中心 >> 行业动态

免费无限破解版游戏大全地铁跑酷复旦大学桂韬:Uncertainty—Aware Sequence Labeling

发布时间:2023-01-29 08:59:59

不到现场,照样看最干货的学术报告!嗨,大家好这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频——足够干网络营销推广公司货,足够新鲜!话不多说,快快看过来,希望这些优秀的青年学者、专家杰青的学术报告 ,能让您在业余时间的知识阅读更有价值。

人工智能论坛如今浩如烟海,有硬货、有干货的讲座却百里挑一“AI未来说·青年学术论坛网络营销推广公司”系列讲座由中国科学院大学主办,百度全力支持,读芯术、paperweekly作为合作自媒体承办单位为中国科学院大学学生会,协办单位为中国科学院计算所研究生会、网络中心研究生会、人工智能学院学生会、化学网络营销推广公司工程学院学生会、公共政策与管理学院学生会、微电子学院学生会。

2020年6月20日,第16期“AI未来说·青年学术论坛”NLP前沿技术及产业化线上专场论坛以“线上平台直播+微信社群图文直播”形式举行复旦网络营销推广公司大学桂韬带来报告《Uncertainty—Aware Sequence Labeling》。

桂韬,复旦大学自然语言处理实验室博士生,导师为张奇和黄萱菁教授。报告内容:桂韬在本次报告中主要分享了他近期在网络营销推广公司文本序列标注方面的工作。

Uncertainty—Aware Sequence Labeling

首先,桂韬介绍了问题的背景序列标注是比较广泛的任务,它包括分词、词性标注、命名实体识别等子任务,大致形式是网络营销推广公司通过输入一段文本,给文本中每个单词赋予相应的语言学的标签目前序列标注的流程一般分成两步,第一步是通过编码层将相应输入文本编码为有效的上下文表示,第二步再通过标签解码层对相应单词对应标签进行解码。

在文本网络营销推广公司编码的时候,可以根据实际任务需求设计不同的模型比如对于NER的任务,每个单词字符组成结构可能有比较大的作用,所以提出基于字符结构循环神经网络建模上下文循环神经网络速度比较慢,所以有人把卷积神经网络引入网络营销推广公司文本建模,从而提高速度。

近期比较火的预训练模型可以将大量无标注语料知识引入编码文本

而对于标签解码,由于序列标签之间有着非常强的相互依赖关系,比如说名词后面很可能接动词,不太可能接冠词,多文档之间标签间网络营销推广公司有标签间共有关系,所以建模标签长距离依赖对标签解码显得非常重要目前标签解码的研究比较少,一般常用做法一是利用Softmax直接将文本每一个单词映射相应标签上,第二种利用CRF建模标签转移矩阵,建立标签网络营销推广公司之间相互依赖关系。

最近一些工作利用神经网络,利用seq2seq的框架来建模标签长距离依赖关系接下来,桂韬分析了不同标签解码方式的优缺点第一种是利用Softmax,它的明显优势是可以实现并行解码,但很大网络营销推广公司缺点是每个单词得到标签是相互独立的,没有建模标签与标签的依赖关系,导致性能不高;第二种是利用CRF,建模标签间转移矩阵,通过转移矩阵构建整个句子解码时的最大句子得分,这种方式能够建模相邻标签依赖关系,网络营销推广公司但同时需要依赖维特比解码方式,解码速度比较慢;第三利用神经网络seq2seq,生成一部分标签,预测当前标签时通过LSTM建模之前标签生成当前标签,这样生成标签实际上建模了当前标签依赖关系,所以具有长距网络营销推广公司离的标签依赖。

但解码仍然需要串行解码,无法并行,同时会带来错误传播问题,如果一个标签预测错,很可能导致后面标签一直错

因此,在并行解码与建立长距离依赖间似乎存在矛盾,桂韬试图寻找两者的结合点这就是这项工网络营销推广公司作的出发点要解决这个问题,一个非常直观的想法是采用两步框架首先用Softmax生成草稿标签,之后用Transformer建立标签与标签依赖关系,对之前生成草稿标签进行修正。

因为Softmax和Tran网络营销推广公司sformer都是并行的,它可以实现整体的并行解码,而Transformer也可以通过草稿标签建模标签与标签长距离依赖但在实验中,桂韬发现了一个棘手问题:Transformer在第二步对草稿标签进行修网络营销推广公司正时,很有可能将正确标签改错。

如在CoNLL2003数据集上进行的测试,发现利用两步框架时,第一步的草稿标签会有39个会改错,54个被改对所以在这种框架下无法避免正确的标签被改错的情况,所以现在要寻找网络营销推广公司一个indicator,能否第二步修正只修正可能错的标签,正确标签保护起来不要修正。

继续通过实验,桂韬发现通过Bayesian神经网络估计模型不确定性,可以非常好地指示哪些草稿标签可能是错的、哪些可能网络营销推广公司是对的在CoNLL2003上的测试集上,他发现当草稿标签预测正确的时候,它的平均不确定性是0.018,如果草稿标签预测错了,那么它的不确定性超过0.5,错误标签不确定性是正确标签不确定性的29倍。

因此网络营销推广公司,可以设计阈值,保护预测正确标签,只修正不确定性非常大、很可能会错误的标签,这样可以实现并行解码同时尽量不将正确标签改错

接下来,桂韬简要介绍了Bayeasian神经网络的基本思想对于常见的深度学习神经网络营销推广公司网络,整个模型参数是确定值,得到标签也是确定的而Bayeasian神经网络的模型参数不再是确定值,而是一个个分布,也就是模型参数是变量,最终模型参数值通过分布得到,这样模型输出标签也是一个分布,可以通网络营销推广公司过标签分布得到整个模型的不确定性。

这里一个大的困难是估计参数分布,因为数据集的真实参数分布是不清楚的,为了计算方便可以使用简单的先验分布来逼近真实分布具体方法可以采用变分推断,通过最小化假设某种分布,网络营销推广公司与真正模型参数分布KL散度来估计这里为了不增加参数量,通过Bernoulli分布逼近参数分布。

因为Bernoulli分布是0和1采样,所以只要采用Dropout就可以得到Bernoulli分布对优化参网络营销推广公司数得到采样,假设采样t次,可以得到逼近参数分布,然后再对模型标签预测,因为采样次数越多,对模型真正后验逼近越准确,通过最终输出模型标签预测分布去计算熵,可以得到不确定性。

之后,桂韬介绍了他所提出的具体网络营销推广公司模型架构他将LSTM引入Bayeasian框架,作为第一步生成草稿标签的解码器,并且伴随得到模型不确定性这里再设置一个不确定性阈值的超参数,大于阈值的标签很有可能是错误的,让这部分草稿标签进入Tran网络营销推广公司sformer层进行修正。

最后,桂韬介绍了一些实验结果首先在命名实体识别和序列标注做了测试,模型性能比CRF、Softmax、seq2seq结果好很多因为这篇工作主要关于标签解码问题,实际上和文本编码网络营销推广公司方式不太相关,所以可以用各种复杂文本编码方式建模文本,再用此方式对标签进行解码。

同时对解码速度进行了测试,发现该模型相比其他模型明显快另外对不确定性阈值设置进行了实验随着不确定性阈值增大,模型逐渐知道网络营销推广公司怎么选择修正标签,并达到非常好的效果,而随着不确定性的阈值继续增大,实际上模型会完全选择草稿标签,这样的话性能又会下降。

由于该框架可以建模非常长文本标签依赖,所以可以扩展到篇章级别的命名实体识别例如文网络营销推广公司章开头有人名,而在中间人名只给了名没有给姓,可能模型单凭句子很难知道是人名,此时可以利用Transformer方式关注到前面的标签,给它做修正,唯一要改正的地方只需要加一个Memory框架,把之前预测网络营销推广公司标签存起来,可以用Transformer进行查询。

桂韬也做了一个简单实验来验证想法,测试合适的memory size。发现只要存一个类似单词标签,通过框架可以得到明显性能提升,如果存的更多可能性能会再网络营销推广公司有进一步提升,但比较缓慢。

(整理人:江洲钰)

AI未来说*青年学术论坛第一期 数据挖掘专场1. 李国杰院士:理性认识人工智能的“头雁”作用2. 百度熊辉教授:大数据智能化人才管理3. 清华唐杰教授:网络网络营销推广公司表示学习理论及应用4. 瑞莱智慧刘强博士:深度学习时代的个性化推荐

5. 清华柴成亮博士:基于人机协作的数据管理第二期 自然语言处理专场1. 中科院张家俊:面向自然语言生成的同步双向推断模型2. 北邮李网络营销推广公司蕾:关于自动文本摘要的分析与讨论3. 百度孙珂:对话技术的产业化应用与问题探讨

4. 阿里谭继伟:基于序列到序列模型的文本摘要及淘宝的实践5. 哈工大刘一佳:通过句法分析看上下文相关词向量第三期 计算机网络营销推广公司视觉专场1. 北大彭宇新:跨媒体智能分析与应用2. 清华鲁继文:深度强化学习与视觉内容理解

3. 百度李颖超:百度增强现实技术及应⽤4. 中科院张士峰:基于深度学习的通用物体检测算法对比探索5. 港中文网络营销推广公司李弘扬 :物体检测最新进展第四期 语音技术专场1. 中科院陶建华:语音技术现状与未来2. 清华大学吴及:音频信号的深度学习处理方法

3. 小米王育军:小爱背后的小米语音技术4. 百度康永国:AI 时代的网络营销推广公司百度语音技术5. 中科院刘斌:基于联合对抗增强训练的鲁棒性端到端语音识别第五期 量子计算专场1. 清华大学翟荟:Discovering Quantum Mechanics with Machine L网络营销推广公司earning

2. 南方科技大学鲁大为:量子计算与人工智能的碰撞3. 荷兰国家数学和计算机科学中心(CWI)李绎楠:大数据时代下的量子计算4. 苏黎世联邦理工学院(ETH)杨宇翔:量子精密测量5. 百网络营销推广公司度段润尧:量子架构——机遇与挑战

第六期 机器学习专场1. 中科院张文生:健康医疗大数据时代的认知计算2. 中科院庄福振:基于知识共享的机器学习算法研究及应用3. 百度胡晓光:飞桨(PaddlePadd网络营销推广公司le)核心技术与应用实践4. 清华大学王奕森:Adversarial Machine Learning: Attack and Defence

5. 南京大学赵申宜:SCOPE - Scalable C网络营销推广公司omposite Optimization for Learning第七期 自动驾驶专场1. 北京大学查红彬:基于数据流处理的SLAM技术2. 清华大学邓志东:自动驾驶的“感”与“知” - 挑战与机遇网络营销推广公司

3. 百度朱帆:开放时代的自动驾驶 - 百度Apollo计划4. 北理宋文杰:时空域下智能车辆未知区域自主导航技术第八期 深度学习专场1. 中科院文新:深度学习入门基础与学习资源2. 中科院陈智能:计网络营销推广公司算机视觉经典——深度学习与目标检测

3. 中科院付鹏:深度学习与机器阅读第九期 个性化内容推荐专场1. 人民大学赵鑫:基于知识与推理的序列化推荐技术研究2. 中科院赵军:知识图谱关键技术及其在推荐系统中网络营销推广公司的应用第十期 视频理解与推荐专场1. 北京大学袁晓如:智能数据可视分析

第十一期 信息检索与知识图谱专场1. 北京邮电大学邵蓥侠:知识图谱高效嵌入方法2. 人民大学徐君:智能搜索中的排序-突破概率排序准网络营销推广公司则3. 百度周景博:POI知识图谱的构建及应用4. 百度宋勋超:百度大规模知识图谱构建及智能应用

5. 百度冯知凡:基于知识图谱的多模认知技术及智能应用第十二期 年度特别专场1. 复旦大学桂韬:当NLP网络营销推广公司邂逅Social Media--构建计算机与网络语言的桥梁2. 清华大学董胤蓬:Adversarial Robustness of Deep Learning

3. UIUC罗宇男:AI-assiste网络营销推广公司d Scientific Discovery4. 斯坦福应智韬:Graph Neural Network Applications第十三期 AI助力疫情攻关线上专场

1. 清华大学吴及:信息技术助力新冠网络营销推广公司防控2. 北京大学王亚沙:新冠肺炎传播预测模型3. 百度黄际洲:时空大数据与AI助力抗击疫情——百度地图的实践与思考4. 百度张传明:疫情下的“活”导航是如何炼成的第十四期 深度学习线上专场

1. 中国网络营销推广公司科学院徐俊刚:自动深度学习解读2. 北航孙钰:昆虫目标检测技术3. 百度尤晓赫:EasyDL,加速企业AI转型4. 百度邓凯鹏:飞桨视觉技术解析与应用第十五期 大数据线上专场1. 复旦赵卫东:大数据的网络营销推广公司系统观

2. 中科大徐童:AI×Talent数据驱动的智能人才计算3. 百度李伟彬:基于PGL的图神经网络基线系统4. 中科大张乐:基于人才流动表征的企业竞争力分析

留言点赞关注我们一起分享AI学习与发展网络营销推广公司的干货如转载,请后台留言,遵守转载规范


上一篇:免费追剧app软件支付服务商Sequence获1900万美元种子轮融资 下一篇:免费听书软件 全免费电信套餐139合约三年,免费领个iPhone14,网友:不香