报告题目:神经网络的凝聚现象
报 告 人:许志钦副教授(上海交通大学)
报告时间:2022年12月15日 16:30
报告地点:腾讯会议(498-163-626)
报告摘要:
神经网络在非线性训练过程中经常会出现参数凝聚的现象,也就是神经元会分成多个组,每组内的神经元的行为类似。本报告将介绍凝聚现象,讨论其中的机制以及其对泛化的意义。
报告人简介:
许志钦,上海交通大学自然科学研究院/数学科学学院长聘教轨副教授。2012年本科毕业于上海交通大学致远学院。2016年博士毕业于上海交通大学,获应用数学博士学位。2016年至2019年,在纽约大学阿布扎比分校和柯朗研究所做博士后。与合作者共同发现深度学习中的频率原则、参数凝聚和能量景观嵌入原则,发展多尺度神经网络等。现为Journal of Machine Learning的创刊managing editor之一。