课程作业
考核占比
- 个人小作业(40%):独立完成
- 小组大作业(50%):由3~4人组成
- 平时成绩(10%):不定时不定量点名以及课堂表现等
个人小作业(40%)
- 围绕所选择的课程所授某一特定主题,完成并提交一篇介绍性综述报告
- 内容包含:问题/主题描述与定义,模型/方法分类,各类技术/方法核心思想介绍及
优缺点,最新前沿进展,面临挑战和研究趋势等(图文并茂),需要有规范文献引用。
- 中文,正文不少于5000字, Deadline为第18周周末
- word文档提交,文件名为“姓名-学号”,文档中包括参考文献,并注明正文字数。
小组大作业(50%)
一、作业要求:
- 每组从所提供的6个候选题目中选一大作业题目,进行创新性探索与科研
- 按学术论文的要求完成包括Title,Abstract, Introduction, Method,
Experiments, Conclusion, References等每部分
- 报告:英文,CVPR模板(double column),正文(不包含reference)至少4页,列
出成员贡献比例;Deadline为第19周周末
- 最后4周(15-18周): project presentation,小组每个成员至少回答一个问题
二、大作业候选题目:
- 题目1: 视频与自然语言结合的多模态视频图像分析:
        
背景介绍:
视觉与自然语言结合受到越来越多的关注,在实际生活场景中也显得
越来越重要。第四届PIC竞赛 http://picdataset.com/ 给出了三个
多模态视频分析的任务,请选择其中一个,进行实验并撰写报告。
        
要求:
本作业是开放性的研究,可以结合自己的研究专长,选择合适的任务,
设计合适的模型,设计合理的框架和对比实验即可。按正式论文格式撰
写课程报告,以论文写作水平、方法创新性、模型效果作为评分标准。
- 题目2: 小样本下的图像分类:
        
背景介绍:
很多实际应用场景中(如无人超市、疾病诊断等)能收集到的数据往
往比较有限,而深度学习技术在训练数据较少时的图像分类表现往往
不太好。因此,如何在有限(数十到一两百例)训练数据情况下获得
泛化性较好的AI分类器模型,成为目前急需解决的难题之一。
        
要求:
在不利用同一模态外部数据集情况下(如不要像元学习方法使用同一
模态额外数据集,但可以利用自然图像数据集预训练模型用于医学图
像分类),研发新型的小样本图像识别模型与方法,在公开的至少一
种医学图像数据集和两种自然图像数据集上进行全方位实验评估,包
括与至少5种已有方法比较,达到或超过目前State-of-the-art方法的
性能。
- 题目3: 对噪声标签鲁棒的视觉识别:
        
背景介绍:
近年来由于深度学习、特别是卷积神经网络的发展,包括图像分类、
目标检测、人脸识别、行人重识别在内的视觉识别任务都取得了很大
进展。但是在现实应用场景中数据标注通常存在噪声,从而导致识别
性能显著下降。目前已有一些工作对此进行专门研究,例如[1]。
[1] K. Nishi, et al., Augmentation Strategies for Learning with Noisy Labels, CVPR 2021.
        
要求:
在对相关研究现状进行充分调研的基础上,针对数据标注有噪声情况
下的视觉识别任务,力争提出创新思路。基于广泛使用的公开数据集,
在图像分类、人脸识别中的至少一个任务上取得优于现有前沿方法的
效果。研究方法和结果需撰写成论文形式。
- 题目4: 视觉识别中的通用域适应算法:
        
背景介绍:
众所周知,机器学习方法在视觉识别任务上的成功高度依赖于在大型
标记数据集上的有监督训练。不幸的是,如果利用数据集A(源域)训
练好的模型部署在新的数据集B(目标域)上,性能通常会显著下降,
这个问题称为数据集偏差。无监督域自适应试图通过减少数据集偏差
来解决这个问题。除了数据集偏差之外,在实际问题中源域和目标域
的类别集合通常存在不一致的问题。这就是最近的热点研究问题之一,
通用域适应(Universal Domain Adaptation,UniDA)。
        
要求:
总结通用域适应的相关研究工作,力争提出更好的新方法,在公开数
据集(http://ai.bu.edu/visda-2021/#data)上,比较现有方法的效
果,以现行工作(https://arxiv.org/abs/2104.03344)中的结果为
基准,力争取得更高的分类准确率。按正式论文格式撰写课程报告,
以论文写作水平、方法创新性、分类准确率作为评分标准。
- 题目5: 基于高阶结构的复杂网络社区发现研究:
        
背景介绍:
网络社区发现是网络分析研究领域的一个非常热门的话题。尽管目前已经
提出了很多社区发现相关的方法,但是这些方法都只考虑了网络的低阶结
构特征--在单个节点和边的层面上进行分析,因此难以发现网络的高阶特
征--在稠密子图结构(例如motif)的层面上进行分析。近来,学者们也
研究了一些高阶方法,但是这些方法通常只关注基于moitf的超图
(hypergraph),并且还假定这些超图是连通的。然而,在现实网络中,
这些假设往往是不成立的:一个完全连通的原始网络得到的超图极有可能
是分块(块与块之间不连通)的,并且还可能存在大量的孤立点。基于此,
现有的高阶方法在面临上述超图分块问题的时候可能会表现得非常不好,
因为超图中没有边关联的两个点是无法被划分在同一个簇的(即便这两个
点在原始网络中属于同一个簇)。为了解决上述问题,我们的课题目标是
设计一个新的高阶结构特征,并基于这些特征得到更好的社区发现结果。
        
要求:
1、设计一个新的高阶结构并基于此设计一个新的社区发现算法;
2、新的算法精度对比现有算法提升5%以上;
3、形成一篇较好的学术论文初稿。
- 题目6: 人机多轮对话系统的对话管理研究:
        
课题背景介绍:
对话系统是序列模型的一个典型应用,其通常包含自然语义理解、对话状
态追踪,策略学习,以及答案生成。 对话系统技术挑战赛是一项对话系
统的顶尖学术竞赛,由来自微软研究院、卡耐基梅隆大学、本田研究院的
科学家于2013年发起。DSTC8的比赛的第二个赛道的Subtask 1和Subtask
2(Track2, https://github.com/dstc8-track2/NOESIS-II/ )是一个
多轮回复选择任务,它要求参赛的AI模型依据给定的多轮对话历史从候选
一百个答案中选出正确的回复。该任务包括两个数据集,即Ubuntu和
Advising。我们的课题目标是针对DSTC8赛道二的Subtask1或者Subtask2
提出新的模型,实现并测试其性能,力争达到一流水平。
        
要求:
1、分析已有方法存在的问题,并提出一个新的模型
2、新模型能够很好地解决某一个现存问题,并且性能优于改进前的效果
3、力争效果进入排行榜的前列,形成一篇较好的学术论文初稿。
三、大作业中期检查:
        
为每个组及时推进课程作业进度考虑,在第 12 周周日结
束之前每个组须将中期检查进度报告提交至课程邮箱,中期检查要求
须报告有实质性进展,主要检查以下几个点:
- (1)小组成员分工情况;
- (2)对所选题目领域了解情况,以 introduction 和 related works 的形
式进行给出;
- (3)实验进度,须有一个及以上对比方法在一个及以上的数据集上
运行出实验结果;
- (4)所选题目遇到的难点和需要解决的重点问题;
- (5)遇到的难点拟采用的解决方法。
- 中期检查报告用 word 写即可,参考文献格式,采用国标格式,按参
考文献在报告中出现的前后顺序进行排序,如:
[1] Khan A, Maji P. Approximate graph Laplacians for multimodal data
clustering[J]. IEEE transactions on pattern analysis and machine
intelligence, 2019, 43(3): 798-813.