- 1.学习过程中,会发现一篇论文很难很快看完,因为经常因为其中涉及到的一些专有名词和技术需要了解和掌握而中断,从而转去进行其他知识的学习,例如上周,在看《Camera Style Adaptation for Person Re-identification》(ICCV2018)过程中,因为涉及到CNN卷积神经网络(Convolutional neural network),由此转到了Neural Networks and DeepLearning(http://neuralnetworksanddeeplearning.com/chap1.html-英文)(https://tigerneil.gitbooks.io/neural-networks-and-deep-learning-zh/content/chapter1.html-中文),上周主要看了本书第一章节(利用神经网络识别手写数字)部分内容(http://www.tensorfly.cn/home/?p=80)
- (1)手写体识别:这是一个很好的学习神经网络的原型问题神经网络,主要思想就是利用大量的手写数字(训练样本),然后开发出一套从训练样本中进行学习的系统。那也就是说,神经网络使用样本来自动推理出识别手写数字的规则。
- 此外,通过学习可以知道在手写体识别过程中,增加训练样本规模,神经网络便能学到手写体的更多规则从而提升它的识别精度。这也应了最近所看的几篇论文,例如之前读的论文《Person Transfer GAN to Bridge Domain Gap for Person Re-Identification》(CVPR2018)便是提出了一个更大的数据集MSMT17(考虑到了视角,光照等更为细致的因素),同时提出了 PTGAN(Person Transfer GAN)方法,实现跨场景的迁移,以此来有效的缩小多个数据集之间的差异,即Domain-gap,最终增加样本数量。而PTGAN 的实现主要基于两个损失函数:风格迁移和行人保持。
- 还有正在读的论文《Camera Style Adaptation for Person Re-identification》(ICCV2018)所解决的同样是通过在训练集中增加更多样本,来了解摄像机之间的风格差异,以此来解决个人身份识别中的数据稀缺问题,并学习不同摄像机之间的不变特征。 由此可以看出,行人再识别研究面临的第一大挑战便是对大量训练数据的需求。
(2)人工神经网络(Artificial Neural Networks)的两大类别:(正在看)
- 感知器(Perceptrons):卷积神经网络(Convoluted Neural Networks),支持向量机(Support Vector Machine)
- 神经元(sigmoid):人工神经网络试图模仿大脑的神经元,每个神经元通过某种特定的输出函数(也叫激励函数)计算处理来自其它相邻神经元的加权输入值,而且神经元之间的信息传递的强度,用所谓加权值来定义,算法会不断自我学习,调整这个加权值。
(3)神经网络标准学习算法:随机梯度下降(正在看)
- 算法的核心:计算、连接、评估、纠错、疯狂训练
- 精髓:非线性、分布式、并行计算、自适应、自组织
- 2. 由于研究课题研究的是基于深度强化学习的行人再识别,学习深度学习和强化学习相关理论知识(http://www.zhuanzhi.ai/document/91c1e8b92a540e71ab8fc40dd6a96304)
- 由于行人再识别与图像检索的思路相同, 可以看作是图像检索的子问题,包括两个核心部分: (1) 特征提取与表达. 从行人外观出发, 提取鲁棒性强且具有较强区分性的特征表示向量, 有效表达行人图像的特性; (2) … Continue Reading ››
Stay Hungry, Stay Foolish!