scispace-正则类型
搜索或查询
过程文章 ·

极深卷积网络大尺度图像识别

卡伦西蒙扬一号 ,AndrewZiserman一号 ·
牛津大学 一号
2015年1月01日 -
TL;DR:论文作者调查卷积网络深度对大规模图像识别设置精度的影响并显示通过推深至16-19层可显著改善前科配置
抽象性 :研究卷积网络深度对大规模图像识别设置精度的影响我们的主要贡献是用极小3x3卷积滤波对深度提高网络进行彻底评价,显示通过将深度推向16-19权值层可大大改善前科配置发现基础图像网挑战2014提交并显示我们表示与其他数据集相容性良好, 并实现最新结果betway亚洲并公诸于众的ConvNet两种最优表现模型 以方便深入研究 计算机视觉应用
引用
多过滤器
过程文章 · 多尔市 ·
开明何一号 ,Xiangyu Zhang一号 ,少庆任一号 ,建孙一号 ·
微软 一号
2016年6月27日
TL;DR:作者在文章中建议剩余学习框架,以方便网络培训深度远比前文高得多,前文ILSVRC2015分类任务排名第一
抽象性 :深度神经网络更难训练提供剩余学习框架以方便网络培训深度远比前用深清晰重构层为学习剩余函数并参考层输入,而不是学习非参考函数我们提供综合实证证据表明,这些剩余网络更容易优化,并可从深度大幅提高中获取精度图像网数据集上,我们评价深度达152层-8x比VGG网[40]但仍复杂度低一组剩余网实现3.57%图像网测试集误差本结果取ILSVRC2015分类任务第一位并分析CIFAR-10100和1000层深度表示对许多视觉识别任务至关重要单因极深表达方式,我们从COO物体检测数据集获取28%相对改善深残留网是我们提交ILSVRC和COCO2015比赛的基础1, 在那里我们也赢得图像网检测任务第一位,图像网定位,COCO检测和COCO分割

123 388引用

贴出内容 ·
开明何一号 ,Xiangyu Zhang一号 ,少庆任一号 ,建孙一号 ·
微软 一号
TL;DR:这项工作提供了一个剩余学习框架,以方便深度远比以前使用的网络培训,并提供综合实证证明显示这些剩余网络更容易优化,并可从深度大幅提高中获取精度
抽象性 :深度神经网络更难训练提供剩余学习框架以方便网络培训深度远比前用深清晰重构层为学习剩余函数并参考层输入,而不是学习非参考函数我们提供综合实证证据表明,这些剩余网络更容易优化,并可从深度大幅提高中获取精度图像网数据集上我们评价残留网深度比VGG网深达152层-8x,但仍复杂度低一组剩余网实现3.57%图像网测试集误差本结果取ILSVRC2015分类任务第一位并分析CIFAR-10100和1000层深度表示对许多视觉识别任务至关重要单因极深表达方式,我们从COO物体检测数据集获取28%相对改善深残留网是我们提交ILSVRC和COCO2015竞赛的基础,我们也在ImageNet检测、图像网定位、COCO检测和COC分治任务中赢得第一位

44703引用

书本 ·

[.]

2016年11月18日
TL;DR:深度学习如本文所述是一种机器学习形式,使计算机从层次概念上学习并理解世界,并用于许多应用中,如自然语言处理、语音识别、计算机视觉、在线推荐系统、生物信息学和视频游戏
抽象性 :深学习是一种机器学习形式,使计算机从经验中学习并理解世界概念层次结构计算机从经验中收集知识,不需要计算机操作符正式具体说明计算机需要的所有知识层次概念允许计算机从简单概念中学习复杂概念图表显示多层深度这本书介绍深入学习的广泛题目文本提供数学和概念背景,覆盖线性代数相关概念、概率理论和信息理论、数值计算和机器学习描述行业从业者使用深学习技巧,包括深进化网络、规范化、优化算法、卷积网络、序列建模和实用方法并调查自然语言处理、语音识别、计算机视觉、在线推荐系统、生物信息学和视频游戏等应用betway亚洲最后,书提供研究视角,覆盖线性因子模型、自译自算器、表示学习、结构概率模型、Monte Carlo方法、分区函数、近似推理和深基因模型等理论专题betway亚洲深入学习可供本科生或研究生规划产业或研究职业使用,并可供软件工程师使用,他们想开始产品或平台深学习网站为读者和教官提供辅助材料

38208引用

杂志文章 · 多尔市 ·
TL;DR:图像网大规模视觉识别挑战(ILSVRC)如本文所述,是对象分类和检测数以百计对象类别和数以百万计图像的基准,从2010年逐年运行至今,吸引五百多个机构参与
抽象性 :图像网大规模视觉识别挑战是对象分类和检测数以百计对象类别和数以百万计图像的基准自2010年起逐年处理挑战,吸引50多个机构参与论文描述创建此基准数据集和推介对象识别并详细分析当前大规模图像分类和对象检测状况, 并比较计算机最新视觉精度与人性精度最后,我们总结5年挑战的经验教训,并提议未来方向和改进

30811引用

过程文章 · 多尔市 ·
2015年6月7日
TL;DR:关键洞察力是构建“完全卷积式”网络,收集任意大小输入并产生相应大小输出并高效推理学习
抽象性 :卷积网络是强视觉模型 产生特征层次显示卷积网络 训练端对端像素 超出语义分割关键洞察力建网 取任意大小输入 并产生相应大小输出 高效推理学习定义并详解完全卷积网络空间,解释网络应用空间稠密预测任务,并连接前位模型现代分类网络(AlexNet[20]、VGG网[31]和GoogleNet[32])完全演化成网络并微调[3]分治任务定义跳转结构 将深度粗度层信息 和浅度精度层信息的外观信息合并完全卷积网络实现PASCALVOC最新分解(2012年20%相对62.2%IU,NYUDv2和SIFT流),而典型图像则需要不到五分之一秒推理

28225引用

引用
多过滤器
书籍章 · 多尔市 ·

[.]

2012年1月01日

139 059引用

过程文章 ·
亚历克斯克里日夫斯基一号 ,IlyaSutskever一号 ,杰佛里E欣顿市一号 ·
032012年12月
TL;DR:CNN最先进性能由深卷动神经网络实现,作者们讨论过,它由五卷层组成,部分卷积层后加最大聚层和三全连通层后加最后千道软max
抽象性 :训练大型深度卷积神经网络 分类120万高分辨率图像测试数据上表一和表五误差率37.5%和17.0%,比上图高得多神经网络有6千万参数和65万神经元,由五层卷积组成,部分卷积后加最大聚层和三层完全连通并有最后1000道软max提高训练速度,使用不饱和神经元和高效GPU实现卷积运算减少全连通层的压倒性,我们使用最近开发的正规化法,称为ubjectout中5测试误差率15.3%,而次优参赛率26.2%

73978引用

过程文章 · 多尔市 ·
佳登一号 ,微东一号 ,理查索契一号 ,里治里一号 ,开里一号 ,李飞飞一号 ·
2009年6月20日
TL;DR:新建数据库名为“图像网”,大规模图像本体学基础WordNet结构,规模和多样性大得多,比当前图像数据集精确得多
抽象性 :图像数据在互联网上爆炸有可能促进更精密和强健模型和算法索引、检索、组织与图像和多媒体数据交互确切地说,如何利用和整理这些数据仍是一个关键问题。大规模图像文理学 建建WordNet结构主干图像网旨在用平均500-1000全解析图像填充WordNet800合成上千万图象由WordNet语义层次组织本文详细分析图像网当前状态:12子树5 247合成和320万图像显示图像网规模和多样性大得多,比当前图像数据集精确得多构建大型数据库是一项挑战性任务描述亚马逊机械土耳其最后,我们通过对象识别、图像分类和自动对象集群三大简单应用来说明图像网的实用性betway亚洲图像网规模、精度、多样性和层次结构为计算机视觉圈外的研究人员提供无与伦比的机会

49 639引用

杂志文章 · 多尔市 ·

[.]

40330引用

过程文章 · 多尔市 ·
2015年6月7日
TL;DR:感知像本文提到的深入卷积神经网络架构,实现图像网2014大型视觉识别挑战新状态分类检测
抽象性 :深入卷积神经网络架构代码感知实现图像网2014大型视觉识别挑战新状态分类检测本架构的主要特征是提高网络内计算资源使用率通过精心设计,我们提高网络深度和广度,同时保持计算预算不变优化质量,建筑决策基于Hebbian原理和多尺度处理直觉LSVRC14提交文件使用的一个特殊化名叫GoogleNet,这是一个22层深网络,质量从分类检测角度评估

40257引用