开云APP·官方入口(kaiyun)(中国)官方网站IOS/Android/手机app下载

Fashion-MNIST周年回首:280多篇论文引用,Google,NIPS最爱-开云app官网入口
作者:肖涵,Fashion-MNIST数据集作者Fashion-MNIST降生至今已经一年了。这个想要取代手写数字MNIST的数据集,搞机械学习研究的列位想必已经很熟悉。一年来,它在GitHub上拿下4000多星,被400多个代码堆栈引用,还在280多篇论文中亮过相。哪些机构、哪些领域的AI研究者最爱用Fashion-MNIST?这个数据集的作者肖涵做了一次总结,量子位获授权揭晓。
联系开云app官网入口
详情
本文摘要:作者:肖涵,Fashion-MNIST数据集作者Fashion-MNIST降生至今已经一年了。这个想要取代手写数字MNIST的数据集,搞机械学习研究的列位想必已经很熟悉。一年来,它在GitHub上拿下4000多星,被400多个代码堆栈引用,还在280多篇论文中亮过相。哪些机构、哪些领域的AI研究者最爱用Fashion-MNIST?这个数据集的作者肖涵做了一次总结,量子位获授权揭晓。

开云app官网入口

作者:肖涵,Fashion-MNIST数据集作者Fashion-MNIST降生至今已经一年了。这个想要取代手写数字MNIST的数据集,搞机械学习研究的列位想必已经很熟悉。一年来,它在GitHub上拿下4000多星,被400多个代码堆栈引用,还在280多篇论文中亮过相。哪些机构、哪些领域的AI研究者最爱用Fashion-MNIST?这个数据集的作者肖涵做了一次总结,量子位获授权揭晓。

Fashion-MNIST数据集地址:https://github.com/zalandoresearch/fashion-mnist作者信息肖涵博士,Fashion-MNIST数据集作者。现为腾讯AI Lab高级科学家、德中人工智能协会主席。他曾于2014-2018 年头就职于位于德国柏林的 Zalando 电商,先后在其推荐组、搜索组和Research组,担任高级数据科学家。肖涵在德国慕尼黑工业大学盘算机系取得了博士 (2014) 和硕士学位 (2011),博士偏向为反抗机械学习。

这期间曾在国立台湾大学资工所做会见学者 (2013)。赴德前,他曾在北京邮电大学取得了信息通信学士学位 (2009)。

肖涵所开办的德中人工智能协会如今拥有400余名会员,致力于德中两国AI领域的互助与交流。微信:hxiao1987Blog: https://hanxiao.github.io引言距离我2017年8月公布Fashion-MNIST数据集已经有一年的时间了。

正如我在其README中写到的那样:Fashion-MNIST的目的是要替代经典数字MNIST数据集,资助研究者更好的评测和明白机械学习算法。在已往的一年里,我看到ML/AI社区朝这个偏向不停前进着。

越来越多的研究人员、工程师、学生和喜好者和初学者都爱上了这个数据集。今天你可以在网上找到关于Fashion-MNIST数以千计的讨论、代码和教程。在Github,Fashion-MNIST已经获得了凌驾4100颗星星,被引用在400多个代码堆栈中,1000多条commits里和7000多个代码片段中。在Google Scholar中,凌驾280篇学术论文使用或引用了Fashion-MNIST数据集。

甚至连来自AAAS的「科学」(Science)杂志都引用了这个数据集。而在Kaggle上,这个数据集在数千个数据集中是压倒一切,并附有300多个Kernels。现在,所有主流的深度学习库都内置了这个数据集:你只需要一行import,就可以直接使用它。

毫无疑问,Fashion-MNIST是一个很是乐成的项目。在这里,我会对它在已往一年里所取得的重要成就做一个总结。我为什么会做Fashion-MNIST?2017年8月的一天,那时我还在Zalando Research部门事情。

我的上司让我调研一把生成反抗网络(GAN)并实现其中一两个模型,借机熟悉一下。我很快就写完并在MNIST数据集上做了测试。但我发现在MNIST上的生成效果似乎总是不错,无论你用的网络庞大度如何,参数设置如何。或许因为MNIST过于简朴?于是,我决议增加一些难度,把公司数据库中的衣服图片扔到网络里去。

很显然,这就需要我重新写一个用于输入处置惩罚的pipeline:把图片居中、调整白平衡、缩放等等,最后再载入到模型中。最终,我决议将图片做离线处置惩罚后,存储为MNIST的花样,省去了自己写data loader。

这就是Fashion-MNIST最初的第一个版本。随后的几天里,我一直在玩这个新数据集,使用它做种种实验。同时,我不停改善它的图片质量,并在Tensorflow, Keras中为它提供更通用的API接口。最终,我把它公布为公司内部的一个开源项目(inner source project)。

在我的前同事Kashif Rasul和Lauri Apple的勉励下,我们最终决议把这个数据集公布到Github和arXiv上。为了在国际上扩大影响力,我也将数据集的说明翻译成了中文和日文。剩下的事情可能大家都已经知道了:这个数据集最先被Reddit下的r/MachineLearning板块讨论,随后迅速在HackerNews, Github,Twitter和Facebook上流传开来。

一连三天内,Fashion-MNIST成为Github上最热门的开源项目之一。几天后,甚至Yann LeCun本人都在他的Facebook主页上发帖勉励大家实验这个新数据集。

在这次的履历中,我想特别谢谢我的前同事Lauri Apple的支持。Lauri是一位恒久致力于开源事业的女性。在一开始,我的想法(接纳Fashion-MNIST替换MNIST)遭到其他人的讽刺和不明白,他们认为圈子里基础不会在乎这个数据集。这个时候,Lauri站了出来告诉我:那些真正做出改变的人永远是那些相信改变的人(people who actually make change are the ones who believe that change is possible)。

Fashion-MNIST对学术圈的孝敬在我今天写这篇总结的时候,已经有凌驾280篇学术论文在实验环节引用或使用了Fashion-MNIST数据集(凭据停止10月9日的Google Scholar效果)。思量到数据集仅仅公布1年,这个数量还是很是可观的。经由一番筛选之后,我留下了其中247篇放在了一个Google表格里,大家可以自行查阅。

那么这247篇论文出自谁之手,在哪揭晓,又研究了哪些问题?在下面,我会向大家做一个全面的先容。Google表格地址:https://docs.google.com/spreadsheets/d/1cGX7Juedn_KVUgjDk298v5uUjc_wPk930tKyEoZhTQM/edit?usp=sharing顶级的AI研究机构青睐Fashion-MNIST下图给出了247篇论文中根据机构的统计图。

如果一篇论文由多个机构互助完成,则在统计时每个机构都加1。而如果一篇论文中多个作者来自同一机构,则这一机构只加1。

而且,我还把同组织的机构合并在一起,好比Google Research, Google Brain, Deep Mind合并为了Google;马普(Max Planck Institute)旗下的信息所、智能所和量子光学所合并为Max Planck Institute。为了越发清晰的展示,论文数量小于3机构没有在这里展示,但大家仍然可以在上面给出的Google表格里检察全部机构的统计列表。在这个图表中,我们不难发现来自北美、亚洲和欧洲地域顶尖的AI研究机构。

在它们之中,Google以9篇使用Fashion-MNIST的论文位居榜首。其次是英国剑桥大学,7篇;IBM Research、加拿大蒙特利尔大学、北京大学和加州大学洛杉矶分校以6篇并列第三。

中国方面,除北京大学外,中科院、南京大学、清华大学及京东也很是青睐Fashion-MNIST这个数据集。而在工业界,除了已经列出的Google, IBM Research和Microsoft,在完整列表中可以找到更多大家耳顺能详的公司:Facebook (2篇), Telefónica Research (2篇) Uber (1篇), Apple (1篇), Samsung (1篇), 华为 (1篇) and Twitter (1篇)。同时,我还注意到有不少北美地域的机械视觉创业公司也在Fashion-MNIST数据集上做了很是有意思的研究,并揭晓了高质量的论文。美中两国在AI领域的竞争和互助下图展示了这些文章出自于哪些国家或地域。

如果一个论文由多个国家或地域互助完成,则在统计时每个国家或地域时都加1。而如果一篇论文中多个作者来自同一国家或地域,则这一国家或地域只加1。

为了更清晰的展示效果,论文数量小于4的国家或地域没有在这里展示,但大家仍然可以在Google表格里检察全部国家或地域的统计列表。很显着,美国以94篇引用Fashion-MNIST的论文的绝对多数占据了榜首,其次是中国44篇。

加拿大、英国德国的研究人员也显示了对这个数据集的浓重兴趣,排列第3,4,5位。榜上前5名的国家孝敬了约莫50%的论文量。总体来讲,共有来自38个国家的研究人员在他们的论文中使用了这个数据集。只管中美之间商业战的乌云笼罩,AI领域竞争猛烈,但我们仍然看到两国在AI研究领域中大量的互助。

在已往的一年内,两国共有10篇互助的论文使用了Fashion-MNIST数据集,高于任何其他两国之间的互助。其次是英国和德国,共互助了4篇论文。

完整的国家地域互助列表可以在Google表格里看到。把政治偏见放在一旁,我很是愿意看到更多的国家与国家之间在AI领域的互助。

这也是Fashion-MNIST的使命之一:增加整个社区的凝聚力和多元化。特别是今天,当AI技术已经越出象牙塔,国与国之间的交流互助变得极为重要。

顶级集会青睐Fashion-MNIST固然,论文不是靠数量而是靠质量取胜的。那么这些论文都是在那里揭晓的呢?他们的质量又如何呢?下图给出了根据集会和期刊的统计表。我只统计了已往一年中已经确定被正式录取的论文,而那些正在审核状态的论文并没有在这个图表中展示。

完整的列表可以在Google表格里检察。大部门的论文都是在2018年涌现出来的,尤其是在诸如NIPS, ICLR, ICML等顶会。在NIPS 2018中,一共有17篇任命的论文使用了Fashion-MNIST数据集。

而2017年这个数字是:零。不外这显而易见,因为在NIPS2017年的5月份的投稿停止时,Fashion-MNIST还没有降生。而在稍后一点的11月戒指的NIPS 2017 Workshop中,我们已经可以看到研究者在论文中使用了这个数据集。

除了在集会上揭晓,也有许多结业论文和顶级期刊中引用到了Fashion-MNIST,其中知名的期刊包罗:Journal of Machine Learning Research (2篇),Neurocomputing(2篇),Nature Communications (1篇), 和Science (1篇)。Fashion-MNIST 在「科学」杂志中被引用这其中最让我自满的一篇论文引用,揭晓在Science科学杂志上。在这篇题为”All-optical machine learning using diffractive deep neural networks”的Science论文中,一个来自加州大学洛杉矶分校的团队制作了一个全光学的深度”神经”网络,而且用3D打印机打印了出来。论文地址:http://innovate.ee.ucla.edu/wp-content/uploads/2018/07/2018-optical-ml-neural-network.pdf这个光学深度神经网络功效上没什么差别,它能对MNIST/Fashion-MNIST的图像举行分类,只不外它的分类速度是——光速!下图展示了MNIST和Fashion-MNIST模型上5个差别的物理层。

开云app官网入口

这些层可以被3D打印出来,而层上面的每个点都有着差别的功效:或是允许光子通过,或是直接把光子反射回去,这就好比神经元之间的毗连。在下图右侧,就是一个打印出的3D打印的全光学神经网络。在实际分类时,这个3D打印的网络被放在如下的仪器中。

通过判断在最后一层上光学信号最强的区域来获得分类效果。GAN研究者青睐Fashion-MNIST生成反抗网络(GAN)近几年一直是深度学习领域的研究重点,尤其是在图像生成、图像处置惩罚等应用领域,GAN经常能取得惊人的效果。也不难明白为什么GAN的研究员喜欢Fashion-MNIST这个数据集:它比力轻量;不需要重新写data-loader;却比MNIST包罗更庞大的和多元的局部模式信息。对于图像GAN的研究者来说,在打造一个新的算法时,第一个测试就是在MNIST和Fashion-MNIST上举行测试。

下图展示了247篇论文根据关键词分类效果。许多论文作者没有提供关键词,对于这些论文,我在读过Abstract和Related Work后,为这些论文手工总结了一些关键词。为了更清晰的展示效果,论文数量小于5的关键词没有在这里展示,但大家仍然可以在Google表格里检察全部关键词的统计列表。新的机械学习算法也喜欢使用Fashion-MNIST来做评测,例如胶囊网络(Capsule Networks)。

胶囊网络自从揭晓以来就收到许多的讨论:有不少人质疑胶囊网络从设计上是否为MNIST做了特此外优化,而这种结构是否在其他数据集上仍然有效。不说大的ImageNet数据集,胶囊网络是否在Fashion-MNIST上仍然有效呢?在已往的一年里,有9篇新的胶囊网络的论文实验中使用了Fashion-MNIST数据集。

他们设计了更稳定的路由算法以确保空间特征能够保留住。Fashion-MNIST对社区的孝敬在我公布Fashion-MNIST几周后,我受邀到亚马逊柏林办公室做了一个演讲。在问答环节,我被一个研究员问道,是否担忧Fashion-MNIST成为那些懒惰的研究员逃避现实问题的一个捏词。究竟,他们现在可以说自己的算法有了份”双保险”(在两个MNIST上验证过了)。

演讲PPT:https://www.slideshare.net/HanXiao4/fashionmnist-a-novel-image-dataset-for-benchmarking-machine-learning-algorithms这个社区从来没有让我失望,这些高质量的论文已经很好的证明晰自己。而除了学术圈的论文,这个社区还找到了Fashion-MNIST另一个重要用途:教学。

在网上你可以找到数以千计的讨论、代码和教程,尤其是在机械学习入门的第一讲。Fashion-MNIST增加了整个社区的多元化:它吸引了许多年轻的AI(特别是女性)喜好者、学生甚至是艺术家和设计师。他们在Twitter上表现,第一眼看到这个数据集都市以为很是可爱,因此很想动手实践。

在2018年9月,Google在中国举行的开发者大会上,来自Google的演讲者使用Fashion-MNIST作为例子向在场的数百名参会者普及Keras深度学习库和机械学习技术。而就在前几天,2018年10月,Google Colab公布的TPU示例中,也使用了Fashion-MNIST作为演示的例子来展现TPU的超强算力。

TPU示例地址:https://colab.research.google.com/github/tensorflow/tpu/blob/master/tools/colab/fashion_mnist.ipynb总结人工智能的进步需要来自整个社区的配合努力。我很欣慰的看到在已往的一年里,Fashion-MNIST为这个社区做出了自己的孝敬:它不仅吸引了多元化配景的喜好者,也促进研究人员设计更严密更具说服力的实验。所以无论你是研究员、学生、教授还是喜好者,无论你是想把Fashion-MNIST用在讲座、论文、研讨会、竞赛还是培训中,只要你喜欢,都可以去做。

最重要的是享受技术带来的兴趣,让更多的人体验到机械学习和人工智能的魅力。— 完 —诚挚招聘量子位正在招募编辑/记者,事情所在在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位民众号(QbitAI)对话界面,回复“招聘”两个字。量子位 QbitAI · 头条号签约作者վ'ᴗ' ի 追踪AI技术和产物新动态。


本文关键词:Fashion-MNIST,周年,回首,280,多篇,论文,引用,Google,开云app官网入口

本文来源:开云app官网入口-www.mx-lj.com