技术开发 频道

真慈善?谷歌开源移动端视觉识别模型MobileNet

  【IT168 编译】谷歌在开源这条路上似乎走的越来越远、越来越深入,提到谷歌,相信大部分人都会竖一个大拇指。MobileNets是谷歌研发的移动端视觉识别模型,是通过预先训练来识别对象的一小组神经网络模型。从理论上来讲,这个软件应该是非常有价值的,但是谷歌现在却将它免费开源出来呢。

  神经网络一旦被训练,那么接下来要做的事情就变得非常简单了,你只需要将每个输入乘以第一层的权重,然后将输出作为输入重复这个过程,直至到达最后一层,得出最终结果。虽然这听起来这个非常简单的事情,似乎最弱的处理器都可以计算出模型,但是实际情况却不是这样的,神经网络使用的真正进步就在于我们可以训练多大的网络,所以网络的巨大规模是我们必须要考虑的问题。现代神经网络拥有数百万的权重,所以要计算出经过训练的网络输出,必须要一个非常强大的处理器。

  MobileNet网络架构是一系列在TensorFlow上高效、小尺寸的视觉模型,它允许用户在移动设备上计算神经网络。目前大多数移动AI应用程序都是通过将图像或语音片段上传到云之后,使用强大的处理器来处理实现模型。相信移动设备计算力的日益增长,之后无论何时何地,联网与否,AI技术都可以加载到移动设备中。

  几乎所有型号的移动设备都已经在ILSVRC-2012-CLS图像数据集上接受过培训,因此它们不仅能够识别各种物体,甚至还可以围绕对象设置边框。

谷歌开源移动端视觉识别模型MobileNet

  MobileNet基本模块:

谷歌开源移动端视觉识别模型MobileNet

  ImageNet-2012验证集的准确性

谷歌开源移动端视觉识别模型MobileNet

  MobileNet的性能众所周知,但是对于准确性性较低的网络或者是只需偶尔检测的应用程序,MobileNet的准确性如何?下表,就为您提供了详细的性能参数:

谷歌开源移动端视觉识别模型MobileNet

  GitHub上也有和MobileNet众多相关的项目,例如zehaos分享的通过TensorFlow构建Mobile。2017年4月17日,提交的MobileNet项目在众多应用的用例中展示了其有效性,如对象检测、细粒度分析、面部属性以及大规模地理定位,从网友的测试来看,MobileNet的效果还是值得肯定的。

  MobileNet虽然极有价值,但是这里还有一个问题值得我们思考,那就是为什么谷歌要开源这样一个有价值的软件?当MobileNet真正成长为一个杀手级软件,谷歌的慈善事业还会继续下去吗?从众多的GitHub项目和响应不凡的网友热情中,我们是不是可以窥见一些原因呢?

0
相关文章