【IT168 评论】去年,微软的“How Old Are You”着实在朋友圈火了一把,这种看图猜年龄的游戏让大家玩性大发。今年数博会蚂蚁金服站台上炫酷的生物识别技术黑科技刷脸刷出了新境界。6月1号,以“创享未来”为主题,“微软爱”贯穿整场的微软开发者峰会上,微软亚太研发集团云计算与企业事业部首席产品经理李京梅以“微软认知服务”为主题分享了微软在人工智能领域的技术发展。

如今的机器学习、人工智能已经不再是神秘的黑科技了。李京梅表示,微软希望把智能服务带入到应用里,让想法变为现实。认知服务是一系列的API接口,微软以“希望我们的认知服务做你的最强大脑”为目标,将语言理解智能服务,必应搜索引擎后面的功能,包括普通网页的搜索以及一些垂直方面比如新闻、视频的搜索,都以API的形式开放给大家。
微软人工智能技术进展
1、提取图像基本特征。3月30日在美国旧金山举办的微软全球开发者大会上,微软增加了图像物体识别和打标签的功能。目前可以识别2000多种物体,识图API看到一种物体就会标注一种物体,而且这2000种物体的种类会逐渐增加。曾经的“how old are you”可以提取图片的一些基本特征判断人物年龄。现在的图片识别已经可以判断出年龄、性别、图片类型等。可以给出图片的大致主题,比如这是一个人在游泳。所有的标注都会通过确信值来体现可靠度。
2、识别名人。这属于分析图像垂直的一些特定领域,比如现在可以识别的名人跨全球商界、体育界、文娱界。大概有小几十万的人脸库。以后肯定会不断增加并且拓展到其他领域,比如识狗、识花等等方面。
3、识别图片里的文字。无论是中文还是英文,均可以实现自动抓取。明确语种的前提下,可自行设置语言参数,提升性能。识别的文字也会被打上坐标值,目前支持多语言识别。

4、智能缩略。微软API可以智能识别出图片主题。当对图片进行裁剪等操作时,不管切到什么形状,多小,都会尽量保留原来的主题,这是一个非常实用的小功能。视频缩略可以利用算法默认把一段视频压缩成一段很有趣的预览视频。可以大致看出视频里都有什么人出现,都在干什么等。
5、人脸识别。目前一张图片可以识别64张脸。也可以验证两个人是不是同一个人,可以对一张图片里的不同人进行自动分组,这是建立在提前为每个人建库的基础上。

6、情绪识别。目前可以识别包括生气、厌恶、伤心、难过、惊讶、害怕等八种情绪。视频人脸情绪识别,可以记录每一个情绪对返回值进行一个整体的统计。比如整个视频里微笑有多少帧,伤心、难过、惊讶等分别有多少帧。每一个表情都会打一个分值,但到底如何使用,最后的决定权还在用户手里。
最后,李京梅表示当语音识别和语言理解智能服务一起应用的时候,微软还可以对语意进行识别,就是让应用可以听懂人的指令。今天认知服务已经在Azure.com上,如果有账号可以去看,21个API里面已经有8个付费计划了。但所有API都可以免费试用。打造属于自己的智能应用,微软希望分享你的应用。
想了解微软开发者峰会更多精彩瞬间,请戳http://live.it168.com/446.html