人工智能再突破 谷歌开源三款图像分割软件
2016/8/26 11:15:00   afzhan.com

  2015年,facebook开发了一款借助语音来询问有关facebook上图片的问题系统应用,这套系统名为visualq&a,它展示了这家社交网络巨头如何使用深度人工智能技术来将已有的数据转化为可以让用户利用和接收的信息。这套建立在facebook使用人工智能来回答有关文本信息问题能力之上的系统,充分融合融入类似的深度学习人工智能技术。

  近日,facebook再次在人工智能方面实现土坯,开源了三款人工智能图像分割(imagesegmentation)软件,分别是deepmask、sharpmask和multipathnet,三款工具相互配合完成一个完整的图像识别分割处理流程,deepmask生成初始对象mask、sharpmask优化这些mask,最后由multipathnet来识别这些mask框定的物体。sharpmask目前已遵循bsd授权协议在github上公开源码。

  facebook的人工智能研究实验室(fair)此前曾在多篇学术论文中讨论过以上开源的图像分割技术。图像分割技术不仅能够识别图片和视频中的人物、地点、物体,甚至能够判断它们在图像中的具体位置(精确到像素级别),为了做到这一点,facebook使用了一种人工智能技术——机器学习,也就是用大量的数据来训练人工神经网络,不断提高其对新数据的处理判断准确性。

  facebook一直是开源人工智能技术的积极推动者,在开源三款图像分割软件工具之前,facebook还曾在torch上开源了一些功能强大的深度学习工具。

  深度学习是科技巨头竞争激烈的技术阵地,包括苹果、百度、谷歌和微软都投入重金,并在coco这样的图像识别竞技场上展开激烈角逐。

  据facbook介绍,图像分割技术对于改进社交软件来说意义重大,例如计算机能够自动识别图片中的物体,这能极大提高图片搜索的准确率和效率,即使这些图片没有添加人工标签。对于视力障碍的用户来说,计算机甚至能给他们念出图片中的内容。

  facebook人工智能实验室的科学家piotrdollár在博客中指出:图像识别技术的下一个挑战是视频识别,这方面facebook的计算视觉技术已经取得一些进展,能够在查看视频的同时理解并区分视频中的物体,例如猫或食物。对视频中物体的实时区分功能将大大提高facebook视频直播内容的推荐准确性,而且随着技术水平的提升,未来机器将能根据场景、物体和动作的时空变化给出实时的描述。

相关新闻: