十分钟,我搞定了一个人物检测模型

AI资讯1年前 (2023)发布 AI工具箱
377 0 0

原作:Supervise.ly

铜灵 编译自 Hackernoon

量子位 出品 | 公众号 QbitAI

人物检测确实是个老生常谈的话题了,自动驾驶中的道路行人检测、无人零售中的行为检测、时尚界的虚拟穿搭、安防界的人员监控、手机应用中的人脸检测……人物检测不易察觉,但已经渗透到生活中的方方面面。

作为计算机视觉领域的基础研究,很多初学者表示这件事耗时耗力很难搞定。在这篇文章中,机器学习平台supervise.ly提供了一种方法,据说十分钟搞定不是梦。

量子位将文章重点内容翻译整理如下,与大家分享:

人物检测在现在有多难?

五年之前,大家普遍在哈尔特征(Haar-like features)的基础上,基于级联分类器用OpenCV解决问题。这往往需要用大量的时间和精力构建模型,依照如今的标准来看,检测质量也不是很好。

要知道,深度学习时代来了,小小的人物检测任务也有了突破,将特征工程和简单的分类器结合已经过时,神经网络开始主导这个领域。

在这篇文章中,我们将用Supervise.ly平台处理人物检测任务,带你用5分钟做出初始方案。这个自称不用写代码、提供众多与训练模型、也无需在各种开发工具中跳来跳去的平台,对新手绝对友好。

基本方法

想要处理这个任务有两种方法:一是直接使用预训练模型,二是训练自己的人物检测模型。在Supervise.ly里这两种方法都可以,但我们重点来看预训练模型版。

我们将用基于Faster R-CNN的NASNet模型处理,此模型已经用COCO数据集预训练过了。

TensorFlow detection model zoo地址:

https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/detection_model_zoo.md

Get主要方法后,打开Supervise.ly,我们开始进入正式构建步骤了。

Step 1:设置人物检测模型

设置检测模型很简单,只需将你的GPU连接到Supervise.ly,然后选择其中一个预训练模型即可。

进入Cluster页面,点击“Connect your first node”。

你将能看到下面这个窗口,将指令复制到你的电脑里,Python Agent软件将自动在你的电脑里完成安装。

点击“Neural networks”进入“Model Zoo”页面后,你能看到一系列为语义分割和物体检测创建的预训练模型。将鼠标放到“FasterRCNN NasNet”那里,选择增加一个新模型,你将看到这个预训练模型出现在了“我的模型”列表中。

Step 2:检测人物,判断质量

在你将模型部署为API之前,想弄清楚它是否符合要求可以先将神经网络预测可视化:将图片拖拽到的相关区域,运行推理过程。

在这个案例中,我们将项目命名为“text_images”,随后点击开始“start import”,用创建的图片检查项目。

随后,我们用这张图片测试人物检测模型的效果如何。在我的模型页面点击“Test”按钮,选择上面已经命名的“testimages”项目,将要存储检测结果的项目命名为“inf_test_images”。

现在,在“inference_full_image”列表中选择推理模式,将“save_classes”: “__all”替换成“save_classes”: [“person”]。

然后进入推理过程,模型看起来还算符合要求,我们进入下一步。

Step 3:将模型部署到应用

部署主要遵循通过调用API在自定义环境中使用模型的基本准则,部署前,需要先前往我的模型页面中创建新任务,将API请求发送到人物检测模型中。

随后,我们需要混获取token和URL信息。在“Cluster->Tasks”页面点击Deploy API info,就可以通过调用API满足检测模型所需的信息了。

运行以下命令:

可视化之后,我们发现输入的图片,已经得到了一张人物检测结果:

模型不仅识别出“深度学习三巨头”和吴恩达老师,连远处不仔细看绝对发现不了的人像也被检测到了。

最后,附原文链接,想要了解更多的同学可自取:

https://hackernoon.com/can-you-solve-a-person-detection-task-in-10-minutes-74fba061194c?source=rss——3a8144eabfe3—-4

© 版权声明

相关文章

暂无评论

暂无评论...