玩转谷歌物体识别API,用TensorFlow和OpenCV打造实时识别应用
bigegpt 2024-09-25 14:29 3 浏览
新智元编译
TensorFlow’s (TF) 的 Object Detection API 刚刚开源,就有人利用它做出了对象识别的应用。评论的口径很一致:这么快就部署出来了,太牛了!让我们看看他是如何操作的。有请 Pivotal Labs 的 Dat Tran:
本文将告诉大家如何使用 TensorFlow 新的 Object Detection API 和OpenCV(Python3.5)来开发你自己的实时对象识别的app,着重介绍了其中的难点。
我在使用这个 app 随机识别桌子上的东西:)
谷歌刚刚发布了新的 TensorFlow 对象识别(Object Detection)API。第一版发布包括:
一些预训练模型(特别是一些可以运行在移动终端的轻量模型)
配有一个模型的 Jupyter notebook 示例
一些可用于模型再训练的很方便的脚本,比如,在你自己的数据集上。
首先,我们看一下 TensorFlow 的 models repo,再看看他们发布的 notebook。
它基本上用预训练模型把对象识别从头到尾走了一遍。在示例中,他们用了“ SSD with Mobilenet”模型,不过你也可以在他们称为“TensorFlow detection model zoo”的地方下载其他预训练模型。顺便说一句,这些模型在 COCO 数据集上训练,随不同的模型速度(慢、中、快)和模型性能(mAP-平均精度)而不同。
接着我照示例跑了一下。示例已经写得很清楚了,它无非是做了以下几件事:
1.导入TensorFlow 、PIL 这样的package;
2.定义一些变量,比如级数、模型名称等等;
3.下载冻结模型(.pb-protobuf),load 到 memory;
4.load一些辅助代码,比如标签翻译索引;
5.对两张测试图像的识别代码。
注意:跑示例之前,留意一下 setup note。需要特别注意 protobuf compilation:
# Fromtensorflow/models/
protocobject_detection/protos/*.proto --python_out=.
不运行这个命令,示例就无效。
接着我相应调整了他们的代码:
删掉了模型下载的部分
PIL 也用不着了,因为 OpenCV 里的视频流已经是 numpy array 了(PIL 很占资源)
不保留 TensorFLow session 的 with 语句,同样是因为太占资源,尤其是每个视频流之后 session 需要启动的时候。
然后,我将 OpenCV 连接到了我自己的网络摄像头。有很多关于这一步的示例,官方文件里也有。这里我就不详述了。最有趣的部分是我为了提升 app 性能做的优化。对我来说,就是对 fps(每秒帧数)的追求。
总的来说,OpenCV 上很多文件的直接应用效果并不是很好,例如,OpenCV 的很多功能都是 I/O 受限的。因此,我不得不想出几种方法来解决这个问题:
从网络摄像头读取帧会引发大量输入输出。我最初的想法是把这部分直接移植到另外一个Python multiprocessing 中,但这个方法并不奏效。Stackoverflow 上对这个问题有所解释,不过我还没有深究过。幸运的是,我从 Adrian Rosebrock 的网站 pyimagesearch 上找到了一个非常好的方法,即利用 threading,大大提高了fps。如果你想了解 multiprocessing 和 threading 的区别,Stackoverflow 上有非常好的回答。
每次应用程序开始时,下载固化好的模型都需要耗费大量内存。我已经在每次运行中都使用了一个 TF session,但速度仍然非常慢。我是如何解决这个问题的呢?方法非常简单。我使用 multiprocessing library 把目标检测部分的庞大工作量移到多个进程中。应用之初速度还会有些慢,因为每个进程都需要下载模型到内存并启动一个TF session,但之后,多进程同时工作的效率就显现出来了。
Demo地址:https://asciinema.org/a/125852
减小视频流中帧的宽度和高度也能大量提升 fps。
注意:如果你和我一样,用的是 Mac OSX 和 OpenCV 3.1,OpenCV 的 VideoCapture 过一段时间就会 crash 一次。可以试着用回到 OpenCV 3.0。
赶快自己去试试吧,上手确实不难。接下来我想做的是用这个 API 训练我自己的数据集,还想把预训练的模型用在我设想的其他 app 上。fps rate 还不够优化。OpenCV 里还有不少瓶颈,目前我没有什么好办法,但有一些替代方案,比如用 WebRTC,可惜它是 web-based。另外,我也希望使用称为 async 的 asynchronous 方法来提升我的 fps rate。敬请期待吧!
原文地址:https://medium.com/towards-data-science/building-a-real-time-object-recognition-app-with-tensorflow-and-opencv-b7a2b4ebdc32
点击阅读原文查看新智元招聘信息
相关推荐
- C#.NET Autofac 详解(c# autoit)
-
简介Autofac是一个成熟的、功能丰富的.NET依赖注入(DI)容器。相比于内置容器,它额外提供:模块化注册、装饰器(Decorator)、拦截器(Interceptor)、强o的属性/方法注...
- webapi 全流程(webapi怎么部署)
-
C#中的WebAPIMinimalApi没有控制器,普通api有控制器,MinimalApi是直达型,精简了很多中间代码,广泛适用于微服务架构MinimalApi一切都在组控制台应用程序类【Progr...
- .NET外挂系列:3. 了解 harmony 中灵活的纯手工注入方式
-
一:背景1.讲故事上一篇我们讲到了注解特性,harmony在内部提供了20个HarmonyPatch重载方法尽可能的让大家满足业务开发,那时候我也说了,特性虽然简单粗暴,但只能解决95%...
- C# 使用SemanticKernel调用本地大模型deepseek
-
一、先使用ollama部署好deepseek大模型。具体部署请看前面的头条使用ollama进行本地化部署deepseek大模型二、创建一个空的控制台dotnetnewconsole//添加依赖...
- C#.NET 中间件详解(.net core中间件use和run)
-
简介中间件(Middleware)是ASP.NETCore的核心组件,用于处理HTTP请求和响应的管道机制。它是基于管道模型的轻量级、模块化设计,允许开发者在请求处理过程中插入自定义逻辑。...
- IoC 自动注入:让依赖注册不再重复劳动
-
在ASP.NETCore中,IoC(控制反转)功能通过依赖注入(DI)实现。ASP.NETCore有一个内置的依赖注入容器,可以自动完成依赖注入。我们可以结合反射、特性或程序集扫描来实现自动...
- C#.NET 依赖注入详解(c#依赖注入的三种方式)
-
简介在C#.NET中,依赖注入(DependencyInjection,简称DI)是一种设计模式,用于实现控制反转(InversionofControl,IoC),以降低代码耦合、提高可...
- C#从零开始实现一个特性的自动注入功能
-
在现代软件开发中,依赖注入(DependencyInjection,DI)是实现松耦合、模块化和可测试代码的一个重要实践。C#提供了优秀的DI容器,如ASP.NETCore中自带的Micr...
- C#.NET 仓储模式详解(c#仓库货物管理系统)
-
简介仓储模式(RepositoryPattern)是一种数据访问抽象模式,它在领域模型和数据访问层之间创建了一个隔离层,使得领域模型无需直接与数据访问逻辑交互。仓储模式的核心思想是将数据访问逻辑封装...
- C#.NET 泛型详解(c# 泛型 滥用)
-
简介泛型(Generics)是指在类型或方法定义时使用类型参数,以实现类型安全、可重用和高性能的数据结构与算法为什么需要泛型类型安全防止“装箱/拆箱”带来的性能损耗,并在编译时检测类型错误。可重用同一...
- 数据分析-相关性分析(相关性 分析)
-
相关性分析是一种统计方法,用于衡量两个或多个变量之间的关系强度和方向。它通过计算相关系数来量化变量间的线性关系,从而帮助理解变量之间的相互影响。相关性分析常用于数据探索和假设检验,是数据分析和统计建模...
- geom_smooth()函数-R语言ggplot2快速入门18
-
在每节,先运行以下这几行程序。library(ggplot2)library(ggpubr)library(ggtext)#用于个性化图表library(dplyr)#用于数据处理p...
- 规范申报易错要素解析(规范申报易错要素解析)
-
为什么要规范申报?规范申报是以满足海关监管、征税、统计等工作为目的,纳税义务人及其代理人依法向海关如实申报的行为,也是海关审接单环节依法监管的重要工作。企业申报的内容须符合《中华人民共和国海关进出口货...
- 「Eurora」海关编码归类 全球海关编码查询 关务服务
-
海关编码是什么? 海关编码即HS编码,为编码协调制度的简称。 其全称为《商品名称及编码协调制度的国际公约》(InternationalConventionforHarmonizedCo...
- 9月1日起,河南省税务部门对豆制品加工业试行新政7类豆制品均适用投入产出法
-
全媒体记者杨晓川报道9月2日,记者从税务部门获悉,为减轻纳税人税收负担,完善农产品增值税进项税额抵扣机制,根据相关规定,结合我省实际情况,经广泛调查研究和征求意见,从9月1日起,我省税务部门对豆制品...
- 一周热门
- 最近发表
- 标签列表
-
- mybatiscollection (79)
- mqtt服务器 (88)
- keyerror (78)
- c#map (65)
- xftp6 (83)
- bt搜索 (75)
- c#var (76)
- xcode-select (66)
- mysql授权 (74)
- 下载测试 (70)
- linuxlink (65)
- pythonwget (67)
- androidinclude (65)
- libcrypto.so (74)
- linux安装minio (74)
- ubuntuunzip (67)
- vscode使用技巧 (83)
- secure-file-priv (67)
- vue阻止冒泡 (67)
- jquery跨域 (68)
- php写入文件 (73)
- kafkatools (66)
- mysql导出数据库 (66)
- jquery鼠标移入移出 (71)
- 取小数点后两位的函数 (73)