百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

如何利用Python批量读取视频文件的时间长度?

bigegpt 2024-10-08 00:48 5 浏览

本期的主题是利用Python来实现对视频文件时间长度的读取。

在学习编程语言时,相比较于通过书本来学习知识,我更喜欢通过观看学习视频的方式来进行学习,通过主讲老师的讲解,我能很直观且快速的了解一些知识点,但是这种方式有一点让我感到无趣,因为看视频学习往往需要花费很长的时间,而且看视频过程中大多数时候都是比较枯燥的。由于平时我有另外的工作要做,我需要计划着时间来学习完这些知识点。在刚开始时,我会用很原始的方式将每一集的视频长度记录下来,接着将这一部分知识点所有的视频时间求和,然后根据我的空闲时间来决定需要多久看完这视频。

学习过一段时间后,我通过代码实现了自动读取视频时间的功能

NO.1 开始进入正题

软件:PyCharm Community 2019.1

解释器版本:Python 3.8

第三方库:et_xmlfile-1.01、jdcal-1.2、openpyxl-2.6.2、ffmpeg-e6625ca-20191004-win64-static

第三方库安装过程中并不顺利,后来我直接对这些安装包进行了解压,将“et_xmlfile”、"openpyxl"、"jdcal.py"和“ffmpeg-e6625ca-20191004-win64-static”文件放置在Lib目录下的site-packeges中。


在写代码前需要先导入一些库,以便对文件目录和数据进行存储

import os
import subprocess
import?json??
from?openpyxl?
import?load_workbook,?Workbook

程序的实现思路我将其分为两块:1、读取视频文件目录下的文件名;2、读取视频文件的时间长度。

首先建立一个ReadVideoTime类并设置一些初始化参数:

def __init__(self, abspath, destfile):        
			self.abspath = abspath
			self.destfile = destfile

NO.2 读取视频文件目录下的文件名

实现思路如下:

1、找到所在视频文件目录的地址;

2、读取该目录下的视频文件名;

3、调用Workbook模块建立excel工作表及工作表的存储路径;

def?getvideolist(self):
			address_list = os.path.dirname(os.path.abspath(self.abspath)) + '\\' + self.destfile
			list_filename = os.listdir(address_list) 
			wb = Workbook()        
			path = os.path.dirname(address_list) + '\\'       
			prefix = 'data'        
			surfix = '.xlsx'        
			newfile = prefix + surfix        
			excel_path = path + newfile        
			wb.save(excel_path)       
			return list_filename, excel_path, address_list

NO.3 读取视频文件的时间长度

实现思路如下:

1、获取getvideolist()函数返回的视频文件名、data.xlsx的存储路径、视频文件夹目录地址;

2、调用load_workbook()开开data.xlsx用于将读取的数据存储在工作表中;

3、将表格的表头依次设定为“序号”、“文件名”及“视频时间长度(s)”;

4、读取列表的最大行和列数量,并将除表头以外的单元格值初始化为空;

5、调用windows cmd 运行ffprobe.exe 并用subprocess.Popen

新建一个子进程,将读取到的指定视频的数据转换为json字段;

6、对获取的json字段数据进行逐行读取并转码成字符串;

7、按照表头的设定规则,通过for循环逐个给单元赋值;

def?write_duration_time(self): 
			list_filename, excel_path, address_list = self.getvideolist()        
			wb = load_workbook(excel_path)        
			sht = wb.worksheets[0]        
			sht["A1"] = "序号"        
			sht["B1"] = "文件名"        
			sht["C1"] = "视频时间长度(s)"                
			max_row = sht.max_row????????
			max_col?=?sht.max_column        
			if max_row > 1 and max_col > 0:            
      			for row in sht.iter_rows(min_row=2, min_col=1, max_col=max_col, max_row=max_row):                
            			for cell in row:                    
                  			cell.value = " "???????

			for?index,?filename?in?enumerate(list_filename):            
      			pname = 'E:\\Python批量读取视频时间\\venv\\Lib\\site-packages\\ffmpeg-20191004-e6625ca-win64-static\\bin\\ffprobe.exe -v quiet -print_format json -show_format "%s"' % (address_list + '\\' + filename)           
						# 输出视频文件文件名????????????
     				print((self.abspath?+?'\\'?+?filename))            
						result = subprocess.Popen(pname, shell=True, stdout=subprocess.PIPE).stdout           
						# 逐行读取result内的结果            
      			list_std = result.readlines()            
						str_tmp = ''            
						for item in list_std:                
     				# 将list_std 中的数据转码                
      						str_tmp += bytes.decode(item.strip())            
            json_data = json.loads(str_tmp)            
            dura_time = json_data['format']['duration']????????????
            print('dura_time:', dura_time)            
            #逐行给单元格赋值            
            sht.cell(row=index + 2, column=1, value=index+1)           
            sht.cell(row=index + 2, column=2, value=filename)            
            sht.cell(row=index + 2, column=3, value=dura_time)        
			# 保存工作目录        
      wb.save(excel_path)        
			print("视频时间长度数据获取成功!")
'*** -v quiet -print_format json -show_format "%s"' %(***)

各位读者朋友这一行代码十分有用,可以方便的通过cmd执行程序并将输出的数据转换成想要的类型。


利用Python批量读取视频文件的时间长度的代码就这么实现了,Let‘s go,现在检验下实现的效果吧!

打开想要获取视频文件时间长度的文件目录:

在执行程序时需要按照如下的方式进行文件进的输入:

请输入视频文件路径:E:\\Python中级教程\\视频-Python深入浅出\\day2视频
请输入视频文件夹:day2视频

执行程序后的效果如下:

执行完程序后会在excel_pathd对应的路径下生成一个'data.xlsx'文件。

打开文件后就可以看到视频文件名及对应的视频长度。

- END -

相关推荐

pyproject.toml到底是什么东西?(py trim)

最近,在Twitter上有一个Python项目的维护者,他的项目因为构建失败而出现了一些bug(这个特别的项目不提供wheel,只提供sdist)。最终,发现这个bug是由于这个项目使用了一个pypr...

BDP服务平台SDK for Python3发布(bdp数据平台)

下载地址https://github.com/imysm/opends-sdk-python3.git说明最近在开发和bdp平台有关的项目,用到了bdp的python的sdk,但是官方是基于p...

Python-for-Android (p4a):(python-for-android p4a windows)

一、Python-for-Android(p4a)简介Python-for-Android(p4a),一个强大的开发工具,能够将你的Python应用程序打包成可在Android设备上运行...

Qt for Python—Qt Designer 概览

前言本系列第三篇文章(QtforPython学习笔记—应用程序初探)、第四篇文章(QtforPython学习笔记—应用程序再探)中均是使用纯代码方式来开发PySide6GUI应用程序...

Python:判断质数(jmu-python-判断质数)

#Python:判断质数defisPrime(n):foriinrange(2,n):ifn%i==0:return0re...

为什么那么多人讨厌Python(为什么python这么难)

Python那么棒,为什么那么多人讨厌它呢?我整理了一下,主要有这些原因:用缩进替代大括号许多人抱怨Python完全依赖于缩进来创建代码块,代码多一点就很难看到函数在哪里结束,那么你就需要把一个函数拆...

一文了解 Python 中带有 else 的循环语句 for-else/while-else

在本文中,我们将向您介绍如何在python中使用带有else的for/while循环语句。可能许多人对循环和else一起使用感到困惑,因为在if-else选择结构中else正常...

python的numpy向量化语句为什么会比for快?

我们先来看看,python之类语言的for循环,和其它语言相比,额外付出了什么。我们知道,python是解释执行的。举例来说,执行x=1234+5678,对编译型语言,是从内存读入两个shor...

开眼界!Python遍历文件可以这样做

来源:【公众号】Python技术Python对于文件夹或者文件的遍历一般有两种操作方法,一种是至二级利用其封装好的walk方法操作:import osfor root,d...

告别简单format()!Python Formatter类让你的代码更专业

Python中Formatter类是string模块中的一个重要类,它实现了Python字符串格式化的底层机制,允许开发者创建自定义的格式化行为。通过深入理解Formatter类的工作原理和使用方法,...

python学习——038如何将for循环改写成列表推导式

在Python里,列表推导式是一种能够简洁生成列表的表达式,可用于替换普通的for循环。下面是列表推导式的基本语法和常见应用场景。基本语法result=[]foriteminite...

详谈for循环和while循环的区别(for循环语句与while循环语句有什么区别)

初九,潜龙勿用在刚开始使用python循环语句时,经常会遇到for循环和while循环的混用,不清楚该如何选择;今天就对这2个循环语句做深入的分析,让大家更好地了解这2个循环语句以方便后续学习的加深。...

Python编程基础:循环结构for和while

Python中的循环结构包括两个,一是遍历循环(for循环),一是条件循环(while循环)。遍历循环遍历循环(for循环)会挨个访问序列或可迭代对象的元素,并执行里面的代码块。foriinra...

学习编程第154天 python编程 for循环输出菱形图

今天学习的是刘金玉老师零基础Python教程第38期,主要内容是python编程for循环输出菱形※。(一)利用for循环输出菱形形状的*号图形1.思路:将菱形分解为上下两个部分三角形图案,分别利用...

python 10个堪称完美的for循环实践

在Python中,for循环的高效使用能显著提升代码性能和可读性。以下是10个堪称完美的for循环实践,涵盖数据处理、算法优化和Pythonic编程风格:1.遍历列表同时获取索引(enumerate...