python从入门到实践,文件读写与Excel操作
bigegpt 2024-11-07 09:24 5 浏览
文件读写操作通过open()函数进行操作,使用with关键字读写文件就不用再惦记着要何时关闭文件。
先来看一个简单常规的文件读写操作;
f = open('test.txt', mode='w+', encoding='utf-8')
f.write(','.join([t for t in range(1000)]))
f.close()
f = open('test.txt', mode='r', encoding='utf-8')
print(f.read())
f.close()
再看一个省心的文件读写操作
def write_csv_file(file_path, data, data_type="list"):
"""爬虫输入写入Excel文件"""
head = ["标题", "小区", "房厅", "面积", "朝向", "楼层", "年份",
"位置", "总价(万)", "单价(元/平方米)"]
keys = ["title", "house", "bedroom", "area", "direction",
"floor", "year", "location", "total_price", "unit_price"]
try:
with open(file_path, 'w', newline='', encoding='utf_8_sig') as csv_file:
writer = csv.writer(csv_file, dialect='excel')
if head is not None:
writer.writerow(head)
if data_type == "list":
for item in data:
row_data = []
for k in keys:
row_data.append(item[k])
writer.writerow(row_data)
else:
# 如果队列不为空,写入每行数据
while not data.empty():
item = data.get()
if item:
row_data = []
for k in keys:
row_data.append(item[k])
writer.writerow(row_data)
print("Write a CSV file to path %s Successful." % file_path)
except Exception as e:
print("Fail to write CSV to path: %s, Case: %s" % (file_path, e))
def read_file():
with open("home.csv", mode='r', encoding='utf-8') as f:
for i in f.readlines():
print(i)
Excel操作
Excel文件操作常用的库有xlrd,xlwt, openpyxl, xlswriter已经pandas等;
- pandas:数据处理最常用的分析库之一,可以读取各种各样格式的数据文件,一般输出dataframe格式,功能强大;
- openpyxl:主要针对xlsx格式的excel进行读取和编辑;
- xlrd库:从excel中读取数据,支持xls;
- xlwt库:对excel进行修改操作,不支持对xlsx格式的修改;
- xlutils库:在xlwt和xlrd中,对一个已存在的文件进行修改
- xlwings:对xlsx、xls、xlsm格式文件进行读写、格式修改等操作
- xlsxwriter:用来生成excel表格,插入数据、插入图标等表格操作,不支持读取
- xlwt库创建Excel
# 设置表格样式
def set_style(name, height, bold=False):
style = xlwt.XFStyle()
font = xlwt.Font()
font.name = name
font.bold = bold
font.color_index = 4
font.height = height
style.font = font
return style
def write_excel(file_name: str, info: List,
table_head: Optional[List], sheet: str = "data",
save_path: str = "",
*args, **kwargs) -> str:
""" xlwt库创建Excel """
try:
file_name += ".xls"
save_file = os.path.join(save_path, file_name) if save_path else file_name # Excel文件保存路径
workbook = xlwt.Workbook() # 创建Excel
sheet1 = workbook.add_sheet(sheet, cell_overwrite_ok=True) # 增加sheet页
for i in range(0, len(table_head)): # 写表头数据
sheet1.write(0, i, table_head[i], set_style('Times New Roman', 220, True))
for i in range(len(info)): # 从第二行开始写数据
item = info[i]
for j in range(len(table_head)):
field = table_head[j]
sheet1.write(i + 1, j, item[field], set_style('Times New Roman', 220, True))
workbook.save(save_file)
logger.info(f"Excel文件: {file_name}, 保存成功")
return save_file
except Exception as e:
logger.exception(f"Excel文件处理异常: {str(e)}")
return ""
- xlrd包读取Excel文件
def read_excel(file_name: str, sheet_name: str = "",
sheet_index: int = 0, data_type: int = 0) -> List:
""" xlrd包读取Excel文件 只支持xls
:param file_name: 文件路径
:param sheet_name: 要读取的sheet名称
:param sheet_index: 要读取的sheet下标
:param data_type: 数据类型 0: list, 1: dict
:return:
"""
wb = xlrd.open_workbook(filename=file_name) # 打开文件
sheet1 = wb.sheet_by_name(sheet_name) if sheet_name else wb.sheet_by_index(sheet_index) # 通过sheet名称或索引获取表格
rows = sheet1.nrows # sheet页行数
colums = sheet1.ncols # sheet页列数
table_head = sheet1.row_values(0) # 获取表头
logger.info(f"table_head: {table_head}")
li = [table_head]
for i in range(1, rows): # sheet页数据添加到li中
if data_type == 0:
li.append(sheet1.row_values(i)) # 数据形式为列表
else:
di = {}
for idx, t in enumerate(table_head):
di[t] = sheet1.row_values(i)[idx]
li.append(di)
return li
- xlsxwriter库进行创建Excel
def write_excel_xlsx(file_name: str, info: List,
table_head: Optional[List], sheet: str = "data",
save_path: str = ""):
""" 数据写入Excel,导出Excel文件, 支持xlsx类型 使用xlsxwriter库
:param file_name: excel文件名称
:param info: 写入的数据
:param table_head: 数据表头
:param sheet: sheet页名称
:param save_path: 保存路径
:return:
"""
try:
down_path = os.path.expanduser("~") # 用户目录
file_name += '.xlsx'
down_path_file = os.path.join(save_path, file_name) if save_path else \
os.path.join(down_path, file_name) # excel文件地址
workbook = xlsxwriter.Workbook(down_path_file) # 创建Excel文件
worksheet = workbook.add_worksheet(sheet) # 创建sheet,名为data
format1 = workbook.add_format(
{'bold': True, 'font_color': 'black', 'font_size': 13, 'align': 'left', 'font_name': u'宋体'}) # 表头格式
format2 = workbook.add_format({'font_color': 'black', 'font_size': 11, 'align': 'left', 'font_name': u'宋体'}) # 表头外格式
worksheet.set_column("A:A", 10) # A列列宽设置能更好的显示
for i in range(0, len(table_head)): # 插入第一行表头标题
field = table_head[i]
worksheet.write(0, i, field, format1)
# 从第二行开始插入数据
for i in range(len(info)):
item = info[i] # 行数据
for j in range(len(table_head)):
field = table_head[j]
worksheet.write(i + 1, j, item[field], format2)
workbook.close()
alert_text = '导出成功,导出地址:{}!'.format(down_path_file)
return down_path_file
except Exception as e:
logger.exception("导出Excel异常: {}".format(e))
return ''
- openpyxl库进行写Excel
def openpyxl_write_excel(file_name: str, info: List,
table_head: Optional[List], sheet: str = "data",
save_path: str = ""):
""" 数据写入Excel,导出Excel文件, 支持xlsx类型 使用openpyxl库
raise ValueError("Cannot convert {0!r} to Excel".format(value)) 数据需要为字符串
"""
down_path = os.path.expanduser("~") # 用户目录
file_name += '.xlsx'
down_path_file = os.path.join(save_path, file_name) if save_path else \
os.path.join(down_path, file_name) # excel文件地址
wb = Workbook() # 创建一个新的Excel表, 只写模式write_only=True, 默认读写模式
sheet1 = wb.active # 激活当前sheet页
# sheet1 = wb.create_sheet(sheet) # sheet页面末尾新建一个sheet页 create_sheet(sheet, index=0) 在第0位置新建
sheet1.append(table_head)
for t in info:
if isinstance(t, list):
t = [str(s) for s in t]
sheet1.append(t)
elif isinstance(t, dict):
fields = [str(t[s]) for s in table_head]
sheet1.append(fields)
wb.save(down_path_file)
return down_path_file
- openpyxl库进行读Excel
def openpyxl_read_excel(file_name: str, sheet_name: str = "", sheet_index: int = 0, data_type: int = 0) -> List:
""" 读取Excel文件 使用openpyxl库 param data_type: 列表中数据类型 0:list, 1: dict """
workbook = load_workbook(file_name) # 加载Excel文件
# booksheet = workbook.active # 获取当前活跃的sheet,默认是第一个sheet
# 如果想获取别的sheet页采取下面这种方式,先获取所有sheet页名,在通过指定那一页。
sheets = workbook.sheetnames # workbook.get_sheet_names() # 从名称获取sheet
# booksheet = workbook.get_sheet_by_name(sheet_name)
try:
booksheet = workbook[sheet_name] if sheet_name else workbook[sheets[sheet_index]]
except Exception as e:
booksheet = workbook[sheets[0]]
rows = booksheet.rows # 获取sheet页的行数据
columns = booksheet.columns # 获取sheet页的列数据
li = []
table_head = []
for idx, row in enumerate(rows): # 迭代所有的行
line = [col.value for col in row]
if idx == 0:
table_head.extend(line) # 列表数据追加到列表
continue
if data_type == 0:
li.append(line) # 数据形式为列表
else:
di = dict(zip(table_head, line)) # 数据转换为字典
li.append(di)
return li
- pandas操作Excel
def pd_excel_write_info(path, file, data, abs_path, **kwargs):
info = {}
for i in data:
info = i
info['path'] = abs_path
f = os.path.join(path, file)
df = pd.DataFrame(info)
df.to_excel(f)
def pd_excel_info(file, sheetname=0, **kwargs):
converters = kwargs.get('converters', {}) # 列转码
try:
data = pd.read_excel(file, sheet_name=sheetname, converters=converters)
li = []
for ix, row in data.iterrows():
try:
li.append(dict(row)) # 按行添加数据 以dict/list形式添加
except Exception as e:
logger.error(e)
return li
except Exception as e:
return None
根据以上库的使用,可以看出openpyxl和pandas的功能更加健全和强大,尤其是pandas,对于数据操作那简直方便的飞起!
以下是各个库是性能对比,该图是从知乎网上得来的,如有侵权边删!
相关推荐
- 悠悠万事,吃饭为大(悠悠万事吃饭为大,什么意思)
-
新媒体编辑:杜岷赵蕾初审:程秀娟审核:汤小俊审签:周星...
- 高铁扒门事件升级版!婚宴上‘冲喜’老人团:我们抢的是社会资源
-
凌晨两点改方案时,突然收到婚庆团队发来的视频——胶东某酒店宴会厅,三个穿大红棉袄的中年妇女跟敢死队似的往前冲,眼瞅着就要扑到新娘的高额钻石项链上。要不是门口小伙及时阻拦,这婚礼造型团队熬了三个月的方案...
- 微服务架构实战:商家管理后台与sso设计,SSO客户端设计
-
SSO客户端设计下面通过模块merchant-security对SSO客户端安全认证部分的实现进行封装,以便各个接入SSO的客户端应用进行引用。安全认证的项目管理配置SSO客户端安全认证的项目管理使...
- 还在为 Spring Boot 配置类加载机制困惑?一文为你彻底解惑
-
在当今微服务架构盛行、项目复杂度不断攀升的开发环境下,SpringBoot作为Java后端开发的主流框架,无疑是我们手中的得力武器。然而,当我们在享受其自动配置带来的便捷时,是否曾被配置类加载...
- Seata源码—6.Seata AT模式的数据源代理二
-
大纲1.Seata的Resource资源接口源码2.Seata数据源连接池代理的实现源码3.Client向Server发起注册RM的源码4.Client向Server注册RM时的交互源码5.数据源连接...
- 30分钟了解K8S(30分钟了解微积分)
-
微服务演进方向o面向分布式设计(Distribution):容器、微服务、API驱动的开发;o面向配置设计(Configuration):一个镜像,多个环境配置;o面向韧性设计(Resista...
- SpringBoot条件化配置(@Conditional)全面解析与实战指南
-
一、条件化配置基础概念1.1什么是条件化配置条件化配置是Spring框架提供的一种基于特定条件来决定是否注册Bean或加载配置的机制。在SpringBoot中,这一机制通过@Conditional...
- 一招解决所有依赖冲突(克服依赖)
-
背景介绍最近遇到了这样一个问题,我们有一个jar包common-tool,作为基础工具包,被各个项目在引用。突然某一天发现日志很多报错。一看是NoSuchMethodError,意思是Dis...
- 你读过Mybatis的源码?说说它用到了几种设计模式
-
学习设计模式时,很多人都有类似的困扰——明明概念背得滚瓜烂熟,一到写代码就完全想不起来怎么用。就像学了一堆游泳技巧,却从没下过水实践,很难真正掌握。其实理解一个知识点,就像看立体模型,单角度观察总...
- golang对接阿里云私有Bucket上传图片、授权访问图片
-
1、为什么要设置私有bucket公共读写:互联网上任何用户都可以对该Bucket内的文件进行访问,并且向该Bucket写入数据。这有可能造成您数据的外泄以及费用激增,若被人恶意写入违法信息还可...
- spring中的资源的加载(spring加载原理)
-
最近在网上看到有人问@ContextConfiguration("classpath:/bean.xml")中除了classpath这种还有其他的写法么,看他的意思是想从本地文件...
- Android资源使用(android资源文件)
-
Android资源管理机制在Android的开发中,需要使用到各式各样的资源,这些资源往往是一些静态资源,比如位图,颜色,布局定义,用户界面使用到的字符串,动画等。这些资源统统放在项目的res/独立子...
- 如何深度理解mybatis?(如何深度理解康乐服务质量管理的5个维度)
-
深度自定义mybatis回顾mybatis的操作的核心步骤编写核心类SqlSessionFacotryBuild进行解析配置文件深度分析解析SqlSessionFacotryBuild干的核心工作编写...
- @Autowired与@Resource原理知识点详解
-
springIOCAOP的不多做赘述了,说下IOC:SpringIOC解决的是对象管理和对象依赖的问题,IOC容器可以理解为一个对象工厂,我们都把该对象交给工厂,工厂管理这些对象的创建以及依赖关系...
- java的redis连接工具篇(java redis client)
-
在Java里,有不少用于连接Redis的工具,下面为你介绍一些主流的工具及其特点:JedisJedis是Redis官方推荐的Java连接工具,它提供了全面的Redis命令支持,且...
- 一周热门
- 最近发表
- 标签列表
-
- mybatiscollection (79)
- mqtt服务器 (88)
- keyerror (78)
- c#map (65)
- resize函数 (64)
- xftp6 (83)
- bt搜索 (75)
- c#var (76)
- mybatis大于等于 (64)
- xcode-select (66)
- mysql授权 (74)
- 下载测试 (70)
- linuxlink (65)
- pythonwget (67)
- androidinclude (65)
- logstashinput (65)
- hadoop端口 (65)
- vue阻止冒泡 (67)
- oracle时间戳转换日期 (64)
- jquery跨域 (68)
- php写入文件 (73)
- kafkatools (66)
- mysql导出数据库 (66)
- jquery鼠标移入移出 (71)
- 取小数点后两位的函数 (73)