Python 使用xlwt模块将多行多列数据循环写入excel文档的操作

脚本专栏 2024/11/17 佚名

2 0 1

神剑山庄资源网 Design By www.hcban.com

我就废话不多说了，大家还是直接看代码吧~

#!/usr/bin/python
# -*- coding: utf-8 -*-

import xlwt
import re

def host_regex(dataline):
 host_regex = r"<host>(.*"
 host = re.findall(host_regex, dataline)
 if host:
  return host[0]

def ip_regex(dataline):
 ip_regex = r"<ip>(.*"
 ip = re.findall(ip_regex, dataline)
 if ip:
  return ip[0]

with open("zbx_export_hosts.xml", "r", encoding="utf8") as f:
 lines = f.readlines()
 alldatas = []
 hostlist = []
 iplist = []
 for line in lines:
  host = host_regex(line)
  ip = ip_regex(line)

  if host is not None:
   hostlist.append(host)
  if ip is not None:
   iplist.append(ip)
 hosts_ip = []
 # 构造数据结构,形如：[[a,b],[c,d],...]
 multi_list = map(list, zip(hostlist, iplist))
 for multi in multi_list:
  hosts_ip.append(multi)
 workbook = xlwt.Workbook()
 worksheet = workbook.add_sheet('test')
 # 关键代码
 for hi in enumerate(hosts_ip):
  for num in range(len(hi[1])):
   # 行、列、值
   worksheet.write(hi[0], num, hi[1][num])

 workbook.save('excelwrite.xls')

PS：其实有两行代码冗余，就不删了！

补充知识：通过python写入xlsx大量数据问题简述

以前批处理生成数据文件都是通过c程序直接按照逗号分隔方式写文本文件以csv保存的。但是由于有些处理的数据表直接给业务人员看，业务人员习惯使用xls，因此提了些需求改造，对于一些小于100w的数据均要求改为xlsx文件格式的报表。

考虑报表文件数据处理便捷，因此决定用python实现，最初使用了openpyxl库，这个python库拥有非常强大的xlsx的读写api，能够很方便的实现读写。但是在实际使用中发现在处理较大行数的xlsx时，占用内存非常严重，8个字段50w行数据在运行中内存高达10G，这不是我们应用服务器能够接受的范围。

因此寻求改善，在网上了解后，发现创建xlsx表时，指定write_only参数是openpyxl提供的大数据写入解决方案，以下摘自官网范例，在选择了此参数后，无法通过ws.cell(row=i, column=j).value = ？的方式复制，只能通过append的方式追加行。关于设置只写cell设置样式，可以直接查看官网

> from openpyxl import Workbook
> wb = Workbook(write_only=True)
> ws = wb.create_sheet()
>
> # now we'll fill it with 100 rows x 200 columns
>
> for irow in range(100):
...  ws.append(['%d' % i for i in range(200)]) #可以先将一行的数据写在一个list中，直接ws.append(list)
> # save the file
> wb.save('new_big_file.xlsx') # doctest: +SKIP

不过仅仅按上述范例修改write_only跑数时发现内存占用并没有缓解，再仔细阅读官网说明时才发现这么一句话“When you want to dump large amounts of data make sure you have lxml installed.”原来在openpyxl安装时，并没有把lxml作为强依赖，只是一个可选包，然后查实发现确实服务器上并没有安装lxml包。

于是与为了解决这个问题先在测试环境上安装lxml，安装过程也不是很顺利。

首先先要装libxml2以及libxslt，因为没有root权限，均为源码安装，且只能安装在用户目录。需要注意的是libxml2在安装时需要--with-python='python安装目录'，libxslt安装的时候需要指定libxml2安装目录。

尤其最后的lxml安装也是坑挺多的，主要是指定libxml2和libxslt，安装lxml时先python3 setup.py build_ext -i -I${libxml2includepath} -L${libxml2libpath} -I${libxsltincludepath} -L${libxsltlibpath} ，再python3 setup.py install。

全部安装完之后，确实openpyxl写xlsx不再增加内存，先在tmp目录一个临时文件中写，待调用save方法时，保存到正式文件。

此外在这个问题解决中，还了解到writexlsx库也可以处理大文件xlsx的写入，并且安装没有这么多的依赖，其实还是非常推荐，也很简介，官网有介绍。

操作大文件时指定{'constant_memory': True}即可。

filename = 'test.xlsx'
wb = xlsxwriter.Workbook(filename, {'constant_memory': True})
ws = wb.add_worksheet('大文件')
i = 0
data= []
data.append('中文')
data.append(1323)
data.append('abc')
ws.write_row(i, 0, data)
i = i + 1
wb.close() #直接关闭即可，不需要额外save

以上这篇Python 使用xlwt模块将多行多列数据循环写入excel文档的操作就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

Python,xlwt模块,数据循环写入,excel文档

标签：

Python,xlwt模块,数据循环写入,excel文档

神剑山庄资源网 Design By www.hcban.com

神剑山庄资源网 免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com

神剑山庄资源网 Design By www.hcban.com

评论“Python 使用xlwt模块将多行多列数据循环写入excel文档的操作”

暂无Python 使用xlwt模块将多行多列数据循环写入excel文档的操作的评论...

《魔兽世界》大逃杀！60人新游玩模式《强袭风暴》3月21日上线

暴雪近日发布了《魔兽世界》10.2.6 更新内容，新游玩模式《强袭风暴》即将于3月21 日在亚服上线，届时玩家将前往阿拉希高地展开一场 60 人大逃杀对战。

艾泽拉斯的冒险者已经征服了艾泽拉斯的大地及遥远的彼岸。他们在对抗世界上最致命的敌人时展现出过人的手腕，并且成功阻止终结宇宙等级的威胁。当他们在为即将于《魔兽世界》资料片《地心之战》中来袭的萨拉塔斯势力做战斗准备时，他们还需要在熟悉的阿拉希高地面对一个全新的敌人──那就是彼此。在《巨龙崛起》10.2.6 更新的《强袭风暴》中，玩家将会进入一个全新的海盗主题大逃杀式限时活动，其中包含极高的风险和史诗级的奖励。
《强袭风暴》不是普通的战场，作为一个独立于主游戏之外的活动，玩家可以用大逃杀的风格来体验《魔兽世界》，不分职业、不分装备（除了你在赛局中捡到的），光是技巧和战略的强弱之分就能决定出谁才是能坚持到最后的赢家。本次活动将会开放单人和双人模式，玩家在加入海盗主题的预赛大厅区域前，可以从强袭风暴角色画面新增好友。游玩游戏将可以累计名望轨迹，《巨龙崛起》和《魔兽世界：巫妖王之怒经典版》的玩家都可以获得奖励。

更新日志

2024年11月17日

Python 使用xlwt模块将多行多列数据循环写入excel文档的操作

Python,xlwt模块,数据循环写入,excel文档

Python暴力破解Mysql数据的示例

python 实现一个图形界面的汇率计算器

评论“Python 使用xlwt模块将多行多列数据循环写入excel文档的操作”

《魔兽世界》大逃杀！60人新游玩模式《强袭风暴》3月21日上线

更新日志

友情链接