神剑山庄资源网 Design By www.hcban.com
本文实例为大家分享了python实现按行分割文件的具体代码,供大家参考,具体内容如下
#!/usr/bin/env python #--*-- coding:utf-8 --*-- import os class SplitFiles(): """按行分割文件""" def __init__(self, file_name, line_count=200): """初始化要分割的源文件名和分割后的文件行数""" self.file_name = file_name self.line_count = line_count def split_file(self): if self.file_name and os.path.exists(self.file_name): try: with open(self.file_name) as f : # 使用with读文件 temp_count = 0 temp_content = [] part_num = 1 for line in f: if temp_count < self.line_count: temp_count += 1 else : self.write_file(part_num, temp_content) part_num += 1 temp_count = 1 temp_content = [] temp_content.append(line) else : # 正常结束循环后将剩余的内容写入新文件中 self.write_file(part_num, temp_content) except IOError as err: print(err) else: print("%s is not a validate file" % self.file_name) def get_part_file_name(self, part_num): """"获取分割后的文件名称:在源文件相同目录下建立临时文件夹temp_part_file,然后将分割后的文件放到该路径下""" temp_path = os.path.dirname(self.file_name) # 获取文件的路径(不含文件名) part_file_name = temp_path + "temp_part_file" if not os.path.exists(temp_path) : # 如果临时目录不存在则创建 os.makedirs(temp_path) part_file_name += os.sep + "temp_file_" + str(part_num) + ".part" return part_file_name def write_file(self, part_num, *line_content): """将按行分割后的内容写入相应的分割文件中""" part_file_name = self.get_part_file_name(part_num) print(line_content) try : with open(part_file_name, "w") as part_file: part_file.writelines(line_content[0]) except IOError as err: print(err) if __name__ == "__main__": sf = SplitFiles(r"F:\multiple_thread_read_file.txt") sf.split_file()
小编再为大家分享一段代码:
将文本文件按照指定的行数分割成数个小的文本文件
#! /usr/bin/env python # -*- coding: utf-8 -*- LIMIT=1000 file_count=0 url_list=[] with open("123.txt") as f: for line in f: url_list.append(line) if len(url_list)<LIMIT: continue #数据达到LIMIT file_name=str(file_count)+".txt" with open(file_name,'w') as file: for url in url_list[:-1]: #print(url) file.write(url) file.write(url_list[-1].strip()) url_list=[] file_count+=1 if url_list: file_name=str(file_count)+".txt" with open(file_name,'w') as file: for url in url_list: file.write(url) print('done')
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
神剑山庄资源网 Design By www.hcban.com
神剑山庄资源网
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件!
如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
神剑山庄资源网 Design By www.hcban.com
暂无python实现按行分割文件的评论...
更新日志
2024年11月06日
2024年11月06日
- 雨林唱片《赏》新曲+精选集SACD版[ISO][2.3G]
- 罗大佑与OK男女合唱团.1995-再会吧!素兰【音乐工厂】【WAV+CUE】
- 草蜢.1993-宝贝对不起(国)【宝丽金】【WAV+CUE】
- 杨培安.2009-抒·情(EP)【擎天娱乐】【WAV+CUE】
- 周慧敏《EndlessDream》[WAV+CUE]
- 彭芳《纯色角3》2007[WAV+CUE]
- 江志丰2008-今生为你[豪记][WAV+CUE]
- 罗大佑1994《恋曲2000》音乐工厂[WAV+CUE][1G]
- 群星《一首歌一个故事》赵英俊某些作品重唱企划[FLAC分轨][1G]
- 群星《网易云英文歌曲播放量TOP100》[MP3][1G]
- 方大同.2024-梦想家TheDreamer【赋音乐】【FLAC分轨】
- 李慧珍.2007-爱死了【华谊兄弟】【WAV+CUE】
- 王大文.2019-国际太空站【环球】【FLAC分轨】
- 群星《2022超好听的十倍音质网络歌曲(163)》U盘音乐[WAV分轨][1.1G]
- 童丽《啼笑姻缘》头版限量编号24K金碟[低速原抓WAV+CUE][1.1G]