全国计算机二级Python第17套-综合应用-46-问题2

考生文件夹下存在2个Python源文件和1个文本文件,分别对应2个问题,其中,文本文件“八十天环游地
球.xt”是法国作家儒勒.凡尔纳《八十天环游地球》长篇小说的网络版本,请修改源文件实现以下功能。
问题1:提取章节题目并输出到文件。要求:在PY301-1.py中补充代码,提取“八十天环游地球.txt”中所
有章节的题目,并且将提取后的题目输出到“八十天环游地球-章节.txt”文件中,每行一个标题,示例如下:
第1章斐利亚.福克和路路通建立主仆关系
.. (略)
问题2:统计每章节的高频词并打印输出。要求在PY301-2.py中补充代码,统计“八十天环游地球.txt”中
每一章的标题和内容中,出现次数最多的词语(词语长度不少于2个字符)及其次数,输出格式为章节名、词
语及其出现的次数,以空格分隔,示例如下:
第1章斐利亚21
第2章路路通12

参考答案


import jieba

#1.读取文件

fi = open("八十天环游地球.txt","r")

lines = fi.readlines()

fi.close()

#[0, 33, 49, 137, 186,..]

rown = []#把各个章的行放入其中

#2.找到第x章所在的行,并且转换成从0开始

for i in range(len(lines)):#0,1,2..

ls = lines[i].strip().split()

if ls[0][0] == "第" and ls[0][-1] == "章":

rown.append(i)

for i in range(len(rown)):

#3.找到对应章的内容

if i != len(rown)-1:

data = "".join(lines[rown[i]:rown[i+1]])

else:

data = "".join(lines[rown[i]:])


转载请注明:文章转载自 阿福课堂 https://www.afuketang.com
阿福课堂官方网站》免责声明:
1、因考试政策、内容不断变化与调整,本网站提供的以上信息仅供参考,如有异议,请考生以权威部门公布的内容为准!
2、本网信息来源为其他媒体的稿件转载,免费转载出于非商业性学习目的,版权归原作者所有,如有内容与版权问题等请与本站联系。联系邮箱:1225682794@qq.com。
历年真题

全国计算机二级Python第17套-综合应用-46-问题1

2024-4-23 9:14:04

历年真题

全国计算机二级Python第18套-基本操作-41

2024-4-23 9:19:53

个人中心
购物车
优惠劵
今日签到
搜索