酒店网站案例,邹城网站定制,房地产开发公司简介范文大全,管理咨询公司取名字文本分词
在这个代码的基础上
把英语单词作为一类汉语#xff0c;作为一类然后列出选项
1. 大小排序
2. 小大排序
3. 不排序打印保存代码 import jieba# 输入文本#xff0c;让我陪你聊天吧~
lines []
print(请输入多行文本#xff0c;以\2333.3\结束作为一类然后列出选项
1. 大小排序
2. 小大排序
3. 不排序打印保存代码 import jieba# 输入文本让我陪你聊天吧~
lines []
print(请输入多行文本以\2333.3\结束)
while True:line input()if line 2333.3:breaklines.append(line)# 对每行文本进行分词和去重将文字拆拆拆~
words []
for line in lines:seg_list jieba.cut(line) # 分词把文字切得精精致致~for word in seg_list:words.append(word) # 把词拼起来组成一个个小秘密~# 将英文单词作为一类给中英文都一个舞台~
new_words []
for word in words:if word.isalpha():new_words.append(word.lower()) # 英文小写不分大小~else:new_words.append(word) # 中文就这样保留~# 选项控制排序1. 大小排序 2. 小大排序 3. 不排序看你喜欢哪种节奏~
option input(请选择排序方式输入对应数字1/2/3)
if option 1:new_words.sort(keylambda w: (not w.isalpha(), w)) # 选了1大小排序这个节奏有点嗨~
elif option 2:new_words.sort(keylambda w: (not w.isalpha(), w), reverseTrue) # 选了2小大排序调皮一点~
elif option ! 3:print(无效选项默认不排序。) # 嘘~别乱点哦~# 原文和分词结果打印让我们揭开神秘的面纱~
print(原文)
for line in lines:print(line)print(\n分词结果)
for word in new_words:print(word)# 保存为txt文件让文字在电子世界里流传~
file_name input(请输入文件名不需要加后缀)
if file_name.strip() :file_name 编号. 第1个分词词语 时间戳file_path /storage/emulated/0/数据中心/txt/ file_name .txt
with open(file_path, w, encodingutf-8) as f:# 写入原文f.write(原文\n)for line in lines:f.write(line \n)# 写入分词结果f.write(\n分词结果\n)for word in new_words:f.write(word \n)print(文件保存成功路径%s % file_path) # 保存完毕请查收~新添加的内容是将英语单词作为一类汉语并进行排序。选项控制排序方式可选择1. 大小排序 2. 小大排序 3. 不排序默认选项为3. 不排序。
请注意英语单词将转换为小写形式如需保留原始大小写 # 根据选项决定是否将英文单词转换为小写形式并保留原始大小写
option input(请选择选项\n1. 将所有英文单词转换为小写形式\n2. 保留英文单词的原始大小写\n请选择选项输入对应数字1/2 )
if option 1:new_words [word.lower() if word.isalpha() else word for word in words] # 选了1将所有英文单词都转换为小写形式
elif option 2:new_words words # 选了2保留英文单词的原始大小写
else:print(无效选项默认将所有英文单词转换为小写形式。)new_words [word.lower() if word.isalpha() else word for word in words] # 嘘别乱选哦~
修改后的代码
import jieba# 输入文本让我陪你聊天吧~
lines []
print(请输入多行文本以\2333.3\结束)
while True:line input()if line 2333.3:breaklines.append(line)# 对每行文本进行分词和去重将文字拆拆拆~
words []
for line in lines:seg_list jieba.cut(line) # 使用jieba库进行分词for word in seg_list:words.append(word) # 添加分词的结果# 根据选项决定是否将英文单词转换为小写形式并保留原始大小写
option input(请选择选项\n1. 将所有英文单词转换为小写形式\n2. 保留英文单词的原始大小写\n请选择选项输入对应数字1/2 )
if option 1:new_words [word.lower() if word.isalpha() else word for word in words] # 将所有英文单词转换为小写形式
elif option 2:new_words words # 保留英文单词的原始大小写
else:print(无效选项默认将所有英文单词转换为小写形式。)new_words [word.lower() if word.isalpha() else word for word in words] # 默认将所有英文单词转换为小写形式# 将分词结果排序1. 大小排序 2. 小大排序 3. 不排序看你喜欢哪种节奏~
option input(请选择排序方式输入对应数字1/2/3)
if option 1:new_words.sort(keylambda w: (not w.isalpha(), w)) # 大小排序
elif option 2:new_words.sort(keylambda w: (not w.isalpha(), w), reverseTrue) # 小大排序
elif option ! 3:print(无效选项默认不排序。) # 默认不排序# 打印原文和分词结果
print(原文)
for line in lines:print(line)print(\n分词结果)
for word in new_words:print(word)# 保存为txt文件
file_name input(请输入文件名不需要加后缀)
if file_name.strip() :file_name 编号. 第1个分词词语 时间戳file_path /storage/emulated/0/数据中心/txt/ file_name .txt
with open(file_path, w, encodingutf-8) as f:# 写入原文f.write(原文\n)for line in lines:f.write(line \n)# 写入分词结果f.write(\n分词结果\n)for word in new_words:f.write(word \n)print(文件保存成功路径%s % file_path) # 文件保存成功提示