加载中...

地址发布 老王说明书 宣传中心
此板块只作为纯讨论

正经话题,不搞色情!贤者时间必备
查看: 249|回复: 0
收起左侧

[其他] 关于网络小说的编码

[复制链接]
发表于 2024-11-11 23:05:54 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?免费注册

x
本人搓了一个自动处理下载小说并将其转为AZW3的脚本,在使用的过程中有一些文件编码出现问题,实际为GBK编码但由于出现了一些非法字符无法识别,最终需要手动设置encoding 和errors="ignore"来处理,请问大佬们有没有自动判断什么编码的方式吗?(这玩意PyCharm都识别不出来)感觉直接修改Byte也不太可行,或是基于词频来判断?  {9 u' x0 b1 k/ U(欢迎访问老王论坛:laowang.vip)
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 免费注册
点击进行验证

本版积分规则

我们不生产资源,只做资源的搬运工。

tags标签-春满四合院-AvGood-Archiver-小黑屋- |网站地图