使用plotly离线模式报错‘UnicodeEncodeError: ‘gbk‘ codec can‘t encode character in position: ‘的解决方法

问题

使用plotly离线模式绘制图像时,报错:

1
UnicodeEncodeError: 'gbk' codec can't encode character '\u25c4' in position 276398: illegal multibyte sequence

报错描述

环境

IDE: PyCharm 2022.3.1
操作系统: Windows 10
Python版本: 3.11

错误相关项目代码

1
2
3
plot_data = [plot_training_trace, plot_test_trace]
plot_figure = go.Figure(layout=plot_layout, data=plot_data)
pyoff.plot(plot_figure) # 这里报错

问题查找过程

尝试使用如修改IDE编码的办法未果。
通过debug,发现是pathlib.py文件中的write_text函数未能正确将文件按照utf-8进行编码。
write_text函数debug
尝试手动修改encoding值,再次运行发现能够正确绘制网页
手动修改encoding
证明io.text_encoding()返回的确为’locale’。查看windows默认编码,发现为GBK
windows编码

解决办法

基于此,有两个解决方法:

  1. 修改plotly对write_text的调用
    编辑_html.py(位于项目的site-packages中,如C:\Users\38412\.virtualenvs\machine-learning-TGwdIfnC\Lib\site-packages\plotly\io\_html.py),修改函数write_html如图,为write_text()添加encodeing参数为’utf8’。修改_html.py
  2. 修改操作系统的默认编码集
    详见参考链接,将系统编码修改为utf-8。
    修改操作系统编码集

2023.3.9更新:
使用Unicode UTF-8会导致WSL子系统无法打开explorer.exe


使用plotly离线模式报错‘UnicodeEncodeError: ‘gbk‘ codec can‘t encode character in position: ‘的解决方法
https://buttering.github.io/EasyBlog/2022/10/15/使用plotly离线模式报错UnicodeEncodeError:gbk codec can‘t encode character in position的解决方法/
作者
Buttering
发布于
2022年10月15日
许可协议