在使用torchtext处理数据过程中,构建词表部分,运行到以下代码报错

#将未能识别的单词设置为<unk>
vocab = build_vocab_from_iterator(yield_tokens(train_iter), specials=["<unk>"]) 

 报错截图如下:

 

找到包所在的文件connection.py,显示包导入出问题,查了一下资料,原以为是six模块版本不对,从这个角度出发也没能解决问题。

 

从网络方面着手,没能获取到文件raw.githubusercontent.com。网上一个有效解决方法如下:

Githubusercontent - raw.Githubusercontent.com (ipaddress.com)

查一下raw.githubusercontent.com的ipv4地址,四个里面随便尝试一个

 

使用管理员权限打开C:/Windows/System32/hosts文件(路径不一定是这个,从C盘搜hosts进入文件),添加一行:

185.199.109.133 raw.githubusercontent.com # comments. put the address here 

保存后重启,应该就能解决。但是我这里行不通。。。由于我是在服务器上跑的代码应该在服务器下通过下面语句找到host文件,再进行操作,我觉得应该是行得通的(但是我没有服务器的sudo密码....):

su root输入密码后 以管理员身份进入服务器
sudo vi /etc/hosts
进入文件

然后进host将ip复制上去,由于我的host文件中ip都是ipv6,于是我将对应的ipv6地址复制上去,可以运行,但是这一段代码运行时间非常久!!

 

linux操作的一些参考博文:

(3条消息) Linux下编辑文件并保存_ezreal_pan的博客-CSDN博客_linux编辑后保存

(3条消息) Linux下编辑并保存文件操作步骤_我是海浪的博客-CSDN博客_linux编辑文件

(3条消息) vim编辑时遇到E325: ATTENTION Found a swap file by the name "./.backu.sh.swp"错误代码的解决办法_粥粥同学的博客-CSDN博客_e325: attention found a swap file by the name

#注 :

仔细确认文件的地址以及是否有空格

语句的运用也要仔细不要混乱,记忆一些常见的linux命令

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐