tensorflow报错：setting an array element with a sequence

liuchongee

64243人浏览 · 2017-09-05 18:28:32

liuchongee · 2017-09-05 18:28:32 发布

最近很多人跟我发私信说会遇到这个问题，其实我之前也遇到过两次，但是感觉当时试了试就解决了，没以为是一个很常见的问题。所以写篇博客来记录一下这个问题，方便以后使用。

首先来说这个问题一般会发生在读取数据的时候，也就是把我们Python里面的数据传递给placeholder的时候回报这个错。我之前的解决方法是将要传入的数据全部使用np.array()函数改写。注意这里是全部改写。也就是说如果你要传入的是一个二维数组，那么其内部的元素也要是np.array()。

首先我们来看一下为什么会出现这样的错误，看下面两行代码：

a = tf.constant([[[[1,2,3], [6,7,8], [9,10,1]],
                   [[0,1,2], [2,3,4], [3,4,1]]],

                  [[[1,2,3], [6,7,8], [9,10,1]],
                   [[0,1,2], [2,3,4], [3,4,1]]]], dtype=np.float32)

a = tf.constant([[[[1,2,3,4], [6,7,8], [9,10]], 
                   [[0,1,2,3], [2,3,4], [3,4]]], 

                  [[[1,2,3,4], [6,7,8], [9,10]], 
                   [[0,1,2,3], [2,3,4], [3,4]]]], dtype=np.float32)

结果会告诉你第一个语句正确可以执行，第二个语句错误，且爆出下面这样的错误：

Traceback (most recent call last):
  File "/home/lc/PycharmProjects/tensorflow/HAN/HAN-text-classification-tf/test.py", line 65, in <module>
    [[0,1,2,3], [2,3,4], [3,4]]]], dtype=np.float32)
  File "/home/lc/anaconda2/lib/python2.7/site-packages/tensorflow/python/framework/constant_op.py", line 102, in constant
    tensor_util.make_tensor_proto(value, dtype=dtype, shape=shape, verify_shape=verify_shape))
  File "/home/lc/anaconda2/lib/python2.7/site-packages/tensorflow/python/framework/tensor_util.py", line 371, in make_tensor_proto
    nparray = np.array(values, dtype=np_dt)
ValueError: setting an array element with a sequence.

这说明什么呢，第二条赋值语句的list元素的shape是不一样的。它不像第一个里面每一个元素长度都是3，反而是2,3,4个元素都有，所以在复制的时候程序并不知道该怎样去做。就将其当做是一个sequence对待，自然是无法赋值的。

其次还有一种情况就是咱们一开始提到的那种，当我们给palceholder传递数据的时候偶尔也会出现这种问题，这时候我们一般会在数据处理的时候将数据使用np.array()进行封装。大概就像这样，使用列表添加append数据的时候就封装一次。

data_x = []

max_sent_in_doc = 30
max_word_in_sent = 30
for perdoc in x_text:
    doc2idx = []
    snt_doc = perdoc.split('。')
    for i,sent in enumerate(snt_doc):
        if i <max_sent_in_doc:
            word2idx =[]
            for j,word in enumerate(sent.split(' ')):
                if j < max_word_in_sent:
                    word2idx.append(np.array(vocab.get(word,UNKNOWN)))
            npad = (0,30-len(word2idx))

            #add padding 
            word2idx = np.pad(word2idx, pad_width=npad, mode='constant', constant_values=0)#padding
            doc2idx.append(np.array(word2idx))
    npad2 =((0,30-len(doc2idx)),(0,0))

    #add padding
    doc2idx = np.pad(doc2idx, pad_width=npad2, mode='constant', constant_values=0)#padding
    data_x.append(np.array(doc2idx))

注意data_x.append()和doc2idx.append()两句即可。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

1.8B 体积、33 种语言互译｜腾讯混元 HY-MT1.5-1.8B 多语言机器翻译模型上线

在跨语言交流日益频繁的今天，阅读外语菜单、处理多语言邮件、与不同语言背景的人沟通，已经成为很多人日常工作与生活的一部分。过去，这类需求往往依赖联网翻译工具，而如今，—— 一部设备即可支持的相互翻译。当 AI 不再只是“逐字直译”，而是开始理解语境、风格与语言之间的细微差异，机器翻译就真正具备了今天为大家介绍一款高质量、多语言、支持端侧部署的机器翻译模型 ——，现已上线 AtomGit AI 社区，