机器是如何理解人类的语言呢?目前的发展水平,理解是指根据输入进行针对性输出。

举个例子,一个人说“我是狗”。第一个字是“我”,表现以说话人自身为主语。“我”后面跟着“是”,表示是对自身的某种判断。“是狗”就比较复杂了,在“它是狗”中,表示是对主语的物种判断,而主语如果是人,“是狗”就会有多种意思。所以,只说这三个字,没办法精确输出,但可以输出若干可能。这样的输出,也会给使用者一种专业的感觉。

大模型的本质是神经元网络,由数字模拟的神经元节点和神经元之间的连接组成,节点上可存数据,连接上也有数据,用于记录这个连接在什么时候使用及含义。以上述例子为例,“我”、“是”、“狗”是三个神经元节点,“我”和“是”之间有一个连接,这个连接的含义或者使用场景是“对自身的价值判断”。机器在输出时,可以同时使用节点和连接上面的数据。

因为语境的不同,“我”和“是”之间可能有多个连接,每一个连接的表示的意思不同,需要根据上下文选择比较合适的一项。

机器学习,是建立神经元节点和连接的过程,同时包含了连接的使用场景和权重。

用于一次输出的所有神经元节点和连接的集合,就是路径。

针对一次输入,可选的路径是多种的。换个说法是,输出可能非常有效,或者输出质量一般,或者完全不能使用。

模型使用次数多了后,连接的权重可能会发生明显的变化,是强者恒强,还是弱者要跟上?强者恒强时,模型会越来越好用。弱者跟上时,模型会越来越不好用。但强者路径不会消失,可能需要某种密码或者算法解锁,才能激活“强者路径”。

语义分析是非常复杂的,需要对一种语言的所有文字进行分析并模型化。模型建立的初期是需要大量人工操作的,以及各种专家,如语言学家、社会学家、人类学家、科学家、哲学家等等。所以,基本可以肯定,现在流行的多种模型,底层核心的东西是一样的,所有的学习和使用数据,都终将回归那个统一的核心。这是合理的,因为技术自身有迭代升级的需求。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐