一.初了解al

概括:
AI就是让机器模仿人类智能的技术,包括学习、推理、感知、理解语言等能力。
AI的三个层次:

  • 弱人工智能 Narrow AI 只擅长做某一件事 人脸识别、语音助手、推荐算法
  • 强人工智能 General AI 能像人一样做任何智力任务 目前还不存在
  • 超人工智能 Super AI 超过全人类智慧总和

二.AI学习原理

数据 → 模型(学习) → 能力

AI的三大学习方式:

  • 监督学习 给数据和答案,让AI学习对应关系 给一堆猫狗照片+标签,让AI学会区分
  • 无监督学习 只给数据,不给答案,让AI自己找规律 给一堆新闻文章,让AI自动分类
  • 强化学习 让AI自己尝试,做对了奖励,做错了惩罚 让AI玩游戏,得分高就奖励

三.AI怎么表示知识

AI看不懂文字、图片、声音,它只能处理数字。所以必须把一切信息转换成数字
这个过程叫做向量化
举例理解:

“苹果”这个水果 → 可能用 [0.2, 0.8, 0.1] 这个数字列表来表示

“香蕉”这个水果 → 可能用 [0.7, 0.1, 0.9] 这个数字列表来表示

这些数字列表就是向量。AI通过比较两个向量的“距离”来判断它们是否相似。

四.Token?

**定义:**Token是AI处理文本时的最小基本单位。

1.为什么需要Token?

AI看不懂连续的字符流,需要先把它切分成小块再处理,就像你把一整段话切成一个个单词
Token长什么样取决于分词器怎么切

“I love AI” 按单词切 [“I”, “love”, “AI”]
“ChatGPT is great” 按单词切(注意GPT是一个词)
[“ChatGPT”, “is”, “great”]
“unhappiness” 按词根切 [“un”, “happiness”]
“我爱你” 按字切(中文常见方式) [“我”, “爱”, “你”]
“苹果很好吃” 按词切 [“苹果”, “很”, “好吃”]

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐