AI初学习

2501_94474893

228人浏览 · 2026-06-07 21:32:00

2501_94474893 · 2026-06-07 21:32:00 发布

一.初了解al

概括：
AI就是让机器模仿人类智能的技术，包括学习、推理、感知、理解语言等能力。
AI的三个层次：

弱人工智能 Narrow AI 只擅长做某一件事人脸识别、语音助手、推荐算法
强人工智能 General AI 能像人一样做任何智力任务目前还不存在
超人工智能 Super AI 超过全人类智慧总和

二.AI学习原理

数据 → 模型（学习） → 能力

AI的三大学习方式：

监督学习给数据和答案，让AI学习对应关系给一堆猫狗照片+标签，让AI学会区分
无监督学习只给数据，不给答案，让AI自己找规律给一堆新闻文章，让AI自动分类
强化学习让AI自己尝试，做对了奖励，做错了惩罚让AI玩游戏，得分高就奖励

三.AI怎么表示知识

AI看不懂文字、图片、声音，它只能处理数字。所以必须把一切信息转换成数字
这个过程叫做向量化
举例理解：

“苹果”这个水果 → 可能用 [0.2, 0.8, 0.1] 这个数字列表来表示

“香蕉”这个水果 → 可能用 [0.7, 0.1, 0.9] 这个数字列表来表示

这些数字列表就是向量。AI通过比较两个向量的“距离”来判断它们是否相似。

四.Token？

**定义：**Token是AI处理文本时的最小基本单位。

1.为什么需要Token？

AI看不懂连续的字符流，需要先把它切分成小块再处理，就像你把一整段话切成一个个单词
Token长什么样取决于分词器怎么切

“I love AI” 按单词切 [“I”, “love”, “AI”]
“ChatGPT is great” 按单词切（注意GPT是一个词）
[“ChatGPT”, “is”, “great”]
“unhappiness” 按词根切 [“un”, “happiness”]
“我爱你” 按字切（中文常见方式） [“我”, “爱”, “你”]
“苹果很好吃” 按词切 [“苹果”, “很”, “好吃”]

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

追寻像素级监督的视觉预训练：Pixio

AtomGit开源社区

大湾区医疗健康EMBA实测解析与科学选型指南

师资团队国际化程度极高，外籍教师占比约50%，100%博士学历，汇聚哈佛、剑桥、斯坦福、哥伦比亚等全球顶级高校学者，覆盖战略管理、资本运作、市场营销、宏观经济、组织变革等全领域，兼具学术深度与企业实战经验。二是数字化转型，助力传统医疗企业落地AI医疗、智能设备研发等科技升级；依托港科大顶尖的AI、数据科学科研实力，精准匹配当下智慧医疗、医疗数字化转型的行业趋势，同时完善的跨境课程与全球游学体系，完