在这里插入图片描述

一切的起点

作为一个对 AI 技术充满好奇的开发者,我一直在想:这些强大的 AI API 到底能用来做什么?

Pollinations 提供了一个非常友好的免费 AI API 平台,可以:

  • 生成图片
  • 识别图片内容
  • 智能对话
  • 文字转语音
  • 语音转文字
  • 翻译
  • 代码生成
  • 甚至生成完整的前端应用

但问题是:知道 API 能做什么,和真正看到它能做什么,是完全不同的两回事。

我决定动手

与其空想,不如动手。我开始了一个简单的实验:

如果我把这些 API 整合到一个网站里,会碰撞出什么样的火花?

于是,这个演示网站诞生了。

我发现了什么

在开发过程中,我不断被 AI 的能力震撼:

🎨 创意可以瞬间具象化

输入一段文字描述,几秒钟后一张精美的图片就出现在眼前。我看到 Kontext 模型甚至能理解用户上传的参考图片,生成风格相似的作品。

💬 对话不只是聊天

当 AI 能够理解上下文、记住历史对话,它就不再是一个简单的问答机器。我尝试让它扮演不同角色——词典编纂者、代码审查员、故事创作者——它都能胜任。
在这里插入图片描述

🌍 语言障碍正在消失

语音输入 → 识别成文字 → 翻译成另一种语言 → 再转成语音播放。这个流程在我的浏览器里跑通的那一刻,我真的感受到技术正在让世界变得更小。

🚀 从想法到原型,只需一个提示

最让我惊讶的是代码生成能力。我告诉 AI 想要什么功能,它就能返回完整的多文件项目代码。虽然不完美,但它确实大大加速了原型开发的过程。

为什么开源

我决定把这个项目完全开源,原因很简单:

  1. 透明:我希望任何人都能看到这些 API 是如何被调用的,参数是如何配置的
  2. 学习:如果你也想探索 AI API,这个代码可以作为一个起点
  3. 协作:我相信社区的力量,也许你会比我做得更好
  4. 信任:开源是最好的信任建立方式,你可以审查每一行代码

技术栈

这个项目使用了现代前端技术:

  • React 19 + TypeScript
  • Zustand 状态管理
  • Tailwind CSS 样式
  • IndexedDB 本地持久化
  • 无需编译:使用 ES Modules 和 importmap,开箱即用

所有代码都是真实可用的,不是玩具项目。

主要功能

这个演示网站包含了 8 个主要模块:

  • 文生图:支持多种模型,可上传参考图片
  • 图生文:让 AI 描述图片内容
  • 智能聊天:流式响应,语音输入,历史会话
  • 文生语音:多种语音可选
  • 语音转文字:浏览器内自动转换格式
  • 音频翻译:语音识别 → 翻译 → 语音合成,一气呵成
  • 电子词典:详细的单词解释,支持发音
  • 代码/应用生成:从提示直接生成可运行代码

你可以做什么

  1. 在线体验访问演示网站(如果有部署的话)
  2. 查看源码GitHub 仓库
  3. 自己部署:Fork 仓库,按照 README 的说明运行
  4. 提交 Issue:发现问题或建议新功能
  5. 提交 PR:直接贡献代码

我想听听你的想法

开发这个项目对我来说是一次很棒的探索之旅,但我更想知道:

  • 这些功能对你有帮助吗?
  • 你最想看到什么新功能?
  • 你发现了什么有趣的 API 用法?
  • 代码质量如何?有什么需要改进的地方?

无论你是普通用户、其他开发者,还是对 AI 感兴趣的朋友,你的反馈对我来说都非常宝贵。

感谢你的时间!✨


开源协议: MIT
仓库: https://github.com/nyr-github/pollinations-demo

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐