Hugging News #0717: 开源大模型榜单更新、音频 Transformers 课程完成发布！

transformers

huggingface/transformers: 是一个基于 Python 的自然语言处理库，它使用了 PostgreSQL 数据库存储数据。适合用于自然语言处理任务的开发和实现，特别是对于需要使用 Python 和 PostgreSQL 数据库的场景。特点是自然语言处理库、Python、PostgreSQL 数据库。

项目地址：https://gitcode.com/gh_mirrors/tra/transformers

免费下载资源

Hugging Face

1659人浏览 · 2023-07-17 18:00:47

Hugging Face · 2023-07-17 18:00:47 发布

每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息，快来看看吧！🎉 😍

重磅更新

Hugging Face 🤗 开源大模型排行榜发现异常：让我们来调查一下！🧐

Open LLM 排行榜是 Hugging Face 设立的一个用于评测开放大语言模型的公开榜单。最近，随着 Falcon 🦅 的发布并在 Open LLM 排行榜上疯狂屠榜，围绕这个榜单在推特上掀起了一轮热烈的讨论。讨论主要围绕排行榜上的四个评测基准其中之一: 大规模多任务语言理解（Massive Multitask Language Understanding，MMLU）基准。

社区发现头部模型 LLaMA 🦙 在 Open LLM 榜单上的 MMLU 得分比 LLaMA 论文中宣称的数字要低很多，大家都感觉很奇怪。

因此，我们决定深入分析一下这个现象🕳🐇，看看到底是什么原因，又应该如何解决。

在这段旅程中，你将学到很多有关如何评测模型的知识，因此，如果后面你在网络上或论文中看到了相关的评测数字，相信你就会有一定的判断力了。

详细内容请看我们在 Hugging Face 公众号发布的文章：Open LLM 排行榜近况。

Hugging Face 🤗 开源大模型榜单更新啦 🔥

💡更新之一：使用更新版 Harness 重新刷榜，更新得分 🆙

在 Falcon 大模型发布之后，很多人对我们开源大模型榜单上的 LLaMA 排名下降及评分进行讨论🙋在 Harness 版本更新之后，我们对所有大模型重新刷榜，目前的得分结果都是最新的！

💡更新之二：更快速的推理 💨

我们现在对兼容模型使用 text - generation - inference 文本生成推理，它速度极快且无缝连接，直接让后端的速度提升了一个数量级 🤯。对于其他模型，我们使用超级棒的 accelerate 来优化并行性。

💡更新之三：提高了可复制性 📄

可以在更多的位置找到你想要的信息以便复制或重现 💻 比如在 "about" 可以找到更多的指令细节；在扩展 view 里可以看到更多有关模型的信息；一如既往，所有刷榜的结果和数据也都开源在我们的 Hub 上📊

如果我们在 Hugging Face 做一个中文大模型的列表并随时更新，你觉得怎么样？🤔️

欢迎留言告诉我们你的想法和问题 🙋

社区活动

「AI 头像变装秀」活动邀请你参加！

我们在小红书平台上举办的「AI 头像变装秀」活动时间已经过半，我们看到大家生成了很多很多可爱的、抖包袱的、唯美的 AI 头像，只能说大家都太优秀啦！越发觉得好像没有一个 AI 生成的头像，出门都不好意思跟人打招呼啦！

7 月 5 日至 7 月 31 日举行 Hugging Face AI 头像变装秀活动 🔥

活动介绍: 我们将分享一段 Stable Diffusion 的 Notebook 代码 🖥️ (https://hf.link/tx)（不要听到代码就头疼呀集美们，超简单的！）顺着执行这段 Notebook 代码，你将可以使用 AI 生成自己的头像，生成头像的风格不限✨

参与方式: 在使用我们提供的代码生成头像之后，请在你的小红书发布一篇笔记 📒 分享你的成果或体验，并 @Hugging Face 官方账号让我们知道。

活动时间: ⏰ 活动将在 7 月 31 日 (周一) 晚上 12 点截止，届时获赞最多的 前三名 小伙伴将获得神秘小惊喜 🎁

如果有疑问 🙋请随时私信或留言！可到小红书查看活动详情，或者在公众号后台回复「头像」加入活动群。

官方小红书账号活动链接:https://hf.link/imot4

内容更新

音频 Transformers 课程完成发布！

我们发布了完全开源的音频 Transformers 课程，迄今为止反响非常好！🤗

Transformers 作为一种强大而多功能的深度学习架构，一次又一次地证明了自己在各种任务中的卓越表现，包括自然语言处理、计算机视觉，最近更是在音频处理领域也有不凡的表现。

在这门课程中，我们将探索如何将 Transformers 应用于音频数据。你将学习如何使用它们来处理各种音频相关的任务。无论你对语音识别、音频分类还是从文本生成语音感兴趣，Transformers 和本课程都能满足你的需求。

课程链接 🚀：https://hf.co/learn/audio-course/chapter0/introduction

我们已经完成了 7 个单元的发布：

单元 1：处理音频数据 - 为处理音频奠定基础。🧱
单元 2：音频应用简介 - 介绍了众多音频应用。🏃‍♂️
单元 3：音频的 Transformers 架构 - 讲解了处理音频相关任务时存在的不同类型的架构和设计！⚡️
单元 4：构建音乐流派分类器 - 实际操作教程，教你如何构建音频分类流程。🎶
单元 5：语音识别 - 深入探索语音识别，并构建一个模型来转录会议记录
单元 6：文字转语音 - 学习如何将给定的文本转换为音频输出
单元 7：具体应用 - 构建真实世界的音频应用程序

完成这门课以后，你将获得使用 Transformers 处理音频数据的坚实基础，并且能够将这些技术应用到各类音频相关的任务上。

为了这次课程，我们还进行了两次线上活动，目前两次活动的回放已经发布，请通过我们的官方哔哩哔哩账号查看:
https://hf.link/bili

本期内容编辑: Shawn

以上就是本期的 Hugging News，新的一周开始了，我们一起加油！💪🎉

GitHub 加速计划 / tra / transformers

130.24 K

25.88 K

下载

最近提交(Master分支：2 个月前 )

33868a05 * [i18n-HI] Translated accelerate page to Hindi * Update docs/source/hi/accelerate.md Co-authored-by: K.B.Dharun Krishna <kbdharunkrishna@gmail.com> * Update docs/source/hi/accelerate.md Co-authored-by: K.B.Dharun Krishna <kbdharunkrishna@gmail.com> * Update docs/source/hi/accelerate.md Co-authored-by: K.B.Dharun Krishna <kbdharunkrishna@gmail.com> * Update docs/source/hi/accelerate.md Co-authored-by: K.B.Dharun Krishna <kbdharunkrishna@gmail.com> --------- Co-authored-by: Kay <kay@Kays-MacBook-Pro.local> Co-authored-by: K.B.Dharun Krishna <kbdharunkrishna@gmail.com> 1 天前

e2ac16b2 * rework converter * Update modular_model_converter.py * Update modular_model_converter.py * Update modular_model_converter.py * Update modular_model_converter.py * cleaning * cleaning * finalize imports * imports * Update modular_model_converter.py * Better renaming to avoid visiting same file multiple times * start converting files * style * address most comments * style * remove unused stuff in get_needed_imports * style * move class dependency functions outside class * Move main functions outside class * style * Update modular_model_converter.py * rename func * add augmented dependencies * Update modular_model_converter.py * Add types_to_file_type + tweak annotation handling * Allow assignment dependency mapping + fix regex * style + update modular examples * fix modular_roberta example (wrong redefinition of __init__) * slightly correct order in which dependencies will appear * style * review comments * Performance + better handling of dependencies when they are imported * style * Add advanced new classes capabilities * style * add forgotten check * Update modeling_llava_next_video.py * Add prority list ordering in check_conversion as well * Update check_modular_conversion.py * Update configuration_gemma.py 2 天前

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

[转载]在Windows环境下安装GNU Radio

转自：在Windows环境下安装GNURadio_恐弱智_新浪博客GNU Radio是用Python开发的，大部分开源的工程能够在Linux环境下运行良好，而Windows下却运行的很勉强，而且安装配置都很复杂。GNU Radio算是个例外了，不光提供了Windows的二进制安装，还有比较详细的说明。我是Python小白，所以折腾了好久才弄好，特意记录下来，免得以后再装还折腾。GNU Radio的

GitCode 开源社区

centOS 8 使用dnf安装Docker

DNF是什么？CentOS 8使用YUM软件包管理器版本v4.0.4。现在，该版本使用DNF(已删除YUM)。DNF是软件包管理器。它会在Linux发行版上安装，执行更新并删除软件包。使用DNF安装Docker跳过具有损坏依赖性的程序包一个有效的解决方案是使您的CentOS 8系统使用以下--nobest命令安装最符合条件的版本：sudo dnf install docker...

GitCode 开源社区

定时同步数据库表(mysql+linux+crontab)

sync.sh里面的参数需要改变，ip/username/password/database/tablesync.sh#!/bin/sh# Please change the IP and password of the data source db.# Then change the table name.filename=/home/nington/db/$(date +%Y-%m