每日一看大模型新闻(2023.12.19)Kyligence发布数据和分析领域大模型司南;OpenAI发布GPT-4使用指南,提供六大策略;OpenAI公布ChatGPT安全框架,跟踪风险并建立严格
1.产品发布
1.1元象开源高性能大模型XVERSE-65B-2底座版
发布日期:2023.12.19
元象开源高性能大模型XVERSE-65B-2底座版 提升代码和数学能力 (msn.cn)
主要内容:元象宣布开源XVERSE-65B-2底座版,XVERSE-65B-2通过综合优化器状态和学习率策略进行Continual Pre-Training,总训练token量达3.2万亿。模型支持40多种语言,上下文窗口为16K,在六个维度11项标准中八成超越GPT3.5。XVERSE-65B显著提升大模型的理解、生成、逻辑和记忆等能力,是国内最早开源的650亿参数免费商用模型。其保持生成创作、角色扮演等能力,为生态贡献“文理兼修、大有可为”的大模型。
Github:https://github.com/xverse-ai/XVERSE-65B
Hugging Face:https://huggingface.co/xverse/XVERSE-65B-2
ModelScope魔搭:XVERSE-65B-2
1.2 UIUC清华联手发布全新代码大模型Magicoder
发布日期:2023.12.19
编码碾压ChatGPT!UIUC清华联手发布7B参数Magicoder,代码数据权重全开源-51CTO.COM
主要内容:UIUC和清华合作推出的Magicoder,在代码生成领域以不到7B参数媲美顶级模型,并全面开源其代码、权重和数据。Magicoder采用OSS-INSTRUCT方法,从开源代码中获取灵感,生成多样、真实和可控的编码指令数据,注重真实性对于指令调整的重要性。在Python、其他编程语言以及数据科学库领域,Magicoder表现出色,在DS-1000dataset上改善了8.3个百分点,展现了在实际用例中的潜力。
论文地址:https://arxiv.org/abs/2312.02120
1.3 Kyligence发布数据和分析领域大模型司南
发布日期:2023.12.19
Kyligence 发布数据和分析领域垂直大模型司南(Compass)
主要内容:Kyligence正式发布了数据和分析领域的垂直大模型司南(Compass)。据介绍,司南大模型具有以下特点:减少“幻觉”、降低成本、加速AI场景化落地,并主要具备以下核心能力:自然语言对话分析、指标搜索与推荐、自动化数据洞察、KPI评估、智能决策建议、支持PB级以上数据量。Kyligence是一家大数据分析和指标平台供应商,提供企业级OLAP(多维分析)产品Kyligence Enterprise和智能一站式指标平台Kyligence Zen,为用户提供企业级的经营分析能力、决策支持系统及各种基于数据驱动的行业解决方案。
1.4摩尔线程KUAE智算中心启动,全功能GPU千卡千亿模型训练平台正式上线
主要内容:北京举办的摩尔线程KUAE智算中心揭幕仪式标志着国内首个全功能GPU为基础的大规模算力集群正式运营。摩尔线程发布MTT S4000智算加速卡和KUAE智算中心解决方案,力求实现国产大模型一体化生态。
MTT S4000支持48GB显存和768GB/s显存带宽,同时提供图形渲染、视频编解码和8K HDR显示能力。KUAE智算中心解决方案以全功能GPU为基础,包括基础设施、平台管理和模型服务,实现开箱即用,降低建设和运营成本。
摩尔线程与多家企业成立PES - KUAE智算联盟,推广全国产智算平台。同时,摩尔线程PES - 大模型生态联盟成立,与生态伙伴合作,推动国产大模型生态全面繁荣。在圆桌对话环节,业界嘉宾强调了软硬一体化的GPU智算系统整合能力的重要性。
2.技术更新
2.1推理性能超H100十倍!21岁华裔小哥哈佛辍学开发AI加速芯片「Sohu」
发布日期:2023.12.19
推理性能超H100十倍!21岁华裔小哥哈佛辍学开发AI加速芯片「Sohu」,2人公司估值3400万刀-51CTO.COM
主要内容:两位哈佛辍学生Gavin Uberti和Chris Zhu创立了Etched.ai,计划制造一款专用于大语言模型加速的AI加速器芯片。这款芯片将在硬件层面上集成Transformer构架,推理速度比英伟达H100提升了8-10倍。他们将第一款LLM加速芯片命名为「Sohu」,号称可以在毫秒级别的时间里处理数千个单词。此外,该芯片还支持多重推测解码(Multicast speculative decoding),可以实时生成新的内容。Etched.ai的首款芯片将在今年第三季度交付,公司估值高达3400万美元。
官网地址:Etched | The World's First Transformer Supercomputer
2.2 OpenAI发布GPT-4使用指南,提供六大策略
主要内容:OpenAI发布了GPT-4使用指南,为更有效地与ChatGPT进行互动提供了六大策略。这些策略包括:
2.提供参考文本:让模型使用或引用参考文本来提供更有针对性的回答。
3.将复杂的任务拆分为更简单的子任务:使用意图分类来识别任务类型,分步骤执行任务。
4.给模型时间“思考”:让模型自己思考解决方案,使用内心独白来隐藏推理过程,询问是否遗漏了内容。
5.使用外部工具:利用文本嵌入进行知识检索,使用代码执行和外部API增强模型功能。
6.系统地测试变更:评估模型输出的质量,参考黄金标准答案评估模型输出。
这些策略有助于提高与ChatGPT的互动质量,让用户更轻松地与模型合作完成各种任务。提示词的巧妙设计可以将任务拆分成清晰的步骤,引导用户与模型之间的交流,是实现高效人机沟通的关键。 OpenAI的使用指南为用户提供了宝贵的入门指导。
2.3音乐生成深度学习模型StemGen
发布日期:2023.12.19
音乐生成深度学习模型StemGen:听取音乐上下文生成音乐作品 (msn.cn)
主要内容:字节跳动AI研究团队推出StemGen项目,采用非自回归、基于Transformer的模型,通过听取音乐上下文生成音乐,在音频质量和音乐与上下文协调性方面取得竞争性成果。结合图像和语言处理技术,以端到端方式推动深度学习音频生成,提出非自回归、基于Transformer的架构训练模型的新范例。
2.4微软与Suno合作,Copilot引入音乐生成功能
发布日期:2023.12.19
Turn your ideas into songs with Suno on Microsoft Copilot | Bing Search Blog
主要内容:微软宣布与人工智能音乐创作领导者Suno达成合作,将他们的能力引入Microsoft Copilot。通过这一合作,无论音乐背景如何,人们都可以轻松地用简单的提示创作出有趣、聪明、个性化的歌曲。Suno一直是人工智能音乐技术的领先者,开创了从一句话生成完整歌曲——包括歌词、乐器和歌声的能力。无需知道如何唱歌、演奏乐器或阅读音乐,就可以将音乐创意变成现实。Microsoft Copilot和Suno将处理所有繁重的工作,将歌曲与提示相匹配。这一合作将为创造力和乐趣开辟新的视野,使音乐创作变得人人可及。这一体验将从今天开始逐步推出,未来几周将逐渐扩大。
2.5英特尔第五代至强可扩展处理器发布,在CPU上跑AI更香了
发布日期:2023.12.19
主要内容:英特尔发布了第五代至强可扩展处理器,其AI味道越发浓厚。与第四代相比,训练性能提升多达29%,推理性能提升高达42%;与第三代相比,AI训练和推理性能提升高达14倍。这意味着现在若将不超过200亿参数的模型“投喂”给第五代至强® 可扩展处理器,那么时延将低到不超过100毫秒。此外,英特尔还推出了被称为四十年来最重大架构转变的酷睿™ Ultra,将其AI的power注入到消费级PC中,用于加速本地的AI推理。在英特尔长期扎根的各行各业AI实战应用方面,包括数据库、科学计算、生成式AI、机器学习、云服务等,也在第五代至强® 可扩展处理器的到来下得到了更大的降本增效。总的来说,第五代至强可扩展处理器可谓“诚意满满”,表现非常亮眼,背后所透露出来的正是英特尔在AI领域一直都非常重视落地的态度。
2.6摩尔线程:首个千卡智算中心落地
发布日期:2023.12.19
摩尔线程首个千卡智算中心落地,从算力到生态全面加速大模型发展
主要内容:摩尔线程KUAE智算中心在北京成功举办揭幕仪式,宣告国内首个以国产全功能GPU为基础的大规模算力集群正式投入使用。摩尔线程CEO张建中发布了旨在支持千亿参数大模型训练和推理的大模型智算加速卡MTT S4000和摩尔线程KUAE平台。该平台支持业界主流分布式框架,融合了多种并行算法策略,并进行了额外优化以提高通信计算并行和Flash Attention效率。
2.7 OpenAI公布ChatGPT安全框架,跟踪风险并建立严格安全基线
发布日期:2023.12.19
OpenAI公布ChatGPT安全框架:跟踪、评估、安全基线等 (chinaz.com)
主要内容:OpenAI于12月19日发布了ChatGPT等产品的安全框架测试版,称之为“准备框架”。该框架详细说明了OpenAI如何确保ChatGPT等大型模型的安全性,包括开发和部署流程。在框架中,OpenAI明确了四类可能带来灾难性后果的风险领域,包括网络安全、CBRN风险(化学、生物、放射性、核)、说客能力风险以及模型的自主能力风险。每个领域都有低、中、高、特别高四个等级,用于描述系统在该风险领域的危险水平。为了强化安全措施,OpenAI成立了“安全咨询小组”(Safety Advisory Group,SAG),该小组将监督风险评估工作并协助做出最佳安全决策。此外,OpenAI还设立了“准备团队”,专注于模型的安全研发和维护,与相关团队协调合作,确保有效的安全措施。
详细文件地址:https://cdn.openai.com/openai-preparedness-framework-beta.pdf
3.商业动态
3.1百度数字人生成专利公布
发布日期:2023.12.19
百度数字人生成专利公布,可赋予不同人格、像人类一样表达情感_腾讯新闻
主要内容:百度公布一项数字人生成专利,通过语言模型训练和三维建模,使数字人具备不同人格。该专利涉及计算机视觉、自然语言处理和深度学习,可应用于元宇宙等场景,提升数字人的交流与互动自然度。生成的数字人可像人类一样表达情感和意识,为人机交互提供更丰富、自然的体验。
3.2金融大模型面临落地挑战,厂商加强合作共建
发布日期:2023.12.19
金融大模型「落地战」,厂商如何跨越藩篱? - 知乎 (zhihu.com)
主要内容:自ChatGPT在2022年底引爆市场以来,金融行业成为大模型最热门的试验场之一。然而,金融机构面临着将大模型真正融入业务的挑战,这主要源于金融行业的数据敏感性和合规性要求。因此,大多数金融大模型仅停留在辅助层面,未能深度融入核心业务。
为了解决这些问题,金融机构和技术厂商正在加强合作,共同探索大模型的落地应用。他们正在制定标准规范,建立生态系统,以确保大模型在各个应用领域成功落地。同时,一些机构正在考虑引入第三方厂商的基础大模型,进行微调,以快速赋能业务流程,缩小与头部机构的技术差距。
更多推荐
所有评论(0)