每日一看大模型新闻(2023.11.28)南加州大学发布提示工程新方法;中文大模型SuperCLUE基准测评报告2023,暨ChatGPT发布一周年特别报告;英伟达发布HelpSteer:开源数据集
1.产品发布
1.1 Stability AI推出文生图模型SDXL Turbo
发布日期:2023.11.28
Introducing SDXL Turbo: A Real-Time Text-to-Image Generation Model — Stability AI
主要内容:Stability AI推出SDXL Turbo的新型文本到图像生成模型。该模型基于逆向扩散蒸馏(ADD)技术,将图像生成步骤从50步减少到1步,同时保持高采样保真度,实时输出文本到图像。SDXL Turbo还大幅提升了推理速度,在A100上,它可以在207毫秒内生成一幅512x512的图像,其中67毫秒用于单个UNet前向评估。用户可以在Stability AI的图像编辑平台Clipdrop上观看SDXL Turbo的测试版演示。目前,用户可以免费试用该模型,并提供模型权重和代码下载,以非商业研究许可证发布,允许个人和非商业使用。
Hugging Face下载地址:
https://huggingface.co/stabilityai/sdxl-turbo
ADD论文地址:
https://stability.ai/s/adversarial_diffusion_distillation.pdf
1.2沃尔玛联合Peacock推出“购买当下”AI服务,实现电视节目中物品识别购物
发布日期:2023.11.28
沃尔玛Walmart推出“识图购物”功能 利用AI辨识电视节目内物品并提供购买链接| 科技讯
主要内容:沃尔玛宣布与串流平台Peacock合作推出“购买当下”AI服务,利用人工智能技术识别电视节目中的物品,并与沃尔玛商品目录进行对比,为用户提供购买链接。此举是沃尔玛继去年与Roku合作推出电视购物广告后的又一尝试,致力于整合购物体验与娱乐内容。用户在暂停电视节目时,将看到沃尔玛商品链接,需通过手机扫描二维码在沃尔玛App中完成购买。这一创新将进一步提升沃尔玛在零售业的数字化竞争力。
1.3英伟达发布HelpSteer:开源数据集助力构建自定义LLM
发布日期:2023.11.28
NVIDIA推出HelpSteer:构建实用大语言模型的开源数据集 | ATYUN.COM 官网-人工智能教程资讯全方位服务平台
主要内容:英伟达最近推出了NVIDIA NeMo SteerLM技术,并开源了HelpSteer数据集,为开发人员提供了构建自定义语言模型的工具。这项技术允许用户在推断过程中控制大型语言模型的响应,通过与Scale AI合作,团队创建了包含多属性注释的HelpSteer数据集,为开发者提供更大的灵活性和可控性。
项目地址:https://huggingface.co/datasets/nvidia/HelpSteer
2.技术更新
2.1南加州大学发布提示工程新方法
发布日期:2023.11.28
比「让我们一步一步思考」这句咒语还管用,提示工程正在被改进_进行_推理_模型
主要内容:大语言模型可以通过元提示进行自动提示工程,但需要正确的指导以发挥其潜力。为解决手动尝试和试错问题,研究者提出了一种新的元提示方法,指导大语言模型更有效地执行提示工程。该方法引入逐步推理模板和上下文规范等元提示组件,明确指导大语言模型在提示工程中进行推理。该方法在两个数学推理数据集上实验,表现最佳,但也有一些局限性和失败案例。
论文地址:https://arxiv.org/pdf/2311.05661.pdf
2.2微软Copilot将升级至GPT-4 Turbo
微软Mikhail Parakhin推文揭秘:Copilot将升级至GPT-4 Turbo-人工智能-ITBear科技资讯
主要内容:微软广告和网络服务负责人Mikhail Parakhin最近在X上表示,他们的团队正在积极改进Copilot(Bing Chat),并计划将其升级到OpenAI的GPT-4 Turbo上。Parakhin说,在升级到GPT-4 Turbo之后,输入字符长度将进一步提高,目前最高输入字数为4000字。
3.商业动态
3.1中文大模型SuperCLUE基准测评报告2023,暨ChatGPT发布一周年特别报告
发布日期:2023.11.28
中文大模型SuperCLUE基准测评报告2023,暨ChatGPT发布一周年特别报告
主要内容:SuperCLUE发布了《SuperCLUE中文大模型基准测评报告,2023》。该报告基于过去一年对国内外大模型发展趋势和综合效果的实时跟踪,通过多维度综合性测评,对国内外大模型发展现状进行观察和思考。报告指出,目前国内外大模型的差距依然明显。其中,GPT-4 Turbo以总分89.79分遥遥领先,高于国内所有大模型及国外代表性大模型。
SuperCLUE官网地址:SuperCLUE
更多推荐
所有评论(0)