news 2026/4/17 23:14:49

导航最新的生成式 AI 公告——2024 年 7 月

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
导航最新的生成式 AI 公告——2024 年 7 月

原文:towardsdatascience.com/navigating-the-latest-genai-model-announcements-july-2024-461f227f588f?source=collection_archive---------7-----------------------#2024-07-26

关于新模型 GPT-4o mini、Llama 3.1、Mistral NeMo 12B 以及其他生成式 AI 趋势的指南

https://medium.com/@tula.masterman?source=post_page---byline--461f227f588f--------------------------------https://towardsdatascience.com/?source=post_page---byline--461f227f588f-------------------------------- Tula Masterman

·发表于 Towards Data Science ·阅读时间 7 分钟·2024 年 7 月 26 日

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/2c1a54aec97e06bbaf4652cc58890eb2.png

图片由作者使用 GPT-4o 生成,展示不同的模型

引言

自 2022 年 11 月 ChatGPT 发布以来,几乎每周都有新的模型、创新的提示方法、创新的代理框架或其他令人兴奋的生成式 AI 突破。2024 年 7 月也不例外:仅在本月,我们就见证了 Mistral Codestral Mamba、Mistral NeMo 12B、GPT-4o mini 和 Llama 3.1 等模型的发布。这些模型在推理速度、推理能力、编程能力和工具调用性能等领域带来了显著提升,使它们成为企业使用的有力选择。

在本文中,我们将介绍最近发布的模型亮点,并讨论当今生成式 AI(GenAI)领域的一些主要趋势,包括增加上下文窗口大小、以及跨语言和跨模态的性能提升。

2024 年 7 月发布模型概述

Mistral Codestral Mamba

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/9ccaedb9551dbc596082350afb2a639e.png

图像由作者基于 Mistral AI Codestral Mamba 公告的结果创建

Mistral NeMo 12B

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/bff3c9eb1e34c83135461162a628694c.png

图像由作者基于Mistral AI NeMo 公告的结果创建

Mistral Large 2

GPT-4o mini

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/c9a13e62a7becc06958538e36a815f33.png

该图由作者根据Feynmans Learning Method结果绘制

Llama 3.1

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/450cbf33dfabb38a07c3b2ce3a1466a1.png

该图由作者根据Meta Llama 3.1 公告结果绘制

生成式 AI 模型的趋势

总的来说,所有规模的模型呈现出越来越强大的趋势,拥有更长的上下文窗口、更长的令牌输出长度以及更低的价格点。推动推理、工具调用和编码能力的提升反映了对能够代表用户执行复杂操作的代理系统的需求不断增加。为了创建有效的代理系统,模型需要理解如何分解问题、如何使用可用的工具以及如何在一次处理大量信息时进行调和。

最近,OpenAI 和 Meta 的公告反映了 AI 安全讨论的日益增加,两家公司展示了应对同一挑战的不同方法。OpenAI 采取了闭源的方式,通过采纳社会心理学和虚假信息领域专家的反馈以及实施新的训练方法来提高模型的安全性。相比之下,Meta 加大了其开源计划的力度,发布了新的工具,专注于帮助开发者减轻 AI 安全问题。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/323d506da8b3ee322752fc81dd3cf6d1.png

这张图片由作者使用 GPT-4o 创建,展示了一个闭源和开源模型竞争的竞技场。

结论

未来,我认为我们将继续看到通用模型和专业模型的进展,像 GPT-4o 和 Llama 3.1 这样的前沿模型将越来越擅长于分解问题,并在跨模态执行各种任务时表现得越来越好,而像 Codestral Mamba 这样的专业模型将在其领域中表现出色,并在处理更长上下文和微妙任务时变得更加得心应手。此外,我预计我们将看到新的基准,专注于模型在单次回合内同时执行多个指令的能力,以及越来越多的 AI 系统通过结合通用模型和专业模型协作执行任务。

此外,虽然模型性能通常是根据标准基准来衡量的,但最终重要的是人类如何看待模型的表现,以及模型在多大程度上有效地推动人类目标的实现。Llama 3.1 的发布包含了一张有趣的图表,展示了人们如何对 Llama 3.1 与 GPT-4o、GPT-4 和 Claude 3.5 的回答进行评分。结果表明,Llama 3.1 在超过 50%的示例中与其他模型平局,剩余的胜率大致在 Llama 3.1 和其挑战者之间分配。这一点具有重要意义,因为它表明开源模型现在可以在一个以前由闭源模型主导的领域中轻松竞争。

想要进一步讨论或合作?请通过LinkedIn与我联系!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 19:36:06

PCL2-CE社区版:打造你的专属Minecraft启动器终极指南

PCL2-CE社区版:打造你的专属Minecraft启动器终极指南 【免费下载链接】PCL2-CE PCL2 社区版,可体验上游暂未合并的功能 项目地址: https://gitcode.com/gh_mirrors/pc/PCL2-CE PCL2-CE社区版作为一款功能强大的Minecraft启动器,不仅提…

作者头像 李华
网站建设 2026/4/17 2:23:17

Unity实时翻译工具:XUnity.AutoTranslator全攻略

Unity实时翻译工具:XUnity.AutoTranslator全攻略 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator XUnity.AutoTranslator是一款专为Unity引擎游戏设计的实时翻译工具,能够实时转换游…

作者头像 李华