创建或修改目录:/www/wwwroot/104.219.215.234/data 失败!
【STD-218】ニューハーフダブルス 天使×小悪魔 沙織 もえ 开源=最广大模子!Llama3.1发布,扎克伯格:分水岭时刻 - 酒色网
情欲九歌十大禁片
你的位置:酒色网 > 情欲九歌十大禁片 > 【STD-218】ニューハーフダブルス 天使×小悪魔 沙織 もえ 开源=最广大模子!Llama3.1发布,扎克伯格:分水岭时刻
【STD-218】ニューハーフダブルス 天使×小悪魔 沙織 もえ 开源=最广大模子!Llama3.1发布,扎克伯格:分水岭时刻
2024-07-27 23:36    点击次数:133

【STD-218】ニューハーフダブルス 天使×小悪魔 沙織 もえ 开源=最广大模子!Llama3.1发布,扎克伯格:分水岭时刻

白交 发自 凹非寺量子位 | 公众号 QbitAI【STD-218】ニューハーフダブルス 天使×小悪魔 沙織 もえ

刚刚,LIama 3.1认真发布,登上大模子王座!

在150多个基准测试集中,405B版块的施展追平致使超越了现存SOTA模子GPT-4o和Claude 3.5 Sonnet。

也即是说,此次,最强开源模子即最强模子。

在此之前,Llama 3.1仍是被多番曝光线路,如今不错说千呼万唤始出来。

从今天运行,模子即可在官网陡立载使用,Meta AI应用可在线试玩。

更令辩论社区陈赞的是发布近100页瞩目论文,涵盖了创造Llama 3.1过程中的一切:预磨真金不怕火数据、过滤、退火、合成数据、缩放定律、基础要领、并行性、磨真金不怕火配方、磨真金不怕火后顺应、器用使用、基准测试、推理战略、量化、视觉、语音、视频……

HuggingFace首席科学家感触:如若你是从零运行辩论大模子,就从这篇论文读起。

小扎扎克伯格还在最新剿袭彭博社采访时专门嘲讽了一把OpenAI。

奥特曼的指示才能值得赞好意思,但有点讪笑的是公司名为OpenAI却成为构建闭塞式东谈主工智能模子的指示者。

小扎还专门为此撰写了一篇长文:开源AI是前进的谈路。

以往,开源模子在性能、功能等方面大多过期于闭源模子,但现在:

就像开源的Linux在一众闭源系统中脱颖而出得回普及,并逐渐变得更先进、更安全,领有比闭源系统更平淡的生态。我信赖Llama 3.1将成为行业的一个滚动点。

迄今为止,扫数Llama 版块的总下载量已高出 3 亿次,Meta亦然放下豪言:

这只是是个运行。

各大云厂商也在第一时候上线了的Llama 3.1的缓助,价钱是酱婶的:

LIama 3.1官廉正式发布

起头来看模子才能。

Llama 3.1将陡立文长度蔓延到 128K、加多了对八种谈话的缓助。

其中超大杯405B版块,在学问、可掌握性、数学、器用使用和多谈话翻译等才能方面都追平、超越了现存顶尖模子。

除此以外,也推出了8B和70B模子的升级版块,才能与同等参数下的顶尖模子基本执平。

再来看模子架构【STD-218】ニューハーフダブルス 天使×小悪魔 沙織 もえ。

官方先容,要在超15万亿个token上磨真金不怕火 Llama 3.1 405B模子挑战不小。

偷拍厕所女同学

为此他们大幅优化了扫数这个词磨真金不怕火栈,并把模子算力限制初次蔓延到了高出16000个H100 GPU。

具体来说,如故继承法式的仅解码器的Transformer架构,并作念一些轻浅编削;并继承迭代的post-traing经过,每轮都有SFT(监督微调)和DPO(平直偏好优化),以提高每个才能的性能。

与Llama以前的版块比较,他们提高了用于预磨真金不怕火和post-training数据的数目和质料。

而为了缓助405B这么尺寸模子的大限制坐褥推理,Meta将模子从16位(BF16)量化到8位(FP8)数值,有用地裁汰了所需的诡计需求,并允许模子在单个做事器节点内运行。

在指示微调方面,Meta还提高了模子对用户指示的反应才能、增强了它治服瞩目指示的才能,同期保证安全性。

在post-training阶段,Meta在预磨真金不怕火模子的基础上进行多轮对皆。

每一轮都包括监督微调(Supervised Fine-Tuning, SFT)、拒绝采样(Rejection Sampling, RS)和平直偏好优化(Direct Preference Optimization, DPO)。

他们使用合成数据生成来绝大部分SFT示例,并数次迭代。

此外,还继承了多种数据处理技巧来将这些合成数据过滤到最高质料。

谋略15T tokens使用Llama 2模子作念算帐和过滤,而代码和数学有关的数据处理活水线则主要模仿了Deepseek的法子。

除了最基本的笔据教唆词反应,Meta官方暗示,任何普通开发者不错用它作念些高等的事情,比如:

及时和批量推理监督微调针对特定应用评估模子执续预磨真金不怕火检索增强生成 (RAG)函数调用合成数据生成而这背后亦然由它的广大生态伙伴缓助。

小扎撰写长文:开源AI是前进的谈路

(以下由大模子翻译,摘取主体现实,如有遗漏造作宽宥更正!)

在高性能诡计的早期,其时的大型科技公司都进入巨资开发各自闭源的Unix版块。那时,很难思象除了闭源以外,还有其他道路约略滋长出如斯先进的软件。可是,开源的Linux操作系统最终赢得了平淡的宽宥——最初是因为它允许开发者解放地修改代码,本钱也愈加便宜;跟着时候的荏苒,Linux不仅变得愈加先进和安全,而且构建了一个比任何闭源Unix系统都要平淡的生态系统,缓助更多的功能。如今,Linux已成为云诡计和大无边移动开拓操作系统的行业法式基础,咱们扫数东谈主都因此享受到了更优质的产物。

我信赖东谈主工智能将以访佛的姿色发展。今天,几家科技公司正在开发最初的闭源模子。但开源正在飞速缩小差距。旧年,Llama 2只可与过期一代的模子相比好意思。本年,Llama 3与最先进的模子竞争,并在某些畛域最初。从来岁运行,咱们瞻望畴昔的Llama模子将成为行业中最先进的。但即使在那之前,Llama仍是在绽开性、可修改性和本钱效果方面最初。

今天,咱们正执政着“开源东谈主工智能成为行业法式”的标的迈进。咱们发布了Llama 3.1 405B,这是第一个前沿级别的开源东谈主工智能模子,以及校正版Llama 3.1 70B和8B模子。除了与闭源模子比较具有显赫更好的本钱/性能比以外,405B模子的绽开性将使其成为微归并蒸馏更小模子的最好采纳。

除了发布这些模子外,咱们正与一系列公司配合,以发展更平淡的生态系统。亚马逊、Databricks和英伟达正在推出一整套做事,缓助开发者微归并蒸馏我方的模子。像Groq这么的更始者仍是为扫数新模子构建了低延伸、低本钱的推理做事。这些模子将在扫数主要云平台上提供,包括AWS、Azure、Google、Oracle等。像Scale.AI、Dell、德勤等公司已准备好匡助企业继承Llama,并用他们我方的数据磨真金不怕火定制模子。跟着社区的增长和更多公司开发新做事,咱们不错共同使Llama成为行业法式,将AI的公道带给每个东谈主。

Meta起劲于开源东谈主工智能。我将详尽为什么我觉得开源是最好的开发堆栈,为什么开源Llama对Meta有公道,以及为什么开源东谈主工智能对天下有公道,因此是一个耐久可执续的平台。

为什么开源东谈主工智能对开发者有公道

当我与天下各地的开发者、首席实行官和官员交谈时,我正常会听到几个主题:

咱们需要磨真金不怕火、微归并蒸馏咱们我方的模子。。每个组织都有其独到的需求,最相宜的是使用不同限制的模子,这些模子不错笔据他们特定的数据进行磨真金不怕火或微调。对于开拓上的任务和分类任务,小模子足矣;而对于更复杂的任务,则需要大模子。现在,你不错诈欺最先进的Llama模子,用你我方的数据不竭磨真金不怕火它们,然后将它们蒸馏成一个最相宜你需要的模子尺寸——而无需让咱们或任何其他东谈主看到你的数据。咱们需要适度我方的走时,不要被收尾在闭源供应商那处。很多组织不但愿依赖他们无法自行运行和适度的模子。他们不但愿闭源模子提供者约略变嫌模子、修改使用条件,致使全都罢手做事。他们也不思被收尾在惟有一个云平台领有模子独家使用权。开源允许平淡的公司生态系统治有兼容的器用链,使你不错减弱地在它们之间迁徙。咱们需要保护咱们的数据安全。很多组织处理明锐数据,需要加以保护,不成通过闭源模子的云API发送。还有一些组织根底不信任闭源模子提供者处理他们的数据。开源通过允许你在职何方位运行模子来管理这些问题。无边觉得,开源软件正常更安全,因为它的开发过程愈加透明。咱们需要一个运行效果高且职守得起的模子。开发者不错在我方的基础要领上,以大致使用闭源模子如GPT-4o一半的本钱,运行Llama 3.1 405B的推理,不管是面向用户的如故离线推理任务。咱们但愿投资于将成为耐久法式的生态系统。很多东谈主看到开源的发展速率比闭源模子快,他们但愿设立他们的系统在将给他们带来最大耐久上风的架构上。为什么开源东谈主工智能对Meta有公道

Meta的交易样式是为东谈主们创造最好的体验和做事。为此,咱们必须确保恒久约略获取最好技巧,何况不会被锁定在竞争敌手的闭源生态系统中,从而收尾了咱们的更始才能。

我的一个弥留履历是,由于苹果对咱们在其平台上约略构建的现实有所收尾,咱们的做事受到了制约。从他们对开发者纳税的姿色,到他们粗略应用的法规,再到他们遏制发布的扫数产物更始,很彰着,如若咱们约略构建产物的最好版块,而竞争敌手无法收尾咱们的更始,Meta和其他很多公司将约略为东谈主们提供更好的做事。从玄学上讲,这是我肯定在东谈主工智能和AR/VR中为下一代诡计构建绽开生态系统的主要原因。

东谈主们正常问我是否挂牵通过开源Llama废弃技巧上风,但我觉得这忽略了大局,原因有几个:

起头,为了确保咱们约略获取最好技巧,何况耐久不会被锁定在闭源生态系统中,Llama需要发展成为一个完竣的器用生态系统,包括效果晋升、硅片优化和其他集成。如若咱们是独一使用Llama的公司,这个生态系统就不会发展起来,咱们的施展也不会比Unix的闭源版块更好。

其次,我瞻望东谈主工智能的发展将不竭格外具有竞争力,这意味着开源任何特定模子并不会在其时予以比下一个最好模子更大的上风。Llama成为行业法式的谈路是通过执续保执竞争力、效果和绽开性,一代又一代地发展。

第三,Meta与闭源模子提供者的一个要道分别在于,出售对东谈主工智能模子的窥察并不是咱们的交易样式。这意味着公开发布Llama并不会削弱咱们的收入、可执续性或辩论投资才能,而这对于闭源提供者来说则否则。

终末,Meta有着耐久的开源技俩和得手的历史。咱们通过发布做事器、收集和数据中心遐想,并让供应链法式化咱们的遐想,通过Open Compute技俩省俭了数十亿好意思元。咱们通过开源诸如PyTorch、React等最初器用,从生态系统的更始中受益。耐久坚执这种法子对咱们恒久有用。

为什么开源东谈主工智能对天下有公道

我信赖开源对于结束积极的东谈主工智能畴昔至关弥留。东谈主工智能比任何其他当代技巧都有更大的后劲来晋升东谈主类的坐褥力、创造力和糊口质料——并加快经济增长,同期推进医学和科学辩论的高出。开源将确保寰球更多的东谈主约略得回东谈主工智能的公道和契机,权柄不会集中在少数公司手中,技巧不错更均匀、更安全地在社会中部署。

对于开源东谈主工智能模子的安全性正在进行狡辩,我的意见是开源东谈主工智能将比替代有贪图更安全。

我联合安全框架是咱们需要提神两类伤害:不测的和有意的。不测的伤害是当一个东谈主工智能系统可能会变成伤害,即使运行它的东谈主没挑升图这么作念。举例,当代东谈主工智能模子可能会不测中给出不良的健康提倡。或者,在更具畴昔感的情状中,一些东谈主挂牵模子可能会不测中自我复制或过度优化贪图,从而损伤东谈主类。有意伤害是当一个不良活动者使用东谈主工智能模子以达到变成伤害的办法。

值得肃肃的是,不测的伤害涵盖了东谈主们对东谈主工智能的大无边担忧——从东谈主工智能系统将对数十亿使用者产生什么影响,到对东谈主类来说果真晦气性的科幻情状的大部分。在这方面,开源应该更安全,因为系统更透明,不错平淡审查。从历史上看,开源软件因此更安全。相同,使用Llama格外安全系统如Llama Guard可能会比闭源模子更安全、更可靠。因此,对于开源东谈主工智能安全性的大无边对话都集中在有意伤害上。

咱们的安全经过包括严格的测试和红队,以评估咱们的模子是否有才能变成要害伤害,贪图是在发布前裁汰风险。由于模子是绽开的,任何东谈主都不错我方测试。咱们必须记取,这些模子是由仍是在收集上的信息磨真金不怕火的,是以当探讨伤害时,开头应该是模子是否能促进比从Google或其他搜索驱散中快速检索到的信息更多的伤害。

当你探讨畴昔的机遇时,请记取,现时大无边最初的科技公司和科学辩论都是设立在开源软件之上的。如若咱们共同投资,下一代公司和辩论将使用开源东谈主工智能。

最弥留的是,开源东谈主工智能代表了天下上诈欺这项技巧为每个东谈主创造最大经济契机和安全的最好契机。

让咱们一皆成立

对于夙昔的 Llama 模子,Meta 是我方开发然后发布的,但并莫得过多热心构建更平淡的生态系统。此次发布咱们采纳了不同的法子。咱们正在里面组建团队,让尽可能多的开发东谈主员和配结伙伴约略使用 Llama,咱们也在积极设立配结伙伴关连,以便生态系统中的更多公司也能为其客户提供独到的功能。

我信赖Llama 3.1 的发布将成为行业的一个滚动点,大无边开发东谈主员将运行主要使用开源,何况我瞻望这种法子只会从现在运行发展。我但愿你能加入咱们的旅程,将东谈主工智能的公道带给天下上的每个东谈主。

最新采访衔接:https://x.com/rowancheung/status/1815763595197616155

参考衔接:[1]https://about.fb.com/news/2024/07/open-source-ai-is-the-path-forward/[2]https://ai.meta.com/blog/meta-llama-3-1/【STD-218】ニューハーフダブルス 天使×小悪魔 沙織 もえ



创建或修改目录:/www/wwwroot/104.219.215.234/data 失败!
JzEngine Create File False