313游戏网 手游攻略 新游动态 燧 姚建国:新一代AIGC算力底座

燧 姚建国:新一代AIGC算力底座

时间:2024-05-12 14:00:33 来源:网络整理 浏览:0

大模型需要大算力,分布式聚合的系统级创新将构建新一代算力基础,赋能AIGC应用。

5月23日,36氪举办“颠覆·AIGC”产业发展峰会。 本次峰会汇聚行业力量,共同探讨企业和行业面对变革时的应对策略,分享思想,探索和发现行业中最具潜力的企业和最有价值的技术,在动荡的环境中探索前进的道路。 。

会上,绥远科技创新研究院。。、首席科学家姚建国教授发表了题为《新一代AIGC算力基础》的主题演讲,从算力角度分享了大型模型开发的经验。 姚建国教授坦言,大型模型的快速发展超出了预期。 两年前大模型的实现方案还不够清晰,但现在看来大模型有很多用处。 姚建国教授也表示,大模型的发展不是一朝一夕的事,计算能力是大模型发展的重要助推器。

同时,姚建国教授进一步指出,国内芯片技术和软件生态建设仍落后于国外。 首先,随着智能算力需求的增加,采用系统级设计解决大模型算力可能成为未来的发展方向; 其次,软件生态产业要打造国内软件生态圈,寻求与国际创新体系接轨。 最后,行业内部合作将加速算力基础设施的商业化进程,共同推动国内算力的发展。

以下为姚建国演讲实录(36氪整理编辑):

我在原科技和上海交通大学工作,所以我会从产学研的角度来分享整个算力视角。

事实上,算力主要分为四个层面:需求、场景、芯片、系统。 有多少朋友相信2022年左右会推出大型车型? 我和很多朋友分享过,讨论了整个大模型的后续发展。 大型模型确实存在计算能力的问题。 更大的模型真的能提高计算能力水平吗?

其实在2023年之前很多朋友都不相信这个问题,为什么呢? 因为我们本来有很多小模型可以解决我们的问题。 比如NLP、CV都是通过经典模型解决的。 模型越大,能力越强,泛化性越好,解锁新技能的能力也越好。 这是一个出乎很多人意料的期待。 最终到了2023年,现在很多人都相信了。 因此,很多发展原本就受限于算力、模型、软硬件的迭代交互结果。 这也是大家都熟悉的一个发展过程。

谷歌在2017年就提出将该机制引入学术界,整个开发过程经历了几代迭代。 整个过程不是一朝一夕就能完成的,模型是迭代完成的。 大模型一开始就存在巨大的风险。 他们自己也不太相信,或者怀疑它能走多远。 经过几代迭代,他们在去年底开始取得突破性成果。 所以我们还是希望国内能有一个标杆的通用模型让我们愿意付费使用,这对整个行业会有很大的推动作用。

计算能力在这个过程中扮演什么角色? 一般来说,大型模型有很多参数,而很多参数往往需要大量的计算能力。 比如公开文献中提到:天哪,这相当于一万张A100加速卡的算力水平。 可见,真正通用的大规模模型算力水平是通过大量的算力来实现的,因此投资巨大,风险巨大。

2020年之前,研究界一直关注模型,一些相关机制通过NLP解决,后来转移到CV。 当然,CV 的准确率还在不断提高。 从整个发展水平和发展格局来看,算力对整个大模型基础设施起到了重大的推动作用。 埃隆·马斯克想做的是先购买 10,000 张 GPU 卡。 这是基本配置。

算力有多种类型,包括通用算力、超级算力、智能计算等。 一般算力就是我们使用的云计算; 超级计算,例如天气预报和超级计算中心; 近年来,智能计算呈指数级发展。 超越摩尔定律的增长。 从2012年到2018年,AI训练算力增长了30万倍,而通用计算仅增长了7倍。 因此,从算力发展来看,目前的算力水平,包括算力需求,仍然是以智能计算为主导的计算发展趋势。

记得两年前去公司交流的时候,很多人都在问,大模型如何实现? 当时我并不知道,但现在看来,它可以在任何地方实现,所以很多发展是出乎意料的。 在这个突如其来的过程中,我们如何寻找规律,看待国内未来的机会? 我们可以沿着别人走过的路,找到其他的发展方向。 因此,整个发展就是产生动力、改变生产力的智能。 。

什么是生产力智能? 它可以帮助我们人类做很多事情,解决生产力问题。 我负责研究生。 在研究生培养方面,我们今年开始改变一些考试规则,比如研究生复试的安排。 如果GPT能做,研究生就不用学了。 这样一来,测试的内容基本上不等同于GPT能力。 人类仍然需要解决复杂的问题。 一般的基本智能可以留给机器。 其中很多都是生成能力,这会给大家未来很大的想象空间。

这是计算能力的要求。 不同的算力需求对应不同的大模型,基础大模型、场景大模型和应用大模型。 基本的大模型是非常基本的。 它是通过巨大的计算能力产生的。 它经过预先训练并有极大的计算能力支持。 这通常需要大型智能计算中心来完成,小型智能计算中心无法满足要求。

场景大模型是在大模型的基础上进行调优的。 可以应用于不同的应用场景,赋能不同的行业。 可以利用普惠训练计算能力来完成。

还有大的应用模型,主要是推理算力,是性价比比较高的算力。 现在推理有两种趋势。 一是云端推理,调用并返回; 另一个是客户端。 现在就有必要了,自己的大模型的部署开始在客户端做。

还有“模型即服务”。 这个已经发展了很长时间了,但是发展的不好。 事实证明,我们的AI是一种常见的自动化AI算法。 很多BAT都做过,但是使用后,客户反馈一般。 的。 但如果通过通用人工智能提供“模型即服务”,则可以带来不同的体验,例如文本生成图表。

所以我们都同意AIGC让大家体验到AI能力,这是非常重要的。 现在街上的任何人都可以谈论人工智能的能力,因为他们都体验过它。 这是许多模型即服务功能部署提供范围的地方。

我们再看一下芯片。 上个月,上海学界就“我们离大模型还差多少?”进行了讨论。 按照学术界的说法,至少落后一代,芯片当然也落后。 只有知道差距在哪里,我们才能迎头赶上。 无论是模型、算法,还是芯片能力,,,一直都在说追赶。

智能芯片仍由英伟达主导。 这是无可否认的事实。 而且,如果你看到全球AI芯片的增长,它正在快速增长,因为对智能计算能力的需求正在增加。 智能算力的主要芯片载体是AI计算加速。 卡无论叫GPU还是DSA,都是AI算力的具体计算。

从市场角度看,需求还是巨大的,但我们该怎么办? 事实上,我们需要深入审视历史发展,确定与我们未来发展道路的耦合程度,比如超级计算。 超级计算也是构建一个大系统,主要依靠互联网来解决大算力问题。 这样就可以实现百亿亿次计算。 其重要特点是单核能力较差,系统能力相当。 如果我个人打不过你,整个系统还是可以的,因为它达到了整体的算力。

未来智能计算将类似于核心芯片。 单个芯片的计算能力是有限的。 但包括互联在内的系统级设计,可以在智能计算层面解决大型模型的计算能力。 未来很可能会朝这个方向发展。

最近,许多研究和初创公司都在提出系统级创新,包括AMD和英特尔。 这是一种技术趋势。 系统级创新的问题来自于算力水平。 不是单单芯片就能解决的,必须通过系统解决方案来实现整个算力的改变。

目前存储和计算的性能提升不少,但带宽提升有限。 计算性能提升9万倍,带宽性能提升30倍。 这肯定是不匹配的,以后还会出现沟通瓶颈。 因此,我们需要解决在高速通信下实现高速互联,并通过高速互联实现可扩展的智能计算水平的问题。

另一方面,现在的耗电量太高,大家都知道智能计算中心实际上是高耗能行业。 为了解决这种节能计算,比如Intel做了7nm以下的数据传输,可以占到63%的能耗水平。 现在很多大型模型计算都是数据密集型计算,所以它们的能耗会非常高。 此外,大型模型需要特殊的加速。 我们刚才看到大型模型的发展可以追溯到谷歌2017年发表的一篇文章,那篇文章为模型提供了专门的算法,现在包括计算在内的各种加速设备都在做专门的加速。 针对特定的模型、特定的算子、特定的计算范式,可以做特殊的加速。 整个实现模型的计算能力将呈指数级增长。 这就是系统性的创新。

另外,从整个智能计算系统的发展趋势来看,芯片仍然需要大算力、高速互联网下的高算力,才能实现系统级的解决方案。 目前,单独的服务器或单独的集群无法解决大型模型的预训练,但推理仍然是可能的。 预训练时会有一些特殊的加速。 比如H100提供了引擎和低精度数据格式,也提高了算力利用率。 这里还有很多互联网创新,所以未来会有很多创新集中在系统层面。

此外,还有生态。 软件生态其实是我们这个行业最关心的事情。 前段时间我们讨论过,软件生态系统已经被提到很多年了。 为什么软件生态系统还没有成长起来? 现在大家都认为,要构建软件生态系统,第一步就是要支持国内包括研究界在内的软件生态产业,并与国际创新体系接轨。

因此,我们还是应该在开放软件生态系统中做一些类似于大模型编程的事情。 现在出现了新的编程模型,包括编程方法,支持更有效、更轻松地对大型模型进行编程。 这也是智能计算系统的发展趋势。

原科技是整个算力的基础设施和数字化基地,包括芯片、软件、系统,包括解决方案。 目前,AI芯片主要有两类,第二代训练和第二代推理。 现在已经实现了计算集群的整体部署。 由于集群需要高速互连,我们也实现了自己的高速互连协议来替代原来的协议。 这样可以实现多机多卡,实现1000张以上卡大规模互联下的集群算力。

同时,源还提供液冷智能计算集群解决方案,实现低能耗、高能效。 已在智能计算中心、泛互联网、智慧城市、金融等人工智能应用场景实现商用。 未来,我们还需要与业界朋友共同推动国内算力的发展,打造新一代AIGC的算力基础。

标题:燧 姚建国:新一代AIGC算力底座
链接:https://www.313yx.com//news/xydt/171527.html
版权:文章转载自网络,如有侵权,请联系删除!
资讯推荐
更多
  • 燧 燧原曜图面向AIGC规模化落地时
  • 燧 联宝科技交付联想首台可搭载国
  • 杀戮传世:四大凶器VS三大魔兵

    大家好,当时风靡一时的传奇世界之所以如此火爆,与它的PK机制是分不开的。由于绝大多数球员都是大个子的比赛,所

    2024-05-12
    问道加点:新手攻略

    问道手游是一款受欢迎的游戏,许多新手在开始玩时都会有困惑,比如在加点方面。玩家在加点时,需要注意一些细节,以

    2024-05-12
    仙境幻想隐藏任务:!

    哈喽,大家好,今天给大家带来的是即将上线的全新仙境传说手游, 作为一款基于经典PC游戏《仙境传说》改编的手机

    2024-05-12
    造梦西游3boss爆率:用造三的角色造四的法宝玩是什么体验#游戏

    再续天庭八戒上次不是打了通天令牌,今天打造金戒,前提我要先去打造一个玲珑玉。按照惯例先去爬塔刷一波灵魂,爬

    2024-05-12