第320章 AI芯片-《我真不是法爷》


    第(2/3)页

    实现了曲线的离散化。

    完美地减少了神经网络预测的成本。

    第二点,也是更关键的。

    正如林奇最初所推崇的硬件。

    TPU芯片直接封装了种种神经网络计算工具。

    诸如矩阵乘法单元,统一缓冲区,激活单元等,它们以后十数个高级指令组成,集中完成神经网络推理所需要的数学计算。

    同时它又采用了典型的RISC处理器为简单计算提供指令。它的矩阵乘法器单元而不是传统的标量处理器,得以在一个时钟周期内,以矩阵操作,完成数十万个操作。

    打个比方,传统CPU是逐行打印,而TPU芯片则能够做到影印效果。

    如此种种特性,让它在神经网络计算收敛方面拥有非凡的效果,曾经几天才能训练出的成功,现在一小时不到就能够完成。

    林奇不禁感慨万分。

    难怪说站在巨人的肩膀上就是爽。

    让他自己来设计,如何能够突破看似最简单的加法器这个关卡?

    万丈高楼平地起,曾经的林奇开发CPU时,第一步入门选择完成的模块便是加法器,因为它的原理最简单,也是最容易实现的操作。

    然而整个TPU芯片,居然本质上也是做加法器?

    它的核心便是由乘加器组合形成的256×256的运算器阵列:乘法矩阵。

    这种冥冥中的呼应,也让林奇有些哭笑不得。

    芯片,本质上便是一个一个模块搭建而成,区别在于有的人是3010片的20周年海德薇限定版,而有的则是630片的普通版。

    随着最为核心的乘法矩阵模块成型,它周围的模块也一步一步成型。

    林奇这一次彻底看懂这种结构后,也忍不住摇头惊叹,难怪只要4块TPU训练出来的人工智能棋手便能够大杀四方,让人类都在围棋这项技艺上都黯然失色。

    要知道一步几千块的旗舰机动辄5nm工艺,而TPU的工艺不过是28nm!

    甚至主频也才700Mhz,这种频率甚至得去上个世纪的486机子里寻找。

    但真的合适的时候,对方便是一切。

    与此同时,林奇发觉脑海里中的记忆宫殿,开始浮现出几篇关键的专利——《NEURAL NETWORK PROCESSOR》、《COMPUTING CONVOLUTIONS USING A NEURAL NETWORK PROCESSOR》……

    这些都是当初TPU所关联公开的专利。

    甚至整个脉络都已经无比明了。

    为了比GPU的计算还要快速,这款神经网络的专用处理器TPU,自然是越发极端!

    它进一步牺牲处理器的通用性,只专注于一种——

    矩阵运算。

    自然他也无法如CPU般支持各种应用程序。

    它唯一的用途,便是支持神经网络算法的大规模加减乘除运算。

    而这个设计的精妙所在,便在于当参数从内存加载到乘法器和加法器的局中后,TPU便继续从存储器加载数据A,随后每次加法时,计算结果都会传递下来,因此最终输出的数据是参数之间乘法结果的总和。这个过程,自己跳过了内存。

    林奇看着即将完工的TPU芯片,就好像他人生第一次要买车一般,当时甚至比买房还要激动,而车还没到的日子,他已经早早把一系列汽车用品采购完成,什么车衣车窗膜坐垫手机支架靠着行李箱垫之流。

    只有想象力无法触及的领域,就没有林奇买漏的点。

    眼下的TPU芯片也是如此,他已经思索着如何代入最终的法术模型芯片之中,怎么把这些彻彻底底的法术力量引导结合芯片使用。

    殊不知。

    在这即将凝聚的一刻,世界即将变天。

    ——

    “准备布置传送魔法阵。”

    “注意,九环传送法阵修改第一重作坐标。”

    “加大功率输出,必要时刻叠加法术。”

    “收到。”

    “正准备修正方位至深渊73层黑暗之井,目前干扰功率过大,建议进行屏蔽。”

    整个大厅内看似杂乱无章哄闹一团,但实际上准备投入传送的法师们都神色冷淡注意这一切。

    九环的传送法阵,也算是咒法系的另一颗宝石所在,只是它不如异界之门那般能够同时呼唤而来扳手,可实际上也更纯粹。
    第(2/3)页