發布成功
讚賞金額:
您輸入的金額有誤,請重新輸入
支付金額:5元
支付方式:
讚賞成功!
你的讚賞是對作者最大的肯定~?
FPGA,現場可編程門陣列,一種半定製的數字集成電路。FPGA 憑借其靈活性高、開發周期短、處理性能強(並行)等特點,廣泛應用於(yu) 通信、圖像處理、醫療等領域。隨著科技的進步,FPGA 在人工智能、5G 和自動駕駛等領域也有一席之地。但對於(yu) 大多數人來說,FPGA依然是神秘而陌生的。讓我們(men) 結合其在雲(yun) 計算行業(ye) 中的應用,簡單介紹一下。
什麽(me) 是FPGA?
通俗來講,它是一種芯片,和我們(men) 熟知的CPU、GPU、ASIC芯片一樣,有其自己的應用場景。FPGA(Field Programmable Gate Array)中文名現場可編程邏輯門陣列,是可編程器件,與(yu) 傳(chuan) 統邏輯電路和門陣列(如PAL、GAL及CPLD器件)相比,FPGA具有不同的結構,允許無限次的編程。
FPGA采用了邏輯單元陣列LCA(Logic Cell Array)這樣一個(ge) 概念,內(nei) 部包括可配置邏輯模塊CLB(Configurable Logic Block)、輸入輸出模塊IOB(Input Output Block)和內(nei) 部連線(Interconnect)三個(ge) 部分。
FPGA的優(you) 勢
近幾年人工智能、大數據各種web服務的規模在指數級的增長,而通用處理器(CPU)的摩爾定律的性能的提升遇到瓶頸。人們(men) 通過使用定製硬件來加速常見的計算任務,然而日新月異的行業(ye) 又要求這些定製的硬件可被重新編程來執行新類型的計算任務。FPGA的可編程屬性進入人們(men) 的視野。
通常,計算密集型任務,如:矩陣運算、圖像處理、機器學習(xi) 、壓縮、非對稱加密、搜索引擎的排序等。這類任務一般是CPU把任務卸載(offload)給FPGA去執行。對這類任務,目前我們(men) 正在用的Intel StraTIx V FPGA的整數乘法運算性能與(yu) 20核的CPU基本相當,浮點乘法運算性能與(yu) 8核的CPU基本相當。
Intel StraTIx 10 FPGA,配備更多的乘法器和硬件浮點運算部件,理論上可達到與(yu) 現在的頂級CPU旗鼓相當的計算能力。
在雲(yun) 計算數據中心,FPGA相比與(yu) CPU和GPU的核心優(you) 勢在於(yu) 延遲更低。各芯片的延遲對比,如下圖:
對通信密集型任務,FPGA相比CPU、GPU 的優(you) 勢就更大了。從(cong) 吞吐量上講,FPGA上的收發器可以直接接上40 Gbps甚至100 Gbps的網線,線束處理任意大小的數據包;而CPU需要從(cong) 網卡把數據包收上來才能處理,很多網卡是不能線束處理64字節的小數據包的。盡管可以通過插多塊網卡來達到高性能,但CPU和主板支持的PCIe插槽數量往往有限,而且網卡、交換機本身也價(jia) 格不菲。
從(cong) 延遲上講,網卡把數據包收到CPU,CPU再發給網卡,即使使用DPDK這樣高性能的數據包處理框架,延遲也有4-5微秒。更嚴(yan) 重的問題是,通用CPU的延遲不夠穩定。例如當負載較高時,轉發延遲可能升到幾十微秒甚至更高,操作係統中的時鍾中斷和任務調度也增加了延遲的不確定性。
FPGA在雲(yun) 計算的應用
雲(yun) 計算中心部署FPGA大致有三種場景:
1 專(zhuan) 用集群場景
FPGA服務器作為(wei) 專(zhuan) 用服務器裏麵插滿了FPGA加速卡,就像是一個(ge) FPGA組成的超級計算機。例如,某公司的實際應用一塊PCIe卡上放了6塊FPGA,每台1U服務器上又插了4 塊PCIe卡。
2 網絡集群場景
為(wei) 了保證數據中心中服務器的同構性,在每台服務器上插一塊FPGA,FPGA之間通過專(zhuan) 用網絡連接。
3 獨立節點場景
FPGA脫離服務器,作為(wei) 獨立的角色存在於(yu) 雲(yun) 計算集群中。把FPGA部署在網卡和交換機之間。如下圖所示,每個(ge) FPGA有一個(ge) 4 GB DDR3-1333 DRAM,通過兩(liang) 個(ge) PCIe Gen3 x8 接口連接到一個(ge) CPU socket(物理上是PCIe Gen3 x16接口,因為(wei) FPGA沒有x16的硬核,邏輯上當成兩(liang) 個(ge) x8的用)。物理網卡(NIC)就是普通的40 Gbps網卡,僅(jin) 用於(yu) 宿主機與(yu) 網絡之間的通信。
FPGA(SmartNIC)對每個(ge) 虛擬機虛擬出一塊網卡,虛擬機通過SR-IOV直接訪問這塊虛擬網卡。原本在虛擬交換機裏麵的數據平麵功能被移到了FPGA裏麵,虛擬機收發網絡數據包均不需要CPU參與(yu) ,也不需要經過物理網卡(NIC)。這樣不僅(jin) 節約了CPU資源,還提高了虛擬機的網絡性能,把同數據中心虛擬機之間的網絡延遲降低了10倍。
FPGA複用主機網絡的初心是加速網絡和存儲(chu) ,更深遠的影響則是把FPGA之間的網絡連接擴展到了整個(ge) 數據中心的規模,做成真正的cloud-scale 超級計算機。
關(guan) 於(yu) 必威官方网站手机網
必威官方网站手机網是一個(ge) 電子方案開發供應鏈平台,提供從(cong) 找方案到研發采購的全鏈條服務。找方案,上必威官方网站手机網!在方案超市找到合適的方案就可以直接買(mai) ,沒有找到就到快包定製開發。必威官方网站手机網積累了一大批方案商和企業(ye) 開發資源,能提供標準的模塊和核心板以及定製開發服務,按要求交付PCBA、整機產(chan) 品、軟件或IoT係統。更多信息,敬請訪問https://www.interviewcrusher.com