手撕友商7nm FPGA?英特爾“親兒子”上陣
在數(shù)據(jù)暴增的時代背景下,企業(yè)開啟了“數(shù)據(jù)搶灘戰(zhàn)”。當世界的一切都將以數(shù)據(jù)為中心,鐵打的算力和功耗就是在這場爭奪戰(zhàn)之中的一把好武器。
通用處理器雖說“什么都能算”,但在人工智能和深度學習等算法逐漸復雜化,可組合性的異構計算正成為主流。得益于FPGA的低時延、高性能、靈活性和極佳的總擁有成本,F(xiàn)PGA成為數(shù)據(jù)時代不可或缺的一名大將。
英特爾曾在2019年發(fā)布介紹其新旗艦產(chǎn)品Agilex FPGA,不同于以往,該系列產(chǎn)品將作為英特爾的全新品牌,而非Stratix的延續(xù)。
近期,Agilex FPGA已于2021年1月進行大規(guī)模量產(chǎn)出貨,在今年4月份,作為Ice Lake發(fā)布的一部分,相關細節(jié)也被逐一披露,其業(yè)界領先的能效和性能勢必能夠掀起新的浪潮。
性能遠超賽靈思Versal
Agilex FPGA是自英特爾收購Altera后推出的第一個全新高端FPGA系列,作為英特爾的“親兒子”,利用所有最好的技術堆料是必然的。從Agile(敏捷)+Flexible(靈活)的命名中,也不難看出這款產(chǎn)品將巔峰性地釋放FPGA器件自身獨特的敏捷性和靈活性。
這款性能到底有多強?實際上,Agilex FPGA的表現(xiàn)都已超出了英特爾自己的預估。英特爾數(shù)據(jù)平臺事業(yè)部副總裁可編程解決方案事業(yè)部(PSG)產(chǎn)品營銷和Enpirion電源產(chǎn)品事業(yè)部總經(jīng)理Deepali Trehan為記者介紹,此前英特爾對于這款產(chǎn)品的預期是比上一代14nm的Stratix 10高出40%的數(shù)據(jù)中心、網(wǎng)絡和邊緣應用的性能,但最新的數(shù)據(jù)顯示這款產(chǎn)品相比上一代高出了45%的性能。
除了和自己產(chǎn)品對比,這款產(chǎn)品也與7nm的賽靈思Versal進行了對比。根據(jù)英特爾的測試,Agilex FPGA比賽靈思Versal的邏輯結構性能功耗比高約2倍,換言之在每瓦性能上Agilex FPGA遠遠甩開了友商。Agilex FPGA也代表著全行業(yè)最佳的收發(fā)速率,達到了每秒116Gbps。我們現(xiàn)在的測試芯片還可以達到每秒 224Gbps。
而在算力方面,Agilex FPGA相比賽靈思Versal有超過50%的視頻IP性能提升。(英特爾® Agilex™FPGA Fmax/Versal Fmax 的幾何平均值= 1.5)
不止如此,Agilex還通過應用5個由Omnitek所開發(fā)的視頻IP塊與賽靈思Versal“同臺競技”。
Omnitek是一家主打視頻加速與推理的初創(chuàng)企業(yè),被英特爾所收購。Omnitek團隊基于Agilex FPGA的架構,僅僅改變了內存和DSP實例。通過與賽靈思Versal同臺對比同樣的視頻IP,更能凸顯Agilex FPGA的實力,而這5個視頻IP塊性能上Agilex FPGA均更勝一籌:
Warp圖像轉換器快32%;
OSVP 1X 可擴展視頻處理器快48%;
OSVP 8X 可擴展視頻處理器快33%;
MPVDMA 多端口視頻直接內存訪問快71%;
Combiner 視頻流合并快73%。
“堆料狂魔”英特爾
“所有人都認同,隨著數(shù)據(jù)中心迅速發(fā)展,需要提升性能來對抗顯著增多的數(shù)據(jù),但性能的提升并不意味著功耗的下降”,Deepali強調,數(shù)據(jù)中心客戶非常看重性能功耗比這一指標,越高的每瓦性能意味著能有更好的計算力和更少的能源消耗。
嵌入式、云計算、邊緣計算、5G正在驅動數(shù)據(jù)激增,但與此同時也可預見的是能耗不斷地增加,同時導致總擁有成本(TCO)的巨大攀升。這是缺乏可持續(xù)性的,也會對環(huán)境產(chǎn)生巨大影響。
“FPGA是一種非常好的能夠提升能源效率的架構,其應用跨越整個數(shù)據(jù)中心”,Deepali表示,F(xiàn)PGA最大的價值在于靈活性,靈活的加速特性使其可服務于云、網(wǎng)、邊緣的各種應用之中。
Agilex是專門為以數(shù)據(jù)為中心的世界設計的,目的是在數(shù)據(jù)的處理、存儲以及移動過程當中提供行業(yè)的領導力。
實際上,Agilex FPGA之所以能取得超過預期的性能和性能功耗比的背后是英特爾的瘋狂“堆料”,幾乎從頭到尾都是全新設計和優(yōu)化的。
第一,在設計上,Agilex FPGA是第一款端到端在英特爾全方位開發(fā)的FPGA,包括概念到設計、實施、驗證、生產(chǎn)制造全過程。
產(chǎn)品采用了能夠完美媲美制程節(jié)點轉換的技術10nm SuperFin技術;搭載第二代Hyperflex架構,該架構基于原14nm架構重新設計,并在資源布置上也進行了優(yōu)化,從而降低功耗和提高性能;重構的互連和平面布局可以減少負載并提高可預測性。以上這些最終都反映在性能和功耗的優(yōu)化上。
第二,在收發(fā)器設計上,采取了基于Chiplet的異構設計,因此可以針對具體應用需求,適用于任何代工廠、制程節(jié)點以及任何IP 開發(fā)商。Chiplet賦予了產(chǎn)品高度的自由,使得英特爾可以根據(jù)應用需求具體開發(fā)行業(yè)領先的功能,比如:可以實現(xiàn)每秒116Gbps收發(fā)器速率、CXL、PCIe Gen5等,包括最高可以支持224Gbps收發(fā)器速率的產(chǎn)品也在研究當中。
第三,在軟件上,英特爾對Quartus Prime軟件進行了極大的優(yōu)化提升,和AGILEX同步開發(fā)。英特爾開發(fā)了多個編譯流程來符合客戶不同的開發(fā)需求,比如設計之初,一些客戶需要非常密集的編譯流程,以便提升生產(chǎn)效率,還有一些客戶需要快速的故障排除,這些都通過多編譯流程的設計來實現(xiàn)。通過這樣的方式為客戶提供了多種選擇,以滿足提升運行時間以及快速故障排除方面的需求。
通過這些在軟件方面所付出的努力,將編譯時間下降了45%,同時又進行多達135種的Design Assistant規(guī)則,以便在規(guī)則方面實現(xiàn)好的控制。通過這些努力可以實現(xiàn)快速的編譯以及減少在FPGA方面的迭代的需求。所有這一切,有助于客戶提升他們的生產(chǎn)率。
英特爾的靈活優(yōu)勢遠不止此
如此頗具優(yōu)勢的產(chǎn)品,針對的將會是視頻與視覺的邊緣計算、5G網(wǎng)絡、數(shù)據(jù)中心三大數(shù)據(jù)激增的領域。Deepali為記者介紹,基于英特爾Agilex FPGA的解決方案具有巨大優(yōu)勢,這是因為它完全滿足硬件的靈活性以及對于硬件可擴展性的要求。
“其實跨越這三個領域,Agilex FPGA有一個非常大的共同優(yōu)勢,那就是極低的功耗。除了極低的功耗可以降低TCO之外,還有很多其他的方式降低客戶降低TCO。比如5G應用方面,它為運營商提供了硬件升級方面的多種選項,使其能夠優(yōu)化成本,同時在數(shù)據(jù)中心領域可以去為它提升和不斷變化的工作負載來進行適配”,Deepali這樣為記者介紹。
根據(jù)之前英特爾的介紹,Agilex Fpga包含F(xiàn)、I、M三個系列,在配置和性能依次提升。具體來說,F(xiàn)系列適用于廣泛應用,I系列適用于高性能處理器接口和帶寬密集型應用,M適用于計算密集型應用,主要是提供面向英特爾至強處理器的一致性連接、HBM 集成、增強型 DDR5 控制器和英特爾傲騰DC 持久內存支持。這種劃分之下,客戶擁有更多更靈活的選擇。
針對于這三個不同系列,Deepali表示,現(xiàn)在Agilex F系列已在量產(chǎn)當中;I系列在實驗室當中,且實驗結果非常好,預計將會在本季度向客戶發(fā)貨;M系列還在開發(fā)當中,目前并沒有公布量產(chǎn)時間。
除了在型號上擁有靈活的選擇性,眾所周知英特爾目前在開發(fā)Xe獨立顯卡,而Xe的目標市場和Agilex FPGA也有一定的重合性。對此,Deepali為記者解釋,“英特爾是全行業(yè)當中唯一一家可以全方位覆蓋所有的加速器架構的半導體公司,包括CPU、FPGA、GPU、Movidius和Habana。我們的全方位架構可以為客戶提供最廣泛的選擇,使他們可以得到最適合他們用例的加速器,所以這完全是基于應用的。有些應用可能更適合CPU+GPU,有些應用可能更適合CPU+FPGA,而在對系統(tǒng)靈活性需求非常高時FPGA會擁有最大的價值!
因此英特爾的方案將是全方位覆蓋的,而這一切都將在英特爾的一體化平臺oneAPI上可以統(tǒng)一進行開發(fā),使得開發(fā)者可根據(jù)自己的應用選擇CPU+GPU或CPU+FPGA,因為英特爾無法完全判斷未來市場會向著哪些方面發(fā)展,所以會提供統(tǒng)一的軟件流,由開發(fā)者自由選擇,是GPU還是FPGA還是哪一種加速器最符合他的需要。
實際上,記者也注意到英特爾除了FPGA產(chǎn)品,還擁有eASIC和ASIC產(chǎn)品。此前英特爾為記者介紹,現(xiàn)階段,F(xiàn)PGA和ASIC是“分工明確”的,可編程FPGA主要針對實施與加速要求最苛刻的算法階段,直到算法已經(jīng)非常成熟、并且最終確立下來之后,ASIC便可大面積實施在硬件之中。而eASIC又名為結構化ASIC,簡言之eASIC就是FPGA和ASIC的中間體,屬于更加偏向過渡態(tài)的產(chǎn)品,兼具靈活性和性能功耗。
因此,在如此強大的硬件加速器和一體化軟件平臺加持之下,英特爾的Agilex FPGA的優(yōu)勢更加凸顯,在此加持之下用戶的選擇面更寬,靈活性更強。加上此前英特爾推出的第三代至強(Xeon)可擴展處理器,配合旗下傲騰SSD、傲騰持久內存等,能夠釋放Agilex FPGA的最佳性能。
回歸Agilex FPGA本身,其強大的性能和功耗也勢必能夠徹底顛覆FPGA市場,這也是英特爾自身長期制程和封裝、架構、內存和存儲、互連、安全、軟件六大技術積累的結晶。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市