在上篇中,狂飆我們介紹了FPGA的隊中前面兩個特點:硬件可編程、并行與實時,狂飆也列舉了這兩個特點帶來的隊中諸多機會。在本文中,狂飆我們將繼續(xù)介紹另外兩個特點,隊中以集齊FPGA的狂飆四大特點和生存機會。
FPGA四大特點與生存機會(續(xù))
特點三:集成度高
FPGA從90年代就開始逐漸集成一些硬化功能模塊,隊中如SRAM塊,狂飆DSP塊,隊中高速串行收發(fā)器XCVR或叫Serdes,狂飆PCIe和以太網(wǎng)硬核,隊中DDR控制器,狂飆CPU,隊中后來集成了高速ADC/DAC,狂飆再后來集成了H.264/265 Codec,HBM,AI加速引擎AIE或叫NPU。
說到集成ARM處理器的FPGA SOC,賽靈思ZYNQ系列的成功堪稱史詩級,可以說在FPGA圈毫無對手。據(jù)不完全估計,賽靈思有接近一半銷售額來自ZYNQ和ZYNQ Ultrascale系列。甚至7納米的產(chǎn)品系列,全部都集成了ARM處理器,你不用都會覺得浪費。
「ZYNQ內(nèi)部結(jié)構(gòu)中的PL與PS」
Intel常年以x86盟主自居,因此旗下Altera對ARM首鼠兩端,SOC做的并不成功。最近幾年,集成RISC-V這種開源架構(gòu)處理器,在諸多方面變得越來越有吸引力,讓我們拭目以待。
我認為,這種集成仍然要有傳統(tǒng)FPGA邏輯才有意義,否則只是單純集成其他功能模塊,有無數(shù)商家可以做,F(xiàn)PGA廠家優(yōu)勢將不復(fù)存在。當(dāng)然,高集成度的成本也必須可控,如果像早期ZYNQ定價策略那樣,把高集成度當(dāng)奢侈品賣,一定曲高和寡,大部分客人就會轉(zhuǎn)而追求低成本而犧牲一定的集成度。比如國產(chǎn)ARM SOC+國產(chǎn)FPGA組合這幾年就比較火,且國產(chǎn)ARM SOC的性能和AI算力都很能打,性價比高。
隨著集成度一路走高,也給FPGA帶來了大量機會。
通用SOM核心板
當(dāng)FPGA SOC出現(xiàn)以后,有一種用法是把它做成SOM,即核心板,就像x86嵌入式應(yīng)用中的COMe那樣。通用核心板不分具體應(yīng)用,可以根據(jù)客戶的應(yīng)用自由定義,在工業(yè),醫(yī)療,儀器儀表等領(lǐng)域應(yīng)用廣泛。它具備普通ARM核心板的特性,也有FPGA部分的靈活性來自由定制其他功能。
「System on Module, SOM」
機器人,運動控制,PLC
FPGASOC結(jié)合了ARM處理器與FPGA邏輯單元,這種架構(gòu)讓工業(yè)控制應(yīng)用能夠在硬件和軟件之間實現(xiàn)高速高效協(xié)同工作。CPU可以運行PLC控制算法、機器人路徑規(guī)劃、運動控制算法等復(fù)雜的高層軟件任務(wù)。FPGA部分用于實現(xiàn)硬實時、低延遲的控制任務(wù),如信號采集、傳感器數(shù)據(jù)處理、PWM信號生成、運動軌跡控制等。FPGA的并行處理能力使得這些控制任務(wù)能夠在硬件層面高效達成。
由于FPGASOC的高集成度,實時性,靈活可定制,在運動控制和伺服驅(qū)動領(lǐng)域,搶掉了很多傳統(tǒng)工業(yè)處理器和DSP處理器的市場,在工業(yè)打印機,3D打印機,血液生化分析儀,ATM存取款機等機電一體的設(shè)備中都有合適的應(yīng)用場景。
「協(xié)作機器人」
醫(yī)療內(nèi)窺鏡,手術(shù)機器人
內(nèi)窺鏡是另一個集成度要求很高的應(yīng)用場景。通常內(nèi)窺鏡CHU(攝像探頭)里面會有一個FPGA做視頻接口和預(yù)處理,CCU(攝像主機)里面可以用FPGA做ISP,用硬核做H.264/265壓縮并存儲,部分高端系統(tǒng)會用FPGA做AI推理加速,增強圖像效果,提供輔助診斷。
手術(shù)機器人基本上就是內(nèi)窺鏡加精密機械臂控制,而據(jù)說手術(shù)機器人機械臂上面的馬達非常精密,與工業(yè)機器人完全不是一個量級。目前這部分依賴進口,以后或許可以國產(chǎn)替代。
車載激光雷達,毫米波雷達
最近幾年興起的車載激光雷達和毫米波雷達,由于體積受限,對系統(tǒng)集成度要求很高。舉例來說,FPGA SOC在車載毫米波雷達中主要承擔(dān)數(shù)字信號處理與系統(tǒng)控制的核心角色。PL部分負責(zé)TDC延時鏈生成,處理雷達信號,執(zhí)行快速傅里葉變換(FFT)、距離/速度解算等任務(wù)。PS部分負責(zé)系統(tǒng)管理、數(shù)據(jù)融合、通信與決策。ASIL C/D級別功能安全(FuSa)需要PL和PS協(xié)同工作,相互監(jiān)控。最后生成4D點云(距離、速度、方位角、高度),送往自動駕駛域控制器。
「車載激光雷達」
KVM坐席管理系統(tǒng)
大型指揮調(diào)度場所的坐席管理是一個有趣的市場。中低端的分布式KVM用普通的H.264/265 Codec就行,海思或Rockchip都可以,對延時和畫質(zhì)要求不高,這種應(yīng)用基本沒有FPGA啥事。而高端應(yīng)用,延時敏感,畫質(zhì)要求高的場景,就有FPGA用武之地了。FPGA SOC主打低延時高品質(zhì),首先自己內(nèi)嵌的H.264/265 Codec要夠好延時夠低,至少要支持42,可以做高質(zhì)量視頻深壓縮,也可以做預(yù)覽流,其次用邏輯部分做出淺壓縮(比如JPEG2000, JPEG XS),實現(xiàn)雙流。賽靈思ZUxEV推出時,也沒具體針對KVM應(yīng)用,但提高集成度會帶來意想不到的市場。
另外,相對于分布式KVM,光纖KVM就是另一個故事了。通常光纖KVM不采用視頻壓縮,用FPGA多通道Serdes實現(xiàn)大帶寬暴力傳輸,保證極低延時和無損畫質(zhì)。
「KVM坐席管理系統(tǒng)」
專業(yè)相機和編解碼器
在PTZ專業(yè)相機和視頻編碼器市場,與KVM的需求有點類似。他們通常也需要深淺雙流壓縮,比如Full NDI淺壓和H.264/265深壓。NDI用PL和PS部分實現(xiàn),H.264/265用Codec硬核搞定。
5G基站RRU
賽靈思的RFSOC DFE將數(shù)字前端(DFE)、ADC/DAC 和可編程邏輯整合在單一芯片中,減少外部元件依賴,極大地簡化了5G NR基站RRU的設(shè)計,成功吸引了一些客戶。Altera甚至ADI都在垂涎這一市場。
集成HBM的FPGA
大家都知道現(xiàn)在的GPU都集成了HBM(高帶寬內(nèi)存),有的FPGA內(nèi)部也集成了HBM。FPGA可以通過大量的并行處理單元同時執(zhí)行多個哈希計算任務(wù),結(jié)合HBM時,可以更有效地利用內(nèi)存帶寬,進行更高效的數(shù)據(jù)訪問和處理,非常適合數(shù)字貨幣挖礦。在超高端儀表和路由器的場景,在外掛DDR已經(jīng)不可行的情況下,帶HBM的FPGA也非常適用。同樣在廣播里面的安全播控應(yīng)用中,F(xiàn)PGA中HBM的大帶寬的存儲,可以用來實時存儲并過濾掉敏感內(nèi)容。
「HBM與處理器合封」
ACAP有什么用
當(dāng)FPGA集成了標(biāo)量處理器,如ARM,又集成了矢量處理器,如AIE或NPU,傳統(tǒng)的FPGA邏輯部分稱為自適應(yīng)處理器,這種異構(gòu)計算平臺還能叫FPGA嗎?賽靈思把它叫作ACAP,即“自適應(yīng)計算加速平臺”,但這個稱謂并不主流。
一個典型的異構(gòu)計算平臺,不能沒有矢量處理器,用來做矩陣運算或AI推理加速。典型的應(yīng)用場景是汽車自動駕駛,ACAP可以做自動駕駛域的主芯片。在醫(yī)療內(nèi)窺鏡中,NPU可以實時做圖像增強等輕量化的AI加速應(yīng)用,也可以用于增強現(xiàn)實(AR)與虛擬現(xiàn)實(VR)。內(nèi)窺鏡圖像可以與增強現(xiàn)實技術(shù)結(jié)合,實現(xiàn)精確的虛擬影像疊加。而在智能監(jiān)控和智能制造領(lǐng)域,ACAP也都可以找到合適的應(yīng)用。
特點四:新工藝,新接口
記得Altera的工藝專家曾自豪的說,我們和臺積電是緊密的排他合作伙伴,臺積電也喜歡用FPGA測試最新的工藝,然后再普及到其他品類的芯片上。那時FPGA總是緊跟最新工藝,很早就支持那些新的接口,因此會帶來很多新機會。后來,賽靈思和臺積電私下勾兌,完全不顧所謂的"排他"伙伴,以至于Altera在工藝上的優(yōu)勢不再。這跟AMD與Intel的情況非常相似,2017年以后,AMD拋棄自己剝離出來的芯片代工廠Global Foundry,倒向臺積電代工其主流處理器,新工藝成了其反攻Intel的重要優(yōu)勢。
二十多年前,Lattice收購的Lucent ORCA是業(yè)界第一個帶10G Serdes的FPGA,通信大廠趨之若鶩。盡管滿屏Bug,我們還是傻傻的研究了很長時間。不過真的是太難用了,否則就會被用在新產(chǎn)品上。這說明一個新的接口對FPGA的選用是很關(guān)鍵的,會先入為主帶來新的機會。現(xiàn)今的應(yīng)用,只有Serdes當(dāng)然是遠遠不夠的,因為很少會用私有協(xié)議跑Serdes,需要足夠多的接口IP來配合使用。
新工藝帶來新接口,新接口支持更大帶寬。讓我們從這幾個角度,來審視一下FPGA的機會。
視頻接口與接口轉(zhuǎn)換
FPGA其中一個重要應(yīng)用就是各種五花八門的接口轉(zhuǎn)換。這里的生存法則很簡單:誰有硬件,誰有IP,誰性價比高,誰就有市場。
當(dāng)年Lattice 帶3G Serdes的FPGA性價比最高,在視頻接口市場做得風(fēng)生水起,占據(jù)了大部分1080p(Full HD)及以下的市場。而等視頻到了4K時代,Serdes速度需求提升至 6G以上甚至12G,由于研發(fā)進度沒跟上,逐漸丟失了部分市場。反而賽靈思由于Serdes速度更高更穩(wěn)定以及對12G SDI, HDMI2.0的接口和IP支持,贏得了相當(dāng)一部分市場。
再比如Lattice就有個系列叫Crosslink,定義為專門的“視頻連接FPGA”,主要特點是硬化了MIPIDPHY,PCIe,USB等接口,用戶可以方便的實現(xiàn)視頻互連和轉(zhuǎn)接,市場接受度也不錯。最近也有FPGA廠家推出了硬化MIPI CPHY的產(chǎn)品,CPHY是三電平電路,實現(xiàn)難度比DPHY要大,率先支持CPHY也一定會搶得先機,在視頻轉(zhuǎn)接和測試測量市場先入為主。
新的視頻接口如HDMI2.1,DP1.4/2.1,STMPTE ST2110接口和IP,誰有誰就可能率先被采用。SLVS-EC接口常用于高速CMOS圖像傳感器與處理器之間的數(shù)據(jù)傳輸,單Lane可達10Gbps,對想接入高端SONY Sensor的用戶來說也必不可少,有的廠家也推出了免費IP,降低了客戶的使用門檻。
隨著視頻分辨率的不斷提升,對FPGA支持新接口的要求也在不停的提高。
測試測量儀表
由于FPGA可以并行控制多個測量通道,它非常適合用于高通量的自動化測試,特別是在半導(dǎo)體測試、電子設(shè)備性能驗證等場合。對FPGA來說,就是需要大帶寬,數(shù)據(jù)要“收得到,存的下,送得出”。不管是接收端,存儲端(DDR或HBM),還是發(fā)送端,都需要大帶寬。數(shù)據(jù)經(jīng)過采集,存儲,預(yù)處理,通常需要高帶寬的PCIe接口把測試數(shù)據(jù)上傳,送回x86或GPU做進一步處理,因此支持新的PCIe Gen4/5接口就有天然的優(yōu)勢。
在攝像頭模組和屏測試應(yīng)用中,支持MIPI CSI/DSIDPHY/CPHY標(biāo)準是必需的,一些高端屏采用HDMI和eDP接口,需要測試這些攝像頭和屏體就必須接入這幾種接口。在存儲器ATE測試市場,DDR5/LPDDR5的接口支持是必須的,且數(shù)量多多益善。100/400/800G以太網(wǎng)測試儀,也需要相應(yīng)的接口IP支持。
隨著帶寬需求不斷增長,新的接口標(biāo)準也不停的更新,高端市場拼的就是硬實力了。比如,在高速ADC/DAC接口處,JESD204B單Lane帶寬為12.5Gbps,而JESD204C單Lane達到32Gbps,誰的Serdes能穩(wěn)定的接上,這部分就是誰的市場,顯然高端市場對成本并不太敏感。
而PAM4 Serdes采用四電平傳輸,帶寬比NRZ(兩電平)高一倍,在波特率28Gbps時,單Lane帶寬可達56Gbps。在高端數(shù)據(jù)中心,光通信,無線通信,800G網(wǎng)絡(luò)測試儀中也有相當(dāng)多的應(yīng)用。
「NRZ和PAM4的眼圖示意」
小結(jié)
我們在上篇和中篇主要介紹了FPGA的四大特點以及這些特點帶來的主要市場機會。有了這些機會以后,F(xiàn)PGA就可以高枕無憂了嗎?事實并非如此。商場如戰(zhàn)場,陣地絕非一成不變,此消彼長時時刻刻都在發(fā)生。
下篇中,就讓我們一起聊聊FPGA面臨的困境,其五大硬傷以及可能的破局之策。
未完待續(xù)…
聲明:本文內(nèi)容全部來自業(yè)界資訊和個人理解,未涉及任何公司機密和客戶信息,僅供大家交流參考。