證明生成的過程中,約有60%的時間花在MSM上,其余時間由NTT/FTT主導(dǎo)。MSM和NTT都存在性能挑戰(zhàn),通常的解決辦法:
●MSM可以在多線程上執(zhí)行,從而支持并行處理。然而,當(dāng)處理大型數(shù)據(jù)向量時,例如6700萬個參數(shù),乘法運算可能仍然很慢,并且需要大量的內(nèi)存資源。此外,MSM存在可擴展性方面的挑戰(zhàn),即使在廣泛并行化的情況下也可能保持緩慢。
綜上來看,內(nèi)存和帶寬是限制證明生成的主要瓶頸。對于顯卡來說,這里的內(nèi)存指的是顯存,并不是主板上的內(nèi)存,主板上的內(nèi)存主要是參與CPU的計算。當(dāng)然目前有些芯片技術(shù)可以打通主板上的內(nèi)存和顯存,讓內(nèi)存為顯存計算來用。
在分析之前,我們先看一下ASIC(Application Specific Integrated Circuit),中文全稱是“專用集成電路”。這里特別強調(diào)“專用”,“專用”意味著針對單一項目來說會更加有競爭力。相對比,GPU(顯卡)是通用計算處理芯片,所以在單一項目上來說“專用”肯定比“通用”更有競爭力。
為了打破英偉達一家獨大的局面,前任全球芯片老大英特爾和多年老對手AMD對標(biāo)CUDA都分別推出了OneAPI和ROCm,Linux基金會更是聯(lián)合英特爾、谷歌、高通、ARM、三星等公司聯(lián)合成立了民間號稱“反CUDA聯(lián)盟”的UXL基金會,以開發(fā)全新的開源軟件套件,讓AI開發(fā)者能夠在基金會成員的任何芯片上進行編程,試圖讓其取代CUDA,成為AI開發(fā)者的開發(fā)平臺。