證明生成的過程中,約有60%的時間花在MSM上,其余時間由NTT/FTT主導。MSM和NTT都存在性能挑戰(zhàn),通常的解決辦法:
●MSM可以在多線程上執(zhí)行,從而支持并行處理。然而,當處理大型數據向量時,例如6700萬個參數,乘法運算可能仍然很慢,并且需要大量的內存資源。此外,MSM存在可擴展性方面的挑戰(zhàn),即使在廣泛并行化的情況下也可能保持緩慢。
●在算法過程中頻繁的數據混洗使得NTT難以在計算集群中分布,無法并行計算,并且由于需要從大型數據集中加載和卸載數據,在硬件上運行時需要大量帶寬。即使硬件操作很快,這可能也會導致速度變慢。例如,如果硬件芯片的內存為16GB或更少,那么在100GB的數據集上運行NTT將需要通過網絡加載和卸載數據,這可能會大大降低操作速度。
按照官方的設想和規(guī)劃未來在Aleo上每天的交易量都是上億美金的規(guī)模,在這樣大數據量的要求下,每時每刻都有證明需要被委托出去在極短的時間內完成證明的生產,不可能指望顯卡能解決這個問題。就像AI大模型訓練一樣,早期數據量和參數少的情況下可以用消費級顯卡,但是現在更多的都是為AI訓練設計的專用芯片和機器。
為了打破英偉達一家獨大的局面,前任全球芯片老大英特爾和多年老對手AMD對標CUDA都分別推出了OneAPI和ROCm,Linux基金會更是聯合英特爾、谷歌、高通、ARM、三星等公司聯合成立了民間號稱“反CUDA聯盟”的UXL基金會,以開發(fā)全新的開源軟件套件,讓AI開發(fā)者能夠在基金會成員的任何芯片上進行編程,試圖讓其取代CUDA,成為AI開發(fā)者的開發(fā)平臺。