人工智能正在許多新應用程序中部署,從提高性能、降低各種終端設備的功耗到發(fā)現數據移動中的異常情況。雖然大多數人都熟悉使用機器學習和深度學習來區(qū)分貓和狗,但新興的應用程序展示了如何以不同的方式使用這種能力。例如,數據優(yōu)先級和分區(qū)可用于優(yōu)化芯片的功率和性能,而無需人工干預。并且可以在整個設計和制造流程中使用各種類型的人工智能來捕捉人類無法捕捉到的錯誤或缺陷。但是所有這些新組件和功能也使設計芯片更加復雜,因為概率取代了有限的答案并且變量增加了。Rambus產品管理高級總監(jiān) Frank Ferro 表示:“當你將 AI 移到邊緣時,邊緣開始看起來像數據中心。基帶執(zhí)行許多相同的處理功能。在內存要求方面,我們看到很多 5G 客戶的帶寬不足,并希望在網絡邊緣使用 HBM。但是,網絡中有更多的可配置性,您可以管理工作負載,而不是去云端。平衡這些工作量非常重要?!?/span>盡管如此,正如 AI 芯片設計師所了解的那樣,AI 世界中沒有什么是簡單的。“在 AI 設計中,有許多問題需要回答,” Synopsys戰(zhàn)略營銷經理 Ron Lowman 說. “在人工智能設計中,有許多問題需要回答。你想處理什么算法?你的功率預算是多少?你想達到什么樣的精度?在圖像識別應用程序中,你可能不需要32位浮點處理器。低成本的16位圖像芯片可能很好。如果你只需要92%的精度,低成本芯片可能會降低你的總體預算。如果你知道你想實現什么,那么采用 IP 方法將有很多優(yōu)勢。您可以選擇正確的 AI 處理器、正確類型的內存(SRAM 或 DDR)I/O 和安全性。選擇正確的 IP 很重要,但進行建模和基準測試也將幫助開發(fā)人員優(yōu)化 AI 解決方案并減少錯誤?!?/span>對于任何高級芯片,設計挑戰(zhàn)都可能迅速增加,更多的變量需要更好的模型、更多的工藝步驟和更多的時間。弗勞恩霍夫 IIS設計方法負責人 Roland Jancke 說:“你從一個非常復雜的芯片將要執(zhí)行的概念開始,然后你會看到對芯片的不同部分是否有不同的要求。在過去,你只會設計一些東西,開發(fā)它,然后把它錄下來,看看它是否有效。那已經不可行了。現在需要一個集成的流程。從一開始,就需要考慮可能的故障模式。甚至可能需要從一開始就使用有限元方法進行仿真,這在過去通常沒有做過。過去,從非常粗糙的模型開始,并且想要集成的功能。因此如果你有一個 MATLAB 模型,那并不能反映芯片不同部分之間的物理交互。你需要在開發(fā)過程的早期整合不同的模型——物理模型、功能模型——看看你的概念是否足夠實用。”隨著移動部件的增多,這變得更加困難,特別是當這些塊針對特定數據類型和用例進行定制或半定制時。但好處是,更好的算法和計算元素還允許在更小的空間內處理更多數據,并且與過去的實現相比,功耗要低得多。反過來,這使得處理可以更接近數據源,在那里它可以用來確定哪些數據是重要的,在任何特定時間點應該在哪里處理這些數據,以及可以丟棄哪些數據。
一個轉折點
大多數這些變化本身是漸進式和漸進式的,但總體而言,它們允許在邊緣進行推斷和訓練,在邊緣,一系列異構體系結構開始出現。通過利用各種類型的神經網絡,可以為特定目的加快處理速度,為不同的應用提供不同的精度和精度。
對于任何執(zhí)行復雜算法和計算的 AI 芯片,都有幾個關鍵要求。首先,他們需要能夠并行處理數據,使用多個計算元素和寬數據路徑來減少延遲。在許多情況下,這還涉及一些與計算元素非常接近的局部內存,以及高帶寬內存。其次,這些設備需要針對尺寸、成本和功率預算進行優(yōu)化,這通常需要根據預計工作負載調整大小的高吞吐量架構。反過來,這需要一些權衡,需要針對特定用例進行平衡。第三,這些架構通常涉及混合處理器來管理復雜的數據流和電源管理方案,其中可能包括 CPU、GPU、FPGA、eFPGA、DSP、NPU、TPU 和 IPU。
“在設計中,開發(fā)人員需要考慮培訓、推理、低功耗、連接性和安全性的要求,”英飛凌物聯網、無線和計算業(yè)務部首席軟件產品營銷經理 Danny Watson 說,“種方法可以實現需要本地快速決策的新用例,同時滿足當今物聯網產品的功耗預算?!?Watson 指出,關鍵是收集正確的數據,以便應用程序可以利用這些數據,從而使他們能夠利用技術改進。
無處不在的人工智能
對于芯片公司來說,這都是一件大事。根據 Precedence Research 的最新報告,整個人工智能市場將從 2021 年的 870 億美元增長到 2030 年的超過 1.6 萬億美元。這包括數據中心和邊緣設備,但增長速度非??臁J聦嵣?,人工智能是當今如此熱門的領域,幾乎所有主要科技公司都在投資或制造人工智能芯片。它們包括蘋果、AMD、Arm、百度、谷歌、Graphcore、華為、IBM、英特爾、Meta、NVIDIA、高通、三星和臺積電。這個市場五年前幾乎不存在,十年前大多數公司都在考慮云計算和高速網關。但是隨著帶有更多傳感器的新設備的推出——無論是汽車、智能手機,甚至是內置某種程度智能的電器,正在生成如此多的數據,因此需要圍繞數據的輸入、處理、移動和存儲設計架構。“在人工智能應用中,正在部署各種技術,”Arteris IP高級技術營銷經理 Paul Graykowski 說?!白罱囊晃豢蛻糸_發(fā)了一種復雜的多通道 ADAS SoC,它可以處理四個傳感器數據通道,每個通道都有自己的專用計算和 AI 引擎來處理數據。同樣,新的 AI 芯片架構也會不斷變化,以滿足新應用的需求?!?/span>