?

基于Innovus的低功耗物理設計

2016-12-01 03:57王志鴻厲媛玥
電子技術應用 2016年8期
關鍵詞:布線低功耗時序

戈 喆,王志鴻,厲媛玥

(恩智浦半導體,江蘇 蘇州 215000)

基于Innovus的低功耗物理設計

戈喆,王志鴻,厲媛玥

(恩智浦半導體,江蘇 蘇州 215000)

為了減少芯片功耗,可靠的低功耗物理設計必不可少?;谛乱淮季植季€工具Innovus,分四個部分闡述了新的低功耗物理設計流程。這些內容包括:基于低功耗的物理庫設計;低功耗布局和優化、基于輸入向量的功耗優化;低功耗時鐘樹協同設計CCOPT(clock concurrent optimization);時鐘樹后低功耗優化。Innovus作為Cadence全新的布局布線工具,提供基于GigaOpt引擎的功耗驅動優化和高級時鐘樹協同優化(CCOPT)等方法,有效幫助設計者實現低功耗芯片設計。全新的低功耗物理設計可改善芯片數字邏輯15%功耗。

低功耗;物理設計;功耗驅動;時鐘樹協同設計

0 引言

高性能與低功耗是當今芯片設計的兩個主要方向。對于便攜式設備大力發展的今天、物聯網應用呼之欲出的明天,低功耗芯片的需求空前高漲,同時也對低功耗芯片的設計提出了更高要求。為了達到更低的功耗,越來越多的低功耗技術被應用到芯片中,比如電源關斷技術(Power Shut Off,PSO)[1]、多電壓域供電(Multi Supply Power,MSV)、多電壓與時鐘模式、動態電壓頻率調節技術(Dynamic Voltage Frequency Scale,DVFS)、存儲器分割(Memory Split)、門控時鐘(Clock Gating)[2]、門控數據線[3]、多閾值電壓設計(Multi-Vt)[4]、襯底偏壓調制技術(Back Bias)等。這些方法從芯片設計的各個層面實現低功耗,芯片物理設計是其中的重要一環。本文基于新一代布局布線工具 Innovus,在傳統低功耗物理設計流程的基礎上,研究了新的低功耗物理設計方法。

1 低功耗物理設計

芯片物理設計是指將芯片電路和代碼轉變為芯片版圖的過程,布局布線是芯片物理設計的核心,本文主要討論低功耗布局布線技術。

低功耗物理設計內容可以分為兩類,一類是對前端各種低功耗設計進行物理實現,比如在物理上對多電壓域進行劃分和布局;片上電源管理模塊和電源開關的放置和連線;通過CPF(Common Power File)控制電平轉換邏輯(Level Shifter)和隔離邏輯(Isolation Cell)的加入、電源連接、擺放和優化;時鐘門控邏輯的擺放與優化;掉電狀態保持寄存器(State Retention Power Gate,SRPG)電源線和單元行的布置等。另一類是在芯片物理層面(如版圖、標準單元甚至是器件級別)實現的低功耗設計,這類方法只能在芯片后端設計時實現,比如多閾值電壓標準單元庫選用,襯底偏壓調制技術,低功耗時鐘樹技術等。

低功耗物理設計的核心是與前端設計相配合,減少芯片內一切不必要的翻轉和電容充放電,減少乃至關斷芯片內不工作模塊的漏電,減少一切時序路徑上的性能冗余,以及提供多樣化的工作模式以避免在不同應用場合的功耗浪費。精巧的低功耗物理設計能夠在保證芯片性能的基礎上,有效改善芯片功耗。

2 基于Innovus的改進低功耗物理設計

Innovus是 Cadence公司的新一代布局布線工具,不僅加強了先進工藝和高性能芯片的設計能力,也為低功耗芯片設計提供了強大的功能。本文基于 Innovus,為90 nm低功耗 ARM核微控制器設計了新的低功耗布局布線流程,最終功耗改善超過15%。

2.1低功耗標準單元庫設計

好的芯片物理設計離不開一套與需求相匹配的標準單元庫,所以低功耗物理設計也需要一套低功耗標準單元庫。

2.1.1多閾值電壓單元

這是最普遍、也是最有效的方法,通過不同閾值電壓單元的搭配,達到芯片性能與功耗的平衡[4]。

2.1.2加長溝道單元與選擇性加長溝道單元

加長溝道單元(Gate Length Bias,GLB),又稱低漏電單元[5-6]。在數字標準單元電路設計中,通常晶體管的溝長都會選擇最小特征尺寸,以獲得最好的性能。但是在加長溝道單元中,所有晶體管的溝長都被加長,比如增加20%最小溝長,這是因為隨著半導體工藝越來越先進,晶體管漏電流所帶來的功耗比例越來越大,通過提高器件溝長,可以有效抑制器件短溝效應和漏致感應勢壘降低效應(DIBL),從而減小器件漏電。加長溝道單元通常應用在非關鍵時序路徑上,通過去除芯片中的冗余性能降低芯片功耗,這和多閾值電壓單元是一樣的道理。

但是,加長溝道單元有一個問題,它會提高芯片動態功耗。因為溝道加長以后,柵面積就會增加,相應的柵電容充放電就會增加,從而增加動態功耗。為了應對這個問題,新的標準單元庫引入選擇性加長溝道單元(Selective GLB)。選擇性加長溝道單元通過有選擇地對單元內關鍵漏電晶體管進行溝道加長,在有效減少漏電的同時將單元動態功耗和性能的損失降到最低。例如,在選擇性加長溝道寄存器中,所有與時鐘相關的晶體管都不能加長溝道以避免動態功耗大量增加,而所有在寄存器掉電狀態下進行狀態保持的晶體管都建議增加溝長,以減小芯片低漏電模式下的漏電功耗。

2.1.3多位寄存器

通過將多個(2、4個居多)關聯性高的寄存器合并成一個多位寄存器(Multi-bit Flip Flop),可以有效共享每個寄存器內的類同邏輯器件,減少寄存器時鐘端口相關聯電容,同時更少的寄存器數量也有助于實現更優的時鐘樹設計[7]。

2.1.4多尺寸梯度單元和極小尺寸單元

引入更多尺寸的標準單元能夠為工具提供更多選擇,有利于減少芯片在修復時序和轉換時間違例時的過量優化。而極小尺寸單元也提供了在某些場合進一步減少功耗的可能。

2.1.5延時單元和保持時序改善寄存器

延時單元(Delay Cell)可以提供大延時,專用于修復保持時序違例。但原有庫中某些延時單元提供大延時的效率并不理想,新庫對此進行了改進設計。

新庫通過設計特別的掃描路徑保持時序改善寄存器,減少系統保持時序違例,同時不影響系統功能路徑時序,改善芯片功耗[8]。

2.2低功耗布局與優化

一個好的布局和優化不僅需要考慮系統時序和布線擁擠程度,也需要考慮整個系統的功耗水平。在布局和優化階段,標準單元的選取、物理擺放、等價邏輯轉換、非關鍵路徑功耗優化以及系統的總加權繞線長度等因素都與系統的功耗息息相關,如何在保證系統性能和繞線的基礎上降低功耗是低功耗設計的關鍵。在這方面,Innovus的 GigaPlace和 GigaOpt引擎為設計者提供了強有力的支持。通過Innovus的功耗驅動(power-driven)布局和功耗驅動優化,可以有效開展三維驅動設計。

2.2.1布局與優化方法分析

為了達到最優效果,本文對Innovus進行了多項測試,結果如表1。

從表 1中可以看到,Innovus通過新的功耗驅動引擎,在沒有任何功耗優化的設置下,可改善總功耗3%。當引入更多的功耗優化選項后,功耗最大可改善近5%。設計者可以根據芯片的應用需要,對動態功耗和靜態功耗的優化比例進行選擇,工具可以根據選擇做出優化策略的改變。另外,Innovus可以在布局階段考慮時鐘樹特殊布線的需求(ndrAwareOpt),從而與時鐘樹之后的設計更加匹配。本文也注意到,Innovus提供的 “有用偏時”選項(usefulSkew)結果并不理想(本文也追蹤比較了時鐘樹之后的結果),需要進一步調試。

表 1顯示,當靜態優化程度(leakage power effort)很高時,功耗整體優化結果并不好。這其中的一個原因是90 nm工藝靜態功耗所占比例太低,另一個原因就是我們采用了加長溝道單元。加長溝道單元在大大降低器件漏電的同時,也會顯著提高器件的動態功耗。工具如果不能很好地從全局進行分辨取舍,就會影響功耗優化效率。所以本文給出的建議是,禁止在布局和優化階段使用加長溝道單元,引導工具更多地通過高閾值電壓單元和小尺寸單元優化靜態功耗。加長溝道單元可以在時鐘樹后有選擇的進行使用。

2.2.2輸入向量驅動功耗優化

動態功耗的產生與芯片的運行狀態息息相關,默認情況下,工具使用默認的翻轉率來進行動態功耗的估算,這會與實際情況有很大偏差,在這種情況下進行動態功耗優化,勢必影響功耗優化效率。Innovus支持輸入向量驅動(VCD driven)優化,本文測試結果如表2。

表2顯示,工具在有特定輸入向量驅動的情況下,可針對此輸入模式進行精準動態功耗優化(vector basedoptimization),從而有效改善(9.3%)此工作模式下的動態功耗優化效果。所以本文建議在進行芯片物理設計時,可以加入典型芯片工作模式輸入向量,幫助工具更好地優化芯片功耗。

表1 布局與優化測試結果

表2 輸入向量驅動功耗對比?。╩W)

2.3低功耗時鐘樹設計

時鐘樹綜合是低功耗物理設計的重要內容,因為即使廣泛采用門控時鐘,芯片時鐘系統還是占據了整個芯片數字邏輯約40%的功耗比重。通常低功耗時鐘樹的設計方法有:

(1)分析時鐘樹結構,設計合理時鐘樹綜合方案。

(2)設置合理的時鐘偏斜(clock skew)和轉換時間(transition)要求。

(3)嘗試不同緩沖器或倒相器時鐘樹方案,一般避免使用大尺寸(功耗大)和小尺寸(片上偏差 OCV大)單元。使用低閾值單元進行時鐘樹綜合。

(4)在片上偏差可接受范圍內,推薦多使用小尺寸門控時鐘單元。門控時鐘單元盡量靠近其驅動單元放置。

(5)使用電阻電容小的金屬層進行時鐘樹布線,使用多孔(multi-cut)布線。

(6)盡可能多地使用時鐘樹特殊布線,可有效減小時鐘樹電阻和耦合電容。

(7)使用多位寄存器。

現在低功耗時鐘樹的主流趨勢是時鐘樹綜合并不需要以“零時鐘偏斜”為目標。因為為了減小時鐘偏斜,時鐘樹上往往需要引入大量邏輯進行平衡,但很多時候這是沒有必要的,特別對于性能要求并不高的微控制器來說。允許時鐘偏差,對數據路徑和時鐘路徑協同優化,避免引入不必要時鐘樹邏輯,在滿足時序要求的同時減少功耗,這就是時鐘樹協同優化(CCOPT)的低功耗時鐘樹設計方法。

Innovus使用新一代CCOPT引擎,幫助設計者進行良好的時鐘樹協同優化設計。本文對兩塊芯片分別進行測試,結果分別如表3和表4。

由表3和表4可知,通過時鐘樹協同優化,可大大減少時鐘樹上的邏輯數量,從而有效減小時鐘功耗。雖然在后續時序優化中,數據路徑上引入的邏輯數量會有所增加,但由于數據路徑的翻轉頻率大大低于時鐘路徑,所以并不會對整體功耗產生太大影響。

表3CCOPT優化結果比較(芯片1)

表4CCOPT優化結果比較(芯片2)

2.4時鐘樹后低功耗設計

時鐘樹綜合后,芯片設計主要通過邏輯單元替換減少功耗。由于時鐘樹后芯片的時序計算越來越準確,這時可以通過減小邏輯單元尺寸、替換高閾值單元、替換加長溝道單元等方法進一步將非關鍵路徑上的冗余性能轉換為功耗節省。

設計者可以通過Innovus的動態功耗優化命令(opt-DynamicPower)進行單元替換,在滿足時序的前提下優化功耗,通過測試(表 5)可以看到這能夠帶來 2~3%的功耗改善。這一過程同樣支持輸入向量驅動,并能達到更優效果。

在繞線與繞線后優化階段,Innovus的功耗優化能力同樣得到改善,經測試與上一代工具相比,功耗減少1.4%。如果在繞線后進一步打開“面積優化”(area reclaim)選項,功耗能夠進一步改善4.6%。

在這個階段,設計者可以考慮替換更多加長溝道單元進入芯片以有針對性地改善芯片靜態漏電。通常而言,靜態節點和準靜態節點可以放心使用加長溝道單元,低翻轉率節點也可以考慮使用加長溝道單元,高翻轉率節點不能引入加長溝道單元,低漏電模式下不掉電的單元應考慮加長溝道(典型的如SRPG中的常開鎖存器)。

對于芯片中數量巨大的保持時序違例,設計者可以通過優化延時單元與緩沖器使用組合的方法來減少使用數量,降低功耗。

最后在時序違例基本干凈以后,能夠通過PBA(Path Based Analysis)方法進一步去除時序路徑上的性能冗余,減少不必要的功耗。這個步驟通常在靜態時序分析(STA)工具中進行,比如Cadence的Tempus。

表5 動態功耗優化結果比較?。╩W)

3 結論

本文借助于 Cadence新一代布局布線工具 Innovus,對傳統低功耗物理設計流程進行了全面優化。內容包含低功耗標準單元庫設計,低功耗布局和優化設計,低功耗時鐘樹設計和時鐘樹后低功耗設計。通過新的工具和方法,芯片數字部分功耗可改善15%,效果顯著。

[1]HUANG P,XING Z C,WANG T R,et al.A brief survey on power gating design[C].Solid-State and Integrated Circuit Technology(ICSICT),2010:788-790.

[2]ZHANG Y L,TONG Q,LI L,et al.Automatic register transfer level CAD tool design for advanced clock gating and low power schemes[C].SoC Design Conference (ISOCC),2012 International:21-24.

[3]GE Z,ZHANG J L,TAN M L.Module-based bus gating methodology in low power SoC design[C].27thIEEE International SOCC,Design Track Digest,2014:4-5.

[4]RAO S M,BHATNAGAR H.Power reduction technique using multi-vt libraries[C].System-on-Chip for Real-Time Applications,Proceedings.Fifth International Workshop,2005:363-367.

[5]GUPTA P,KAHNG A B,SHARRMA P,et al.Gate-length biasing for runtime-leakage control[J].IEEE Trans.Computer-aided design of integrated circuits and sysntems,2006,25(8):1475-1485.

[6]HU J P,WANG J.Standard cell design of a low-leakage flip-flop with gate-length biasing[C].ASIC(ASICON),2011 IEEE 9th International Conference,:361-364.

[7]SANTOS C,REIS R,GODOI G,et al.Multi-bit flip-flop usage impact on physical synthesis[C].Integrated Circuits and Systems Design(SBCCI),2012 25th Symposium,pp.1-6.

[8]GE Z,TAN M L.Scan-hold-timing-friendly flip-flop to improve chip routing and power[C].IEEE International SOCC 2015,Design Track Digest,Sep 2015:78-79.

Low power physical design in Innovus

Ge Zhe,Wang Zhihong,Li Yuanyue
(NXP Semiconductor,Suzhou 215000,China)

To reduce chip power,a reliable low power physical design is necessary.This paper introduces a improved low power physical design flow based on new PR(Place and Route)tool Innovus,from low power physical library design,to power-driven,vcddriven placement and optimization,to low power CCOPT(Clock Concurrent Optimization)design,and to more low power optimization after CTS.Innovus is Cadence next generation PR tool,which brings a lot of low power features to help designer implement low power design,such as GigaOpt power-driven optimization and advanced CCOPT.Improved low power physical design helps reduce 15%digital power of chip.

low power;physical design;power driven;clock concurrent optimization

TN402

A

10.16157/j.issn.0258-7998.2016.08.003

2016-06-16)

戈喆(1982-),男,碩士,主要研究方向:數字電路后端物理設計。

王志鴻(1980-),女,碩士,主要研究方向:數字電路后端物理設計。

厲媛玥(1977-),女,碩士,主要研究方向:數字電路后端物理設計和時序分析。

中文引用格式:戈喆,王志鴻,厲媛玥.基于Innovus的低功耗物理設計[J].電子技術應用,2016,42(8):21-24.

英文引用格式:Ge Zhe,Wang Zhihong,Li Yuanyue.Low power physical design in Innovus[J].Application of Electronic Technique,2016,42(8):21-24.

猜你喜歡
布線低功耗時序
基于Sentinel-2時序NDVI的麥冬識別研究
一種高速低功耗比較器設計
擺脫繁瑣布線,重定義家庭影院 Klipsch Reference Wireless 5.1
電子布線系統在工程中的應用
衛星固定站集成布線方案的優化設計
基于FPGA 的時序信號光纖傳輸系統
一種毫米波放大器時序直流電源的設計
DPBUS時序及其設定方法
ADI推出三款超低功耗多通道ADC
IDT針對下一代無線通信推出低功耗IQ調制器
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合