解決磊晶層厚度均勻度的非線性模式


矽厚度均勻度是以化學氣相沉積(CVD)法成長磊晶層(epitaxial layers)的一種品質特性衡量指標,半導體廠的工程師都依賴試誤(嚐試與錯誤)方式的經驗,以改善厚度均勻度。最近10至12年所報導的一些新式線性模式分析技術,在定量描述製程變數對沉積層厚度分佈的影響時,能提供顯著的優點,而且成功的應用於許多的製程上。於此所描述的案例,則顯示非線性技術能較線性模式提供一個數量級的精確度。
磊晶圓(Epitaxial silicon wafers)通常作為個別電子元件(discrete electronic devices)、積體電路(ICs)以及微機電元件製程的基材,磊晶層並以化學氣相沉積法進行沉積。視其應用,磊晶層的厚度變化可從小於1微米到大於100微米,在某些狀況,降低磊晶層厚度變異性為首要之務,包括晶圓間與晶圓內的變異。此種結構都在水平式單晶圓反應器內製造,反應器有足夠的穩定度與適應性以減少厚度變異。對普通厚的磊晶層,使用1100~1150蚓的常壓製程,並以氫氣為載氣(carrier gas),三氯矽烷(Trichlorosilane, TCS)為氣體源(source gas)。此種製程能以3.5~5微米/分的沉積速率達到相當高的產能。
磊晶層的成長速率受載氣中的溫度與TCS濃度影響,同時由於其高製程溫度,成長速率主要受到含矽物種(silicon containing species)在氣流(gas stream)邊界層擴散的限制,邊界層厚度為氣體速度的函數,所以即使TCS莫耳分率(mole fraction)保持固定,如果載氣流動速率改變,沉積速率即改變。另外,成長速率在氣體流動方向強烈變化。基本上,晶圓前緣(leading edge)的局部成長速率可能以25%~35%的比例高於晶圓後緣(trailing edge)。
為了獲得良好的厚度均勻度,晶圓在沉積過程中必須旋轉,所以厚度分佈會形成徑向對稱(radially symmetric),藉著晶圓溫度分佈的改變,可稍稍調整徑向厚度分佈。不過對於穩定的製程,主要是藉著氣流橫向速度分佈(lateral velocity profile)的改變進行調整,同時也改變了橫向邊界層厚度與局部沉積速率。為了進行此種速度分佈控制,所使用的反應器(ASM Epsilon)裝配了五只可調噴嘴。實際上,僅有三個可調參數,因為流動型態經常儘可能的維持對稱,以避免在成長腔體內的可能逆流效應(backstreaming effects)。所以噴嘴1與噴嘴5有相同的開口尺寸,噴嘴2與噴嘴4亦然,依據圖一的術語,I1 = I5, I2 = I4。
化學氣相沉積製程模式分析
即使是幾何型態最簡單的反應器,化學氣相沉積的物理模式分析也是相當複雜與費時,同時經驗模式(empirical modeling)的常用統計技術為線性方式,而且表現並不佳(參考小宮山等所評論用於CVD製程的數學模式[1])。
化學氣相沉積製程的模式分析,於1980年代傳統上是利用計算流體動力學完成,當時由於一些充分的理由,人們並不滿意經驗模式。於彼時,計算能量剛剛達到能運算一些處理時間與空間的偏微分方程式。
有限元素法於1980年代仍相當新穎,尤其應用於實際的工程問題時。另一方面,因為經驗模式並不具備以類神經網路(artificial neural networks)發展的新技術所擁有的優點,所以經驗模式的效果並不好。
儘管大自然並不以線性方式的簡單性運作,線性技術支持者仍利用於線性迴歸加入非線性項的簡單性與可行性。然而,加入了非線性項經常還是無法達到目標,即使做到了,也無法充分近似。
目前非線性經驗模式分析於製程改善較物理模式分析更為可行。因此,可以應用例如類神經網路的非線性模式分析新技術。此技術具備了所謂的泛用近似能力(universal approximation capability) [2],足以適用於大部分製程業界所遇到的功能近似需求。於發展此模式時,使用者無須知道非線性的型態與嚴重性。
類神經網路
類神經網路在結構與較小範圍的功能上,都類似生物系統的神經元網路。如同腦部的神經元網路,類神經網路包含了在層狀組織內的神經元,此些神經元指向鄰近層的神經元,並與之連接(圖二)。
製造業界使用多種類型的類神經網路已達十年之久,經常使用於製程控制與產品研發─以及其他實際的應用上[3, 4]。最常見的多層認知(multilayer perceptron)網路為前饋(feedforward)神經網路的一種;業界最常應用的神經網路[5-13]也都基於此型態。非線性模式也能以許多方式達成。
於前饋神經網路(feedforward neural network),每個神經元i的輸出為:
於此活化函數(activation function)經常為logistic S型(sigmoid)函數,能以下式表示:
進入神經元的輸入訊號為xj,wij為每一個輸入訊號連結到第i個神經元的權值,wio項稱之為偏差參數,因此產生了連接輸入變數與輸出變數的一組代數方程式。所以對每個觀察值(一組輸入與輸出變數),依據所給與的權值,從此些方程式可預測其輸出。訓練過程目的在找出產生預測誤差平方總和最小值的權值。
目前有多種訓練方法正在使用中,逆傳遞(Back-propagation)方法為約十年前最常使用的訓練方法,現今最常使用像Levenberg- Marquardt method [14-16]此種非常好的最佳化方式。
線性與非線性模式分析的比較
非線性模式分析為經驗式或半經驗式的模式分析,模式至少將一些非線性置入分析考量。為了僅可能從有限的數據、或者從數據稀疏的訊息內容去近似非線性,經常需要將神經網路與其他的經驗式模式合併,或著與部份物理模式合併。
不同條件的實驗結果,產生了59點數據的厚度分佈,利用NLS 031軟體構成非線性模式以預測厚度分佈。
沉積層邊緣厚度量測值與非線性模式預測值的比較顯示於圖三,中央位置的模式厚度預測值較佳。相反的,圖四顯示了具備相同輸入與輸出變數的線性迴歸模式結果。
線性模式與非線性模式經常有相似的準確性,非線性模式至少須與線性模式一般精確,而且在許多方面是更為準確,不過在數量上其所改善的程度有限。就本篇論文所討論的數據而言,線性模式與非線性模式之間有相當程度的差距。
圖五顯示沉積層三處位置的厚度模擬分析結果,於線性模式此些厚度的誤差變異性較非線性模式高出一個數量級。
圖六顯示當其他的輸入參數保持固定時,噴嘴開口4對邊緣厚度的影響。由Nonlinear Solutions Oy公司經由數年所發展的LUMET系統概念,為一種框架式架構,非線性模式可以加入此系統內。由於非線性模式於進行代數運算時,相當的複雜與龐大,所以必須以架構方式提供此非線性模式,得以讓工程師能使用軟體,而無須詳細的了解軟體如何運算。此概念已經使用於數種應用上─從鋼條到光纖電纜─每一種應用都不同,其目的也不同。使用LUMET概念,如果解答存在,則可能找出能滿足所需條件的製程參數。於附表中,僅有噴嘴開口3、4與5能在限制範圍內變動,並期望厚度盡量保持均勻。第三欄顯示所能找到最佳噴嘴開口尺寸的解決方式。
結論
即使是相當大的非線性模式在計算輸出時,也僅需要點幾秒的時間,所以非線性模式一般都較物理模式分析為快;物理模式涉及微分方程運算,因此需要更長的時間去計算目標變數。不過,這些都要付出很高的代價,非線性模式分析對一般工程師而言較為複雜,方程式可能龐大而且麻煩的難以整理,包含了一些難以詮釋的參數。即使是適用於業界相當簡單的非線性模式,都需要相當的經驗與專門知識去發展。非線性模式的發展需要適當的數據,而這些數據都很難獲得,特別是當做為模式基礎的非線性仍不清楚,或者實驗昂貴。模式發展也需要相當的時間,即使以一個月的時間去發展一個工業模式仍嫌太短,所以非線性模式的發展相當昂貴。
不過由發展非線性模式所獲得的好處顯示,其所花費的代價仍然值得,因為不像依據物理法則與簡化假設的物理模式,非線性模式不須做任何假設,即可顯示實際狀況,同時較應用於物理模式中相當簡單的方程式,有更高的能力去描述實際環境。換言之,非線性模式經常為一個較佳的模式,因為非線性模式有助於獲得更嚴謹的製程控制與更佳的產品。SST-AP/Taiwan
致謝
Epsilon為ASM International NV註冊商標。
參考資料
1. H. Komiyama, Y. Shimogaki, Y. Egashira, hemical Reaction Engineering in the Design of CVD Reactors,?Chem. Eng. Sci., Vol. 54, No. 13?4, pp. 1941?957, July 1999.
2. K. Hornik, M. Stinchcombe, H.White,ultilayer Feedforward Networks are Universal Approximators,?Neural Networks, Vol. 2, No. 5, pp. 359?66, 1989.
3. A. Bulsari, ed., Neural Networks for Chemical Engineers, Elsevier, Amsterdam, Netherlands, 1995.
4. A. Bulsari, uality of Nonlinear Modelling in Process Industries,?Internal Report NLS/1998/2.
5. A. Bulsari, M. Lahti,onlinear Modelling Secondary Coating from Expensive Experimental Data,?Proc. International Wire and Cable Symposium, pp. 302?05, Nov. 2001.
6. A. Bulsari, M. Lahti,onlinear Models Guide Secondary Coating of OFCs,?Wire and Cable Technology International, Vol. 29, No. 5, pp. 40?3, Sept. 2001.
7. A. Bulsari, J. Fredriksson, T. Lehtinen, eural Networks for Quality Control in the Wire Rod Industry,?Wire Industry, Vol. 67, pp. 253?58,March 2000.
8. A. Bulsari, P.Hooli,ore Accurate Alloying with Neural Networks,?Stainless Steel World, Vol. 12, pp. 54?7, Nov. 2000.
9. A. Bulsari, J. Fredriksson,T. Lehtinen,uden Sukupolven Laatujarjestelmat Sisaltavat Epalineaarisia Malleja,?Vuoriteollisuus, No. 1, pp. 38?1, 1999.
10. P. Myllykoski, A. Bulsari, election of Influential Variables for Modelling Cold Rolling of Thin Sheets,?Proc. EANN, pp. 155?58, 1997.
11. A. Bulsari, A. Kappi,rediction of Compressive Strength and Compaction Degree of Concrete,?Proc. EANN, pp. 181?84, 1998.
12. A. Bulsari, M. Lahti,