雜誌搜尋      

解決磊晶層厚度均勻度的非線性模式

   日期:2005/4/14   來源:半導體科技    

矽厚度均勻度是以化學氣相沉積(CVD)法成長磊晶層(epitaxial layers)的一種品質特性衡量指標,半導體廠的工程師都依賴試誤(嚐試與錯誤)方式的經驗,以改善厚度均勻度。最近10至12年所報導的一些新式線性模式分析技術,在定量描述製程變數對沉積層厚度分佈的影響時,能提供顯著的優點,而且成功的應用於許多的製程上。於此所描述的案例,則顯示非線性技術能較線性模式提供一個數量級的精確度。
磊晶圓(Epitaxial silicon wafers)通常作為個別電子元件(discrete electronic devices)、積體電路(ICs)以及微機電元件製程的基材,磊晶層並以化學氣相沉積法進行沉積。視其應用,磊晶層的厚度變化可從小於1微米到大於100微米,在某些狀況,降低磊晶層厚度變異性為首要之務,包括晶圓間與晶圓內的變異。此種結構都在水平式單晶圓反應器內製造,反應器有足夠的穩定度與適應性以減少厚度變異。對普通厚的磊晶層,使用1100~1150蚓的常壓製程,並以氫氣為載氣(carrier gas),三氯矽烷(Trichlorosilane, TCS)為氣體源(source gas)。此種製程能以3.5~5微米/分的沉積速率達到相當高的產能。
磊晶層的成長速率受載氣中的溫度與TCS濃度影響,同時由於其高製程溫度,成長速率主要受到含矽物種(silicon containing species)在氣流(gas stream)邊界層擴散的限制,邊界層厚度為氣體速度的函數,所以即使TCS莫耳分率(mole fraction)保持固定,如果載氣流動速率改變,沉積速率即改變。另外,成長速率在氣體流動方向強烈變化。基本上,晶圓前緣(leading edge)的局部成長速率可能以25%~35%的比例高於晶圓後緣(trailing edge)。
為了獲得良好的厚度均勻度,晶圓在沉積過程中必須旋轉,所以厚度分佈會形成徑向對稱(radially symmetric),藉著晶圓溫度分佈的改變,可稍稍調整徑向厚度分佈。不過對於穩定的製程,主要是藉著氣流橫向速度分佈(lateral velocity profile)的改變進行調整,同時也改變了橫向邊界層厚度與局部沉積速率。為了進行此種速度分佈控制,所使用的反應器(ASM Epsilon)裝配了五只可調噴嘴。實際上,僅有三個可調參數,因為流動型態經常儘可能的維持對稱,以避免在成長腔體內的可能逆流效應(backstreaming effects)。所以噴嘴1與噴嘴5有相同的開口尺寸,噴嘴2與噴嘴4亦然,依據圖一的術語,I1 = I5, I2 = I4。

化學氣相沉積製程模式分析
即使是幾何型態最簡單的反應器,化學氣相沉積的物理模式分析也是相當複雜與費時,同時經驗模式(empirical modeling)的常用統計技術為線性方式,而且表現並不佳(參考小宮山等所評論用於CVD製程的數學模式[1])。
化學氣相沉積製程的模式分析,於1980年代傳統上是利用計算流體動力學完成,當時由於一些充分的理由,人們並不滿意經驗模式。於彼時,計算能量剛剛達到能運算一些處理時間與空間的偏微分方程式。
有限元素法於1980年代仍相當新穎,尤其應用於實際的工程問題時。另一方面,因為經驗模式並不具備以類神經網路(artificial neural networks)發展的新技術所擁有的優點,所以經驗模式的效果並不好。
儘管大自然並不以線性方式的簡單性運作,線性技術支持者仍利用於線性迴歸加入非線性項的簡單性與可行性。然而,加入了非線性項經常還是無法達到目標,即使做到了,也無法充分近似。
目前非線性經驗模式分析於製程改善較物理模式分析更為可行。因此,可以應用例如類神經網路的非線性模式分析新技術。此技術具備了所謂的泛用近似能力(universal approximation capability) [2],足以適用於大部分製程業界所遇到的功能近似需求。於發展此模式時,使用者無須知道非線性的型態與嚴重性。

類神經網路
類神經網路在結構與較小範圍的功能上,都類似生物系統的神經元網路。如同腦部的神經元網路,類神經網路包含了在層狀組織內的神經元,此些神經元指向鄰近層的神經元,並與之連接(圖二)。
製造業界使用多種類型的類神經網路已達十年之久,經常使用於製程控制與產品研發─以及其他實際的應用上[3, 4]。最常見的多層認知(multilayer perceptron)網路為前饋(feedforward)神經網路的一種;業界最常應用的神經網路[5-13]也都基於此型態。非線性模式也能以許多方式達成。
於前饋神經網路(feedforward neural network),每個神經元i的輸出為:


於此活化函數(activation function)經常為logistic S型(sigmoid)函數,能以下式表示:


進入神經元的輸入訊號為xj,wij為每一個輸入訊號連結到第i個神經元的權值,wio項稱之為偏差參數,因此產生了連接輸入變數與輸出變數的一組代數方程式。所以對每個觀察值(一組輸入與輸出變數),依據所給與的權值,從此些方程式可預測其輸出。訓練過程目的在找出產生預測誤差平方總和最小值的權值。
目前有多種訓練方法正在使用中,逆傳遞(Back-propagation)方法為約十年前最常使用的訓練方法,現今最常使用像Levenberg- Marquardt method [14-16]此種非常好的最佳化方式。

線性與非線性模式分析的比較
非線性模式分析為經驗式或半經驗式的模式分析,模式至少將一些非線性置入分析考量。為了僅可能從有限的數據、或者從數據稀疏的訊息內容去近似非線性,經常需要將神經網路與其他的經驗式模式合併,或著與部份物理模式合併。
不同條件的實驗結果,產生了59點數據的厚度分佈,利用NLS 031軟體構成非線性模式以預測厚度分佈。
沉積層邊緣厚度量測值與非線性模式預測值的比較顯示於圖三,中央位置的模式厚度預測值較佳。相反的,圖四顯示了具備相同輸入與輸出變數的線性迴歸模式結果。
線性模式與非線性模式經常有相似的準確性,非線性模式至少須與線性模式一般精確,而且在許多方面是更為準確,不過在數量上其所改善的程度有限。就本篇論文所討論的數據而言,線性模式與非線性模式之間有相當程度的差距。
圖五顯示沉積層三處位置的厚度模擬分析結果,於線性模式此些厚度的誤差變異性較非線性模式高出一個數量級。
圖六顯示當其他的輸入參數保持固定時,噴嘴開口4對邊緣厚度的影響。由Nonlinear Solutions Oy公司經由數年所發展的LUMET系統概念,為一種框架式架構,非線性模式可以加入此系統內。由於非線性模式於進行代數運算時,相當的複雜與龐大,所以必須以架構方式提供此非線性模式,得以讓工程師能使用軟體,而無須詳細的了解軟體如何運算。此概念已經使用於數種應用上─從鋼條到光纖電纜─每一種應用都不同,其目的也不同。使用LUMET概念,如果解答存在,則可能找出能滿足所需條件的製程參數。於附表中,僅有噴嘴開口3、4與5能在限制範圍內變動,並期望厚度盡量保持均勻。第三欄顯示所能找到最佳噴嘴開口尺寸的解決方式。

結論
即使是相當大的非線性模式在計算輸出時,也僅需要點幾秒的時間,所以非線性模式一般都較物理模式分析為快;物理模式涉及微分方程運算,因此需要更長的時間去計算目標變數。不過,這些都要付出很高的代價,非線性模式分析對一般工程師而言較為複雜,方程式可能龐大而且麻煩的難以整理,包含了一些難以詮釋的參數。即使是適用於業界相當簡單的非線性模式,都需要相當的經驗與專門知識去發展。非線性模式的發展需要適當的數據,而這些數據都很難獲得,特別是當做為模式基礎的非線性仍不清楚,或者實驗昂貴。模式發展也需要相當的時間,即使以一個月的時間去發展一個工業模式仍嫌太短,所以非線性模式的發展相當昂貴。
不過由發展非線性模式所獲得的好處顯示,其所花費的代價仍然值得,因為不像依據物理法則與簡化假設的物理模式,非線性模式不須做任何假設,即可顯示實際狀況,同時較應用於物理模式中相當簡單的方程式,有更高的能力去描述實際環境。換言之,非線性模式經常為一個較佳的模式,因為非線性模式有助於獲得更嚴謹的製程控制與更佳的產品。SST-AP/Taiwan

致謝
Epsilon為ASM International NV註冊商標。

參考資料
1. H. Komiyama, Y. Shimogaki, Y. Egashira, hemical Reaction Engineering in the Design of CVD Reactors,?Chem. Eng. Sci., Vol. 54, No. 13?4, pp. 1941?957, July 1999.
2. K. Hornik, M. Stinchcombe, H.White,ultilayer Feedforward Networks are Universal Approximators,?Neural Networks, Vol. 2, No. 5, pp. 359?66, 1989.
3. A. Bulsari, ed., Neural Networks for Chemical Engineers, Elsevier, Amsterdam, Netherlands, 1995.
4. A. Bulsari, uality of Nonlinear Modelling in Process Industries,?Internal Report NLS/1998/2.
5. A. Bulsari, M. Lahti,onlinear Modelling Secondary Coating from Expensive Experimental Data,?Proc. International Wire and Cable Symposium, pp. 302?05, Nov. 2001.
6. A. Bulsari, M. Lahti,onlinear Models Guide Secondary Coating of OFCs,?Wire and Cable Technology International, Vol. 29, No. 5, pp. 40?3, Sept. 2001.
7. A. Bulsari, J. Fredriksson, T. Lehtinen, eural Networks for Quality Control in the Wire Rod Industry,?Wire Industry, Vol. 67, pp. 253?58,March 2000.
8. A. Bulsari, P.Hooli,ore Accurate Alloying with Neural Networks,?Stainless Steel World, Vol. 12, pp. 54?7, Nov. 2000.
9. A. Bulsari, J. Fredriksson,T. Lehtinen,uden Sukupolven Laatujarjestelmat Sisaltavat Epalineaarisia Malleja,?Vuoriteollisuus, No. 1, pp. 38?1, 1999.
10. P. Myllykoski, A. Bulsari, election of Influential Variables for Modelling Cold Rolling of Thin Sheets,?Proc. EANN, pp. 155?58, 1997.
11. A. Bulsari, A. Kappi,rediction of Compressive Strength and Compaction Degree of Concrete,?Proc. EANN, pp. 181?84, 1998.
12. A. Bulsari, M. Lahti,
上一則      下一則
   相關文章