

| Title        | MOSスタティックRAMの高速化に関する研究           |
|--------------|----------------------------------|
| Author(s)    | 和田,知久                            |
| Citation     | 大阪大学, 1994, 博士論文                 |
| Version Type | VoR                              |
| URL          | https://doi.org/10.11501/3098875 |
| rights       |                                  |
| Note         |                                  |

The University of Osaka Institutional Knowledge Archive : OUKA

https://ir.library.osaka-u.ac.jp/

The University of Osaka

# MOSスタティックRAMの高速化 に関する研究

## 1994年

和田知久

#### 内容梗概

本論文は、筆者が昭和58年三菱電機株式会社に入社以来、同社ULSI開発研究所において行なってきたスタテイック型ランダムアクセスメモリ(SRAM)の研究開発における、「MOSスタディックRAMの高速化に関する研究」の成果をまとめたもので、特に設計面からの高速化の手法に重点を置いており、本文は序論の章、結論の章を含め、7章より構成されいる。

第1章 序論

本章では本研究に関連する分野における歴史的背景と、高速SRAMに関する開発の沿 革と現状について概説し、本研究を行なうに至った動機と目的を明らかにする。

SRAMの高速化のアプローチとして、1)アレイアーキテクチャ、2)回路技術、そして3)コンピュータシステムにキャッシュメモリとして使用された場合の論理構成の 最適化の3つの方法を用い、それぞれの検討結果を2章、3章、4章で述べる。また、 5章では高速化時に信頼性的問題となるノイズとソフトエラーの問題の解決策について 述べる。そして、6章にて工学的応用としての高速高集積1MSRAMの実用化について 述べ、7章で内容をまとめる。

第2章 アーキテクチャによるSRAMの高速化

本章では、SRAMの高速化のアプローチとしてメモリアレイを構成するワード線なら びにビット線の構成方法(メモリアレイアーキテクチャ)による高速化の手法を示す。 まず最初に、吉本ら により提案された分割ワード線構成(Divided Word Line)を進化さ

せた変形分割ワード線構成(Modified Divided Word Line)を提案し、変形分割ワード線 構成がSRAMのワード線選択の高速化を実現できるアーキテクチャであることを示す。

次に、新しいビット線構成であるT字型ビット線構成(T-shaped Bit Line)を提案し、 T字型ビット線構成が高速化および多ビット構成に適するビット線アーキテクチャであ ることを示す。

第3章 回路技術によるSRAMの高速化

本章では、SRAMの高速化のアプローチとして回路技術による高速化の手法を示す。 まず最初に、アドレス入力信号の変化を感知して同期パルスを発生し、そのパルスを 用いて内部回路を同期させて動作させるATD方式(Address Transition Detection)を用い た高速化の概要を説明する。

次に、ATDを利用したデータバスプリチャージとデュアルレベルデータバスプリチャ ージ方式を提案し、チップ内部のデータバスの高速化の方法を示す。

さらに、ATDを用いたデータ出力プリセット方式を提案し、高速化の問題のひとつで あるノイズを低減しながら高速化を実現する方法を示す。 第4章 キャッシュメモリとしてのSRAMの高速化

高速SRAMが最も必要とされるアプリケーションは高性能のコンピュータシステムで あり、主にSRAMはキャッシュメモリとして使用されている。キャッシュメモリはある 大きさの固まったデータをアクセスするので完全なランダムアクセスを必要としない。

本章ではキャッシュメモリをCPUと同じチップ内に集積するときに有効なOn-Chipキャッシュメモリ用の解析的なアクセスタイムモデルを示す。

また、そのアクセスタイムモデルを用いてキャッシュメモリの論理構成と物理構成に よるスピードのトレードオフを示し、キャッシュメモリとしてSRAMを高速化する方法 を示す。

第5章 SRAMの高速化に対する信頼性上の問題と解決策

本章では、SRAMを高速化するときの信頼性上の問題であるノイズとソフトエラーの 問題について述べる。

まず最初に、高速なオフチップドライバによる電源線のバウンスノイズ発生をモデル 化してモデル式を提案し、低ノイズ化するための解決策を示す。

次に、高速化すなわちサイクルタイムを短くするとソフトエラー率が上昇するメカニ ズムを明らかにし、これを解決する方法を示す。

第6章 工学的応用(高速高集積1MSRAMの実用化による検証)

第2章~第5章までの結果を踏まえ、具体的な高集積1MSRAMを実用化するに当たり 応用面での検討、評価結果について述べる。

高性能ショートチャネルトランジスタと変形分割ワード線構成、ATDによるデュアル レベルデータバスプリチャージ、高感度センスアンプ、ゲートコントーロル型データバ スドライバなる技術により高速アクセスタイム14nsを実現した。

また同時に、高速1MSRAMでテスト時間短縮のために新しく採用したビット構成可変 方式とその評価結果を述べる。

第7章 結論

第2章から第6章までの研究成果を総括して、本研究の結論を述べる。

目次

| 第1章 | 序論                                         |          |
|-----|--------------------------------------------|----------|
| 1.1 | 関連分野の歴史的背景                                 | <u> </u> |
| 1.2 | 本研究の目的                                     | 4        |
| 1.3 | 本研究の内容                                     | 4        |
| 1.4 | 参考文献                                       | 7        |
|     |                                            |          |
| 第2章 | アーキテクチャからの高速化                              |          |
| 2.1 | はじめに                                       | 15       |
| 2.2 | 変形分割ワード線構成                                 | 16       |
| 2.2 | 2.1 分割ワード線構成と変形分割ワード線構成 —————————          | 16       |
| 2.2 | 2.2 適用例および結果                               | 17       |
| 2.3 | T 字型ビット線構成 ─────────────────────────────── | 20       |
| 2.3 | B.1 通常ビット線構成とT字型ビット線構成────                 | 20       |
| 2.3 | 8.2 適用例および結果                               | 22       |
| 2.4 | 結論                                         | 25       |

-27

第3章 回路技術面からの高速化

| 3.1 はじめに                                             | 29 |
|------------------------------------------------------|----|
| 3.2 ATD方式の概要                                         | 29 |
| 3.3 データバスプリチャージによる高速化                                | 30 |
| 3.3.1 データバスプリチャージーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー | 30 |
| 3.3.2 デュアレレベルデータバスプリチャージーーーーー                        |    |
| 3.4 出力プリセットによる高速化と低ノイズ化の両立                           | 36 |
| 3.5 結論                                               |    |
| 3.6 参考文献                                             | 41 |

第4章 キャッシュメモリとしての高速化

| 4.1 はじめに ―――                        | 43 |
|-------------------------------------|----|
| 4.2 On-Chipキャッシュメモリ用のアクセスタイムモデル ――― | 43 |
| 4.2.1 背景                            | 43 |
| 4.2.2 キャッシュメモリの構成                   | 44 |
| 4.2.3 解析的アクセスタイムモデル ―――             | 46 |
| A デコード遅延                            | 47 |
| B ワード線遅延                            | 50 |
|                                     |    |

目次(3)

| C ビット線/センスアンプ遅延               | 51 |
|-------------------------------|----|
| D データバス/出力遅延                  | 55 |
| E アクセスタイム                     | 56 |
| 4.2.4 モデルの検証                  | 57 |
| 4.3 結論 ————————————————————   | 63 |
| 4.4 参考文献 ———————————————————— | 64 |

第5章 SRAMの高速化に対する信頼性上の問題と解決策

| 5.1 はじめに                              | 65 |
|---------------------------------------|----|
| 5.2 出力バッファの解析的モデル                     | 65 |
| 5.2.1 CMOS出力バッファの電源ノイズ                | 65 |
| 5.2.2 データ出力バッファの解析的近似 ————————        | 67 |
| 5.2.3 モデルと回路シミュレーションSPICEとの比較         | 69 |
| 5.2.4 電圧降圧回路を組み合わせた低ノイズ出力バッファ         | 70 |
| 5.3 SRAMソフトエラー率の逆サイクルタイム依存性 ――――      | 72 |
| 5.3.1 メモリセルの構成                        | 73 |
| 5.3.2 ソフトエラー率の測定結果                    | 73 |
| 5.3.3 解析 ————————————————————         | 74 |
| 5.3.3.1 SRAMのソフトエラー率の通常のサイクルタイム依存性 ―― | 74 |
| 5.3.3.2 ソフトエラー率の逆サイクルタイム依存性 ――――      | 76 |
| 5.3.4 ソフトエラー率のサイクルタイム依存性に対する考察        | 78 |
| 5.3.4.1 他の実験結果                        | 78 |
| 5.3.4.2 ドライバトランジスタのしきい値電圧を上げる効果 ―――   | 79 |
| 5.3.4.3 高抵抗負荷の抵抗値を下げる効果               | 80 |
| 5.3.5 ソフトエラー率のサイクルタイム依存性のまとめ          | 80 |
| 5.4 結論                                | 82 |
| 5.5 参考文献 —————————————————————        | 84 |

第6章 工学的応用(高速高集積1MSRAMの実用化による検証)

| 6.1 はじめに                     | 85 |
|------------------------------|----|
| 6.2 ビット構成可変14nsの1MSRAM       | 85 |
| 6.2.1 回路設計                   | 85 |
| A チップアーキテクチャーーーーーーーーーーーーー    | 85 |
| B 変形分割ワード線構成 ———————————     | 87 |
| C センスアンプ回路                   |    |
| D ゲート制御型データバスドライバ            | 88 |
| E デュアレレベルデータバスプリチャージ <i></i> | 89 |
| F ビット構成可変機能                  |    |
| 6.2.2 0.7μm CMOSプロセス技術       |    |
|                              |    |

| 6.3 メモリの新テスト機能としてのビット構成可変機能―――             | 93  |
|--------------------------------------------|-----|
| 6.3.1 SRAMのテスト                             | 94  |
| 6.3.2 回路技術 ————                            | 94  |
| 6.3.3 評価結果                                 | 97  |
| 6.4 結論 —————————————————————               | 100 |
| 6.5 参考文献 —————————————————————             | 101 |
| 第7章 結論                                     |     |
| 7.1 本研究の結論                                 | 105 |
| 7.2 謝辞 ——————————————————————————————————— | 109 |
| 研究業績目録 —————————————————————               | 110 |

第1章

序論

### 1.1 関連分野の歴史的背景

スタティックランダムアクセスメモリ(以後SRAM)の開発は、1969年のIntel社のP チャンネル型シリコンゲートの256ビットランダムアクセスメモリ(Intel 1101)に始 まった。SRAMは1ビット情報を保持するメモリセルを構成するために4~6個のトラ ンジスタが必要であり、ダイナミックRAM(DRAM)の1トランジスタ/1キャパシタ 構成に比べて同一製造技術水準(同一のチップサイズと同一の最小サイズ)では集積度 が1/4で、ビットコストが高いという本質的な欠点を有している。しかしながら、1) リフレッシュ動作が不要、2)動作タイミングが簡単で使いやすい、3)読み出し/書 き込み速度が高速、4)スタンバイ電流が小さいなどのメリットを発揮してDRAMがコ ンピュータの主記憶におもに使われているのに対して、SRAMは多種多用な用途に使用 されその需要は増大している。SRAMの究極の性能は高集積性、高速性、低消費電力性 を兼ね備えることであるが、用途によって要求性能は異なっている。

SRAMの用途でリフレッシュ動作不要、使い易さおよび低ビットコストを必要とするのは端末機器、計測器用の小容量メモリシステムや、ハードディスク装置の小容量のバッファメモリを対象としたもの[1-1]~[1-6]で、アクセス時間は55nsから100ns以上と高速ではないが、動作時の消費電力を200mW~300mWに抑えている。

また、SRAMの用途で特に低消費電力を必要とするものはハンディーターミナル、ラッ プトップ/ノート型コンピュータ、電子手帳、ペン入力パソコンなどの携帯機器の主記 憶であり、バッテリーバックアップによる不揮発性メモリ[1-7]~[1-10]として使用され、 スタンバイ時の消費電力は10µW以下に低減されている。このような低スタンバイ電力 と低動作電力は1970年代後半に現われた高抵抗ポリシリコンを負荷抵抗素子として用 いたメモリセルの採用[1-11]~[1-14]と、コンプリメンタリMOS(以後CMOS)プロセ スの微細化の促進によって達成され、以後低消費電力性と高速性を両立するSRAMが開 発されている[1-15]~[1-48]。その後、4M以上の大容量のSRAMではさらなる低スタン バイ電力達成のために高抵抗ポリシリコン負荷に変わって、薄膜トランジジスタが採用 [1-49]~[1-51]され一層の低スタンバイ電力が実現された。

また、SRAMの用途で特に高速性を必要とするものはスーパーコンピュータの主記憶、 ワークステーションおよびパーソナルコンピュータのキャッシュ/バッファメモリなど [1-15]~[1-48]で、マイクロプロセッサの著しい速度向上に対応する高速なSRAMが必要 とされた。特に、数量の多いパーソナルコンピュータにキャッシュメモリが使用された 以降キャッシュメモリとしての高速SRAMの需要は大きく成長している。

図1-1-1にマイクロプロセッサの動作スピードと主記憶を構成するDRAMのスピード の推移を示す[1-52]。比例縮小則[1-53]に従った微細化の促進、回路面の工夫、縮小命令 セットコンピュータ(RISC)に代表されるアーキテクチャの改善によってマイクロプロセッ サの動作周波数は1985年以降年率2倍のスピードで性能向上を実現したが、主記憶と して使用されるDRAMのスピードの向上は、微細化と同時に集積度が向上していること もありプロセッサに比べて緩やかで、両者の間に大きなスピードギャップが生じた。こ のスピードギャップを埋めるコンピュータアーキテクチャからの解決策が高速なSRAM を使用するキャッシュメモリであり、図1-1-2に示すようなメモリの階層構成が主流に なってきた。



図1-1-1:マイクロプロセッサとDRAMのスピードの推移



図1-1-2:メモリの階層構成

キャッシュメモリとは主記憶よりもプロセッサに近いレベルに置かれた高速かつ低容 量のメモリである。プロセッサが主記憶内のデータをアクセスする場合、場所的局所性

と時間的局所性の2つの局所性がある。前者は1度アクセスされたデータの近傍のアド レスにあるデータがアクセスされる確率が高い性質であり、後者は1度アクセスされた データは近い将来再びアクセスされる可能性が高い性質である。キャッシュメモリは、 主記憶内のデータをある単位(ブロック)ごとにキャッシュメモリにコピーし、以上述 べた2つの局所性を利用してメモリの平均のアクセス時間を下げるものである。したがっ て、キャッシュメモリは主記憶に対して十分な高速性が必要であり高速なSRAMが使用 されている。しかし、小容量のキャッシュメモリと言えども主記憶容量の増大に伴って SRAMの集積度を上げる必要があり、微細化の促進だけでプロセッサと同一の性能向上 を実現するのは困難であり、設計面での工夫やプロセスの改良が行なわれてきた。図 1-1-3に国際固体素子回路会議(International Solid State Circuit Conference)に登場 した高速SRAMのアクセス時間の推移を示す。プロセス技術としてCMOSプロセス技術、 バイポーラトランジスタとCMOSを組み合わせたBiCMOSプロセス技術、バイポーラプ ロセス技術の3種類の技術が使われてきている。バイポーラ技術では10ns以下の非常 に高速なアクセス時間を実現できるが、メモリセルがバイポーラトランジスタで構成さ れセルサイズが大きく、またメモリセルの各ビットの消費電力が大きいので高集積に向 かず64Kビットが開発された最大容量である。一方、CMOSでは高集積が可能であるが 高速性ではバイポーラに劣りアクセス時間10ns程度以上のものが開発されている。そ して、高集積でかつ10ns以下のSRAMは主にBiCMOS技術で製造されている[1-54]~ [1-65]。



### 1.2 本研究の目的

本研究の目的は高性能なコンピュータシステムに必要なキャッシュメモリに使用されるSRAMの高速化であり、特に設計面からSRAMの高速化を実現することを目的としている。

具体的には、1) SRAMの高速化を実現するためにSRAMのメモリアレイ構成(アー キテクチャ)の最適化による高速化の方法[1-66]~[1-68]を明らかにしかつ、2)回路技 術による高速化の方法[1-69]~[1-71]を明らかにすることを目的としている。また、3) キャッシュメモリとして使用されたときのアクセス時間をモデル化し、高速なキャッシュ メモリの構成方法[1-72]を明らかにすることを目的としている。さらに、4) 高速化に より発生する信頼性上の問題点とその解決方法[1-73]、[1-74]を明らかにすることを目的 としている。

#### 1.3 本研究の内容

本論文は上述の目的を達成するために著者が行なった研究の成果を述べるものであり、 本論文の構成は次の通りである。本論文の構成を図1-3-1に示す。

#### 第1章 序論

本章では本研究に関連する分野における歴史的背景と、本SRAMの高速化に関する研 究について概説する。

第2章 アーキテクチャによるSRAMの高速化

吉本ら により提案された分割ワード線構成(Divided Word Line)を進化させた変形分 割ワード線構成(Modified Divided Word Line)を提案し、変形分割ワード線構成が SRAMのワード線選択の高速化を実現できるアーキテクチャであることを示す。

次に、新しいビット線構成であるT字型ビット線構成(T-shaped Bit Line)を提案し、 T字型ビット線構成が高速化および多ビット構成に適するビット線アーキテクチャであ ることを示す。

第3章 回路技術によるSRAMの高速化

まず最初にアドレス入力信号の変化を感知して同期パルスを発生し、そのパルスを用 いて内部回路を同期させて動作させるATD方式(Address Transition Detection)を用いた 高速化の概要を説明する。 次に、ATDを利用したデータバスプリチャージとデュアルレベルデータバスプリチャ ージ方式を提案し、チップ内部のデータバスの高速化の方法を示す。

さらに、ATDを用いたデータ出力プリセット方式を提案し、高速化の問題のひとつで あるノイズを低減しながら高速化を実現する方法を示す。

第4章 キャッシュメモリとしてのSRAMの高速化

高速SRAMが最も必要とされるアプリケーションは高性能のコンピュータシステムで あり、主にSRAMはキャッシュメモリとして使用されている。キャッシュメモリはある 大きさの固まったデータをアクセスするので完全なランダムアクセスを必要としない。

本章ではキャッシュメモリをCPUと同じチップ内に集積するときに有効なOn-Chipキャッシュメモリ用の解析的なアクセスタイムモデルを示す。

また、そのアクセスタイムモデルを用いてキャッシュメモリの論理構成と物理構成に よるスピードのトレードオフを示し、キャッシュメモリとしてSRAMを高速化する方法 を示す。

第5章 SRAMの高速化に対する信頼性上の問題と解決策

SRAMを高速化するときの信頼性上の問題であるノイズとソフトエラーの問題につい て述べる。まず高速なオフチップドライバによる電源線のバウンスノイズ発生をモデル 化してモデル式を提案し、低ノイズ化するための解決策を示す。

次に、高速化すなわちサイクルタイムを短くするとソフトエラー率が上昇するメカニ ズムを明らかにし、これを解決する方法を示す。

第6章 工学的応用(高速高集積1MSRAMの実用化による検証)

第2章~第5章までの結果を踏まえ、具体的な高集積1MSRAMを実用化するに当たり応用面での検討、評価結果について述べる。

高性能ショートチャネルトランジスタと変形分割ワード線構成、ATDによるデュアル レベルデータバスプリチャージ、高感度センスアンプ、ゲートコントロール型データバ スドライバなる技術により高速アクセスタイム14nsを実現した。

また同時に、高速1MSRAMでテスト時間短縮のために新しく採用したビット構成可 変方式とその評価結果を述べる。

#### 第7章 結論

第2章から第6章までの研究成果を総括して、本研究の結論を述べる。

- 5 -



#### 図1-3-1:本論文の構成

#### 1.4 参考文献

[1-1] 富沢、穴見、田中. "16KビットNMOSスタティックRAM," 工業調査会 電子材料, pp.50-54.

[1-2] O. Minato, T. Masuhara, T. Sasaki, Y. Sakai, T. Hayashida, K. Nagasawa, K. Nishimura, T. Yasui, and T. Miyauchim " A HICMOSII 8K x 8 Static RAM," ISSCC Dig. Tech. Papers, Feb. 1982, pp.256-257.

[1-3] S. Konishi, J. Matsunaga, T. Ohtani, M. Sekine, M. Isobe, T. Iizuka, Y. Uchida, and S. Kohyama, "A 64Kb CMOS RAM," ISSCC Dig. Tech. Papers, Feb. 1982, pp.258-259.

[1-4] H. Shinohara, K. Anami, T. Yoshihara, K. Kihara, Y. Kohno, Y. Akasaka, and S. Kayano, "A fast 8K x8 Mixed CMOS Static RAM," IEEE Trans. Electron Devices, ED-32, 9, pp.1792-1796 (Sept. 1985).

[1-5] H. Shinohara, K. Anami, K. Ichinose, T. Wada, Y. Kohno, Y. Kawai, Y. Akasaka, and S. Kayano, "A 45ns 256K CMOS SRAM with Tri-Level Word Line," ISSCC Dig. Tech. Papers, Feb. 1985, pp.62-63.

[1-6] H. Shinohara, K. Anami, K. Ichinose, T. Wada, Y. Kohno, Y. Kawai, Y. Akasaka, and S. Kayano, "A 45ns 256K CMOS SRAM with Tri-Level Word Line," IEEE J. Solid-State Circuits, SC-20, 5, pp.929-934 (Oct. 1985).

[1-7] T. lizuka, K. Ochii, T.Ohtani, K. Kondo, S. Kohyama, "A Static 16Kb Bulk CMOS RAM," ISSCC Dig. Tech. Papers, Feb. 1980, oo.226-227.

[1-8] K. Ochii, Y. Kawakami, S. Kohyama, H. Igarashi, K. Fushikida, "A 15nW Standby Power 64Kb CMOS RAM," ISSCC Dig. Tech. Papers, Feb. 1982, pp.260-261.

[1-9] M. Yoshimoto, K. Anami, H. Shinohara, T. Yoshihara, H. Takagi, S. Nagao, S. Kayano, and T. Nakano, "A 64Kb full CMOS RAM with divided word line structure," ISSCC Dig. Tech. Papers, Feb. 1983, pp.58-59.

[1-10] T. Watanabe, H. Hayashi, I. Sakaki, Y. Akatsuka, T. Yujide, H. Yamamoto, O. Kudoh, S. Takahashi, and T. Hara, "A Battery BAckup 64K CMOS RAM with Double Level Aluminum Technology," ISSCC Dig. Tech. Papers, Feb. 1983, pp.60-61.

[1-11] T. R. O'Connell, J. M. Hartman, E. D. Errett, G. S. Larch, and W. C. Dunn, "A 4K static clocked and nonclocked RAM deign," ISSCC Dig. Tech. Papers, Feb. 1977, pp.14-15.

[1-12] G. S. Leach, J. M. Hartman, R. L. Clark, and T. R. O'Connell, "A 1K x 8 bit 5V Only Static RAM," ISSCC Dig. Tech. Papers, Feb. 1978, pp.104-105.

[1-13] T. Masuhara, O. Minato, T. Sakaki, H. Nakamura, Y. Sakai, T. Yasui, and K. Uchibori, "2K x 8b HMOS Static RAMs," ISSCC Dig. Tech. Papers, Feb. 1980, pp.224-225.

[1-14] T. Ohzone, S. Kondo, K. Tujii, T. Shiragasawa, T. Ishihara, and S. Horiuchi, "A 64Kb Static RAM," ISSCC Dig. Tech. Papers, Feb. 1980, pp.236-237.

[1-15] O. Minato, T. Masuhara, T. Sakai, Y. Sakai, K. Yoshizaki, "HI-CMOSII 4K Static RAM," ISSCC Dig. Tech. Papers, Feb. 1981, pp.14-15.

[1-16] M. Isobe, J. Matsunaga, T. Sakurai, T. Ohtani, K. Sawada, H. Nozawa, T. Iizuka, and S. Hohyama, "A 46ns 256K CMOS RAM," ISSCC DIg. Tech. Papers, Feb. 1984, pp.214-215.

[1-17] K. Hardee, M. Griffus, R. Glavas, "A 30ns 64K CMOS RAM," ISSCC Dig. Tech. Papers, Feb. 1984, pp. 216-217.

[1-18] T. Ozawa, S. Koshimaru, O. Kudo, H. Ito, T. Yamanaka, N. Yasuoka, H. Asai, N. Harashima, abd S. Kikuchi, "A 25ns 64K CMOS RAM," ISSCC Dig. Tech. Papers, Feb. 1984, pp.218-219.

[1-19] O. Minato, T. Masuhara, T. Sakaki, Y. Sakai, and T. Hayashida, "A 20ns 64K CMOS SRAM," ISSCC Dig. Tech. Papers, Feb. 1984, pp.222-223.

[1-20] J. Miyamoto, S. Saito, H. Momose, H. Shibata, K. Kanzaki, and T. Iizuka, "A 28ns CMOS SRAM with Bipolar Sense Amplifiers," ISSCC Dig. Tech. Papers, Feb. 1984, pp.224-225.

[1-21] S. Yamamoto, K. Ushibori, K. Nagasawa, S. Meguro, T. Yasui, O. Minato, and T. Masuhara, "A 256K CMOS SRAM with Variable-Impedance Loads," ISSCC Dig. Tech. Papers, Feb. 1985, pp.58-59.

- 8 -

[1-22] Y. Kobayashi, H. Eguchi, O. KUdoh, T. Hara, H. Ooka, I. Sakaki, M. Andoh, and M. Tameda, :A 10  $\mu$  W Standby Power 256K CMOS SRAM," ISSCC Dig. Tech. Papers, Feb. 1985, pp.60-61.

[1-23] K. Ochii, H. Yasuda, K. Kobayashi, T. Kondoh, and F. Masuoka, "A 17ns 64K CMOS SRAM with a Schnitt triger Sense amplifier," ISSCC Dig. Tech. Papers, Feb. 1985, pp.64-65,

[1-24] N. Okazaki, F. Miyaji, K. Kobayashi, Y. Harada, J. Aoyama, and T. Shimada, "A 30ns 256K Full CMOS SRAM," ISSCC Dig. Tech. Papers, Feb. 1986, pp.204-205.

[1-25] S. E. Shuster, B. A. Chappel, R. L. Franch, P. F. Grier, S. P. Klepner, J. F. S. Lai, R. A. Lipa, R. J. Perry, W. E. Pokorny, and M. A. Roberge, "A 15ns CMOS 64K RAM," ISSCC Dig. Tech. Papers, Feb. 1986, pp.206-207.

[1-26] S. T. Flannagan, P. A. Reed, P. Voss, S. Nogle, B. Simon, D. Sheng, R. Kung, and J. J. Barnes, "Two 64K CMOS SRAM with 13ns Access Time," ISSCC Dig. Tech. Papers, Feb. 1986, pp.208-209.

[1-27] S. Kayano, K. Ichinose, Y. Kohno, H. Shinohara, K. Anami, S. Murakami, T. Wada, Y. Kawai, and Y. Akasaka, "25-ns 256Kx1/64Kx4 CMOS SRAM's," IEEE J. Solid-State Circuits, vol. SC-21, pp. 686-691, Oct. 1986.

[1-28] S. Hanamura, O. Minato, T. Masuhara, Y. Sakai, T. Yamanaka, N. Moriwaki, and F. Kojima, "A 256K CMOS SRAM with Internal Refresh," ISSCC Dig. Tech. Papers, Feb. 1987, pp.250-251.

[1-29] A. Roberts, J. Dreibelbis, G. Braceras, J. Gabric, L. Gilbert, R. Goodwin, E. Hedberg, T. MAffirr, L. Meunier, D. Moran, P. Nguyen, D. Reed, R. Reismiller, and R. Sasaki, "A 256K SRAM with On-chip Power Supply Conversion," ISSCC Dig. Tech. Papers, Feb. 1987, pp.252-253.

[1-30] K. Wang, M. Bader, P. Voss, V. Soorholtz, R. Mauntel, H. Mendez, and R. Kung, "A 21ns 32K x 8 CMOS SRAM with a Selectively Pumped P-well Array," ISSCC Dig. Tech. Papers, Feb. 1987, pp.254-255.

[1-31] T. Komatsu, N. Okazaki, T. Nishihara, S. Kayama, N. Hoshi, J. Aaoyama, and T. Shimada, "A 35ns 1Mb CMOS SRAM," ISSCC Dig. Tech. Papers, Feb. 1987, pp.258-259.

[1-32] O. Minato, T. Sasaki, S. Honjo, K. Ishibashi, Y. Sasaki, N. Moriwaki, K. Nishimura, Y. Sakai, S. Meguro, M. Tsunematsu, and T. Masuhara, "A 42ns 1mb CMOS SRAM," ISSCC Dig. Tech. Papers, Feb. 1987, pp.260-261.

[1-33] T. Wada, T. Hirose, H. Shinohara, Y. Kawai, K. Yuzuriha, Y. Kohno, and S. Kayano, "A 34ns 1Mb CMOS SRAM using Triple Poly," ISSCC Dig. Tech. Papers, Feb. 1987, pp.262-263.

[1-34] T. Ohtani, K. Hashimoto, M. Matsui, J. Tsujimoto, H. Iwai, M. Saitoh, H. Shibata, H. Sasaki, M. Isobe, J. Matsunaga, and T. Iizuka, "A 25ns 1Mb CMOS SRAM," ISSCC Dig. Tech. Papers, Feb. 1987, pp.264-265.

[1-35] K. Sasaki, S. Hanamura, K. Ueda, T. Oono, O. Minato, K. Nishimura, Y. Sakai, S. Megro, M. Tsunematsu, T. Masuhara, M. Kubotera, H. Toyoshima, "A 15ns 1Mb CMOS SRAM," ISSCC Dig. Tech. Papers, Feb. 1988, pp.174-175.

[1-36] H. Shimada, Y. Tange, K. Tanimoto, M. Shiraishi, N. Suzuki, and T. Nomura, "An 18ns 1Mb CMOS SRAM," ISSCC Dig. Tech. Papers, Feb. 1988, pp.176-177.

[1-37] F. List, S. Bell, S. Chu, J. Dikken, C. Hartgring, J. Raemaekers, B. Walsh, and R. Salters, "A 25ns Low-Power Full CMOS 1M (128Kx8) SRAM," ISSCC Dig. Tech. Papers, Feb. 1988, pp.178-179.

[1-38] H. Lee, B. El-Kareh, R. Glaker, G. Graventies, R. Lipa, J. Maslack, J. Pessetto, W. Pokorny, M. Roberge, . Williams, H. Zelelr, and K. Beilstein, "An Experimental 1Mb CMOS SRAM with Configurable Organization and Operation," ISSCC Dig. Tech. Papers, Feb. 1988, pp.180-181.

[1-39] S. Flannagan, S. Nogle, A. Faber, N. Herr, R. Mauntel, B. Engles, and R. Kung, "A 16ns 256K x 1 CMOS SRAM," ISSCC Dig. Tech. Papers, Feb. 1988, pp.182-183.

[1-40] T. Wada, K. Anami, Y. Kawai, K. Yuzuriha, Y. Kohno, T. Matsukawa, and S. Kayano, "A 14ns 1Mb CMOS SRAM with Variable Bit-Organization Features," ISSCC Dig. Tech. Papers, Feb. 1988, pp.252-253.

[1-41] F. Towler, J. Chu, R. Houghton, P. Lane, B. A. Chappell, T. I. Chappell, and S. E. Schuster, "A 128K 6.5ns Access/5ns Cycle CMOS ECL Static RAM," ISSCC Dig. Tech. Papers, Feb. 1989, pp.30-31.

[1-42] K. Sasaki, S. Hanamura, K. Ishibashi, T. Yamanaka, N. Hashimoto, T. Nishida, K. Shimohigashi, and S. Honjo, "A 9ns 1Mb CMOS SRAM," ISSCC Dig. Tech. Papers, Feb. 1989, pp.34-35.

[1-43] T. Hirose, H. Kuriyama, S. Murakami, K. Yuzuriha, T. Mukai, K. Tsutsumi, Y. Nishimura, Y. Kohno, and K. Anami, "A 20ns 4Mb CMOS SRAM with Hierarchical Word Decoding Architecture," ISSCC Dig. Tech. Papers, Feb. 1990, pp.132-133.

[1-44] S. Flannagan, P. Pelley, N. Herr, B. Engles, T-S, Feng, S. Nogle, J. Eagen, R. Dunnigan, L. Day, and R. Kung, "An 8ns CMOS 64Kx4 and 256Kx1 SRAM," ISSCC Dig. Tech. Papers, Feb. 1990, pp.134-135.

[1-45] S. Murakami, K. Fujita, M. Ukita, K. Tsutsumi, Y. Inoue, O. Sakamoto, M. Ashida, Y. Nishimura, Y. Kohno, and K. Anami, "A 21mW 4Mb CMOS SRAM for Battery Operation," ISSCC Dig. Tech. Papers, Feb. 1991, pp.46-47.

[1-46] T. Chappell, B. Chappell, S. Shuster, J. Allan, S. Klepner, R. Joshi, and R. France, "A 2ns Cycle, 4ns-Access 512Kb CMOS ECL SRAM," ISSCC Dig. Tech. Papers, Feb. 1991, pp.48-49.

[1-47] K. Sasaki, K. Ishibashi, K. Ueda, K. Komiyaji, T. Yamanaka, N. Hashimoto, H. Toyoshima, F. Kojima, and A. Shimizu, "A 7ns 140mW 1Mb CMOS SRAM with Current Sense Amplifier," ISSCC Dig. Tech. Papers, Feb. 1992, pp.208-209.

[1-48] M. Matsumiya, S. Kawashima, M. Sakata, T. Miyabo, T. Koga, K. Itabashi, K. Mizutani, T. Ema, K. Toyoda, T. Yabu, H. Shimada, N. Suzuki, and M. Ookura, "A 15ns 16Mb CMOS SRAM with Reduced Voltage Amplitude Data Bus," ISSCC Dig. Tech. Papers, Feb. 1992, pp.214-215.

[1-49] S. Hayakawa, M. Kakumu, A. Aono, H. Takeuchi, K. Sato, K. Noguchi, T. Ohtani, T. Yoshida, T. Nakayama, T. Asami, S. Morita, M. Kinugawa, J. Matsunaga, K. Maeguchi, and K. Ochii, "A 1  $\mu$  A Retention 4Mb SRAM with a Thin-Film Transistor Load Cell," ISSCC Dig. Tech. Papers, Feb. 1990, pp.128-129.

[1-50] K. Sasaki, K. Ihsibashi, T. Yamanaka, K. Shimohigashi, N. Moriwaki, S. Honjo, S. Ikeda, A. Kioke, S. Meguro, and O. Minato, "A 23ns 4Mb CMOS SRAM with 0.5  $\mu$  A Standby Current," ISSCC Dig. Tech. Papers, Feb. 1990, pp.130-131.

[1-51] K. Ishibashi, K. Takasugi, T. Yamanaka, T. Hashimoto, and K. Sasaki, "A 1V TFT-Load SRAM Using a Two-Step Word Voltage Method," ISSCC Dig. Tech. Papers, Feb. 1992, pp.206-207.

[1-52] Hennessy, J., and D. Patterson [1990], *Computer Architecture: A Quantitative Approach*, Morgan Kaufmann Publishers, San Mateo, Calif.

[1-53] R. H. Dennard, F.H. Gaansslen, H. N. Yu, V. L. Redeout, E. Bassous, and A. R. Leblanc, "Design of ion-implanted MOS FET's with very small physical dimensions," IEEE J. Solid-State Circuits, SC-9, pp.256-268 (1974).

[1-54] N. Tamba, S. Miyaoka, M. Odaka, K. Ogiue, K. Yamada, T. Ikeda, M. Hirano, H. Higuchi, and H. Uchida, "An 8ns 256K BiCMOS RAM," ISSCC Dig. Tech. Papers, Feb. 1988, pp.184-185.

[1-55] R. A. Kertis, D. D. Smith, and T. L. Bowman, "A 12ns 256K BiCMOS SRAM," ISSCC Dig. Tech. Papers, Feb. 1988, pp.186-187.

[1-56] H. V. Tran, D. B. Scott, P. K. Fung, R. H. Havemann, R. E. Eklund, T. E. Ham, R. A. Haken, and A. Shah, "An 8ns Battery Back-Up Submicron BiCMOS 256K ECL SRAM," ISSCC Dig. Tech. Papers, Feb. 1988, pp.188-189.

[1-57] M. Suzuki, S. Tachibana, A. Watanabe, S. Shukuri, H. Higuchi, T. Nagano, and K. Shimohigashi, "A 3.5ns, 500mW 16Kb BiCMOS ECL RAM," ISSCC Dig. Tech. Papers, Feb. 1989, pp.32-33.

[1-58] H. Tran, K. fung, D. Bell, R. Chapman, M. Harward, T. Suzuki, R. Havemann, R. Eklund, R. Fleck, D. Le, C. Wei, N. Iyengar, M. Rodder, R. Haken, and D. Scott, "An 8ns BiCMOS 1Mb ECL SRAM with a Configurable Memory Array Size," ISSCC Dig. Tech. Papers, Feb. 1989, pp.36-37.

[1-59] M. Matsui, H. Momose, N. Urakawa, Y. Urakawa, T. Maeda, A. Suzuki, K. Sato, K. Makita, J. Matsunaga, and K. Ochii, "An 8ns 1Mb ECL BiCMOS SRAM," ISSCC Dig. Tech. Papers, Feb. 1989, pp.38-39.

[1-60] Y. Maki, S. Kamata, , Y. Okajima, T. yamauchi, and H. Fukuma, "A 6.5ns 1Mb BiCMOS SRAM," ISSCC Dig. Tech. Papers, Feb. 1990, pp.136-137.

[1-61] M. Takada, K. Nakamura, T. Takeshima, K. Furuta, T. Yamazaki, K. lamai, S.

Ohi, Y. Fukuda, Y. Minato, and H. Kimoto, "A 5ns 1Mb ECL BiCMOS SRAM," ISSCC Dig. Tech. Papers, Feb. 1990, pp.138-139.

[1-62] H. Shimada, S. Kawashima, M. Matsumiya, N. Suzuki, K. Itabashi, K. Kazio, Y. Miyamoto, and M. Kagohashi, "A 10ns 4Mb BiCMOS TTL SRAM," ISSCC Dig. Tech. Papers, Feb. 1991, pp.52-53.

[1-63] Y. Okajima, Y. Sato, K. Kurosawa, and S. Yamada, "A 7ns 4Mb BiCMOS SRAM with A Parallel Testing Circuit," ISSCC Dig. Tech. Papers, Feb. 1991, pp.54-55.

[1-64] H. Kato, A. Suzuki, T. Hamano, T. Kobayahsi, K. Sato, T. Nakayama, H. Gojohbori, T. Maeda, K. Ochii, "A 9ns 4Mb BiCMOS SRAM with 3.3V Operation," ISSCC Dig. Tech. Papers, Feb. 1992, pp.210-211.

[1-65] K. Nakamura, T. Oguri, T. Atsumo, M. Takada, A. Ikemoto, H. Suzuki, T. Nishigori, and T. Yamazaki, "A 6ns 4Mb ECL I/O BiCMOS SRAM with LV-TTL Mask Option," ISSCC Dig. Tech. Papers, Feb. 1992, pp.212-213.

[1-66] Y. Kohno, T. Wada, K. Anami, Y. Kawai, K. Yuzuriha, T. Matsukawa, and S. Kayano, "A 14-ns 1-Mbit CMOS SRAM with Variable Bit Organization," IEEE J. Solid-State Circuits, vol. SC-23, pp. 1060-1066, Oct. 1988.

[1-67] US patent, Tomohisa Wada, Kenji Anami, Shuji Murakami, "semiconductor memory device," No. 5280441, Jan. 18, 1994.

[1-68] Toru Shiomi, Tomohisa Wada et al., "A 5.8ns 256K BiCMOS TTL SRAM with T-Shaped Bit Line Architecture," IEEE J. Solid-State Circuits, vol. SC-28, pp. 1362-1369, Dec. 1993.

[1-69] S. Kayano, K. Ichinose, Y. Kohno, H. Shinohara, K. Anami, S. Murakami, T. Wada, Y. Kawai, and Y. Akasaka, "25-ns 256Kx1/64Kx4 CMOS SRAM's," IEEE J. Solid-State Circuits, vol. SC-21, pp. 686-691, Oct. 1986.

[1-70] Y. Kohno, T. Wada, K. Anami, Y. Kawai, K. Yuzuriha, T.Matsukawa, and S. Kayano, "A 14-ns 1-Mbit CMOS SRAM with Variable Bit Organization," IEEE J. Solid-State Circuits, vol. SC-23, pp. 1060-1066, Oct. 1988.

[1-71] T. Wada, T. Hirose, H. Shinohara, Y. Kawai, K. Yuzuriha, Y. Kohno, and S. Kayano, "A 34-ns 1-Mbit CMOS SRAM Using Triple Polysilicon," IEEE J. Solid-State

Circuits, vol. SC-22, pp.727-732, Oct 1987.

[1-72] T. Wada, S. Rajan, and S. A. Przybylski, " An Analytical Access Time Model for On-Chip Cache Memories," IEEE J. Solid-STate Circuits, vol. SC-27, pp. 1147-1156, Aug. 1992.

[1-73] T. Wada, M. Eino, and K. Anami, "Simple Noise Model and Low-Noise Data-Output Buffer for Ultra High-Speed Memories," IEEE J. Solid-State Circuits, vol. SC-25, No. 6, pp.1586-1588, December 1990.

[1-74] S. Murakami, T. Wada, M. Eino, M. Ukita, Y. Nishimura, K. Suzuki, and K. Anami, "A New Soft-Error Phenomenon in ULSI SRAM's -Inverted Dependence of Soft-Error Rate on Cycle Time-," IEICE TRANSACTIONS, vol. E74, No. 4, April 1991.

第2章

# アーキテクチャによる高速化

2.1 はじめに

一般にSRAM、DRAMそしてRead Onlyメモリ(以後ROM)などの半導体メモリは図 2-1-1に示されるように1ビットの情報を蓄えるメモリセルが2次元のアレイ状に配列 され、行方向にはWord Line(ワード線)、列方向にはBit Line(ビット線)と呼ばれる 複数の信号線がアレイ上で直交しており。i行目のワード線と、j列目のビット線を指定 することで2次元アレイ中のi行j列のメモリセルを指定することができる。



図2-1-1:半導体メモリの2次元のアレイ構成

データの読み出しのときには、この2次元のアレイ構成の中で1つのワード線を選択 し、メモリセルのデータをビット線に伝達してそのビット線の信号をセンスアンプで増 幅する。したがって、高速化のためにはワード線の高速な選択ならびにビット線におけ るデータの高速なセンスが重要となる。

本章では上記ワード線、ビット線の構成すなわちアレイアーキテクチャによるSRAM の高速化について述べる。吉本ら により提案された分割ワード線構成(Divided Word Line)を進化させた変形分割ワード線構成(Modified Divided Word Line)を提案し、 SRAMのワード線選択を高速化できることを示す。

次に、新しいビット線構成であるT字型ビット線構成(T-shaped Bit Line)を提案し、 T字型ビット線構成が高速化および多ビット構成に適するアーキテクチャであることを 示す。

#### 2.2 変形分割ワード線構成

2.2.1 分割ワード線構成と変形分割ワード線構成

変形分割ワード線構成は吉本ら[2-1]による分割ワード線構成を改良したものである。 図2-2-1は分割ワード線構成の概念図、図2-2-2は変形分割ワード線構成の概念図である。 両者ともメモリアレイがブロック分割されているSRAMのワード線の選択方法であり、 ワード線は水平方向に走るグローバルワード線と垂直方向に走るブロック選択線(分割 ワード線構成の場合)、n分の1ロウ選択線(変形分割ワード線構成の場合)により選 択される。



図2-2-1:分割ワード線構成の概念図

分割ワード線構成の場合、グローバルワード線はブロック分割数と等しい数のゲート に入力される、またブロック選択線は1ブロック中のワード線数と等しい数のゲートに 入力される。一般的に1ブロック中のワード線数はブロック分割数より数倍のオーダで 大きいので、ブロック選択線の負荷容量は大きくなりブロック選択線の選択スピードが 遅くなる。変形分割ワード線はこの問題を解決するものである。ブロック選択線を多重 化し、ブロック選択線の負荷容量を分割する。このとき、グローバルワード線はこの多 重度の大きさの行グループ(n<sub>R</sub>)を同時に選択することになり、グローバルワード線はこの多 重度の大きさの行グループ(n<sub>R</sub>)を同時に選択することになり、グローバルワード線の負 荷容量はn<sub>R</sub>と共に上昇する。ワード線の選択はグローバルワード線とブロック選択線も しくは n 分の1 ロウ選択線の論理積であるので、遅い方の選択信号により決定される。 したがって、変形分割ワード線構成ではパラーメータn<sub>R</sub>を最適化することでグローバル ワード線とn 分の1 ロウ選択線のスピードを均等化し、ワード線選択を高速化すること ができる。



図2-2-2:変形分割ワード線構成の概念図

2.2.2 適用例および結果

図2-2-3は変形分割ワード線構成が適用された1MSRAM[2-2]のメモリアレイのブロッ ク分割を示した図である。



図2-2-3:変形分割ワード線構成が適用された1MSRAM[2-2]のメモリアレイ図

1Mビットのメモリセルアレイは512行 x 2048列からなり、32のブロックに分割され ている。消費電力低減のために32の内1つのメモリブロックのみが活性化される。各メ モリブロックは512行と1列の冗長メモリセル列を含む65列からなり65のメモリセルが 1本のワード線に接続されている。ワード線はタングステンシリサイド化されたポリシ リコンで形成されており、シート抵抗は約5オーム/□である。この低抵抗かつ低容量 ワード線が高速化の一つの要因であり、ワード線のCR遅延を0.5nsに短縮している。 各メモリブロックは256Kワードx4ビット構成に対応するために、さらに4つのサブブロッ クに分割されている。行選択信号は変形分割ワード線構成により階層的にデコードされ ており、各2ブロックごとに配置されたブロックロウデコーダとチップ左端に配置され たグローバルロウデコーダによりワード線デコードが行なわれる。

図2-2-4はワード線の選択方法を示すデコード回路である。X0-X8およびZ0-Z4はそれ ぞれ行選択とブロック選択のためのアドレス信号である。Xアドレスの上位X2-X8はグ ローバルロウデコーダにてプリデコードされ、複数のグローバルワード線の中の1本を 選択する。この1MSRAMでは行グループ数n<sub>R</sub>は4で最適化されており、グローバルワ ード線は各ブロックロウデコーダの8個のNANDゲートに入力される。1本のグローバ ルワード線に対応する行グループ数xブロック分割数のワード線の内の1本は図2-2-4 に示されるようにZアドレスによるブロック選択信号とXアドレスの残りの下位X0-X1の プリデコード信号により選択される。



図2-2-4:ワード線の選択方法を示すデコード回路

図2-2-5はビット線を1層目、グローバルワード線を2層目の金属配線で形成した場合の変形分割ワード線構成の効果を示した図である。X軸は行グループの大きさn<sub>R</sub>で1が通常の分割ワード線構成に対応する。n<sub>R</sub>が増加するごとに、グローバルワード線との

クロスオーバー容量が減るのでビット線容量が減少し、高速化に有利となる。同時に、 グローバルロウデコーダの面積は減少し、ブロックロウデコーダの面積は増加しチップ サイズを最小化する最適点が存在する。最適ポイントは設計ルールやメモリ容量で変化 するが、この1MSRAMでは最適値が4となっている。水平方向に走るグローバルワー ド線の容量は増加するが、垂直方向のn分の1ロウ選択線の容量は減少し、n<sub>R</sub>を変える ことで信号線の容量配分を均衡化し速度性能を最適化することが可能となる。結果的に この1MSRAMの標準アクセス時間14nsの50%即ち7nsの高速なワード線選択時間を実 現した。



図2-2-5:変形分割ワード線構成の効果

#### 2.3 T字型ビット線構成

2.3.1 通常ビット線構成とT字型ビット線構成

図2-3-1は通常のビット線構成を示す図である。図中、ローカルロウデコーダはメモ リセルアレイの左端に配置され、ビット線負荷、カラムデコーダ、ローカルセンスアン プおよび書き込み回路はメモリセルアレイの上下に配置されている。通常、SRAMの標 準パッケージは幅が狭いので、このようなメモリセルアレイの上下に多数の回路を配置 する方法はチップの幅を増加させ、標準パッケージに適さない。



図2-3-1:通常のビット線構成図

また、Tranら[2-3]や鈴木ら[2-4]によって報告されているように、高速のデータセンス のためには各カラム(ビット線対)ごとにバイポーラトランジスタを設けるダイレクト カラムセンシングが有効であるが、通常ビット線ピッチが小さいことによる面積的制限 によりダイレクトカラムセンシングを実現するのは困難であり、通常図2-3-2に示され るようにカラムスイッチを用いて複数のカラムスペースを用いてバイポーラセンスアン プを配置する方法がとられている。この方法では、I/O線の容量の増加とカラムスイッ チが直列に挿入されているので、センス時間が増加する問題があり、また複数のカラム ごとにセンスアンプが1つしか配置されないので非常に大きな数のI/O、多数のセンス アンプが同時に動作するSRAMを構成するのには適さない。

新しく提案したT字型ビット線構成[2-5]は通常直線であるビット線をT字型にして、 (1)幅の狭い標準パッケージに合うアレイ構成、(2)高速なデータセンスを実現す るためのダイレクトカラムセンシングが実現可能なアレイ構成、を実現することを目的 としている。





図2-3-3:T字型ビット線構成

図2-3-3はT字型ビット線構成を示す図である。この方式では、ビット線は接続された メタル1とメタル2からなっておりワード線とメタル2のビット線は並行に置かれてい る。カラムピッチはT字型ビット線構成によって1ブロックのカラム数とロウ数の比で 緩和され、カラムピッチを広げることができる。この図はT字型ビット線構成が適用さ れた256K BiCMOS TTL SRAM[2-6]の例であり、1 ブロックは256ロウ/64カラムで構成されているので、メタル2のビット線は4ロウごとにメタル1のビット線に接続されている。このように、T字型ビット線構成はカラムピッチを緩和し各カラムごとにセンスアンプを配置するダイレクトセンシングを可能とする。

2.3.2 適用例および結果

図2-3-4は256K BiCMOS TTL SRAMで使用された変形分割ワード線構成とT字型ビット線構成を組み合わせたメモリアレイの構成を示した図である。各ブロックに配置され たローカルセンスアンプの出力はワイヤードORでリードデータバスに接続されており、 チップ端に配置されたメインセンスアンプに入力されている。トータル64組のリード データバスがメモリアレイ上に配置されており、64ビットという大きい幅のデータを リードデータバス専用の面積を設けることなしに一度に取り出すことが可能である。し たがって、T字型ビット線構成は高性能ワークステーション等に用いられるI/O数の大き なキャッシュメモリを実現するのに適している。



図2-3-4:256K BiCMOS TTL SRAMのメモリアレイの構成

この例では4ビットのI/O構成なので、64ビット中の4ビットをカラムデコーダ出 カにより選択する必要がある。したがって隣接した4つのローカルセンスアンプはひと つのカラムデコーダ出力でコントロールされており、カラムデコーダ出力は16行おき にメモリアレイ上に配線される。結果的に、メモリアレイの一端にグローバルロウデコ ーダを配置し、もう一端にグローバルカラムデコーダを配置する対称性のよいチップレ イアウトが可能となる。また従来各メモリブロックごとに重複して配置する必要があっ たカラムデコーダが1箇所に配置されるのでチップサイズを低減することができる。グ ローバルロウデコーダ出力線、グローバルカラムデコーダ出力線、リードデータバス線 およびメタル2のビット線はすべてメタル2で形成することができ、すべてメモリアレ イ上を並行して走るのでチップサイズを大きくすることはなく、高密度なメモリセルア レイを実現できる。







図2-3-6:シルード配線の有り/無しの回路シミュレーションでの比較

図2-3-5は4行4列分のメモリアレイ上の配線を示した図である。T字型ビット線構成

では、小振幅動作するビット線やリードデータバス線が大振幅で動作するグローバルワ ード線(グローバルロウデコーダ出力)、グローバルカラムデコーダ出力線と平行して 走るので、小振幅信号が大振幅信号からのカップリングノイズを受けることによる誤動 作に対策をする必要がある。そのカップリングの問題は図2-3-5に示すように小振幅信 号線と大振幅信号線の間に低インピーダンスの固定レベルの線(シルード配線)を挿入 することで解決することができる。図2-3-6はこのシルード配線の有り/無しを回路シ ミュレーションで比較した結果であり、2nsのアクセスタイムを短縮することができた。

図2-3-7はT字型ビット線構成を適用した256K BiCMOS TTL SRAMのチップ写真であ り長辺側には入力バッファとブロック選択回路のみが配置されている。チップ短辺が短 縮され、4.28 x 11.05 = 47.3mm<sup>2</sup>が実現された。



図2-3-7:256K BiCMOS TTL SRAMのチップ写真

#### 2.4 結論

本章ではワード線、ビット線の構成すなわちアレイアーキテクチャによるSRAMの高 速化について述べた。

(1) ワード線選択の高速化の手法として、吉本らにより提案された分割ワード線構成を発展させた変形分割ワード線構成を考案した。

(2)変形分割ワード線構成はチップサイズ、ビット線容量のトレードオフを最適化し、 信号線容量配分を均衡化し速度性能を最適化することが可能であることを示した。

(3)変形分割ワード線構成はメモリセルアレイ上を走るグローバルワード線の本数を 減らすので、ビット線容量を減らし、またデコーダ面積を最小化できることを示した。

(4)新しいビット線構成であるT字型ビット線構成を考案した。

(5)T字型ビット線構成は通常メモリアレイの上下に配置されるセンスアンプ/ビット線負荷回路をメモリアレイの左右に配置することを可能とし、標準SRAMで通常用いられてる幅の狭いパッケージに適したチップ構成を実現することを示した。

(6) T字型ビット線構成はカラムピッチを緩和し各カラムごとにセンスアンプを配置 するダイレクトセンシングを可能とし、高速化に適したビット線アーキテクチャである ことを示した。

(7) T字型ビット線構成は64ビット程度の大きなデータ幅を1つのメモリブロック から取り出すことを可能とし、キャッシュメモリなどのI/O数の大きいメモリに適する ことを示した。

(8) T字型ビット線構成は各メモリブロックごとに重複して配置する必要があったカ ラムデコーダの1箇所配置を可能とし、チップサイズを低減することができることを示 した。

(9) T字型ビット線構成は分割ワード線構成や変形分割ワード線構成との整合性が良 く、グローバルロウデコーダ出力線、グローバルカラムデコーダ出力線、リードデータ バス線およびメタル2のビット線はすべてメタル2で形成することができ、すべてメモ リアレイ上を並行して走るのでチップサイズを大きくすることはなく、高密度なメモリ セルアレイを実現できることを示した。 (10)(9)で発生する小振幅信号の大振幅信号からのカップリングノイズによる誤 動作は小振幅信号線と大振幅信号線の間に低インピーダンスの固定レベルの線(シルー ド配線)を挿入することで解決することができることを示した。

### 2.5 参考文献

[2-1] M. Yoshimoto et al., "A divided word-line structure in the static RAM and its application to a 64K full CMOS SRAM," IEEE J. Solid-State Circuits, vol. SC-18, pp. 479-485, Oct. 1983.

[2-2] Yoshio Kohno, Tomohisa Wada, Kenji Anami, Yuji Kawai, Kojiro Yuzuriha, Takayuki, Matsukawa, and Shimpei Kayano, "A 14-ns 1-Mbit CMOS SRAM with Variable Bit Organization," IEEE J. Solid-State Circuits, vol. SC-23, pp. 1060-1066, Oct. 1988.

[2-3] H. V. Tran et al., "An 8-ns 256K ECL SRAM with CMOS memory array and battery backup capability," IEEE J. Solid-State Circuits, vol. SC-23, pp. 1041-1047, Oct. 1988.

[2-4] M. Suzuki et al,, "A 3.5-ns, 500-mW 16K-bit BiCMOS ECL SRAM," IEEE J. Solid-State Circuits, vol. SC-24, pp.1233-1237, Oct., 1989.

[2-5] US patent, Tomohisa Wada, Kenji Anami, Shuji Murakami, "semiconductor memory device," No. 5280441, Jan. 18, 1994.

[2-6] Toru Shiomi, Tomohisa Wada et al., "A 5.8ns 256K BiCMOS TTL SRAM with T-Shaped Bit Line Architecture," IEEE J. Solid-State Circuits, vol. SC-28, pp. 1362-1369, Dec. 1993.


## 第3章

# 回路技術面からの高速化

## 3.1 はじめに

アクセスタイムは大きく分類して(1)ワード線の選択時間、(2)ビット線対がセンス可能な電位差になる時間、(3)ビット線対のデータを増幅しデータバスを介して データを出力バッファに転送する時間、そして(4)出力バッファがチップ外部容量を 駆動する時間に分れる。

本章ではまず最初にHardeeらのアドレス入力信号の変化を感知し同期パルスを発生 し、そのパルスを用いて(2)ビット線対がセンス可能な電位差になる時間を短縮する、 ATD方式(Address Transition Detection)を用いた高速化の概要を説明する。次にATDを 用いた高速化の第2の方法として、(3)ビット線対のデータを増幅しデータバスを介 してデータを出力バッファに転送する時間を短縮する、著者らが考案したATDを用いた データバスプリチャージ方式、デュアルレベルデータバスプリチャージ方式を示し、本 方式によるチップ内部のデータバスの高速化の方法を示す。そしてATDを用いた高速化 の第3の方法として、(4)出力バッファがチップ外部容量を駆動する時間を短縮する、 著者らが考案したATDを用いたデータ出力プリセット方式を説明し、高速化の問題のひ とつであるノイズを低減しながらかつ高速化を実現する方法を示す。

### 3.2 ATD方式の概要

ATD方式はHardeeらの論文[3-1]により初めて紹介された方式であり、現在SRAMの 高速化や低消費電力化のために広く使用されている技術である。HardeeらのSRAMは 1層の金属配線と2層のポリシリコン配線を使用していた。当時まだポリシリコン層の 低抵抗化は一般的ではなく、ポリシリコンの典型的な抵抗値は15-30Ωと高く、ポリシ リコンで形成されたワード線の遅延時間は大きな問題で、SRAMのアクセスタイムを制 限していた。図3-2-1はATDを用いてこの問題を解決する方法を示した図である。

ワード線の容量は非常に大きいのでRC時定数が図3-2-1(A)に示すように、ワード線の 両端に大きな遅延時間が発生する。このワード線遅延時間の間に、ビット線対をショー トし等電位とし、ビット線対を以前の状態から新しい状態に遷移させるのでなく、イコ ライズ状態から新状態に遷移させる。図3-2-1(C)と(D)に示すように、ビット線対が新 しい状態に遷移する時間をΔt分短縮することが可能である。このΔtはこのSRAMでは アクセスタイムの30%以上を占めていた。

図3-2-2はこのATD方式を用いるSRAMのブロックダイアグラムである。すべてのロ ウアドレス入力線(A0-7)はロウデコータを駆動するだけでなく、ATD回路に入力されて いる。任意のロウアドレス入力の遷移がATD回路で検出され、パルス発生回路にトリガ を与える。パルス発生回路はセルフタイムのパルスを発生し、ビット線対をイコライズ するイコライズ回路を駆動しその後ビット線対のイコライズをやめる。



図3-2-1:ATDによる高速化方法



図3-2-2:ATD方式を用いるSRAMのブロックダイアグラム

3.3 データバスプリチャージによる高速化

```
3.3.1 データバスプリチャージ
```

Hardeeらはワード線のRC遅延の間にビット線対をATDを用いて平衡状態にすること で高速化を実現したが、ワード線を構成するポリシリコンのポリサイド化による低抵抗 化や多層の金属配線でのシャントによりワード線の遅延時間が短縮されたSRAMでは、 Hardeeらの方法は高速化に大きなインパクトがなくなった。



図3-3-1:256KSRAMのブロックダイアグラム

図3-3-1は著者らによる256KSRAMのブロックダイアグラムである[3-2]。このように メモリセルアレイが多ブロック分割(この場合16ブロック)された場合、各ブロック 間を結ぶデータバス線が長くなり同時に容量が大きくなる。著者らが考案したデータバ スプリチャージ[3-2]、[3-4]はこのように多ブロック分割され遅延時間が増大したSRAM のデータバス遅延を低減する方法であり、Hardeeらの方法とは異なる高速化を目的と するATDパルスの使用方法である。

図3-3-2はこの256KSRAMのセンス系の回路図であり、図3-3-3はセンス系のタイミン グダイアグラムであり、図3-3-4はデータバスプリチャージ回路とシュミットトリガラッ チ回路である。アドレス入力の遷移を検出してATDパルスが発生する。図3-3-3に示す ように、ATDパルスからIOEQ(I/O line equalize), SEQ(Sense amp equalize), SEn(nth-Sense amp enable)そしてDEQ(Data bus equalize)などのパルスが生成される。 BEQ(Bit line equalize)はビット線対のイコライズをするものでHardeeらの方法と同じ であるが、SEQnそしてDEQはデータバスを電源/GNDの中間電位にプリチャージする ものである。データバスRWD(Read write data bus)の中間電位プリチャージはシュミッ トトリガラッチ(STL)回路と組み合わされデータバスの遅延時間を最小化している。図 3-3-3でRWDとdata outの実線と破線がデータバスプリチャージあり/無しの場合の波 形をそれぞれ示している。



図3-3-2:256KSRAMのセンス系の回路図



図3-3-3:センス系のタイミングダイアグラム

DEQおよびSEQnがHigh状態のときCMOSインバータの入出力は短絡されデータバス RWDはそのCMOSインバータの論理しきい値電圧すなわち中間電位にプリチャージさ れている。そしてDEQおよびSEQnがLowになった後、データがデータバスを転送され る。しかし、データバスが中間プリチャージ状態の時に以前の読み出しデータが出力 data outに保持される必要がある。これを満足するためにSTL回路が出力バッファ直前 に設けられている。STLは以前のデータを保持するので、データバスが中間プリチャー ジ状態の時でもdata outに以前のデータを出力させる。



図3-3-4:データバスプリチャージ回路とシュミットトリガラッチ回路

STL回路はクロスカップルに接続されたインバータとポリサイドで形成された抵抗に より構成されている。図3-3-5(a)と(b)はSTLの入出力特性とタイミングダイアグラムを 示したものである。ノードSTLDは絶えずインバータBによってプルアップもしくはプ ロダウンされており、そのレベルは入力抵抗RinとトランジスタQ3とQ4の抵抗比で決定 される。ここでは、データバスRWDが中間状態にプリチャージされてもSTLDがインバ ータAの論理しきい値(データバスの中間プリチャージレベルに等しい)に到達しない ように設定されている。

DEQおよびSEQnがLowに遷移した後、STLDはRWDに追随して動き、インバータA の論理しきい値を横切り、その後STLDが変化する。入力抵抗の電位差は400mVと設定 しているので、RWDの400mVの変化でSTLを反転させることができる。また、データ バスのプリチャージレベルを決めているのは図3-3-2のセンスアンプの最終段のCMOS インバータと図3-3-4のDEQによりコントロールされるCMOSインバータであり、STL のしきい値もCMOSインバータで決定されており、同一のチャネル幅比Wp/Wnをこれ ら3ケのCMOSインバータで使用することでプロセス変動などによるデバイスパラメー タの変動に対して、データバスプリチャージレベルとSTLのしきい値の関係は常に保証 される。図3-3-6はアクセス時間の比較をしたもので、この256KSRAMではデータバス プリチャージによりデータバスでの遅延時間を6.5nsから2.5nsに4.0ns短縮し、13%以 上のアクセスタイムの短縮を実現した。



図3-3-5:STLの入出力特性とタイミングダイアグラム



図3-3-6:アクセス時間の比較

3.3.2 デュアレレベルデータバスプリチャージ

上記データバスプリチャージはATDを用いて、データバス遅延を減少させる方法であ るが、データバスを中間値にプリチャージするのでその中間値を受ける特別なレシーバ 回路が必要になる。著者らによる256KSRAM[3-2]ではシュミットトリガラッチ回路が 用いられ、Komatsuらによる1MSRAM[3-3]ではdual-threshold data transfer circuitが用 いられている。これらのレシーバ回路はアクセスパスに直列に挿入され、また少なくと も1段のステージを必要とする。一般的にこのようなデータバスプリチャージ方式はデ ータバス容量が非常に大きい場合に使用されるので、段数が少ないが入力容量の大きな 出力バッファを接続することが可能であり、特殊なレシーバ回路を挿入することは適さ ない。



図3-3-7:1MSRAM[3-4]の読み出し系の回路図

著者らが考案したデュアルレベルデータバスプリチャージ[3-4]はこの点を改良するもので、出力バッファの論理しきい値の少し上もしくは下のレベルに以前のデータにしたがってデータバスをプリチャージする方法である。図3-3-7は著者らの1MSRAM[3-4]で使用された読み出し系の回路図であり、図3-3-8は同タイミングダイアグラムである。SEQ3(Sense amp equalize3)、DEQ(Data bus equalize)およびDEQ(Data bus equalize)はATDパルスから生成されたデータバスプリチャージ用の制御パルスである。出力バッファの入力点に接続されたデバイスサイズの小さいラッチ回路に前サイクルのデータが保持されており、この前サイクルのデータにしたがってデータバスのプリチャージレベルは2種類の異なるレベルとなる。ここではそれらのレベルは2Vと3Vとなっており、出力バッファのしきい値を中間の2.5Vに設定している。

このデュアルレベルデータバスプリチャージを用いることで特別なレシーバ回路をア クセスパスに直列に挿入することなく、データバスに出力バッファを直接接続すること が可能となりそれに伴う遅延時間を短縮することが可能となる。ここでの設定ではデー タバスのプリチャージレベルと出力バッファの論理しきい値の差は500mVであり、こ れは上記データバス中間値プリチャージの入力抵抗の電位差400mVとほぼ同じであり、 どちらにしてもデータバスがプリチャージレベルから400mV~500mVの変動してデー タが次段に転送されるのでプリチャージレベルをデュアルにすることによる速度に対す

#### るデメリットは少ない。



図3-3-8:読み出し系のタイミングダイアグラム

## 3.4 出力プリセットによる高速化と低ノイズ化の両立

このセクションでは第3の方法として著者らが考案した出力プリセット方式[3-5]によ る高速化と低出力ノイズ化を述べる。

アクセスタイムは大きく分類して(1)ワード線の選択時間、(2)ビット線対がセ ンス可能な電位差になる時間、(3)ビット線対のデータを増幅しデータバスを介して データを出力バッファに転送する時間、そして(4)出力バッファがチップ外部容量を 駆動する時間に分れる。Hardeeらの方法は(2)を短縮し、著者らが提案したデータ バスプリチャージとその変形のデュアレレベルデータバスプリチャージは(3)を短縮 するものである。そしてデータ出力プリセットは低ノイズ化を実現しながら(4)を短 縮するものである。一般にSRAMの出力ピンには30pF~100pF程度の容量が接続される。 この容量の充放電を高速化するのはドライブ能力の大きい回路を用いればよい、しかし ながら低インピーダンスのドライバを用いるとチップ内部の電源線/接地線にバウンス (ノイズ)を発生しRAMの誤動作を誘発する可能性がある。特に、多数の出力バッファ を持ちそれが同時にスイッチングするような場合、そのバウンスが増大する。データ出 カプリセット方式はこの電源線/接地線にバウンスを増大させずにアクセス時間を短縮 する方法である。

図3-4-1は著者らによる1MSRAM[3-5]の出力プリセット方式を用いた読み出し系の回路図である。それに対応するタイミングダイアグラムが図3-4-2に示されている。



図3-4-1:1MSRAM[3-5]の読み出し系の回路図

IOLG (I/O line equalize)とSE1(Sense enable1)の2つのパルスがATDパルスより発 生される。IOLGはI/O線対をイコライズする(Hardeeらの方法)、SE1はHighの時に CMOSインバータの入出力を短絡してデータバスRWDを中間値にプリチャージする (データバスプリチャージ)。したがって、データバスRWDはSE1がLowに遷移した 後、中間値からメモリセルから読み出されたデータに応じてHighもしくはLowに遷移す る。



図3-4-2:1MSRAM[3-5]のタイミングダイアグラム

図3-4-3は出力バッファのみを詳細に示した図である。出力バッファの第1段目は2 種類の異なる論理しきい値を持つCMOSインバータより構成されている。2つの論理し きい値VHとVLはそれぞれ3/4Vccと1/4Vccである。RWDはSE1にしたがって先にも述べ たように中間電位(1/2Vcc)にプリチャージされる。したがって、この時DOPS(Data output pre-set)がHighとなり、パルスが自動的に発生される。data outがLowであった 場合P型MOSFET Q2のソース、ドレイン、ゲート端子はすべてLowであり、N型 MOSFET Q1のノードはそれぞれLow、High、Highとなる。したがって、Q2はOFF状 態となりQ1はON状態となっている。したがって、出力ノードを充電する電流がQ1を通っ て流れる。この時ノードDPはQ5とQ1の抵抗比と出力ノードの電位で決まる電位に落ち、 Q3をONさせる。そして、Q3とQ1を流れる電流により、出力ノードはLowから中間値 へ充電される。

一方、data outがHighであった場合同様なメカニズムでQ4とQ2を流れる放電電流に より出力ノードはHighから中間値へ放電される。この設計ではQ1およびQ2のチャネル 幅はQ3およびQ4のそれよりかなり小さく設定してあるので、おもな充放電電流はQ3と Q4を流れ、Q1とQ2による出力バッファの面積の上昇を5%以下に低減している。



図3-4-3:出力バッファ回路

data outが中間値になった時Q1とQ2の両者はONしている。この設計ではQ5とQ1の チャネル幅によりこの時のDPのレベルをVcc-0.5Vとなるようにしている。同様に、Q2 とQ6によりDNは0.3Vとしている。したがってdata outが中間値になった時、出力トラ ンジスタQ3とQ4の両者はOFF状態となっておりトランジスタQ3、Q4を通って貫通電 流は流れない。但し、Q1、Q2を通って電流は流れる。この値は、出力バッファ1つに 対して1.5mAとしている。しかし、出力レベルが中間状態となるのは1回の読み出し動 作にに対して10ns以下であり、影響は小さい。このようにして、出力バッファは真の データが現われる前に中間電位にプリセットされ、出力端子は中間レベルからHighもし くはLowレベルに変化する。



図3-4-4:出力バッファのシミュレーション波形

図3-4-4は回路シミュレータSPICE2による出力バッファのシミュレーション波形であ る。出力負荷容量は30pFである。左側はRWD (Read write data bus)のHighからLowへ の変化に対応し、右側はRWDのLowからHighへの変化に対応する。最下段は出力バッ ファの電流波形を示し、中段は電圧波形である。点線は通常の場合であり、実線は出力 プリセット方式を使用した例である。結果的に、1MSRAM[3-5]では出力端子の遷移時 間が半減しアクセスタイムを10%短縮した。また同時に、チップ内部の電源線/接地線 にバウンシングノイズを発生させる電流のピーク値ならびに最大傾斜値を30%削減した。

### 3.5 結論

本章では回路技術、とくにATDを利用するSRAMの高速化について述べた。

(1) ATDを用いた高速化の別の手法としてデータバスプリチャージを考案した。

(2)データバスと出力バッファの間にシュミットトリガラッチ(STL)回路を設けて、 データバスプリチャージ中にデータ出力端子が前サイクルの状態を保持することを可能 とした。

(3)データバスプリチャージは著者らによる256KSRAM[3-2]で、データバスでの遅 延時間を6.5nsから2.5nsに4.0ns短縮し、13%以上のアクセスタイムの短縮を実現した。

(4) データバスプリチャージの特別なレシーバ回路を不要とする、データバスを2種類の異なるレベルにプリチャージするデュアルレベルデータバスプリチャージを考案した。

(5) デュアルレベルデータバスプリチャージは特別なレシーバ回路のアクセスパスへの直列挿入する必要性をなくし、データバスに出力バッファを直接接続することを可能とし、それに伴う遅延時間の短縮が可能であることを示した。

(6) ATDを用いた高速化の別の手法としてデータ出力プリセットを考案した。

(7) データ出力プロセットはチップ内部の電源線/接地線にバウンスを増大させずに 出力バッファがチップ外部容量を駆動する時間を短縮することを示した。

(8) データ出力プリセットは著者らによる1MSRAM[3-5]のバウンシングノイズの原因の電流のピーク値ならびに最大傾斜値を30%削減ながら、アクセス時間を10%削減した。

## 3.6 参考文献

[3-1] Kim C. Hardee and Rahul Sud, "A Fault-Tolerant 30ns/375mW 16K x 1 NMOS Static RAM," IEEE J. Solid-State Circuits, vol. SC-16, pp. 435-443, Oct. 1981.

[3-2] S. Kayano, K. Ichinose, Y. Kohno, H. Shinohara, K. Anami, S. Murakami, T. Wada, Y. Kawai, and Y. Akasaka, "25-ns 256Kx1/64Kx4 CMOS SRAM's," IEEE J. Solid-State Circuits, vol. SC-21, pp. 686-691, Oct. 1986.

[3-3] T. Komatsu, N. Okazaki, T. Nishihara, S. Kayama, N. Hoshi, J. Aaoyama, and T. Shimada, "A 35ns 1Mb CMOS SRAM," ISSCC Dig. Tech. Papers, Feb. 1987, pp.258-259.

[3-4] Y. Kohno, T. Wada, K. Anami, Y. Kawai, K. Yuzuriha, T. Matsukawa, and S. Kayano, "A 14-ns 1-Mbit CMOS SRAM with Variable Bit Organization," IEEE J. Solid-State Circuits, vol. SC-23, pp. 1060-1066, Oct. 1988.

[3-5] T. Wada, T. Hirose, H. Shinohara, Y. Kawai, K. Yuzuriha, Y. Kohno, and S. Kayano, "A 34-ns 1-Mbit CMOS SRAM Using Triple Polysilicon," IEEE J. Solid-State Circuits, vol. SC-22, pp727-732, Oct 1987.

第4章

## キャッシュメモリとしての高速化

### 4.1 はじめに

高速SRAMが最も必要とされるアプリケーションは高性能のコンピュータシステムで あり、主にSRAMはキャッシュメモリとして使用されている。キャッシュメモリはある 大きさの固まったデータをアクセスするので完全なランダムアクセスを必要としない。

また、キャッシュメモリにはブロックサイズ、アソシアティビティのようなキャッシュ メモリのヒット率に関係する論理的なパラメータ(以後、論理パラメータ)が加わり、 この論理パラメータのLSI上での構成方法でSRAMのアクセスタイムも影響を受ける。

本章では、高速SRAMの最も大きい応用分野であるキャッシュメモリのアクセスタイ ムの最適化に対して有効なアクセスタイムモデルについて述べる[4-11]。このモデルは 特に設計自由度の高いオンチップキャッシュの解析的モデルであり、通常のキャッシュ サイズ、ブロックサイズ、アソシアティビティのような論理パラメータ以外にメモリア レイの物理構成に関するパラメータ(以後、物理パラメータ)を含んでいる。このモデ ルにより、詳細な回路設計なしにキャッシュメモリのスピードを見積ることができ、多 種多様なキャッシュメモリ設計の最適化をすることができる。

そして、そのアクセスタイムモデルを用いてキャッシュメモリの論理構成と物理構成 によるスピードのトレードオフを示し、キャッシュメモリとしてSRAMを高速化する方 法を示す。

## 4.2 On-Chipキャッシュメモリ用のアクセスタイムモデル

#### 4.2.1 背景

VLSI技術の急速な進歩に伴ってマイクロプロセッサのクロック周波数は飛躍的に向 上してきている。この高速クロックの利点を性能に有効に発揮させるには、ペナルティ なしにマイクロプロセッサにメモリシステムからインストラクションやデータを供給す る必要があり、高いバンド幅でインストラクションやデータを転送する必要がある。し かし、論理ゲートのスピードはVLSI技術の向上で非常に高速になっている一方で、メ モリのアクセススピードはそれほど向上していない。その1つの理由はVLSI技術の向 上と同時に必要とされるメモリ容量も増大しているからである。したがって、キャッシュ メモリは高速なコンピュータシステムを実現する場合重要な技術となってきている。

ほとんどのキャッシュメモリに関する研究はミス率、トラフィック率という典型的な キャッシュメモリの性能評価指数を最小化することを主にしている。しかし、本当の性 能評価指数は与えられたワークロード(仕事)の実行時間である。多くの場合、オンチッ プキャッシュはシステムのサイクルタイムを決めるクリティカルな要因である。そのた め、論理パラメータ(キャッシュサイズ、ブロックサイズ、アソシアティビティ)とキャッ シュアクセスタイムの関係を定量化することは重要となる。この定量化により、キャッ

-43-

シュメモリ設計者がキャッシュメモリを最適化し最良の設計を実現することが可能となる。オンチップキャッシュの場合、設計者が標準SRAMでオフチップキャッシュを構成 するのに比べて構成に対してフレキジブルに設計することができるので、この定量式は 特にオンチップキャッシュの場合にさらに有効となる。

オンチップキャッシュメモリを設計する場合、論理パラメータ(キャッシュサイズ、 ブロックサイズ、アソシアティビティ)がキャッシュアクセスタイムに影響を与えるだ けでなく、メモリアレイのアスペクトレシオのような物理的な構成を決める物理パラメ ータもアクセスタイムに影響を与える。DuncombeのSPURマイクロプロセッサのキャッ シュシステムのレポート[4-1]では、キャッシュサイズとアスペクトレシオのアクセスタ イムに対する影響を検討している。このレポートの中でキャッシュアクセスタイムは SPICE非線形回路シミュレータによって求められている。しかし、この方法では大きな キャッシュメモリ設計の自由度をカバーするには多数回のシミュレーションの実行が必 要となる。その上、SPICEは論理パラメータや物理パラメータ以外に多数の回路的パラ メータも必要となり、SPICEだけで有限時間内に多種多様なキャッシュメモリ設計すべ てをカバーし、最適解を見つけることは困難である。仮に、シンプルでかつある程度の 精度があり広いキャッシュメモリ設計の自由度をカバーするアクセスタイムのモデルが 存在すれば、設計者はそのモデルにより最速のアクセスタイムを持つキャッシュや論理 パラメータを選ぶことができる。これにより設計の最適解に近い構成を探し、最終的に 集中的なSPICEシミュレーションで設計を最適化することができる。

4.2.2 キャッシュメモリの構成

| 表4 | -2- | 1 | : | ア | ク | セス | タ | 1 | 4 | Ŧ | デ | ル | パ | ラ | X | ータ |
|----|-----|---|---|---|---|----|---|---|---|---|---|---|---|---|---|----|
|----|-----|---|---|---|---|----|---|---|---|---|---|---|---|---|---|----|

| Symbol | s Meanings                         | Parameters & Equations            |
|--------|------------------------------------|-----------------------------------|
| В      | Block Size                         | 4B, 8B, 16B, 32B                  |
| A      | Associativity                      | 1, 2, 4, 8                        |
| S      | Number of sets                     | 256, 512, 1K, 2K, 4K, 8K,16K      |
| Ndwl   | # of segments per word line (Data) | 1, 2, 4                           |
| Ndbl   | # of segments per bit line (Data)  | 1, 2, 4                           |
| Ntwl   | # of segments per word line (Tag)  | 1, 2, 4                           |
| Ntbl   | # of segments per bit line (Tag)   | 1, 2, 4                           |
| Rows   | Number of rows in a sub-array      | S/Ndbl                            |
| Cols   | Number of columns in a sub-array   | 8•B•A/Ndwl                        |
| Subs   | Number of sub-arrays               | Ndwl•Ndbl                         |
| с      | Cache size                         | B·A·S = S/Ndbl·B·A/Ndwl·Ndwl·Ndbl |

この解析モデルに用いられるパラメータを表4-2-1にまとめる。B、A、およびSは主

要論理パラメータであり、それぞれはブロックサイズ、アソシアティビティ、セット数 に対応する。これらの他に物理的構成に関係する4つの物理パラメータ(Ndwl、Ndbl、 Ntwl、Ntbl)を新たに導入した。Ndwlはデータアレイ中のワード線の分割数であり、 Ndblはデータアレイ中のビット線の分割数である。分割されたワード線に対応するセグ メントはそのセグメントごとにワード線ドライバをもっており、1つのワード線に対応 するNdwl個のセグメントはある特定のロウアドレスに対応し同時に選択される。分割 されたビット線に対応するセグメントはそのセグメントごとにセンスアンプをもち、1 つのビット線に対応するNdbl個のセグメントはある特定のカラムアドレスに対応する。 しかし、特定のコラムアドレスに対して1つのセンスアンプ(セグメント)のみが活性 化される。したがって、同時に選択されるメモリセル数および同時に活性化されるセン スアンプ数はNdwlやNdblによって変化しない。NtwlおよびNtblはタグアレイに関して 同様に定義される。図4-2-1(a)は最も基本的な2ウエイセットアッソシアティブのキャッ シュメモリの構成であり、Ndwl=Ndbl=1に対応する。ここで、セット数Sはアレイのロ ウの数(Rows)と等しくなり、(8・B・A)はアレイのカラムの数(Cols)と等しくなる。



図4-2-1:キャッシュメモリの構成

(a) Ndwl=Ndbl=1の2ウエイセットアソシアティブキャッシュ

(b) Ndwl=2, Ndbl=1の2ウエイセットアソシアティブキャッシュ

- (c) Ndwl=Ndbl=1ならびにセットサイズSが大きいダイレクトマップキャッシュ
- (d) Ndwl=1, Ndbl=2ならびにセットサイズSが大きいダイレクトマップキャッシュ

図4-2-1(a)の例では、ワード線の長さ(8·B·A)は長すぎてワード線の遅延がアクセス タイムの中の主要な成分になる場合がある。このような場合、ワード線をもっと短いセ グメントに分割(すなわち、Ndwl > 1)することでアクセスタイムを減らすことが可能 になる場合がある。図4-2-1(b)は4-1-1(a)と同じキャッシュを異なる物理構成(Ndwl=2) で構成したものであり、より小さいワード線遅延を持つ(図中の2本のワード線は同時 に選択される)。

他のアクセスタイムを決定する大きな要因としてビット線の遅延がある。図4-2-1(c) は大きなセット数を持つ場合のデータアレイの構成を示している。このアレイ構成はビッ ト線容量が大きくなる構成に対応しておりビット線遅延を増大させる。そのビット線遅 延時間を減らすために、ビット線は分割され複数のセグメントにすることができる(す なわち、Ndbl > 1)。図4-2-1(d)は4-1-1(c)と同じキャッシュメモリアレイをNdwl=1で Ndbl=2で構成した場合である。この場合、ある特定のビット線に対応するセンスアン プの1つが選択/活性化される。

Ndwl=1、Ndbl=2のアレイ構成(図4-2-1(b))とNdwl=2、Ndbl=1のアレイ構成(図 4-2-1(d))は図のように一見同じ構成のように見えるが、これらの2つの構成は異なる 数の行/列のアドレス信号線に対応する。前者は後者の半分のセット数を持ち、後者は 前者の半分の(B·A)を持つ。

4.2.3 解析的アクセスタイムモデル





図4-2-2:標準的なRAMアレイ

メモリブロックはn個のサブブロックに分割されており、各々のサブブロックはロウ デコーダ、ビット線負荷、カラムデコーダ、マルチプレクサ、センスアンプなどの周辺 回路を含んでいる。読み出し動作は入力アドレスのデコード、対応するワード線のハイ レベルへの駆動、メモリセルのデータのビット線への転送、ビット線電圧の感知増幅、 チップ内部データバスのドライブ、そして出力バスの駆動からなる。このアクセスタイ ムモデルでは図4-2-3に示すように、全体を大きく4つのコンポーネント(デコード遅 延、ワード線遅延、ビット線/センスアンプ遅延、データバス/出力遅延)に分解して いる。



図4-2-3:クリティカルパス

### A デコード遅延

図4-2-4は典型的な4ビットのデコード回路である。ワード線ドライバとワード線も 含まれている、しかしアドレス信号AOのフェイズスプリッタ(同相およびその反転を 作るバッファ回路)がインバータ2ケ(2つの反転信号)に変更され、他のアドレスの フェイズスプリッタ出力がすべてハイレベルに固定されている。以上の修正により、 AO信号によりすべてのワード線ドライバ/ワード線がコントロールされるようになる。 この変更は回路の動作を変えるのだが、入力段からワード線ドライバまでの遅延時間に は影響を与えない。何故なら、遅延パスに添ったゲートは同一であり同一の駆動能力を 持ち、同一の入出力の接続すなわち負荷容量が同じであるからである。したがって、図 4-2-4のデコーダの遅延時間はファンアウトが大きい場合の回路の最適化問題[4-2]と考 えることができる。

各ゲートの遅延時間はそのファンアウト数と入力数に比例すると仮定すると、トータ ルのデコード遅延(Tdecode)は以下の式で現すことができる[4-3]。

$$T_{decode} = t_0 \bullet f_{out} \bullet N_{in} \bullet N_{stage}$$
(4-2-1)

ここで、t0はファンアウト1のインバータの遅延時間、foutは各論理ゲートの平均ファ ンアウト数、Ninは各論理ゲートの平均入力数、そしてNstageはトータルの論理ゲート の段数である。各論理ゲートはインバータ、NANDゲート、NORゲートのいずかである。 Ninが2の場合は2入力NANDもしくは2入力NORゲートに対応する。TdecodeがNin に比例するという仮定はショートチャネルトランジスタの場合に直列接続のトランジス タの数に遅延時間が大きく依存しないので、それほど正確ではない場合もありうる。し かし、NinはTdecodeを最小化した場合1から2の間と小さい値になり誤差は10%以下 となり、この仮定は大きくは違わない。



図4-2-4:4ビットデコーダ

トータルのファンアウト数FOUTtotalは以下の式で与えられる。

$$FOUT_{total} = f_{out}^{Nstage} = \frac{C_{Nstage+1}}{C_1} \cdot Total WL$$
 (4-2-2a)

ここでC1は初段すなわちインバータ2ケの入力容量であり、CNstage+1は各ワード線 ドライバの入力容量である。Nstageはデコーダの初段からワード線ドライバの前段 (ワード線ドライバは含まない)までの段数である。

すべてのワード線ドライバ数(Total WL)はデータアレイとタグアレイを含めるとS·( Ndwl+Ndwl)となるので、式(4-2-2a)は以下のようになる。

$$f_{out}^{Nstage} = \frac{C_{Nstage+1}}{C_1} \cdot S \cdot (N_{dwl} + N_{twl})$$
(4-2-2b)

初段は複雑な論理ゲートでなくインバータなので、アドレス入力数Naddは以下のよ

-48-

うになる。

$$N_{add} = \log_2 S = N_{in}^{Nstage-1}$$
(4-2-3)

式(4-2-2b)および(4-2-3)を(4-2-1)に代入すると、以下の式(4-2-4)がえられる。

$$T_{\text{decode}} = t_0 \left( \frac{C_{\text{Nstage+1}}}{C_1} \cdot S \cdot (N_{\text{dwl}} + N_{\text{twl}}) \right)^{1/\text{Nstage}} \cdot (\log_2 S)^{1/(\text{Nstage-1})} \cdot N_{\text{stage}} (4-2-4)$$

この式(4-2-4)はTdecodeはNstageの関数であり与えられたS、Ndwl、Ntwlに対して 最小値を持つことを示している。Nstageは通常10以上なので、Nstage - 1はNstageと 近似することができる。したがって、Tdecodeの最小値(4-2-5a)がdTdecode/dNstage = 0を解くことで以下のように得られる。

$$T_{\text{decode}} = t_0 \cdot D^{1/\ln D} \cdot \ln D \tag{4-2-5a}$$

ここで、

$$D = \left(\frac{C_{Nstage+1}}{C_1}\right) x \left(S \cdot \log_2 S\right) x \left(N_{dwl} + N_{twl}\right)$$
(4-2-5b)

図4-2-5は最小のデコード遅延Tdecodeを示した図である。S・(Ndwl + Ntwl)即ち、トータルのワード線ドライバの数に対して大きな依存性を持っている、しかしS・(Ndwl + Ntwl)を固定しSだけを変えた場合はあまり変化しない。これはNinパラメータがトータルのデコード遅延に大きな影響がないことを示している。



図4-2-5:デコード遅延

本デコード遅延モデルの限界は各ゲートの入力容量は考慮されているが、配線遅延の ような寄生容量は無視されている点と実際のデコーダ回路はチップ上のレイアウトの制 約などにより段数を減らし格段のファンアウトを大きく取る場合があり、このモデルの ように最適化されない点である。結果的に、このデコード遅延モデルはデコード遅延の 理論的最小値を与えることになる。

B ワード線遅延

ワード線ドライバは立ち上がり時間と立ち下がり時間が同じになるようにプルアップ とプルダウンのトランジスタサイズが適切に設定されたCMOSインバータと考える。2 μmルール時代の1層ポリシリコンのワード線は図4-2-6(a)のように、分散RCとしてモ デル化することができる。しかし、最近の新しいプロセスではダブルワード線方式[4-5]、 [4-6]と称し、メタルワード線がポリシリコンワード線と並行に配置され、ポリシリコン ワード線はメタルでシャントされる。通常、それらの配線容量は駆動されるすべてのト ランジスタのゲート容量より十分に小さい。0.8 μm CMOSプロセス[4-9]ではW=L=1 μ mのトランジスタのゲート容量は1.95fFであり、フィールド酸化膜上のポリシリコン配 線の容量は0.075 fF/μm2と十分に小さい。したがって、ダブルワード線構造は図 4-2-6(b)のようにランプ容量でモデル化することができる。



(a) 旧ワード線モデル、(b) 新ワード線モデル

簡単なモデルで計算すると、ワード線遅延Twlは以下のようになる。

$$T_{wl} = \frac{C_{total} \cdot \Delta V}{I} = Cols \cdot C_{wcell} \cdot \frac{V_{dd}}{2 \cdot I_{dn}} = \left(\frac{4 \cdot C_{wcell} \cdot V_{dd}}{I_{dn}}\right) \times (B \cdot A) \times \left(\frac{1}{N_{dwl}}\right) (4-2-6)$$

ここでCwcellはメモリセル1ケあたりのワード線容量であり、通常2つのパストラン ジスタのゲート容量に相当する。Vddは電源電圧であり、通常は5V。ldnはワード線ト ライバのNMOSトランジスタの平均飽和電流(Vgs=Vdsのとき)であり、PMOSトラン ジスタの平均飽和電流ldpと等しいと仮定している。

C ビット線/センスアンプ遅延

図4-2-7はビット線とその周辺回路であり、メモリセル、ビット線負荷、センスアン プから構成されている。Cblはビット線容量であり、サブアレイのビット長(S/Ndbl)と 1ビット当たりのビット線の単位容量Cbcellの積となる。Cbcellは主としてパストラン ジスタのドレイン部のジャンクション容量が占めている。クロックで制御されたビット 線負荷を用いる設計も可能であるが、ここでは簡単のためにDC動作のビット線負荷を 仮定する。DCビット線負荷は通常小さい振幅を持つので、ビット線負荷トランジスタ は線形抵抗と考えることができ、メモリセルのパストランジスタは飽和領域で動作して いると考えることができる。図4-2-8(a)は簡略化されたビット線遅延モデルであり、メ モリセル電流Ic=0はビット線の充電動作に対応し、Icが0でないの場合はビット線の放 電動作に対応する。

キルヒホッフの法則により、

$$C_{b1} \frac{\partial V_{b}}{\partial t} = \frac{p_{1}C - b}{R_{1}} - I_{c} \qquad (4-2-7)$$

$$C_{bl} \frac{\partial V_b}{\partial t} = \frac{V_{pre} - V_b}{R_l} - I_c$$

-51-



図4-2-8:簡略化されたビット線遅延モデル

ここでVpreはビット線最大プリチャージレベルであり、この場合Vdd - Vthになる。式 (4-2-7)を解くと、

$$V_b = V_{pre} - R_l \cdot I_c \left(1 - \exp\left(-\frac{t}{R_l \cdot C_{bl}}\right)\right)$$
 discharge (4-2-8a)

 $V_b = V_{pre} - R_l \cdot I_c \cdot exp\left(-\frac{t}{R_l \cdot C_{bl}}\right)$  precharge (4-2-8b)

式(4-2-8a)は放電時に対応し、(4-2-8b)は充電時に対応する。

図4-2-8(b)はこれらの波形図を示したものである。差動センス電圧ΔVはこれらの電圧 の差であるので、ΔVは以下のようになる。

$$\Delta \mathbf{V} = \mathbf{R}_{\mathbf{l}} \cdot \mathbf{I}_{\mathbf{C}} \left( 1 - 2 \cdot \exp\left(-\frac{\mathbf{t}}{\mathbf{R}_{\mathbf{l}} \cdot \mathbf{C}_{\mathbf{bl}}}\right) \right)$$
(4-2-9)

したがって、∆V=0のとき、

$$t_1 = -R_1 \cdot C_{b1} \cdot \ln 0.5 = 0.7 R_1 \cdot C_{b1}$$
 (4-2-10)



図4-2-9:センスアンプ周辺の信号波形

(a) ビット線電位差ΔV、(b) ΔVの近似波形、(c) S1、S1信号波形、(d) S2波形

図4-2-9(a)はΔVの時間依存性を示したものである。ΔV=Vsenseの時の時間t2は以下の ようになる。

$$\mathbf{t}_2 = -\mathbf{R}_1 \cdot \mathbf{C}_{bl} \cdot \ln \left[ 0.5(1 - \frac{\mathbf{V}_{\text{sense}}}{\mathbf{R}_1 \cdot \mathbf{I}_c}) \right]$$
(4-2-11)

ここでVsenseはセンスアンプによって正しくセンス動作が行なわれる最小差動電位で ある。センスアンプ遅延を解析するためにこの波形は図4-2-9(b)のようにt2でのステッ プ入力と近似する。

図4-2-10はセンスアンプとデータバスドライバである。このセンスアンプは3つのカレントミラー型差動ステージからなり、ビット線間の差動電圧を感知増幅し、Vddの大きさ程度まで増幅する。したがって、各々のセンスアンプ段は式(4-2-12)で与えられるゲインGを持つ。

$$R_{l} \cdot I_{c} \cdot G^{2} = V_{dd} \tag{4-2-12}$$

ここでRI・Icはビット線の最大振幅である。初段の2つのカレントミラー型差動ステージ と2段目のカレントミラーセンスアンプが同じ消費電流を持つと仮定すると、NMOSト ランジスタQ1-Q4はGm/2の相互コンダクタンスを持ち、Q5-Q6はGmの相互コンダク タンスを持つことになる。センスアンプ1段目の遅延時間(t3-t2)は以下のようになる。

$$t_{3} - t_{2} = \frac{C_{\text{total}} \cdot \Delta V}{I} = \frac{\frac{3}{4}G \cdot (R_{1} \cdot I_{c}) \cdot C_{cm}}{\frac{G_{m}}{2} \cdot R_{1} \cdot I_{c}} = \frac{3 \cdot G \cdot C_{cm}}{2 \cdot G_{m}}$$
(4-2-13)

ここでCcmは2段目のセンスアンプの入力容量となる。(4-2-12)式のGを(4-2-13)式に代 入すると、

$$t_3 - t_2 = \frac{3 \cdot C_{cm}}{2 \cdot G_m} \sqrt{\frac{V_{dd}}{R_1 \cdot I_c}}$$
(4-2-14)



図4-2-10:センスアンプ

NMOSトランジスタQ1-Q4が飽和している場合、

$$G_{m} = \mu_{n} \cdot C_{ox} \cdot \left(\frac{W}{L}\right) \cdot (V_{gs} \cdot V_{tn})$$
(4-2-15)

したがって、

$$\frac{C_{cm}}{G_m} = \frac{C_{ox} \cdot W \cdot L}{\mu_n \cdot C_{ox} \cdot \left(\frac{W}{L}\right) \cdot (V_{gs} \cdot V_{tn})} = k \cdot L^2$$
(4-2-16)

式(4-2-16)は初段センスアンプの遅延時間(t3 - t4)はL<sup>2</sup>に比例することを示しており、この遅延時間は微細トランジスタを用いることで改善できることを示している。

同様の方法で2段目のセンスアンプの遅延時間(t4-t3)を計算すると以下のようになる。

$$t_4 - t_3 = \frac{V_{dd} \cdot C_{dbd}}{2 \cdot G_m \cdot R_l \cdot I_c \cdot \sqrt{\frac{V_{dd}}{R_l \cdot I_c}}} = \frac{C_{dbd}}{2 \cdot G_m} \sqrt{\frac{V_{dd}}{R_l \cdot I_c}}$$
(4-2-17)

ここで、Cdbdはデータバスドライバの入力容量である。大きなGmはセンスアンプでの 消費電力が大きいことに対応し、この遅延時間を減らすには消費電力を大きく取る必要 がある。

したがって、トータルのビット線/センスアンプ遅延は以下のように示すことができる。

$$T_{bit} = \frac{1}{2 \cdot G_m} \sqrt{\frac{V_{dd}}{R_l \cdot I_c}} (3C_{cm} + C_{dbd})$$

$$- \ln \left( 0.5(1 - \frac{V_{sense}}{R_l \cdot I_c}) \right) \cdot R_l \cdot C_{bcell} \times (S) \times \left( \frac{1}{N_{dbl}} \right)$$
(4-2-17a)

ビット線負荷をクロック動作した場合の遅延時間はTbit(clock) = Tbit - t1となるので、

$$T_{bit}(clock) = \frac{1}{2 \cdot G_m} \sqrt{\frac{V_{dd}}{R_l \cdot I_c}} (3C_{cm} + C_{dbd}) + \left(-\ln\left(0.5(1 - \frac{V_{sense}}{R_l \cdot I_c})\right) - 0.7\right) \cdot R_l \cdot C_{bcell} \times (S) \times \left(\frac{1}{N_{dbl}}\right)$$
(4-2-17b)

図4-2-10で、データバスドライバは多数のドライバが同一のデータバスに接続される 場合があるので、Clocked CMOSが使用されている。SEL信号およびSEL信号はアドレ ス信号もしくはタグ部でのヒット信号によりコントロールされる。タグ部のヒット信号 の場合はSEL信号はセンスアンプ出力のS2信号より遅い場合が考えられる、すなわち クリティカル時間がタグによって決定する場合である。しかし、sawadaらの32KBのキャッ シュメモリ設計[4-7]にあるようにタグアレイのセンスアンプ電流を増加することでこの タグによるペナルティは消すことが可能である。Hillによって示されたデータ[4-8]によ れば、カスタム設計のダイレクトマップのキャッシュと2ウエイセットアソシアティブ のキャッシュのアクセス時間の差は2%である。したがって、式(4-2-17a)、(4-2-17b)は セットアソシアティブキャッシュの解析にも使用可能である。

D データバス/出力遅延

図4-2-11はデータバスドライバから出力ドライバを示している。データバス/出力遅 延Toutは以下のように示される。

$$T_{out} = \frac{C_{total} \cdot \Delta V}{I} = \frac{(C_{db} + C_{dod}) \cdot V_{dd}}{2 \cdot I_{dbd}} + \frac{C_{out} \cdot V_{dd}}{2 \cdot I_{dod}}$$
(4-2-18a)

$$C_{db} = C_{sout} \cdot A \cdot N_{dbl} + C_{metal} \cdot 8 \cdot B \cdot A \cdot N_{dbl}$$
(4-2-18b)

即ち、

$$T_{out} = \frac{V_{dd}}{2} \left( \frac{C_{dod}}{I_{dbd}} + \frac{C_{out}}{I_{dod}} \right) + \frac{V_{dd} \cdot C_{sout}}{2 \cdot I_{dbd}} x (A \cdot N_{dbl}) + \frac{4 \cdot V_{dd} \cdot C_{metal}}{I_{dbd}} x (B \cdot A \cdot N_{dbl})$$
(4-2-18c)

ここでCdbはデータバス容量でありデータバスドライバの出力容量(Csout・A・Ndbl)とメ タル配線容量(Cmetal・8・B・A・Ndbl)の和となる。Csoutはデータバスドライバの出力容 量、Cmetalはメモリセル1ビットに対応するメタル配線の容量である。Cdodは出力ド ライバの入力容量、Coutは出力ドライバの出力容量である。Vddは電源電圧であり、こ こでは5V、ldbdおよびldodはデータバスドライバと出力ドライバの充放電電流であり、 ここでは充電と放電の電流値が同じであるとしている。



図4-2-11:データバスドライバから出力ドライバまでの回路図

E アクセスタイム

以上の結果をまとめると、トータルのアクセス時間Taccessは以下のようになる。

$$T_{access} = t_{0} \cdot D^{1/\ln D} \cdot \ln D$$

$$+ \left(\frac{4 \cdot C_{wcell} \cdot V_{dd}}{I_{dn}}\right) \times (B \cdot A) \times \left(\frac{1}{N_{dwl}}\right)$$

$$+ \frac{1}{2 \cdot G_{m}} \sqrt{\frac{V_{dd}}{R_{l} \cdot I_{c}}} (3C_{cm} + C_{dbd})$$

$$+ \left(-\ln\left(0.5(1 - \frac{V_{sense}}{R_{l} \cdot I_{c}})\right)\right) \cdot R_{l} \cdot C_{bcell} \times (S) \times \left(\frac{1}{N_{dbl}}\right)$$

$$+ \frac{V_{dd}}{2} \left(\frac{C_{dod}}{I_{dbd}} + \frac{C_{out}}{I_{dod}}\right)$$

$$+ \frac{V_{dd} \cdot C_{sub}}{2 \cdot I_{dbd}} \times (A \cdot N_{dbl})$$

$$+ \frac{4 \cdot V_{dd} \cdot C_{metal}}{I_{dbd}} \times (B \cdot A \cdot N_{dbl})$$

$$D = \left(\frac{C_{Nstage+1}}{C_{1}}\right) \times (S \cdot \log_{2}S) \times (N_{dwl} + N_{twl})$$

$$(4-2-5b)$$

式(4-2-19)において、第1項はデコード遅延、第2項はワード線遅延、第3項および 第4項はビット線/センスアンプ遅延、第5から7項はデータバス/出力遅延に対応し ている。式(4-2-19)および(4-2-5b)はVdd、C、Idの様な最小限の回路的パラメータとB、 A、Sなる論理パラメータおよびNdwl、Ntwlのようなアレイの物理的構成に関する物理 パラメータからなっている。近似的に回路パラメータを決めた後で、アクセス時間 Taccessは論理パラメータと物理パラメータを変えて最適化することができる。

#### 4.2.4 モデルの検証

以後のアクセスタイムモデルや回路シミュレータSPICEを用いた計算では、0.8µmの CMOSプロセスを仮定して話を進める。用いられたSPICEトタンジスタパラメータは Standord大学の講義で用いられたものを使用した[4-9]。

モデル中の回路パラメータはこのSPICEトランジスタモデルから計算されており、回 路の定数は図4-2-6、4-1-7、4-8(a)、4-10および4-11に示されている。結果的に使用し たパラメータはto=122ps、Cwcell=3.36fF/cell、ldn=3.3mA、Vdd=5V、lc=0.2mA、 Rl=1.2KΩ、Cbcell=2.5fF/cell、Gm=0.45mA/V、Ccm=15.5fF、Cdbd=0.266pF、 Vsense=100mV、Csout=0.16pF、Cmetal=1.2fF/cell、Cdod=0.67pF、ldbd=6.6mA、 Cout=5pF、そしてldod=33mAである。

図4-2-12は式(4-2-5)を用いて得られるデコード遅延Tdecodeを示した図である。ここ で、C1=2・CNstage+1、すなわちワード線ドライバのサイズとフェイズスプリッタのサ イズは等しいとしNdwl=Ndblとしている。単位遅延時間toは7段のリングオシレイター のSPICEシミュレーションにより得られた値である。このデコード遅延モデルは先に述 べたようにデコード遅延の理論的最小値を与え、またデコード回路の構成は様々な構成 が考えられるので、SPICEシミュレーションとの比較は行なっていない。



図4-2-12:デコーダ遅延



図4-2-13:ワード線遅延

図4-2-13はモデル式(4-2-6)とSPICEシミュレーションによるワード線遅延Twlの論理 パラメータに対する依存性を比べたものである。計算およびSPICEシミュレーションに 使用されたデバイスのサイズは図4-2-6(b)および4-1-7に示されている。SPICEとモデル は非常に良い一致を示した。

図4-2-14はビット線/センスアンプ遅延をデータアレイ中の行(ロウ)の数に対して

プロットしたものである。ここで、ビット線容量はCbcell=2.5fF/cellが用いられている [4-10]。タグアレイに対するビット線/センスアンプ遅延は同一のグラフのNdblを単純 にNtblに置き換えることで得られる。256行以下のとき、アクセスタイムモデルと SPICEシミュレーションの間に少しの違いがあるがアレイの行(ロウ)数が大きい時は 非常に良い一致を示している。



図4-2-14:ビット線/センスアンプ遅延

データバス/出力遅延とデータアレイ中のビット線の分割数Ndblの関係を図4-2-15に 示す。Csout=0.16pFおよびCmetal=1.2fF/cellは著者らの1MSRAMの論文[4-10]から計 算した。SPICEの結果とアクセスタイムモデルの結果の間に少しの違いが見られる。こ の、誤差はモデルでは入力信号がステップ波形という仮定により生じていると考えられ る。SPICEシミュレーションでは入力波形の立ち上がり時間/立ち下がり時間の効果が 考慮されているが、モデルではこの効果は無視されている。しかしながら、絶対差は 1ns以下であり、小さい。

したがってSPICEとアクセスタイムモデルの違いは1.5ns以下であり、8-nsのアクセ ス時間を持つキャッシュメモリでは20%程度の誤差となる。しかしながら、この解析的 アクセスタイムモデルの目的は設計者にアクセス時間を最小とする論理パラメータやメ モリアレイの物理構成を決める物理パラメータを選択させることであり、このアクセス タイムモデルはそのようなパラメータがアクセスタイムの各コンポーネントにどのよう に影響するかを示すので、その目的は十分に達成されている。

図4-2-16はB=4バイト、A=1、Ndwl=1の時のアクセスタイムとキャッシュサイズの関係を示したものである。1キロバイト程度の小容量のキャシュメモリではNdblによらず アクセスタイムはほぼ同じであるが、大容量のキャッシュではNdblはアクセスタイムに 大きな影響を与える。したがって、与えられたキャッシュサイズに対してNdblやNdwl などの物理パラメータを変えることでアクセスタイムは最適化することができる。最適 なNdblやNdwlが使用された場合、キャッシュ容量の増加に対するアクセスタイムの増 加は最小に抑えることができる。図4-2-16の結果より最適化されたアクセスタイムはお およそキャッシュサイズの対数に比例した。





図4-2-16:キャッシュサイズとアクセスタイムの関係

図4-2-17は32キロバイトのダイレクトマップ型キャッシュメモリでブロックサイズB

### とNdblおよびNdwlを変化させた場合のアクセスタイムを示したものである。



図4-2-17:ブロックサイズとアクセスタイムの関係



図4-2-18:アソシアティビティとアクセスタイムの関係

それぞれのブロックサイズBに対応する最小のアクセスタイムはそれぞれに異なる Ndwl/Ndblの値に対応している。図中、各Bの最小のアクセスタイムに対応するNdwl /Ndblが示されている。ブロックサイズBが小さい時(すなわち、縦に長く幅の狭いキャッ シュ構成)、小さいNdwl/Ndblが最小のアクセスタイムに対応する。ブロックサイズ
が増加するにしたがって、最適のNdwi/Ndbl値は増加する。また図より最適なNdwi/ Ndblが使用された場合、ブロックサイズが大きい方が小さいアクセスタイムに対応する。 64バイトのブロックサイズは4バイトのブロックサイズに比べて20%高速である。

しかし図4-2-18に示すように、アソシアティビティが増加してもアクセスタイムは減 少しない。ブロックサイズBやアソシアティビティAの増加はワード線の長さの増加に 対応する。BおよびAはアクセスタイムモデル式(4-2-19)の第2項、6項、7項に現われ る。しかし、第2項および6項ではBとAは積の形で現われる。したがって、図4-2-17 と図4-2-18のアクセスタイムの差は第6項による。これはアソシアティビティが増加し た時データバスドライバの数が増加しデータバス容量が増加することに対応する。この データバスの容量の増加が図4-2-17で示されるワード線長が増加することによるアクセ スタイムの増加をキャンセルしている。

#### 4.3 結論

本章では高速SRAMの主な用途であるキャッシュメモリに応用した場合のアクセスタ イムの最適化について述べた。

(1) オンチップキャッシュメモリに適した解析的アクセスタイムモデルを提案し、その妥当性を検証した。

(2)この解析的アクセスタイムモデルはキャッシュサイズC、ブロックサイズB、ア ソシアティビティAなどの一般的なキャッシュの論理パラメータのほかにサブアレイの アスペクトレシオやサブアレイ数を決める物理パラメータ(Ndwl、Ndbl、Ntwlおよび Ntbl)を含んでおり、これにより詳細な回路設計なしにキャッシュメモリのスピードを 見積ることができ、多種多様なキャッシュメモリの設計自由度をカバーすることができ る。

(3)この解析的アクセスタイムモデルにより、与えられたキャッシュサイズC、ブロッ クサイズB、アソシアティビティAに対して、最速のアクセスタイムに対応する最適な アレイ構成を決める物理パラメータが存在することが解かった。

(4)最適なアレイ物理パラメータ(Ndwl、Ndbl、NtwlおよびNtbl)を使用したとき、 アクセスタイムはキャッシュサイズの対数にほぼ比例して増加することが判明した。

(5)最適なアレイ物理パラメータ(Ndwl、Ndbl、NtwlおよびNtbl)が使用された場合、大きいブロックサイズBは小さいアクセスタイムに対応する。しかし、アソシアティビティの増加によりデータバス容量が増加するため、大きいアソシアティビティは必ずしも小さいアクセスタイムに対応しないことが判明した。

### 4.4 参考文献

[4-1] R.R. Duncombe, "The SPUR Instruction Unit: An On-Chip Instruction Cache Memory for a High Performance VLSI Multiprocessor," Technical Report UCB/CSD 87/307, Computer Science Division, University of California, Berkeley, August, 1986.

[4-2] H.C. Lin and L.W. Linholm, "An Optimized Output Stage for MOS Integrated Circuits," IEEE J. Solid-State Circuits vol. SC-10, pp. 106-109, 1975.

[4-3] Carver Mead and Lynn Conway, Introduction to VLSI Systems, Addison Wesley Publishing Company, 1980.

[4-4] T. Sakurai and A.R. Newton, "Delay Analysis of Series-Connected MOSFET Circuits," IEEE J. Solid-State Circuits, vol. SC-26, NO.2, Feb. 1991.

[4-5] Paul Chow, The MIPS-X RISC Microprocessor, Kluwer Academic Publishers, 1989.

[4-6] T. Yamanaka, T. Ozawa, S. Koshimaru, O. Kudo, H. Ito, N. Yasuoka, H. Asai, N. Harashima, abd S. Kikuchi, "A 25-ns 64K Static RAM," IEEE J. Solid-State Circuits, vol. SC-19, No.5, Oct. 1984.

[4-7] Kazuhiro Sawada, et al, " A 32-Kbyte Integrated Cache Memory," IEEE J. Solid-State Circuits, vol. SC-24, No.4, pp. 881-888, Aug. 1989.

[4-8] Mark D.Hill, " A Case for Direct-Mapped Caches", IEEE COMPUTER, pp. 25-39, Dec. 1988.

[4-9] M.G. Johnson and N.P.Jouppi, "Transistor Model for a Synthetic 0.8um CMOS Process," Submitted to the IEEE Circuits & Devices Magazine.

[4-10] Y. Kohno et al.,"A 14-ns 1-Mbit CMOS SRAM with Variable Bit Organization," IEEE J. Solid-State Circuits, vol. SC-23, pp. 1060-1066, Oct. 1988.

[4-11] T. Wada, S. Rajan, and S. A. Przybylski, " An Analytical Access Time Model for On-Chip Cache Memories," IEEE J. Solid-State Circuits, vol. SC-27, pp. 1147-1156, Aug. 1992.

# 第5章

# SRAMの高速化に対する信頼性上の 問題と解決策

#### 5.1 はじめに

VLSIプロセスおよびデバイス技術の進歩により、SRAMを構成する素子の高速スイッ チングが実現されている。しかし、高速スイッチングにより発生するチップ内部の電源 線やグランド線に発生するバウンスノイズはアクセスタイムが短くなるにつれて問題と なってきている。特に、データ出力バッファは非常に大きなチップ外部の容量を駆動す るので、大きなコンダクタンスを持ち主たるノイズ源になっている。

また、高抵抗負荷を用いたSRAMのメモリセルはそのメモリセルサイズの小面積の利 点を活かして標準SRAMに使用されている。高集積化と同時にその高抵抗負荷の抵抗値 も上昇を続けており前世代小容量品と同じスタンバイ電流スペックを実現している。通 常高抵抗負荷を用いたSRAMではワード線がHighに上がった選択状態になったときメモ リセルのHighを保持しているノード電位が電源Vccより低下し、非選択になった後その 高抵抗を介して非常に大きなミリ秒のオーダの時定数で充電されるので、サイクルタイ ムが短くなるにつれてソフトエラー率が上昇する

本章ではまず最初に出力バッファの出力波形を高速化する障害となる出力の同時スイッ チングによるチップ内部の電源電位に発生するバウンスノイズのモデリングとその対策 方法を述べ、それを実現する電圧降圧回路を組み合わせた低ノイズ出力バッファを提案 する[5-1]。

次に、通常高速化すなわちサイクルタイムを短くするとソフトエラー率が上昇するメ カニズムを明らかにし、これと逆のサイクルタイムを長くするとソフトエラー率が上昇 する逆依存性の存在を示し、この逆依存性を利用してソフトエラー率を下げる方法を述 べる[5-7]。

### 5.2 出力バッファの解析的モデル

VLSIプロセスおよびデバイス技術の進歩により、RAMの動作スピードは著しく向上し ており、高速スイッチングにより発生するチップ内部の電源線やグランド線に発生する バウンスノイズはアクセスタイムが短くなるにつれて問題化している。データ出力バッ ファは大きなチップ外部の容量を駆動するので、大きなコンダクタンスを持ち主なノイ ズ源になっている。

本項では、データ出力バッファによる電源電位に発生するバウンスの解析的モデルを示 す。具体的には解析モデルは出力バッファトランジスタのコンダクタンス、出力電位振 幅、および電源の寄生インダクタンスとバウンス電位の関係を示す。また、電圧降圧回 路を組み合わせた低ノイズ出力バッファを提案しその効果を示す。

5.2.1 CMOS出力バッファの電源ノイズ

一般的なCMOS型出力バッファに電源線の寄生インダクタンスを含めた図を図5-2-1 に示す。



図5-2-1:電源線の寄生インダクタンスを含めた一般的なCMOS型出力バッファ

リードデータ信号(RD)はNANDもしくはNORゲートにより出力トランジスタQ1、Q2 に転送される。出力イネイブル信号OE(Output enable)はデータ出力バッファのモード を制御する。OEがHighレベルのとき出力バッファは活性化され、Lowレベルのとき出 カバッファはハイインピーダンスを出力する。

回路シミュレーションプログラムSPICEによるデータ出力バッファのHighからLowへの変化時のシミュレーション結果を図5-2-2に示す。使用したパラメータを以下に示す。Q1のL/W=1.0  $\mu$ m/220  $\mu$ mx8、Q2のL/W=1.5  $\mu$ m/200  $\mu$ mx8、Vcc=5V、LVcc=10nH、LGND=10nH、CVcc1-GND1=500pF、そしてCOUT=100pF x 8である。バイトワイド構成のRAMを仮定して、チャネル幅および出力容量は8倍されている。チップ内部の電源電位Vcc1/GND1にL x di/dtによりノイズが発生する。この場合GND1のノイズは直接COUTの放電により発生するがVcc1のノイズはGND1とVcc1のカップリング容量CVcc1-GND1により間接的に発生する。



図5-2-2:データ出力バッファのHighからLowへの変化時のシミュレーション結果

5.2.2 データ出力バッファの解析的近似

寄生インダクタンスLGNDによるGND1上に発生するノイズを解析するために、図 5-2-3(a)のような簡単な時間可変抵抗とインダクタを考える。Q2の入力波形はLowから Highへ一定の傾きで変化すると仮定し、そのスイッチング時間をtrとする。Q2をショー トチャネルトランジスタとすると、ゲート電位にほぼ1次比例で飽和領域のトランジス タのコンダクタンスは変化するので、トランジスタQ2のコンダクタンスGは以下のよう になる。

$$G = \frac{G_0}{tr}t$$
 (0 < t ≤ tr) (5-2-1a)

$$G = G_0 (tr < t)$$
 (5-2-1b)

ここでG0はQ2の最大コンダクタンスである。動作中のQ2のゲート入力はHighレベルと なり、これはVcc1の電位である。これはGND1のノイズのカップリングを受ける。した がって、Q2に印加されるゲート/ソース電圧はGND1の浮き上がりによって影響を受け ないので、ノイズ電位Vnの出力トランジスタのコンダクタンスへの影響は無視するこ とができる。このノイズ電位Vnは以下のように示される。

$$V_n = L \frac{di}{dt}$$
(5-2-2)

ここでLはGND線の寄生インダクタンス(LGND)である。

図5-2-2に示すように、COUTが比較的大きいときデータ出力ノードのスイッチング 時間はtrよりかなり大きい。



図5-2-3:データ出力バッファモデル (a) 時間可変抵抗とインダクタによる出力バッファモデル、(b) ノイズ波形

したがって、ノイズがピークを持つときの出力レベルVdoutは定数と考えることができ、

$$V_{\text{dout}} - V_n = \frac{i}{G} \tag{5-2-3}$$

式(5-2-1)および(5-2-2)を(5-2-3)に代入し解くと以下の式が得られる。

$$V_{n} = \frac{1}{1 + \frac{tr}{L \cdot G_{0}}} V_{dout} \quad (0 < t \le tr)$$
 (5-2-4a)

$$V_{n} = \frac{1}{1 + \frac{tr}{L \cdot G_{0}}} V_{dout} \cdot exp(-\frac{t - tr}{L \cdot G_{0}}) \quad (tr < t)$$
(5-2-4b)

この結果は図5-2-3(b)に示されており、結果的にピークノイズ電圧Vnmaxは以下のようになる。

$$V_{nmax} = \frac{1}{1 + \frac{tr}{L^{\bullet}G_0}} V_{dout}$$
(5-2-5)

5.2.3 モデルと回路シミュレーションSPICEとの比較

図5-2-4はVdout=3および5V、G0=0.065(1/Ω)、tr=0.2nsのときのインダクタンスLと ピークノイズ電圧Vnmaxの関係を示したグラフである。モデルはSPICEと非常に良く 一致している。またLの増加と共にVnmaxは増加するがすぐに飽和し、その飽和値は Vdoutと等しくなる。



図5-2-4:インダクタンスLとピークノイズ電圧Vnmaxの関係

L=10nH、G0=0.065(1/Ω)のときのスイッチング時間の逆数(1/tr)とVnmaxの関係を図 5-2-5に示す。Vdout=5Vのときモデルは1/trが2(1/ns)以下の領域で大きくなっているが、 ほぼモデルとSPICEの結果は一致している。その一致していない領域では、Q2の入力 信号が一定の傾きで変化するという仮定が成り立っていないと考えられる。図5-2-6は VnmaxとVdoutの関係を示す。SPICEとモデルは良く一致しており、ノイズ電位Vnは Vdoutに正比例の関係がある。

結果的に、ピークノイズ電圧Vnmaxを下げるためにはL·Goよりtrが大きくかつVdout が小さいことがピークノイズ電圧Vnmaxを下げるために必要となる。大きなtrおよび小 さなGOは出力バッファでの遅延時間を増加させることに対応し、またVnmaxはVdoutに 一次比例の関係にあるので、超高速デバイスの低ノイズ化には電源ピンを増加させて寄 生インダクタンスを減らす方法もしくは出力電圧振幅を最小化するのが有効となる。



図5-2-5:スイッチング時間の逆数(1/tr)とピークノイズ電圧Vnmaxの関係



図5-2-6:出力振幅Vdoutとピークノイズ電圧Vnmaxの関係

5.2.4 電圧降圧回路を組み合わせた低ノイズ出力バッファ

今回新しく考案した電圧降圧回路を組み合わせた低ノイズ出力バッファを図5-2-7に示す。降圧回路VDCは最大のVdoutをVcc2=3Vに降圧する。Q2の最大ゲート/ソース

間電圧VGNおよびQ1のVGPは3V以下に制限される。したがって、G0の電源電圧Vcc依存性はなくなり、同時にスイッチング時間trのVcc依存性が減少する。



図5-2-7:電圧降圧回路を組み合わせた低ノイズ出力バッファ

式(5-2-5)のノイズのピーク値の比Vnmax(VDC不使用時)/Vnmax(VDC使用時) をtr、G0、Vdoutの電源依存性を考慮してVcc=4.5Vのときデーダ出力バッファでの遅延 時間が等しいという条件で求めると図5-2-8のようになる。通常のRAMは5V±10%すな わち4.5Vから5.5Vで動作するので、最悪条件Vcc=5.5Vのノイズと電位降圧回路を組み 合わせた低ノイズ出力バッファを比べるとノイズのピーク値は約半分となる。このとき、 スピードに対する最悪条件Vcc=4.5Vの遅延時間は両者で等しい。したがって出力振幅 Vdoutを小振幅化し、ピークノイズに影響を与えるtr、G0、Vdoutなるパラメータの電 源電位依存性を減らすことで低ノイズ高速動作を実現できる。



図5-2-8:ノイズのピーク値の比Vnmax(VDC不使用時)/Vnmax(VDC使用時)

### 5.3 SRAMソフトエラー率の逆サイクルタイム依存性

本項では高抵抗負荷を用いたSRAMにおけるソフトエラー率の新現象「逆サイクルタ イム依存性」について述べる。高抵抗負荷を用いたSRAMのメモリセルはそのメモリセ ルサイズの小面積の利点を生かして標準SRAMに使用されている。高集積化と同時にそ の高抵抗負荷の抵抗値も上昇を続けており前世代の小容量デバイスと同じスタンバイ電 流スペックを実現している。通常高抵抗負荷を用いたSRAMではワード線がHighに上がっ た選択状態になったとき、メモリセルのHighを保持しているノード電位が電源Vccより 低下し、非選択になった後その高抵抗を介してミリ秒のオーダの非常に大きな時定数で 充電されるので、サイクルタイムが短くなるにつれてソフトエラー率が増加する[5-2]、 [5-3]。

今まで種々の高抵抗負荷型SRAMのソフトエラー率の改善方法[5-4]、[5-5]が報告され ているが、いずれも上記サイクル時間依存性に関係するものである。論文[5-4]では、ビッ ト線負荷デバイスとしてNMOSを用いたSRAMでのソフトエラー率を議論しており、メ モリセル中のアクセストランジスタおよびドライバトランジスタを流れる電流を高抵抗 からの充電電流より小さくすることでソフトエラー率を改善している。

本項では新現象であるPMOS負荷を用いたSRAMにおけるサイクル時間を短くすると ソフトエラー率が現象する「逆サイクルタイム依存性」を述べる。この新現象によりサ イクルタイム100nsでのソフトエラー率は1.5桁改善された。さらに本新現象を説明す る新モデルを提案し「通常サイクルタイム依存性」、「逆サイクルタイム依存性」、 「サイクルタイム依存性なし」なる3種の依存性がどのようなメモリセルパラメータに より発生するかを明らかにする。

5.3.1 メモリセルの構成

図5-3-1に高抵抗負荷型SRAMのメモリセルとその周辺回路構成を示す。メモリセル は4個のNMOSトランジスタと2個の高抵抗(R1、R2)から構成されるフリップフロッ プと2個のトランスファーゲートからなる。ノードNHとNLはそれぞれ"High"と"Low" の電位VHとVLを保持する。アルファ線が半導体中を通過したときに発生する電子がノ ードNHに収集されたときソフトエラーが発生する。生成された電子によりノード容量 CNの電位VHのレベルを低下させる。この低下したVHのレベルがVLより低い場合メモ リセルに保持されたデータは反転する。また、ビット線電位は電源Vccとの間に接続さ れたビット線負荷デバイス(NMOSまたはPMOS)を介して供給される。



図5-3-1:高抵抗負荷型SRAMのメモリセルとその周辺回路構成

#### 5.3.2 ソフトエラー率の測定結果

図5-3-2は3TΩ(テラオーム)の高抵抗負荷を用いた1MSRAM [5-6]の電源電位4.5V におけるソフトエラー率の測定結果である。アルファ線源はAm241で室温25℃で測定 した。実線と点線はそれぞれビット線負荷にPMOSもしくはNMOSを用いた場合に対応 する。点線は通常のサイクルタイム依存性であり、実線はサイクルタムが10 μs以下で サイクルタイムが短くなるにしたがってソフトエラー率が減少するソフトエラー率の逆 サイクルタイム依存性である。この逆サイクルタイム依存性によりNMOSビット線負荷 の通常SRAMよりサイクルタイムが短い領域でソフトエラー率が改善している。100ns のサイクルタイムで約1.5桁改善されている。



図5-3-2:1MSRAM [5-6]のソフトエラー率の測定結果

5.3.3 解析

本節ではソフトエラー率の逆サイクルタイム依存性のメカニズムを解析する。まず最初にNMOSビット線負荷の通常SRAMの通常のサイクルタイム依存性を説明する。そしてその後この新現象である逆サイクルタイム依存性を解析する。

5.3.3.1 SRAMのソフトエラー率の通常のサイクルタイム依存性

図5-3-3に"High"のデータを記憶するノードNHまわりの回路図とNMOS/PMOSビット線負荷の比較を示す。QAおよびQDはそれぞれアクセストランジスタとドライバトランジスタである。NMOSビット線負荷を持つSRAMでは、ビット線電位はVcc - Vthであり、Vthはビット線負荷のNMOSトランジスタのしきい値電圧である。ワード線が選択されVccとなったときのアクセストランジスタQAのゲート/ソース電位VGSはVthに等しい。したがって、ワード線が選択されたときQAのドレイン電流IAはノードNHを急速にビット線電位であるVcc-Vthにプルダウンする。またワード線が選択されたときメモリセルのビット線放電電流がノードNLの電位VLを数百mV浮き上げて、QDのサブスレシュホールド電流IDも増加する。しかしNMOSビット線負荷の場合、IAはID比べて十分大きくIDは無視できる。



図5-3-3:ノードNHまわりの回路図とNMOS/PMOSビット線負荷の比較

図5-3-4はノードNHの電位VHの読み出し動作時の時間的変化を示した図である。実線はサイクルタイムが長い場合、点線はサイクルタイムが短い場合を示している。



図5-3-4:ノードNHの電位VHの読み出し動作時の時間的変化

ワード線が選択されたときVHはVcc-Vthに低下し、ワード線が非選択状態の間にしだいに充電されVccに近づく。したがって、長いサイクルタイムはVHがより高い電位へ充電されることに対応する。ワード線が非選択のときメモリセルノードのプルアップは高

抵抗でのみ行なわれるので、ソフトエラーは主としてワード線が非選択状態で発生する。 それゆえ、VHの平均電位VHAがソフトーエラー率に関係する。結果的に、図5-3-4が示 すようにサイクルタイムが短い場合、VHAは低下しソフトエラー率は増大する。

5.3.3.2 ソフトエラー率の逆サイクルタイム依存性

PMOSビット線負荷に対応するメモリセルの動作も図5-3-3に示されている。PMOS ビット線負荷の場合ビット線電位はVccとなる。ワード線が選択されVccになったとき、 ゲート/ソース電圧は0VであるのでQAはOFFしている。したがって、この場合IAは流 れず、IDがノードNHをプルダウンする原因となる。IDはIAに比べて非常に小さいので VHが低下するには比較的長い時間を必要とする。以下にノードNHの電位低下を解析す る。VHの電位は以下のように現される。

$$V_{\rm H}(t) = \rm Vcc - \frac{I_{\rm D}}{C_{\rm N}} \cdot t$$
 (5-3-1)

ここで t はワード線1本の選択時間である。式(5-3-1)より、ワード線の選択期間中に VHは単調に減少する。VHがVcc-Vthに到達するとアクセストランジスタのゲート/ソ ース電位はVthとなりアクセストランジスタがONするので、VHの電位の低下は止る。 VH(t)=Vcc-Vthとなる時間Tを求めると式(5-3-1)より以下のようになる。

$$T = Vth \cdot \frac{C_N}{I_D}$$
(5-3-2)

したがって、t > Tでは $V_{H}(t) = Vcc - Vth となる。$ 

図5-3-5はPMOSビット線負荷に対応するVHの時間依存性を示した図である。ワード 線の選択時間をサイクルタイムTC、ワード線の選択インターバルをTIとすると、

$$T_{I} = T_{C} \cdot N_{W} \tag{5-3-3}$$

となり、NWはワード線の数に対応する。TC < Tのとき、VHは式(5-3-1)にしたがって減 少し実線で示したようになる。そして、ワード線の非選択後VHは高抵抗により充電さ れ増加する。したがって、TCが減少するに従ってVHの低下は抑制され平均電位VHAが 高くなる。一方、TC > TのときVHは灰色線で示したようにVcc-Vthでクランプされる。 VHの再充電時間はTI - TCとなりTCに比例するので、サイクル時間が短いほど平均電位 VHAは減少しこれはNMOSビット線負荷の場合と類似している。

高抵抗R1がノード容量CNを充電するので、充電期間のVH(t)は以下のようになる。

$$V_{\rm H}(t) = Vcc - \Delta V \cdot \exp(-\frac{t}{C_{\rm N} \cdot R_1}) \qquad (0 \le t \le T_{\rm I} \cdot T_{\rm C}) \tag{5-3-4}$$



図5-3-5:PMOSビット線負荷に対応するVHの時間依存性

ここでΔVはワード線の選択中のノード電位の低下分である。ソフトエラー率を求める ためにVHAを求める。式(5-3-1)、(5-3-2)および(5-3-4)より、

$$V_{H}(T_{C}) = \frac{1}{T_{I} - T_{C}} \int_{0}^{T_{I} - T_{C}} \left[ V_{CC} - \frac{I_{D}}{C_{N}} \cdot T_{C} \cdot \exp(-\frac{t}{C_{N} - R_{1}}) \right] dt \quad (0 \le T_{C} \le T) \quad (5-3-5)$$
$$V_{H}(T_{C}) = \frac{1}{T_{I} - T_{C}} \int_{0}^{T_{I} - T_{C}} \left[ V_{CC} - V_{C} + \exp(-\frac{t}{C_{N} - R_{1}}) \right] dt \quad (T_{C} > T) \quad (5-3-6)$$

図5-3-6は式(5-3-5)、(5-3-6)より計算されたVHAを測定されたソフトエラー率とを同時に示した図である。ここでデバイスは高抵抗負荷を用いた1MSRAM [5-6]であり、高抵抗値R1=3TΩである。また、TI=TC × 16K、Vcc=4.5V、ID=1nAである。Nノード容量CNはゲート酸化膜容量、PN接合容量からなりおよそ10fFである。ビット線負荷のVthはバックゲート効果を含めて1.3Vである。先にも述べたように、サイクルタイムが短くなるとVHAは増加する。ここで臨界サイクルタイムTは13μsであり、計算はソフトエラー測定結果と良い一致を示した。したがって、ノードNHの低下の時定数を考慮することで逆サイクルタイム依存性が説明される。



図5-3-6:VHAを測定されたソフトエラー率

5.3.4 ソフトエラー率のサイクルタイム依存性に対する考察

本節では前節の解析結果をもとにソフトエラー率のサイクルタイム依存性をさらに議 論し、ソフトエラー率のサイクルタイム依存性を減らす/無くす方法を述べる。

5.3.4.1 他の実験結果

図5-3-7はPMOSビット線負荷を用いたSRAMの他のソフトエラー率のサイクルタイム依存性の測定結果である。メモリセル内のドライバトランジスタのしきい値電圧Vthnをパラメータとして変化してある。実線のVthn=0.7Vは逆サイクルタイム依存性が現われており、図5-3-2および図5-3-6と同じである。一方、点線のVthn=0.5Vでは通常NMOSビット線負荷のサイクルタイム依存性が現われている。これは、セクション5.2.4で述べたようにドライバトランジスタQDのゲート/ソース電位が数百ミリボルト浮き上がることによる。すなわち、Vthnの減少でIDが増大したのが原因である。

平均ノード電位VHAをIDを1nAから100nAまでパラメータとして変化させて計算した ものを図5-3-8に示す。ID=1nAはVthn=0.7Vに対応し、Vthnの減少はIDの増加に対応す る。実線のID=1nAは図5-3-6と同じであり同じ臨界サイクルタイムT=13µsとなる。式 (5-3-2)により、TとIDは反比例の関係であるので、IDの増加と共にTは減少する。それ と同時にノード平均電位VHAも図5-3-8のように減少する。したがって、Vthnが0.7Vか ら0.5Vに減少した時IDが2桁以上増加し、Tは約100ns以下になる。したがって、サイ クルタイムの減少にしたがってVHAは単調に減少し、通常のサイクルタイム依存性が現 われている。



図5-3-7:他のPMOSビット線負荷SRAMのソフトエラー率の測定結果



図5-3-8:平均ノード電位VHAの計算値

5.3.4.2 ドライバトランジスタのしきい値電圧を上げる効果

前節の議論よりPMOSビット線負荷を持つSRAMではドライバトランジスタQDのサ ブスレシュホールドリーク電流IDがソフトエラー率のサイクルタイム依存性に関係する。 図5-3-8よりサブスレシュホールドリーク電流IDを1nA以下にすればVHAはほぼすべて のサイクルタイムにおいてVccになる。したがって、ドライバトランジスタのVthnを必 要な値に上げることでソフトエラー率のサイクルタイム依存性をなくし、それを長いサ イクルタイムに対応する低い値に保つことができる。この場合Vthnは0.7Vである。

5.3.4.3 高抵抗負荷の抵抗値を下げる効果

ソフトエラーのサイクルタイム依存性はハイノードの電位VHAの低下を抑制すればよいので、高抵抗値を下げることでも同じ効果を実現することができる。図5-3-9は高抵抗値R1をパラメータとしてVHAのサイクルタイム依存性を示したものである。



図5-3-9:高抵抗値R1をパラメータとしてのVHAのサイクルタイム依存性

サブスレシュホールドリーク電流IDは1nAである。式(5-3-2)で示されるように、臨界 サイクルタイムTはR1に依存しない。高抵抗値R1をを下げることで、電位VHAをすべて のサイクルタイムでほぼVccに保つことができる。この場合、R1=100GΩであり、ソフ トエラー率のサイクルタイム依存性がほぼなくなる。

5.3.5 ソフトエラー率のサイクルタイム依存性のまとめ

PMOSビット線負荷SRAMのソフトエラー率のサイクルタイム依存性はメモリセルの ドライバトランジスタのしきい値電圧Vthnと高抵抗負荷の抵抗値R1に関係することが 判明した。結果は図5-3-10にまとめられている。1MSRAM [5-6]ではVthn=0.5V、 R1=3TΩで通常のNMOSビット線負荷を使用したSRAMと同じソフトエラー率のサイク ルタイム依存性が観測された。

Vthn=0.7Vにしきい値電圧を上げることで、新現象であるソフトエラー率の逆サイク ルタイム依存性が観測された。また、さらにメモリセルのドライバトランジスタのしき い値電圧を上げるかもしくは高抵抗値R1を100GΩ以下にすることでソフトエラー率の サイクルタイム依存性をなくすことが可能であることが予測された。



図5-3-10:ソフトエラー率とメモリセルパラメータとの関係

#### 5.4 結論

本章ではSRAMを高速化するときの信頼性上の問題である出力バッファによる電源バウンスノイズとソフトエラーのサイクルタイム依存性の問題とその解決策について述べた。

(1)出力バッファのスイッチングのときにチップ内部の電源/GND電位に発生する 電位バウンス(ノイズ)の解析的モデルを提案した。

(2) このモデルは回路シミュレーションプログラムSPICEの結果と良い一致を示した。

(3)このモデルはL·Go(Lは寄生インダクタンス、G0は出力トランジスタの最大コ ンダクタンス)よりスイッチング時間trが大きくかつ出力電圧振幅Vdoutが小さいこと がピークノイズ電圧Vnmaxを下げるために必要となることを示した。

(4)大きなtrおよび小さなG0は出力バッファでの遅延時間を増加させることに対応し、 またVnmaxはVdoutに一次比例の関係にあるので、超高速デバイスの低ノイズ化には電 源ピンを増加させて寄生インダクタンスを減らす方法もしくは出力電圧振幅を最小化す るのが有効であることを示した。

(5)(4)の方法を実現する電位降圧回路を組み合わせた低ノイズ出力バッファを提案し、5V±10%スペックのデバイスにおいて最悪値の遅延時間を同一にしたまま、ノ イズの最悪値を約半分に低減できることを示した。

(6)新現象であるソフトエラー率の逆サイクルタイム依存性を発見しそのメカニズム を解析した。

(7)ソフトエラー率の逆サイクルタイム依存性はPMOSビット線負荷を用いたSRAM で発生し、ドライバトランジスタQDのしきい値電圧Vthn、高抵抗負荷の抵抗値R1に関 係することがわかった。

(8)PMOSビット線負荷を用いたSRAMでもNMOSビット線負荷のSRAMが持つ通常 のサイクルタイム依存性は発生し、1MSRAM [5-6]ではVthn=0.5VかつR1=3TΩで観測 された。

(9)メモリセルのパラメータによるソフトエラー率のサイクルタイム依存性を"High"
レベルを保持するメモリセルノードの電位を用いモデル化し、このモデルによりVthnを
0.7V以上に上げるもしくはR1を100GΩ以下にすることで、ソフトエラー率のサイクル

タイム依存性を抑制し、ロングサイクルタイムのときの低いソフトエラー率を任意のサ イクルタイムで保つことが可能になることを示した。

## 5.5 参考文献

[5-1] T. Wada, M. Eino, and K. Anami, "Simple Noise Model and Low-Noise Data-Output Buffer for Ultra High-Speed Memories," IEEE J. Solid-State Circuits, vol. SC-25, No. 6, pp.1586-1588, December 1990.

[5-2] M. Yoshimoto, K. Anami, H. Shinohara, Y. Hirata, T. Yoshihara, and T. Nakao, "Soft error analysis of fully static MOS RAM," Jpn. J. Appl. Phys., 22, Suppl. 22-1, pp. 69-73, 1983.

[5-3] P. M. Carter and B. R. Wilkins, "Influences on soft error rates in static RAM's," IEEE J. Solid-State Circuits, vol. SC-22, pp. 430-436, June 1987.

[5-4] S. Murakami, K. Ichinose, K. Anami, and S. Kayano, "Improvement of Soft-Error Rate in MOS SRAM's," IEEE J. Solid-State Circuits, vol. SC-24, pp. 869-873, Aug. 1989.

[5-5] K. Ishibashi, T. Yamanaka, and K. Shimohigashi, "An  $\alpha$ -immune 2V Supply Voltage SRAM Using Polysilicon PMOS Load Cell," '89 Symp on VLSI Circuits Dig. Tech. Papers, pp29-30, May 1989.

[5-6] Yoshio Kohno, Tomohisa Wada, Kenji Anami, Yuji Kawai, Kojiro Yuzuriha, Takayuki, Matsukawa, and Shimpei Kayano, "A 14-ns 1-Mbit CMOS SRAM with Variable Bit Organization," IEEE J. Solid-State Circuits, vol. SC-23, pp. 1060-1066, Oct. 1988.

[5-7] S. Murakami, T. Wada, M. Eino, M. Ukita, Y. Nishimura, K. Suzuki, and K. Anami, "A New Soft-Error Phenomenon in ULSI SRAM's -Inverted Dependence of Soft-Error Rate on Cycle Time-," IEICE TRANSACTIONS, vol. E74, No. 4, April 1991.

# 第6章

# 工学的応用

# (高速高集積1MSRAMの実用化による検証)

#### 6.1 はじめに

本章では14nsのアクセスタイムを実現した高速高集積1MSRAMの実用化について述 べる[6-8]、[6-11]。ビット構成は1MワードX1ビットと256KワードX4ビットで、こ の2種類のビット構成は外部からの所定のピンに信号を与えることで切り替えることが できる[6-18]、[6-19]。また、高速化のために変形分割ワード線、高感度センスアンプ、 ゲートコントロール型データバスドライバー、デュアレレベルデータバスプリチャージ なる方法を用いている。トレンチ分離を用いた0.7µm3層ポリシリコン2層メタル CMOSプロセスで、メモリセルサイズ41.6µm<sup>2</sup>とチップサイズ86.6mm<sup>2</sup>を達成してい る。

本章の前半ではチップ設計、回路、性能につき述べ、後半ではビット構成可変機能が テスト時間短縮に対しての効果を述べ、評価結果を示す。

### 6.2 ビット構成可変14nsの1MSRAM

プロセス技術ならびに回路技術の進歩により、大容量かつ高速のSRAMの開発が加速 されている。これらの高速のSRAMは主にスーパーコンピュータの主記憶や、ミニコン ピュータやワークステーションのキャッシュメモリ、もしくはVLSIテスタのテストパ ターンメモリなど非常に高速アクセスタイムを必要とするところに用いられている。近 年ATD(Address Transition Detection)方式や、ワード線やビット線長を短くした構成を 用いたり、ポリサイドによる低抵抗化、もしくは2層のメタル配線技術を用いて25ns 以下の高速のアクセススピードを実現した256KSRAMが幾つか報告されている[6-1] ~ [6-3]。また、8ビット構成の中間スピードの1MSRAMも幾つか報告されている[6-4] ~ [6-7]。しかしながら、これらのスピードはすべて25ns以上である。

本節では14nsのアクセスタイムを実現した1MSRAMについて述べる[6-8]、[6-11]。ビッ ト構成は1MワードX1ビットと256KワードX4ビットで、この2種類のビット構成は 外部からの所定のピンに信号を与えることで切り替えることができる。3層ポリシリコ ン2層メタル0.7μmルールのCMOSプロセスで試作した。高速アクセスタイムを実現 するために、分割ワード線構成[6-9]を進化させた変形分割ワード線構成、高感度センス アンプ、ゲートコントロール型データバスドライバ、ATD方式と組み合わされたデュア レレベルデータバスプリチャージを用いている。

6.2.1 回路設計

A チップアーキテクチャ

図6-2-1にこのSRAMのブロック図を示す。ビット構成は1Mワード X 1ビットもしく

は256Kワード X 4ビットであり、これらのビット構成はX1/X4コントロールピンによっ て制御される。アドレス入力信号は 4 つグループ(X アドレス、Y アドレス、Z アドレス、 W アドレス)に分けられておりそれぞれ行選択、列選択、ブロック選択、センスアンプ 選択に対応している。W アドレスは1Mワード X 1ビット構成のときのみ使用される。各々 のアドレス入力バッファはローカルにATDパルス発生回路を備えチップ内部のコントロ ールクロックを発生する。そしてそのクロックは高速アクセスのためにビット線負荷や センスアンプをコントロールする。



図6-2-2:メモリアレイのブロック分割図

図6-2-2はメモリアレイのブロック分割を示した図である。1Mビットのメモリセルア レイは512行 x 2048列からなり、32のブロックに分割されている。消費電力低減のた めに32の内1ケのメモリブロックのみが活性化される。各メモリブロックは512行と1列 のリダンダンシを含む65列からなり65のメモリセルが1本の分割ワード線に接続されて いる。ワード線はタングステンシリサイド化されたポリシリコンで形成されており、シ ート抵抗は約5オーム/□である。この低抵抗かつ低容量ワード線が高速化の一つのキ イファクターであり、ワード線のRC遅延を0.5nsに短縮している。各メモリブロック は256Kワード x 4ビット構成に対応するために、さらに6つのサブブロックに分割され ている。行選択信号は変形分割ワード線構成により階層的にデコードされており、各2 ブロックごとに配置されたブロックロウデコーダとチップ左端に配置されたグローバル ロウデコーダによりワード線デコードが行なわれる。

B 変形分割ワード線構成

詳しい説明は第2章セクション1に説明されている。このチップでは、変形分割ワード線構成によりビット線容量を減らしかつチップサイズを通常の分割ワード線を用いた場合に比べて1.5%減少させ、高速アクセスかつ小面積チップサイズを実現している。

C センスアンプ回路



図6-2-3:読み出し回路

図6-2-3にセンスアンプ、データバスドライバ、デュアレレベルデータバスプリチャ -87-

ージャ、出力バッファを含む読み出し回路を示す。センプアンプは3段構成であり、第 1段目、2段目は2入力2出力の対称型アンプである。この対称型アンプは小振幅の I/O線信号を増幅するのに適している。したがって、データ"0"読み出し速度とデータ"1" 読み出し速度は一致する。第3段目は通常の2入力1出力のカレントミラー型センスア ンプである。各ステージは約3のゲインを持つように設定されている。全体として、 I/O線の50mVの電圧振幅が増幅される。SEQ1 (Sense amp equalize 1)、SEQ2、 SEQ3、DEQ (Data bus equalize)、DEQなるパルスはチップ内部のATDにより生成さ れたクロックにより生成される。、データパスでの信号伝達を加速するために、SEQ1 およびSEQ2はセンスアンプ内部の相補信号を等電位にイコライズするのに用いられて いる。図では省略されているがビット線、I/O線も同様にクロックによりイコライズさ れる。



図6-2-4:ブロック数とデータバス容量の関係

D ゲート制御型データバスドライバ

図6-2-3のデータバスドライバはトライステートのCMOSインバータであり、このト ライステートはセンスイネイブル信号SEにより入力ゲートをコントロールして制御さ れる。選択状態/活性状態はSEが"High"にSEが"Low"に対応する。したがって、この データバスドライバはトランジスタが直列接続されていないので同一サイズのCMOSイ ンバータと同一の駆動能力を持つ。図6-2-2に示されているようにメモリセルアレイが 多数サブブロックに分割されると、データバスに多数のデータバスドライバが接続され ドライバの出力容量が増加しデータバスのトータル容量が増加する。図6-2-4はブロッ ク数とデータバス容量の関係を示したもので、実線(a)はゲート制御型データバスドラ イバ、点線(b)はトランスミッションゲートを用いた通常のトライステートバッファ [6-5]である。駆動能力を同一に保つために、通常のトライステートバッファではゲート 幅が2倍になっている。データバス容量はブロック分割数が増えるにしたがってしだい に増加している。この1Mb CMOS SRAMに用いられた32のブロック分割数の場合、ゲ ート制御型では通常に比べてデータバス容量が約40%減少しており、データバスでの遅 延時間削減に有効である。

E デュアレレベルデータバスプリチャージ

詳しい説明は第3章セクション3に説明されている。このチップでは、このデュアレ レベルデータバスプリチャージを用いることで特別なレシーバ回路をアクセスパスに直 列に挿入することなく、データバスに出力バッファを直接接続することが可能となりそ れに伴う遅延時間を短縮することが可能となっている。

F ビット構成可変機能

詳しくは、第6章セクション3で述べる。

6.2.2 0.7 µm CMOSプロセス技術

高速/大容量を両立するために0.7µm CMOSプロセス技術を採用した。2層のメタ ルならびに3層のポリシリコン(1層の低抵抗ポリサイドを含む)配線ならびにツイン ウエル構造を使用した。主なプロセスパラメータを表6-2-1にまとめる。

表6-2-1:主なプロセスパラメータ

|     | Process Twin-well CMOS, N-              | Sub        |
|-----|-----------------------------------------|------------|
|     | Double Level Alumin                     | um         |
|     | Triple Level Polysilic                  | on         |
|     | Gate Length (NMOS) 0.7µm                | (LDD)      |
|     | (PMOS) 0.9µm                            | (LDD)      |
|     | Gate Oxide Thickness 180/               | Å          |
|     | Junction Depth (NMOS) 0.2µ              | m          |
|     | (PMOS) 0:3µ                             | m          |
|     | Trench N (width/space) 1.0u             | m / 0.7µm  |
|     | LOCOS N <sup>+</sup> (width/space) 2.0µ | im / 1.5µm |
|     | 1st Poly Si (width/space) 0.7µ          | m / 0.8µm  |
|     | 2nd Poly Si(width/space) 1.0µ           | m / 1.0µm  |
|     | 3rd Poly Si (width/space) 1.0µ          | m / 1.0µm  |
|     | 1st Al (width/space) 1.4µ               | m / 1.0µm  |
| · • | 2nd Al (width/space) 2.0µ               | m / 2.0µm  |
|     | Contact Hole 0.8µ                       | m x 0.8µm  |
|     | Direct Contact Hole 0.8µ                | m x 0.8µm  |
|     | Via Hole 1.0u                           | m x 1.0µm  |

メモリセルの断面図を図6-2-5に示す、メモリセルサイズ縮小のために128KワードX 8ビットの1MSRAM [6-5]と同様のトレンチ分離技術と3層ポリシリコン配線を用いた。



図6-2-5:メモリセルの断面図



図6-2-6:メモリセルおよびロウデコーダ部のチップ写真

1層目のポリシリコン(WSix/ポリシリコン)をMOSトランジスタのゲート電極、 2層目をVcc電源配線、3層目を負荷の高抵抗に使用した。1層目のメタルはビット線、 2層目のメタルは図6-2-6に示すようにグローバルワード線に使用した。

1 層目と2 層目のメタル間の層間膜はプラズマCVD酸化膜である。周辺回路では2 層 目のメタルを信号線、電源線、グランド線に使用した。3 層ポリで2 層ポリのメモリセ ルサイズを縮小し、かつ超高抵抗を実現している。

通常のLOCOS分離に変わって、最小分離幅は0.7μmのバーズビークの少ない浅いト レンチ分離技術を使用している。シリコンのエッチングとチャネルカット用のボロン注 入後、リーク電流を減らすためにトレンチの壁を薄く酸化し、その後SiO2をトレンチ に埋めこむ。トレンチ分離形成後、周辺回路用に通常のLOCOS分離を行なう。トレン チ分離で最も重要な電気特性はMOSトランジスタのサブスレシュホールドリーク電流 であり、トランジスタのリーク電流が高抵抗による充電電流より大きいときメモリセル はデータ保持ができなくなる。図6-2-7はW/L=5μm/0.7μmのNMOSトランジスタを 10000個並列に接続したもののサブスレシュホールドリーク電流特性であり、トレンチ とLOCOSで特に違いはない。



図6-2-7:サブスレシュホールドリーク電流特性

周辺回路では0.7μmのNMOSと0.9μmのPMOSが用いられており、高速動作を実現 している。両トランジスタともLDD構造を用いて、NMOSに対してはホットエレクトロ ンによる特性劣化を防止しPMOSに関してはソース/ドレインとチャネル間にオフセッ トが発生しパフォーマンスが低下するのを防いでいる。

6.2.3 試作結果

図6-2-8はVcc=5V、室温(25℃)でのデータ出力波形を示したものである。30pFの負荷 条件でアドレスアクセスタイムならびにチップセレクトアクセスタイムは14nsであっ た。周波数40MHzでの動作電流は100mA、40MHzでのスタンバイ電流は20mAである。 CMOS入力ならびにDCのときの典型的スタンバイ電流は2μAである。



図6-2-9はチップ写真であり、メモリアレイはワード線長を短くするため

図6-2-9はチップ写真であり、メモリアレイはワード線長を短くするために32のブロックに分割されている。グローバルロウデコーダはメモリアレイの端に配置されている。



各ブロックに1カラムのリダンダンシがある。400mil幅28ピンのDIPまたはSOJパケ ージに封止される。特性を表6-2-2にまとめる。

表6-2-2: RAMの特性のまとめ

| ORGANIZATION    | 256Kx4 / 1Mx1 (VARIABLE) |
|-----------------|--------------------------|
| CELL SIZE       | 8.0µm x 5.2µm            |
| CHIP SIZE       | 5.51mm x 15.72mm         |
| ACCESS TIME     | 14ns                     |
| ACTIVE CURRENT  | 100mA at 40MHz           |
| STANDBY CURRENT | 20mA at 40MHz            |
| REDUNDANCY      | 32 COLUMNS               |
| PACKAGE         | 400mil, 28-PIN, DIP/SOJ  |

### 6.3 メモリの新テスト機能としてのビット構成可変機能

プロセスおよび回路技術の進歩により、SRAMのメモリ容量は2~3年で4倍の割合 で大容量化し同時に動作スピードも向上している。しかしながら、1Mビット以上の大 容量かつ高速メモリではテスト時間がメモリ容量に比例し、テスト精度の向上の為に測 定時間が延びることによりテスト時間短縮機能が必要である。マルチビットテストモー ド[6-10]やラインモードテスト[6-12]、[6-13]、そしてビルドインセルフテスト[6-14]、 [6-15]がDRAMでのテスト時間短縮機能として提案されているが、アクセスタイムの測 定精度を保てない。SRAM ではビット構成をヒューズのブローで切り替える方法[6-16] が提案されているが、テスト時間短縮はできない。また別のビット構成切り替え[6-17] では特別なタイミングの入力信号が必要であり、DRAMとは異なるSRAMの特徴である タイミングのフレキシビリティを欠く結果になる。

本節では外部ピンコントロールによる新しいビット構成切り替え機能機能を提案する [6-18]、[6-19]。1Mワード X 1 ビット構成のSRAMを256Kワード X 4 ビットとして測 定することで、テスト時間を大きく短縮することが可能となる。両者のアクセスタイム を同じにするために、1Mワード X 1 ビット構成と256Kワード X 4 ビットのアクセス パスを電気的に等価になるように設計した。この新しいテスト機能(ビット構成可変機 能) はあるピンに対して入力として使用する場合と出力として使用する両方の場合が必要であり通常大きな入力容量を伴うが、出力ドライバ回路を入力静電(ESD)保護回路に 使用することで、低く均一な入力容量スペックを実現している。

6.3.1 SRAMのテスト

半導体ランダムアクセスメモリのテストは大まかに、DCパラメータ測定テストとメ モリ機能、動作マージン、速度選別などのACテストに分れる。DCパラメータテストは 特にメモリ容量の増加とテスト時間に関係はないが、N-パターンとよばれるすべてのメ モリセルを順にアクセスするテストパターンを用いた場合ACテストの時間はメモリ容 量に比例して増加する。したがって、同一ビット構成を持つ1MSRAMは256KSRAMの 4倍のテスト時間を必要とする。これを解決する一つの方法としてマルチビットテスト モード[6-10]が提案された。このテストモードでは同時に複数のメモリセルに同一のデ ータを書き込み、その後それらの複数のメモリセルからの読み出しデータの論理関係を チェックする。たとえば、同時に読み出されたデータが等しいときにパスとなり、すべ てが等しくなる以外はフェイルとなる。このテストモードは単なるメモリセルの欠陥を 発見するには非常に有効であるが、テストモード使用のときとノーマル動作のときのデ ータのアクセスルートに違いがあるので正確なアクセスタイムの測定には適さない。こ のテストモードで用いられる論理関係のチェック回路は通常のアクセスルートにないも のである。その上、テストモードでは複数の書き込み/読み出しデータは同一であるの で、データ間の干渉はチェック不能となる。

高速のSRAMのテストでは、アクセスタイムの選別テストは高速のスペックを保証す る必要があるので最も重要である。SRAMのアクセスタイムはテストパターン(アドレ スシーケンス、データのパターン)や周囲温度、電圧、サイクルタイムのようなタイミ ングなどに大きく依存する場合があり多種のテスト条件が必要となる。したがって、ト ータルのSRAMのテスト時間を減らすためには、テスト時間短縮モードでも高精度にア クセスタイムを測定する必要がある。

6.3.2 回路技術

図6-3-1に試作された1MワードX1ビットと256KワードX4ビットのSRAMのピン 配置を示す。これらの2種のビット構成はピン#21、B1/B4信号でコントロールされる。 内側のピン名はコントロールピンがHighのときに対応する1MワードX1ビットのとき のものである。12、13、15-19ピンはコントールピンがLowのときに対応する256Kワ ードX4ビットのときのピンとして図6-3-1の外側のピン名に変わる。その他のピンは 両者の構成で同一機能を持つ。したがって、コンロトールピンによって2種類のビット 構成で使用可能である。

| For x4 For x1 For x1 For x4<br>$A_3 \square 1$ $20$ $V_{\infty}$<br>$A_4 \square 2$ $27$ $A_2$<br>$A_3 \square 3$ $26$ $A_1$<br>$A_5 \square 3$ $26$ $A_1$<br>$A_6 \square 6$ WV $23$ $A_1$<br>$A_6 \square 6$ WV $23$ $A_1$<br>$A_6 \square 6$ WV $23$ $A_1$<br>$A_1 \square 6$ $21$ $B1/B4$<br>$A_{13} \square 9$ $20$ $A_{16}$<br>$A_{13} \square 9$ $20$ $A_{16}$<br>$A_{13} \square 9$ $10$ $11$ $15$ $A_{10}$ $D004$<br>$T$ $A_{10}$ $D003$<br>$T$ $A_{10}$ $D002$<br>$T$ $T$ $A_{10}$ $D002$<br>$T$ $T$ $T$ $A_{10}$ $D002$ |
|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|

図6-3-1:SRAMのピン配置

図6-3-2はメモリセルから出力ピンまでのデータのルートを示す、ビット構成可変機能のブロック図である。1つのメモリアレイブロックは4個のセンスアンプ/書き込み回路を備えている。それぞれのセンスアンプはREAD-DATA BUS読み出しデータバスに接続されている。



図6-3-2:メモリセルから出力ピンまでビット構成可変機能のブロック図

256KワードX4ビット構成のときは各々の読み出しデータバス信号は4つのデータ
出力バッファに接続され、1MワードX1ビット構成のときは4つの読み出しデータバスの内の1つがIOSi(i-th nput/Output select)信号により、リードデータセレクタにより 1MワードX1ビット構成用のデータ出力バッファに転送される。リードデータセレク タは図6-3-3に示されるように単純なCMOSトランスミッションゲートで構成されてい る。CCDB1からCDB4で示される容量はリードデータバスの寄生容量である。



図6-3-3:リードデータセレクタ

CDQ1からCDQ4とCDOUは出力バッファの入力容量にほぼ等しく、リードデータバスの容量に比べて小さい。リードデータバスはチップの長辺にそって走り、この場合32のセンスアンプが接続されるので容量は大きい。したがって、電気的には256KワードX4ビットと1MワードX1ビット構成のデータ伝達経路はほぼ等しくなり、ビット構成を変えてものアクセスタイムは同一となる。

ビット構成可変機能は1つのピンがコントロール信号により複数の機能を持つことが 必要となる。また多数のRAMを用いるシステムではメモリボード上の信号のスキューを 減らすために、RAMのピンが低く均一の入出力容量を持つ必要がある。この要求を満た すために、新しい入出力回路を使用した。図6-3-4と6-2-5に入出力回路とピン#13とピ ン#15の入力信号切り替え回路を示す。電源/グランド以外の信号ピンは同一入出力回 路をその機能が入力/出力/入出力にかかわらず備えている。その入出力回路が入力回 路としてのみ使用されるとき、オフチップドライバを構成する2つのMOSFETの両者は OFFし、入力保護回路として使用される。ACT(Active)、ACT、CNTL(Control)なる3ケ のコントロール信号は入力回路の動作モードを決める。チップ内部のビット構成コント ール信号B1/B4、B1/B4にしたがって、入力信号切り替え回路の出力は切り替わる。上 記方法を用いて、均一な入出力をSOJパッケージで実現することができた。







図6-3-5: ピン#13とピン#15の入力信号切り替え回路

#### 6.3.3 評価結果

図6-3-6は高温(摂氏80度)における、アドレスアクセスタイムの2つのビット構成 に対するシュムープロットである。テストパターンはマーチパターン。電源電圧Vccが 4V以上のとき、両構成のアクセスタイムはほぼ同じで最大差は2ns未満であり、アクセ スタイムの絶対値の10%以下となった。したがって、本方式はアクセスタイムの選別 テストにも使用することが可能である。この特別テスト機能としてのビット構成可変機 能は実販売されている1MワードX1ビット構成のCMOS SRAMに使用されており、ト ータルのテスト時間は約4分の1に短縮されている。



図6-3-6:アドレスアクセスタイムの2つのビット構成に対するシュムープロット

SOJパッケージを使用してすべての入出力信号ピンの入力容量とESD(静電破壊)耐 量を測定した。図6-3-7は入力容量の測定結果である。3.5pF前後の均一で低い入力容量 を実現している。ESD耐量は100pFの放電容量とピンに1.5KΩのシリーズ抵抗を接続し て測定した。測定電圧は250Vステップで±3.75KVまでである。特に特別のプロセスス テップを追加せず、オフチップドライバを入力保護回路として入力保護回路として用い ることで+3.75KVと-3.25KVなる十分に高いESD耐量が実現された。



図6-3-7:入力容量の測定結果

### 6.4 結論

(1) 14nsのアクセスタイムがを実現した高速高集積の1MSRAMを試作した。

(2)ビット構成は1MワードX1ビット、もしくは256KワードX4ビットであり、この2種類のビット構成は外部からの所定のピンに信号を与えることで切り替えることができる。

 (3) 3層ポリシリコン2層メタルの0.7μmのCMOSプロセスでメモリセル内の素子 分離にトレンチ分離技術を用い、8.0μm X 5.2μmのメモリセルサイズ、5.51mm X
 15.72mmのチップサイズを実現した。

(4)32ブロック分割、変形分割ワード線、高感度センスアンプ、ゲート制御型デー タバスドライバ、ATDと組み合わせたデュアレレベルデータバスプリチャージ技術を用 いて、ティピカルのアクセスタイム14ns、40MHzの動作条件で100mAの動作電流を達 成した。

(5) 多数のテストパターンに対してテスト時間を大幅に減らすことを可能とし、短時間、高精度かつ厳しいテスト条件を実現するビット構成可変機能を提案した。

(6) このビット構成可変機能はアクセスタイムを同一に保つので、SRAMのような 高速メモリにおけるテスト時間削減に有効であることを示した。

(7) 出力ドライバトランジスタを入力保護回路に用いることで、低く均一な3.5pF の入力容量と高いESD耐量を実現した。

(8) このビット構成可変機能は256KワードX4ビット構成ならびに1MワードX1 ビット構成に切り替え可能な1MSRAMで現実的な問題なく実証された。

## 6.5 参考文献

[6-1] S. Kayano, K. Ichinose, Y. Kohno, H. Shinohara, K. Anami, S. Murakami, T. Wada, Y. Kawai, and Y. Akasaka, "25-ns 256Kx1/64Kx4 CMOS SRAM's," IEEE J. Solid-State Circuits, vol. SC-21, pp. 686-691, Oct. 1986.

[6-2] M. Honda, K. Kondou, H. Mitani, T. Kimura, S. Koshimaru, Y. Nagahashi, and M. Tameda, "A 25ns 256K CMOS SRAM," in ISSCC Dig. Tech. Papers, Feb. 1986, pp. 250-251.

[6-3] K. Wang, M. Bader, P. Voss, V. Soorholtz, R. Mauntel, H. Mendez, and R. Kung, "A 21-ns 32K X 8 CMOS Static RAM with a selectively pumped p-well array," IEEE J. Solid-State Circuits, vol. SC-22, pp. 704-711, Oct. 1987.

[6-4] T. Komatsu, N. Okazaki, T. Nishihara, S. Kayama, N. Hoshi, J. Aaoyama, and T. Shimada, "A 35-ns 128K X 8 CMOS SRAM," IEEE J. Solid-State Cirucits, vol. SC-22, pp. 721-726, Oct. 1987.

[6-5] T. Wada, T. Hirose, H. Shinohara, Y. Kawai, K. Yuzuriha, Y. Kohno, and S. Kayano, "A 34-ns 1-Mbit CMOS SRAM Using Triple Polysilicon," IEEE J. Solid-State Circuits, vol. SC-22, pp727-732, Oct 1987.

[6-6] M. Matsui, T. Ohtani, J. Tsujimoto, H. Iwai, A. Suzuki, K, Sato, M. Isobe, K. Hashimoto, M. Saito, H. Shibata, H. Sasaki, T. Matsuno, J. Matsunaga, and T. Iizuka, "A 25-ns 1-Mbit CMOS SRAM with loading-free bit lines," IEEE J. Solid-State Circuits, vol. SC-22, pp. 733 -740, Oct. 1987.

[6-7] O. Minato, T. Sasaki, S. Honjo, K. Ishibashi, Y. Sasaki, N. Moriwaki, K. Nishimura, Y. Sakai, S. Meguro, M. Tsunematsu, and T. Masuhara, "A 42ns 1mb CMOS SRAM," ISSCC Dig. Tech. Papers, Feb. 1987, pp.260-261.

[6-8] T. Wada, K. Anami, Y. Kawai, K. Yuzuriha, Y. Kohno, T. Matsukawa, and S. Kayano, "A 14ns 1Mb CMOS SRAM with Variable Bit-Organization Features," ISSCC Dig. Tech. Papers, Feb. 1988, pp.252-253.

[6-9] M. Yoshimoto, K. Anami, H. Shinohara, T. Yoshihara, H. Takagi, S. Nagao, S. Kayano, and T. Nakano, "A divided word-line structure in the static RAM and its application to a 64K full CMOS RAM," IEEE J. Solid-State Circuits, vol. SC-18, pp.

479-485, Oct. 1983.

[6-10] M. Kumanoya, K. Fujisima, H. Miyatake, Y. Nishimura, K. Saito, T. Matsukawa, T. Yoshihara, and T. Nakano, "A reliable 1-Mbit DRAM with a multi-bit-test mode," IEEE J. Solid-State Circuits, vol. SC-20, pp. 909-913, Oct. 1985.

[6-11] Y. Kohno, T. Wada, K. Anami, Y. Kawai, K. Yuzuriha, T. Matsukawa, and S. Kayano, "A 14-ns 1-Mbit CMOS SRAM with Variable Bit Organization," IEEE J. Solid-State Circuits, vol. SC-23, pp. 1060-1066, Oct. 1988.

[6-12] J. Inoue, T. Matsumura, M. Tanno, and J. Yamada, "Parallel testing technology for VLSI memries," in Proc. 1987 Int. Test Conf., pp. 1066-1071.

[6-13] Y. Matsuda, K. Arimoto, M. Tsukude, T. Oishi, and K. Fujishima, "A new array architecture for parallel testing in VLSI memories," in Proc. 1989 Int. Test Conf., pp. 322-326.

[6-14] T. Ohsawa, T. Furuyama, Y. Watanabe, H. Tanaka, N. Kushigawa, K. Tsuchida, Y. Nagahara, S. Yamano, T. Tanaka, S. Shinozaki, and K. Natori, "A 60-ns 4-Mbit CMOS DRAM with bult-in self-test functions," IEEE J. Solid-State Clrcuits, vol. SC-22, pp. 663-668, Oct. 1987.

[6-15] T. Takeshima, M. Takeda, H. Koike, H. Watanabe, S. Koshimaru, K. Mitake, W. Kikuchi, T. Tanigawa, T. Murotani, K. Noda, K. Tasaka, K. Yamanaka, and K. Koyama, "A 55-ns 16Mb DRAM," in ISSCC Dig. Tech. Papers, Feb. 1989, pp. 246-247.

[6-16] T. Williams, K. Beilstein, B. El-Kareh, R. Flaker, G. Gravenites, R. Lipa, H.S. Lee, J. Maslack, J. Pessetto, W.Pokorry, M. Roberge, and H. Zeller, "An experimental 1-Mbit CMOS SRAM with configurable organization and operation," IEEE J. Solid-State Circuits, vol. 23, no. 5, pp. 1085-1094, Oct. 1988.

[6-17] A. Aizaki, M. Ohkawa, A. Aizaki, Y. Okuyama, I. Sasaki, T. Shimizu, K. Abe, M. Ando, and O. Kudoh, "A 15ns 4Mb CMOS SRAM," in ISSCC Dig. Tech. Papers, Feb. 1990, pp. 126-127.

[6-18] T. Wada, M. Eino, M. Ukita, and K. Anami, "Variable Bit Organization as a New Test Function for Standard Memories," IEEE J. Solid-State Circuits, vol. SC-26, no. 1, January 1991.

[6-19] US patent, Tomohisa Wada, Kenji Anami, "semiconductor memory device with changeble word organization modes including a test mode" No. 4907203, Mar. 6 1990.

-104-

٠Ē

第7章

結論

### 7.1 本研究の結論

SRAMの高速化に関する第2章から第6章までの研究成果を総括して、本研究の結論を述べる。

(2章)ワード線、ビット線の構成すなわちアレイアーキテクチャによるSRAMの高速 化に関して、

(2-1) ワード線選択の高速化の手法として、吉本ら により提案された分割ワード線構成を発展させた変形分割ワード線構成を考案した。

(2-2) 変形分割ワード線構成はチップサイズ、ビット線容量のトレードオフを最適化 し、信号線容量配分を均衡化し速度性能を最適化することが可能であることを示した。 (2-3) 変形分割ワード線構成はメモリセルアレイ上を走るグローバルワード線の本数 を減らすので、ビット線容量を減らし、またデコーダ面積を最小化できることを示した。 (2-4) 新しいビット線構成であるT字型ビット線構成を考案した。

(2-5) T字型ビット線構成は通常メモリアレイの上下に配置されるセンスアンプ/ビット線負荷回路をメモリアレイの左右に配置することを可能とし、標準SRAMで通常用いられてる幅の狭いパッケージに適したチップ構成を実現することを示した。

(2-6) T字型ビット線構成はカラムピッチを緩和し各カラムごとにセンスアンプを配置 するダイレクトセンシングを可能とし、高速化に適したビット線アーキテクチャである ことを示した。

(2-7) T字型ビット線構成は64ビット程度の大きなデータ幅を1つのメモリブロック から取り出すことを可能とし、キャッシュメモリなどのI/O数の大きいメモリに適する ことを示した。

(2-8) T字型ビット線構成は各メモリブロックごとに重複して配置する必要があったコ ラムデコーダの1箇所配置を可能とし、チップサイズを低減することができることを示 した。

(2-9) T字型ビット線構成は分割ワード線構成や変形分割ワード線構成との整合性が良 く、グローバルロウデコーダ出力線、グローバルコラムデコーダ出力線、リードデータ バス線およびメタル2のビット線はすべてメタル2で形成することができ、すべてメモ リアレイ上を並行して走るのでチップサイズを大きくすることはなく、高密度なメモリ セルアレイを実現できることを示した。

(2-10) (2-9) で発生する小振幅信号の大振幅信号からのカップリングノイズによる 誤動作は小振幅信号線と大振幅信号線の間に低インピーダンスの固定レベルの線(シル ード配線)を挿入することで解決することができることを示した。

(3章)回路技術、とくにATDを利用するSRAMの高速化に関して、

(3-1) ATDを用いた高速化の別の手法としてデータバスプリチャージを考案した。

(3-2) データバスと出力バッファの間にシュミットトリガラッチ(STL)回路を設けて、 データバスプリチャージ中にデータ出力端子が前サイクルの状態を保持することを可能 とした。

(3-3) データバスプリチャージは著者らによる256KSRAM[3-2]で、データバスでの遅 延時間を6.5nsから2.5nsに4.0ns短縮し、13%以上のアクセスタイムの短縮を実現した。

(3-4)データバスプリチャージの特別なレシーバ回路を不要とする、データバスを2 種類の異なるレベルにプリチャージするデュアルレベルデータバスプリチャージを考案 した。

(3-5) デュアルレベルデータバスプリチャージは特別なレシーバ回路のアクセスパス への直列挿入する必要性をなくし、データバスに出力バッファを直接接続することを可 能とし、それに伴う遅延時間の短縮が可能であることを示した。

(3-6) ATDを用いた高速化の別の手法としてデータ出力プリセットを考案した。

(3-7)データ出力プリセットはチップ内部の電源線/接地線にバウンスを増大させず に出力バッファがチップ外部容量を駆動する時間を短縮することを示した。

(3-8) データ出力プリセットは著者らによる1MSRAM[3-5]のバウンシングノイズの原因の電流のピーク値ならびに最大傾斜値を30%削減ながら、アクセス時間を10%削減した。

(4章)高速SRAMの主な用途であるキャッシュメモリに応用した場合のアクセスタイムの最適化に関して、

(4-1)オンチップキャッシュメモリに適した解析的アクセスタイムモデルを提案し、 その妥当性を検証した。

(4-2) この解析的アクセスタイムモデルはキャッシュサイズC、ブロックサイズB、ア ソシアティビティAなどの一般的なキャッシュの論理パラメータのほかにサブアレイの アスペクトレシオやサブアレイ数を決める物理パラメータ(Ndwl、Ndbl、Ntwlおよび Ntbl)を含んでおり、これにより詳細な回路設計なしにキャッシュメモリのスピードを 見積ることができ、多種多様なキャッシュメモリの設計自由度をカバーすることができ ることを示した。

(4-3) この解析的アクセスタイムモデルにより、与えられたキャッシュサイズC、ブロックサイズB、アソシアティビティAに対して、最速のアクセスタイムに対応する最適なアレイ構成を決める物理パラメータが存在することが解かった。

(4-4)最適なアレイ物理パラメータ(Ndwl、Ndbl、NtwlおよびNtbl)を使用したとき、 アクセスタイムはキャッシュサイズの対数にほぼ比例して増加することが判明した。

(4-5)最適なアレイ物理パラメータ(Ndwl、Ndbl、NtwlおよびNtbl)が使用された場合、大きいブロックサイズBは小さいアクセスタイムに対応する。しかし、アソシアティビティの増加によりデータバス容量が増加するため、大きいアソシアティビティは必ずしも小さいアクセスタイムに対応しないことが判明した。

(5章)SRAMを高速化するときの信頼性上の問題である出力バッファによる電源バウ ンスノイズとソフトエラーのサイクルタイム依存性に関して、

(5-1)出力バッファのスイッチングのときにチップ内部の電源/GND電位に発生する 電位バウンス(ノイズ)の解析的モデルを提案した。

(5-2) このモデルは回路シミュレーションプログラムSPICEの結果と良い一致を示し、 その妥当性が示された。

(5-3) このモデルはL·Go(寄生インダクタンス、出力トランジスタ最大コンダクタン ス積)よりスイッチング時間trが大きくかつ出力電圧振幅Vdoutが小さいことがピーク ノイズ電圧Vnmaxを下げるために必要となることを示した。

(5-4)大きなtrおよび小さなG0は出力バッファでの遅延時間を増加させることに対応 し、またVnmaxはVdoutに一次比例の関係にあるので、超高速デバイスの低ノイズ化に は電源ピンを増加させて寄生インダクタンスを減らす方法もしくは出力電圧振幅を最小 化するのが有効であることを示した。

(5-5)(5-4)の方法を実現する電位降圧回路を組み合わせた低ノイズ出力バッファを 提案し、5V土10%スペックのデバイスにおいて最悪値の遅延時間を同一にしたまま、 ノイズの最悪値を約半分に低減できることを示した。

(5-6)新現象であるソフトエラー率の逆サイクルタイム依存性を発見しそのメカニズムを解析した。

(5-7) ソフトエラー率の逆サイクルタイム依存性はPMOSビット線負荷を用いた SRAMで発生し、ドライバトランジスタQDのしきい値電圧Vthn、高抵抗負荷の抵抗値 R1に関係することが解かった。

(5-8) PMOSビット線負荷を用いたSRAMでもNMOSビット線負荷のSRAMが持つ通 常のサイクルタイム依存性は発生し、1MSRAM [5-6]ではVthn=0.5VかつR<sub>1</sub>=3TΩで観 測された。

(5-9) メモリセルのパラメータによるソフトエラー率のサイクルタイム依存性を "High"レベルを保持するメモリセルノードの電位を用いモデル化し、このモデルにより Vthnを0.7V以上に上げるもしくはR<sub>1</sub>を100GΩ以下にすることで、ソフトエラー率のサ イクルタイム依存性を抑制し、ロングサイクルタイムのときの低いソフトエラー率を任 意のサイクルタイムで保つことが可能になることを示した。

(6章)工学的応用に関して、

(6-1)14nsのアクセスタイムがを実現した高速高集積の1MSRAMを試作した。

(6-2) ビット構成は1MワードX1ビット、もしくは256KワードX4ビットであり、この2種類のビット構成は外部からの所定のピンに信号を与えることで切り替えることができる。

(6-3) 3 層ポリシリコン 2 層メタルの0.7 μ mのCMOSプロセスでメモリセル内の素子

分離にトレンチ分離技術を用い、8.0 µm X 5.2 µmのメモリセルサイズ、5.51mm X 15.72mmのチップサイズを実現した。

(6-4)32ブロック分割、変形分割ワード線、高感度センスアンプ、ゲート制御型デ ータバスドライバ、ATDと組み合わせたデュアレレベルデータバスプリチャージ技術を 用いて、ティピカルのアクセスタイム14ns、40MHzの動作条件で100mAの動作電流を 達成した。

(6-5)多数のテストパターンに対してテスト時間を大幅に減らすことを可能とし、短時間、高精度かつ厳しいテスト条件を実現するビット構成可変機能を提案した。

(6-6) このビット構成可変機能はアクセスタイムを同一に保つので、SRAMのような 高速メモリにおけるテスト時間削減に有効であることを示した。

(6-7) 出力ドライバトランジスタを入力保護回路に用いることで、低く均一な3.5pFの 入力容量と高いESD耐量を実現した。

(6-8) このビット構成可変機能は256Kワード X 4 ビット構成ならびに1Mワード X 1 ビット構成に切り替え可能な1MSRAMで現実的な問題なく実証された。

### 7.2 謝辞

本論文をまとめるにあたり、終始御懇切なる御指導と御討論を賜った大阪大学工学部 電子工学科 浜口智尋教授に衷心より御礼申しあげます。

また、本論文作成にあたり、御懇篤なる御指導と御高配を賜った大阪大学工学部吉野 勝美教授、尾浦憲治朗教授に厚く御礼申し上げます。

また、本論文に対して御検討と数々の御教示を頂いた大阪大学工学部 西原 浩教授、 児玉慎三教授に感謝の意を表します。

本研究の逐行にあたり、終始御懇切な御教示と御鞭撻を賜り、また研究の機会を与え て頂いた三菱電機株式会社ULSI開発研究所所長 小宮 啓義博士、同副所長 出水 清史博士、同熊本製作所所長 中野 隆生博士、同ULSI研究所メモリ設計技術部部長

吉原 務博士、同システムLSI開発研究所設計技術第一部部長茅野 晋平博士に厚く 御礼を申し上げます。

また、本研究の逐行、及び論文の作成にあたり、数々の御教示、御忠告をいただいた 三菱電機北伊丹製作所課長 穴見 健治博士、同ULSI研究所 グループマネージャー 西村 安正博士に厚く御礼申し上げます。

また、本論文における数々の分析、解析に御協力頂いた三菱電機ULSI研究所 グルー プマネージャー 河野 芳雄氏、同本社 篠原 尋史氏、同ULSI研究所 村上 修二 氏、広瀬 愛彦氏、浮田 求氏、大庭 敦氏、同北伊丹製作所 塩見 徹氏、大林 茂 樹氏、営野 雅直氏、元LSI研究所 一瀬 勝樹氏、米国Stanford大学講師 Steven A. Przybylski博士、同Stanford大学Suresh Rajan氏に心から感謝します。

末筆ながら、本研究の期間中に終始有益な討論と協力をいただいた三菱電機ULSI研究 所、同システムLSI研究所ならびに同北伊丹製作所の各位に心から感謝します。

# 研究業績目録

#### 1) 発表論文(査読付)

- Hirofumi Shinohara, Kenji Anami, Katsuki Ichinose, <u>Tomohisa Wada</u>, Yoshio Kohno, Yuji Kawai, Yoichi Akasaka, and Shinpei Kayano, "A 45-ns 256K CMOS Static RAM with a Tri-Level Word Line," IEEE J. Solid-State Circuits, Vol. SC-20, NO. 5, pp. 929-934 (Oct. 1985).
- (2) Shimpei Kayano, Katsuki Ichinose, Yoshio Kohno, Hirofumi Shinohara, Kenji Anami, Shuji Murakami, <u>Tomohisa Wada</u>, Yuji Kawai, and Yoichi Akasaka,"25-ns 256Kx1/64Kx4 CMOS SRAM's,"IEEE J. Solid-State Circuits, Vol. SC-21, NO. 5, pp. 686-691 (Oct. 1986).
- (3) <u>Tomohisa Wada</u>, Toshihiko Hirose, Hirofumi Shinohara, Yuji Kawai, Kojiro Yuzuriha, Yoshio Kohno, and Shimpei Kayano, "A 34-ns 1-Mbit CMOS SRAM Using Triple Polysilicon," IEEE J. Solid-State Circuits, Vol. SC-22, NO.5, pp.727-732 (Oct. 1987).
- (4) Yoshio Kohno, <u>Tomohisa Wada</u>, Kenji Anami, Yuji Kawai, Kojiro Yuzuriha, Takayuki Matsukawa, Shimpei Kayano," A 14-ns 1-Mbit CMOS SRAM with Variable Bit Organization," IEEE J. Solid-State Circuits, Vol. SC-23, NO. 5, pp. 1060-1066 (Oct. 1988).
- (5) Shigeki Ohbayashi, <u>Tomohisa Wada</u>, Toshihiko Hirose, and Kenji Anami, "A Study on Fanout Optimization of SRAM Decoder with a Line Capacitance,"Trans. of IEICE, vol.E73, 11, pp.1855-1857, (Nov. 1990)
- (6) <u>Tomohisa Wada</u>, Masanao Eino, and Kenji Anami, "Simple Noise Model and Low-Noise Data-Output Buffer for Ultrahigh-Speed Memories," IEEE J. of Solid-State Circuits, vol. SC-25, No.6, pp.1586-1588, Dec. 1990.
- (7) <u>Tomohisa Wada</u>, Masanao Eino, Motomu Ukita, and Kenji Anami, " Variable Bit-Organization as a New Test Function for Standard Memories,"IEEE J. of Solid-State Circuits, vol. SC-26, No.1, pp.51-54, Jan. 1991.
- (8) Hirotada Kuriyama, Tosihiko Hirose, Shuji Murakami, <u>Tomohisa Wada</u>, Koreaki Fujita, Yasumasa Nishimura, and Kenji Anami, "A 4Mbit CMOS SRAM with 8ns

Serial-Access-Time," IEEE J. Solid-State Circuits, Vol. 26, 4, pp.502-506, Apr. 1991.

- (9) Shuji Murakami, <u>Tomohisa Wada</u>, Masanao Eino, Motomu Ukita, Yasumasa Nishimura, and Kenji Anami, "A New Soft-Error Phenomenon in ULSI SRAM's -Inverted Dependence of Soft-Error Rate on Cycle Time -, " IECE Trans., Vol.E 74, NO.4 APR. 1991.
- (10) <u>Tomohisa Wada</u>, Suresh Rajan, and Steven A. Przybylski, "An Analytical Access Time Model for On-chip Cache Memories, " IEEE J. Solid-State Circuits, vol. SC-27, pp. 1147-1156, Aug. 1992.
- (11) Toru Shiomi, <u>Tomohisa Wada</u>, Shigeki Ohbayashi, Atsushi Ohba, Hiroki Honda, Yoshiyuki Ishigaki, Masahiro Hatanaka, Shigeo Nagao, Kenji Anami, "A 5.8ns
   256K BiCMOS TTL SRAM with T-Shaped Bit Line Architecture," IEEE J. Solid-State Circuits, vol. SC-28, pp. 1362-1369, Dec. 1993.

#### 2)研究会、技術報告資料

- (1) <u>和田知久</u>、寺島 郁、浜口智尋、"極微細加工MOSFETにおけるホットエレクトロン現象、"特定研究「極微構造エレクトロニクス」第4回研究会、pp.5-8、昭和58年7月.
- (2) C. Hamaguchi, T. Mori, <u>T. Wada</u>, K. Terashima, K. Taniguchi, K. Miyatsuji, and H. Hihara, "Physics of Nanometer Structure Devices," Osaka Univ. Int. Sym. on Nanometer Structure Electronics, pp. 34-43, April, 1984.
- (3) <u>和田知久</u>、穴見健治、杠幸二郎、河野芳雄、松川隆行、茅野晋平、"ビット構成 可変機能付き14ns 1MビットCMOS SRAM、"信学技報、SDM88-11、pp.29-36、 1988-5.
- (4) 高橋 潤、塩見 徹、<u>和田知久</u>、大林茂樹、大庭 敦、"T字ビット線構成
  5.8ns 256K BiCMOS TTL SRAM、"信学技報、、1991.

#### 3) 講演論文(査読付)

- (1) Hirofumi Shinohara, Kenji Anami, Katsuki Ichinose, <u>Tomohisa Wada</u>, Yoshio Kohno, Yuji Kawai, Yoichi Akasaka, and Shimpei Kayano, "A 45ns 256K CMOS SRAM with Tri-Level Word Line," ISSCC Dig. Tech. Papers, Feb. 1985, pp62-63.
- (2) <u>Tomohisa Wada</u>, Toshihiko Hirose, Hirofumi Shinohara, Yuji Kawai, Kojiro Yuzuriha, Yoshio Kohno, and Shimpei Kayano, "A 34ns 1Mb CMOS SRAM using Triple Poly," ISSCC Dig. Tech. Papers, Feb. 1987, pp.262-263.
- (3) <u>Tomohisa Wada</u>, Kenji Anami, Yuji Kawai, Kojiro Yuzuriha, Yoshio Kohno, Takayuki Matsukawa, and Shimpei Kayano, "A 14ns 1Mb CMOS SRAM with Variable Bit-Organization Features," ISSCC Dig. Tech Papers, Feb. 1989, pp.30-31.
- (4) Y. Inoue, T. Ipposhi, <u>Tomohisa Wada</u>, Katsuki Ichinose, T. Nishimura, and Yoichi Akasaka, "4 PMOS / 2 NMOS Vertically Stacked CMOS-SRAM with 0.6um Design rule," Sym. on VLSI Technology Dig. Tech. Papers, 1989, pp.39-40.
- (5) Shuji Murakami, <u>Tomohisa Wada</u>, Masanao Eino, Motomu Ukita, Yasumasa Nishimura, and Kenji Anami, "A New Soft-Error Phenomenon in ULSI SRAM's -Inverted Dependence of Soft-Error Rate on Cycle Time -," 1990 Symp. on VLSI Circuits Dig. Tech. Papers, 1990, pp.77-78.
- (6) Hirotada Kuriyama, Toshihiko Hirose, Shuji Murakami, <u>Tomohisa Wada</u>, Koreaki Fujita, Yasumasa Nishimura, and Kenji Anami, "A 4-Mbit CMOS SRAM with 8-ns Serial-Access Time," 1990 Sym. on VLSI Circuits Dig. Tech. Papers, 1990, pp.51-52.
- (7) Toru Shiomi, <u>Tomohisa Wada</u>, Shigeki Obayashi, Atsushi Ohba, Hiroki Honda, Yoshiyuki Ishigaki, Masahiro Hatanaka, Shigeo Nagao, Kenji Anami, and Tadashi Sumi, "New Bit Line Architecture for Ultra High-Speed SRAMs - T-Shaped Bit Line and It's Real Application to 256K BiCMOS TTL SRAM," CICC Dig. Tech. Papers, 1991.

4)講演論文(査読無し)

- (1) <u>和田知久</u>、小谷教彦、東谷恵市、河津 哲、"接合深さの基板電流に与える効果、" 昭59年度電通全大 271、p.2-34、1984.
- (2)<u>和田知久</u>、篠原尋史、一瀬勝樹、穴見健治、茅野晋平、"内部同期方式を用いた 高速CMOSセンスアンプ、"昭60年度電通全大 529、p.2-247、1985.
- (3) 一瀬勝樹、篠原尋史、<u>和田知久</u>、穴見健治、茅野晋平、"CMOSスタティック RAMのワード線中間電位発生回路、"昭60年度電通全大 542、p.2-260、1985.
- (4) <u>和田知久</u>、篠原尋史、 茅野晋平、" CMOS SRAMの低ノイズ出力バッファ、" 昭61年度電通全大 471、p.2-229、1986.
- (5) 栗山祐忠、<u>和田知久</u>、穴見健治、茅野晋平、"ソフトエラー率を考慮したSRAM メモリセルの設計、"昭62年度電通全大 167、p.1-168、1987.
- (6) 広瀬愛彦、<u>和田知久</u>、篠原尋史、茅野晋平、"CMOS SRAMの中間レベルプリセット方式を用いた出力バッファ、"昭62年度電通全大 414、p.2-128、1987.
- (7)<u>和田知久</u>、穴見健治、茅野晋平、"高速SRAMのビット構成可変方式、"昭63年 度電通全大 C-305、p.2-266、1988.
- (8) 浮田 求、<u>和田知久</u>、穴見健治、"CMOSインバータの貫通電流の解析、"1989 年度電通全大 C-118、p.5-104、1989.
- (9) 村上修二、<u>和田知久</u>、穴見健治、"大容量RAM用リダンダンシー回路の検討、" 1989年度電通全大 C-144、p.5-130、1989.
- (10) 営野雅直、<u>和田知久</u>、穴見健治、張間寛一、"出力バッファのノイズモデル、" 1989年度電通全大 C-370、p.5-321、1989.
- (11) 浮田 求、<u>和田知久</u>、高橋 潤、塩見 徹、大林茂樹、"MOS SRAM電源線の 発振現象、"1992年度電通全大 、1992.