A memoria cache é um tipo de memória ultra rápida que armazena os dados e instruções mais utilizadas pelo processador, permitindo que estas sejam acessadas rapidamente. O cache passou a ser utilizado a partir dos micros 386, quando os processadores começaram a tornar-se mais rápidos que a memória RAM. Quanto maior a quantidade, ou quanto maior a velocidade, maior será a eficiência do cache. Geralmente o cache é divido em dois níveis, chamados de cache L1 (level 1) e cache L2. Um Pentium III Coppermine, por exemplo, tem 32 KB de cache L1 e 256 KB de cache L2, ambos operando na freqüência do processador. Alguns processadores, como o K6-3 e o Pentium 4 Xeon utilizam também cache L3.
Os chips de memória cache utilizam memória SRAM, um tipo mais caro de memória que não precisa de refresh. O refresh é uma característica inerente a todas as tecnologias de memória RAM, incluindo as DDR e DDR2 atuais. Cada célula do pente de memória é composta por um transístor e um capacitor. O transístor controla a passagem do impulso elétrico, enquanto o capacitor o armazena. O problema é que o capacitor é capaz de manter a carga por um curto período, de forma que os dados precisam ser reescritos várias vezes por segundo.
A memória cache armazena os dados mais usados pelo processador, reduzindo o número de operações em que é preciso buscar dados diretamente na lenta memória RAM. Mesmo uma pequena quantidade de memória cache é capaz de melhorar bastante o desempenho do processador.
Fonte: http://www.hardware.com.br/termos/cache