Um sistema de pontos flutuantes será determinado por um trio @i\{\beta, t, M\}@i onde

  • @i\beta > 1@i é a base do sistema
  • @it> 1@i é o comprimento da mantissa
  • @i-M@i e @iM@i são os expoentes mínimo e máximo respectivamente.

O conjunto dos pontos flutuantes @i\mathbb{F}@i é o subconjunto finito de @i\mathbb{R}@i dado por @d \mathbb{F}=\{ 0.d_1\cdots d_t * \beta ^ {e}: 0\leq d_i<\beta, d_1>0, -M\leq e\leq M\} @d A função arredondamento associa a cada @i0< x < \beta^M @i o número de @i\mathbb{F}@i mais próximo de @ix@i. Esta função será denotada por @i fl(x)@i. De uma forma geral podemos escrever um tal @i x\in \mathbb{R}@i como @d x= 0.d_1\cdots d_td_{t+1}\cdots * \beta^{e} \\ x= 0.d_1\cdots d_t*\beta^{e} + 0.d_{t+1}\cdots *\beta^{e-t} @d Vamos denotar como: @d \bar{x}=0.d_1\cdots d_t*\beta^{e} \\ r(x) = 0.d_{t+1}\cdots *\beta^{e-t} @d Então @i x=\bar{x} + r(x)@i. Além disso @i\bar{x} \in \mathbb{F}@i é o maior número em ponto flutuante menor que @ix@i (ou o truncamento de @ix@i). Note também que @d 0\leq r(x)< \beta^{e-t} @d e @i \bar{x} + \beta^{e-t} = 0.d_1\cdots (d_t+1)*\beta^{e}@i também é número de @i \mathbb{F}@i. Daí concluimos que @d |fl(x)-x| \leq 0.5 \beta^{e-t} @d Considerando agora o erro relativo temos que @d x=0.d_1\cdots *\beta^{e} \implies x\geq 0.1*\beta^{e} \implies x\geq \beta^{e-1} @d portanto @d \frac{|fl(x)-x|}{|x|} \leq 0.5\beta^{1-t}@d

Última atualização: sexta-feira, 16 mar. 2012, 18:39