# Geradores

Geradores são objetos que entregam uma seqüência de valores. Os valores podem estar armazenados em memória ou serem gerados quando solicitados.

Um gerador frequentemente utilizado é o `range`. Na saída abaixo, note como não é mostrada a seqüência de valores. Isso é porque esse objeto gera os valores quando eles forem necessários.

In [None]:
range(19)

Uma forma de usar os valores é percorrê-los em um `for`:

In [2]:
for i in range(9):
 print(i**3)

0
1
8
27
64
125
216
343
512


Para cada iteração do `for`, um novo valor é solicitado ao objeto gerador `range(0,9)`.

A função `map`, que aplica uma função fornecida a todos os valores passados, também retorna um objeto gerador. Isto é, a função será aplicada aos valores na medida do necessário.

In [3]:
map(lambda x: 2*x - 3, [1, 4, 7, 9])



Não acredita? Então veja as temporizações abaixo:

In [4]:
%timeit map(lambda x: x**2, range(10))

The slowest run took 10.39 times longer than the fastest. This could mean that an intermediate result is being cached.
1000000 loops, best of 3: 1.14 µs per loop


In [5]:
%timeit map(lambda x: x**2, range(1000))

The slowest run took 9.35 times longer than the fastest. This could mean that an intermediate result is being cached.
1000000 loops, best of 3: 1.21 µs per loop


In [6]:
%timeit map(lambda x: x**2, range(10000000))

The slowest run took 10.04 times longer than the fastest. This could mean that an intermediate result is being cached.
1000000 loops, best of 3: 1.2 µs per loop


Se queremos ver todos os valores gerados, podemos converter o gerador para uma lista.

In [7]:
list(range(9))

[0, 1, 2, 3, 4, 5, 6, 7, 8]

In [8]:
list(map(lambda x: 2*x - 3, [1, 4, 7, 9]))

[-1, 5, 11, 15]

Outra função que retorna um gerador é a função `filter`.

In [9]:
filter(lambda x: x ** 2 < 100, range(20))



## Tipos de geradores

Há dois tipos de geradores:

1. Expressões geradoras
1. Funções geradoras

### Expressões geradoras

Expressões geradoras são criadas substituindo os `[]` de uma *list comprehension* por `()`.

Abaixo temos uma *list comprehension*, que retorna uma lista com todos os valores:

In [10]:
[i ** 2 for i in range(10)]

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

Podemos criar uma expressão geradora com os mesmo valores usando `()`:

In [11]:
valores = (i ** 2 for i in range(10))

Agora, `valores` é um objeto gerador, que pode, por exemplo, ser usado num `for`:

In [12]:
for x in valores:
 print(x)

0
1
4
9
16
25
36
49
64
81


Os parêntesis da expressão geradora podem ser omitidos em locais onde a sintaxe do Python já exige parêntesis, por exemplo, na passagem de parâmetros para funções ou métodos:

In [13]:
' '.join(v.strip().upper() for v in 'a , b ,c, x, y,z'.split(','))

'A B C X Y Z'

In [14]:
sum(x * x for x in range(10))

285

In [15]:
list(x*2 for x in (abs(x) for x in [-1,-2,3,-4]))

[2, 4, 6, 8]

### Funções geradoras

Funções geradoras são funções que criam um objeto gerador. Podemos conseguir uma função geradora usando `yield` ao invés de `return`. Neste caso, o valor fornecido no `yield` será retornado, mas a função continuará ativa (não termina ainda). Quando for solicitado um novo valor, a função voltará a executar continuando da instrução seguinte ao `yield`.

Por exemplo, a função geradora abaixo gera os `n` primeiros número pares a partir de `0`:

In [16]:
def gerapares(n):
 corrente = 0
 for i in range(n):
 print('Vou retornar', corrente)
 yield corrente
 corrente += 2

Quando a execução chega em `yield corrente` o valor atual da variável corrente é retornado como o próximo número gerado, e a execução da função é suspensa. Quando o código que usa o gerador solicitar o próximo valor, a execução retorna no comando seguinte (`corrente += 2`), como se não tivesse sido interrompida.

A função pára de gerar novos números quando termina (por chegar ao fim do código ou por executar um `return`).

In [17]:
gerapares(10)



In [18]:
for x in gerapares(10):
 print('Valor atual:', x)

Vou retornar 0
Valor atual: 0
Vou retornar 2
Valor atual: 2
Vou retornar 4
Valor atual: 4
Vou retornar 6
Valor atual: 6
Vou retornar 8
Valor atual: 8
Vou retornar 10
Valor atual: 10
Vou retornar 12
Valor atual: 12
Vou retornar 14
Valor atual: 14
Vou retornar 16
Valor atual: 16
Vou retornar 18
Valor atual: 18


A função pode ter o número de comandos `yield` que forem necessários. A execução é interrompida num `yield`, retorna no comando seguinte e continua até encontrar o próximo `yield`.

Por exemplo, o gerador abaixo retorna alternadamente `'feliz'` e `'triste'`.

In [19]:
def bipolar(n):
 for i in range(0,n,2):
 yield 'feliz'
 yield 'triste'

In [20]:
for estado in bipolar(10):
 print('Estou', estado)

Estou feliz
Estou triste
Estou feliz
Estou triste
Estou feliz
Estou triste
Estou feliz
Estou triste
Estou feliz
Estou triste


Vejamos agora uma comparação de desempenho de geradores listas. Primeiro, duas funções idênticas, uma retornando uma lista de valores e outra sendo um gerador para a mesma sequência de valores.

In [21]:
def cria_lista(n):
 corrente = 0
 res = []
 for i in range(1,n):
 corrente += i*i
 res.append(corrente)
 return res

In [22]:
def gera_valores(n):
 corrente = 0
 for i in range(1,n):
 corrente += i*i
 yield corrente

Vemos que as duas geram os mesmo valores, mas de forma diferente:

In [23]:
cria_lista(10)

[1, 5, 14, 30, 55, 91, 140, 204, 285]

In [24]:
list(gera_valores(10))

[1, 5, 14, 30, 55, 91, 140, 204, 285]

Agora vamos temporizar uma operação sobre esses valores (soma) de duas formas:

In [25]:
%timeit sum(cria_lista(1000000))

1 loop, best of 3: 481 ms per loop


In [26]:
%timeit sum(gera_valores(1000000))

1 loop, best of 3: 347 ms per loop


Vemos que neste caso o uso de geradores é mais eficiente.

Por fim, vejamos uma função geradora para os `n` primeiros números da sequência de Fibonacci começada em 1, 1. (Implementação diferente da apresentada em aula.)

In [27]:
def fib(n):
 a, b = 1, 1
 for i in range(n):
 yield a
 a, b = b, a + b

In [30]:
list(fib(10))

[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]

### Exaustão de geradores

Ao usar geradores é importante lembrar que um gerador irá fornecer valores até terminar. Após fornecido o último valor, ele não fornecerá mais valores.

Veja por exemplo o código abaixo.

In [31]:
bipolar4 = bipolar(4) # Cria um objeto gerador e guarda referência
print('Primeira fase')
for estado in bipolar4:
 print('Estou', estado)
print('Segunda fase')
for estado in bipolar4:
 print('Estou', estado)
print('Terminado')

Primeira fase
Estou feliz
Estou triste
Estou feliz
Estou triste
Segunda fase
Terminado


Isso acontece com todos os geradores. Por exemplo, o `map`.

In [32]:
cubs = map(lambda x: x**3, range(5))
print('Primeira vez')
for q in cubs:
 print(q)
print('Segunda vez')
for q in cubs:
 print(q)
print('Acabou')

Primeira vez
0
1
8
27
64
Segunda vez
Acabou


# Módulos

Módulos são as unidades de organização de código em Python. Cada módulo corresponde, em geral, a um arquivo. Identificadores definidos em um arquivo fazem parte do escopo do módulo.

Por exemplo, no arquivo `quadratura.py` temos a definição de duas funções de integração numérica (quadratura) pelo método dos trapézios. Para usar essas funções, devemos importar o módulo associado a esse arquivo e acessar as funções dentro do escopo do módulo.

In [33]:
import quadratura
import math

In [34]:
quadratura.trapezoide_precisao(math.sin, 0, math.pi/2, 1e-10)

0.9999999999880265

No arquivo `teste.py` definimos uma função `f` e uma variável `x`. O arquivo também executa um `print`. Note como ao importar o arquivo, o `print` é executado.

In [35]:
import teste

Estou executando o modulo teste


Agora os identificadores do módulo são acessíveis. A função pode ser chamada, a variável pode ter seu valor lido ou alterado.

In [36]:
teste.f()

Em f() do modulo teste


In [37]:
teste.x

4

In [38]:
teste.x = 2

In [39]:
teste.x

2

Os módulos são importados apenas uma vez. **Um `import` em módulo já importado não terá nenhum efeito**, mesmo que o código do módulo tenha sido alterado.

In [40]:
import teste

In [41]:
teste.x

2

In [42]:
import teste

Se queremos forçar um módulo a ser recarregado (importante se fizemos alterações no código e queremos testá-las), devemos usar a função `reload` do módulo `imp`:

In [43]:
from imp import reload

In [44]:
reload(teste)

Estou executando o modulo teste




In [45]:
teste.x

4

Outra possibilidade é importar identificadores individuais do módulo. No código abaixo, importamos apenas o identificador `x` do módulo `teste`.

In [46]:
from teste import x

In [47]:
x

4

**Como já havíamos importado o módulo, agora temos dois `x`**: um no escopo do módulo e outro no escopo corrente. Essas são variáveis independentes (**a do escopo corrente é apenas inicializada com o mesmo objeto da variável do módulo**). Se mudarmos o objeto referenciado por uma das variáveis, a outra variável não é afetada.

In [48]:
teste.x

4

In [49]:
x = 2

In [50]:
x

2

In [51]:
teste.x

4

Em alguns casos é útil importar um módulo, mas com outro nome. Por exemplo, o código abaixo importa o módulo `teste`, mas para ser referenciado como `t`.

In [52]:
import teste as t

In [53]:
t.x

4

In [54]:
t.f()

Em f() do modulo teste


In [55]:
teste.x, t.x

(4, 4)

In [56]:
t.x = 3
teste.x, t.x

(3, 3)

Além de importar identificadores individuais de um módulo para o escopo corrente, podemos importar todos os identificadores do módulo, usando um `*` no `from`:

In [57]:
from teste import *

Agora tanto `f` como `x` fazem parte do escopo corrente.

In [58]:
x

3

In [59]:
f()

Em f() do modulo teste


In [60]:
x = 1

In [61]:
x

1

In [62]:
teste.x

3

Podemos saber todos os identificadores definidos em um escopo usando a função `dir`. Abaixo seguem os identificadores no escopo do módulo (já importado) `teste`. (Os identificadores com `__` são pré-definidos pelo Python.)

In [63]:
dir(teste)

['__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 'f',
 'x']

Isso pode ser útil quando queremos saber o que o módulo fornece, sem consultar a documentação.

In [64]:
dir(math)

['__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 'acos',
 'acosh',
 'asin',
 'asinh',
 'atan',
 'atan2',
 'atanh',
 'ceil',
 'copysign',
 'cos',
 'cosh',
 'degrees',
 'e',
 'erf',
 'erfc',
 'exp',
 'expm1',
 'fabs',
 'factorial',
 'floor',
 'fmod',
 'frexp',
 'fsum',
 'gamma',
 'gcd',
 'hypot',
 'inf',
 'isclose',
 'isfinite',
 'isinf',
 'isnan',
 'ldexp',
 'lgamma',
 'log',
 'log10',
 'log1p',
 'log2',
 'modf',
 'nan',
 'pi',
 'pow',
 'radians',
 'sin',
 'sinh',
 'sqrt',
 'tan',
 'tanh',
 'trunc']

## Diretórios como módulos

Outra forma de definir módulos é através de diretórios. **Um diretório será correspondente a um módulo se ele possuir um arquivo denominado `__init__.py`**. Esse arquivo será executado quando o módulo for importado. Por exemplo o diretório `dirmod` pode ser importado como um módulo (veja código que acompanha este notebook, e analise o código dos arquivos incluidos para entender os resultados abaixo).

In [65]:
import dirmod

Importando o modulo dirmod


In [66]:
dirmod.primeiro.f()

f do dirmod em primeiro


In [67]:
dir(dirmod)

['__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__path__',
 '__spec__',
 'dirmod',
 'primeiro',
 'segundo']

Outros arquivos dentro do diretório podem funcionar como "submódulos" do diretório:

In [68]:
import dirmod.primeiro
import dirmod.segundo

In [69]:
dirmod.primeiro.f()

f do dirmod em primeiro


In [70]:
dirmod.segundo.g()

g de dirmod em segundo


In [71]:
from dirmod import *

In [72]:
primeiro



In [73]:
segundo.g()

g de dirmod em segundo
