## Continuando com números primos

Vamos escrever uma função para calcular os n primeiro números primos.

In [1]:
def primeiros_primos_v0(n):
 # Começamos com uma lista vazia de primos conhecidos
 primos = []
 # O primeiro candidato é o 2
 candidato = 2
 while len(primos) < n: # Enquanto não tiver primos suficientes
 # insere candidato em primos se for primo
 eh_primo = True # Assume que candidato é primo até prova em contrário
 for p in primos: # Verifica todos os primos anteriores
 if candidato % p == 0:
 eh_primo = False # É divisível, portanto candidato não é primo
 break
 if eh_primo:
 # Se é primo, acresenta na lista
 primos.append(candidato)
 # Passa para o próximo candidato
 candidato += 1
 return primos

Agora vamos fazer uma outra variante da mesma função, usando a opção `else` do comando `for`.

In [2]:
def primeiros_primos(n):
 # Começamos com lista vazia de candidatos
 primos = []
 # O primeiro candidato é o 2
 candidato = 2
 while len(primos) < n: # Enquanto não tiver primos suficientes
 # insere candidato em primos se for primo
 for p in primos: # Percorre todos os primos anteriores
 if candidato % p == 0:
 break # Se é divisível, interrompe loop
 else:
 # Se loop não foi interrompido, não é divisível por nenhum
 # primo anterior, portanto é primo.
 primos.append(candidato)
 # Passa para o próximo candidato. Vamos evitar os pares...
 if candidato == 2:
 candidato = 3
 else:
 candidato += 2
 return primos

Alguns testes...

In [3]:
primeiros_primos_v0(10)

[2, 3, 5, 7, 11, 13, 17, 19, 23, 29]

In [4]:
primeiros_primos(10)

[2, 3, 5, 7, 11, 13, 17, 19, 23, 29]

In [5]:
primeiros_primos(1)

[2]

In [6]:
primeiros_primos(0)

[]

In [7]:
primeiros_primos(-1)

[]

Agora vamos definir uma função verificar se um número dado é primo. Para isso, vamos usar a função que calcula primos até um dado número, da aula anterior, que está copiada abaixo (corrigindo um pequeno problema, relacionado com a situação onde a lista de primos resultante é vazia).

In [8]:
import math
def primos_ate(n):
 # Primeiro formamos uma lista com os inteiros de 2 a n
 # Esses são os candidatos a primos.
 candidatos = list(range(2, n + 1))
 # Se a lista for vazia, já sabemos o resultado.
 if len(candidatos) == 0:
 return []
 # Ao calcular a raiz quadrada de n, arredondamos para cima, 
 # para evitar problemas com aproximação numérica.
 raiz_n = int(math.ceil(math.sqrt(n)))
 # i mantém a posição do primo atual (que está limpando a lista)
 # corrente é o valor de candidatos[i]
 # começamos na posição inicial (que tem valor 2)
 i, corrente = 0, candidatos[0]
 while corrente <= raiz_n:
 # Os múltiplos de corrente são os que estão nas posições
 # j = i + k * corrente, k = 1, 2, ...
 j = i + corrente
 while j < len(candidatos):
 candidatos[j] = None # Marcamos os múltiplos com None
 j += corrente
 # Agora que eliminamos os múltiplos de corrente, vamos
 # avançar corrente (e i) para o próximo não eliminado
 j = i + 1
 while j < len(candidatos):
 # Se encontramos um candidato não eliminado saímos
 if candidatos[j] is not None: break
 # Senão, testamos o próximo
 j += 1
 else:
 # Se não houve break, não foi achado candidato.
 # Isso quer dizer que não há mais primos a testar.
 break
 # Se o código continua, então candidatos[j] é o próximo primo.
 i, corrente = j, candidatos[j]
 # Agora todos os que não estão marcados com None são primos.
 # Copio esses valores em uma lista de resultados.
 res = []
 for x in candidatos:
 if x is not None:
 res.append(x)
 return res

Para saber se um número é primo, podemos testar sua divisibilidade por todos os primos menores ou iguais a sua raiz quadrada (pois pelo menos um de seus fatores primos tem que estar nessa faixa).

In [9]:
def eh_primo(n):
 # Calcularmos a raiz quadrada, usando a função round para pegar o
 # inteiro mais próximo
 raiz_n = round(math.sqrt(n))
 # Pegamos então uma lista com todos os inteiros até raiz_n
 primos = primos_ate(raiz_n)
 # Verificamos se algum desses primos divide n
 for p in primos:
 if n % p == 0:
 # n é divisível por p, portanto não é primo
 return False
 # n não é divisível por nenhum dos valores em primos,
 # portanto é primo.
 return True

In [10]:
eh_primo(2), eh_primo(5), eh_primo(9), eh_primo(36), eh_primo(37)

(True, True, False, False, True)

In [11]:
eh_primo(1892832876219)

False

Para terminar nossa exploração de número primos, vamos definir uma função que dá a decomposição de um número inteiro em fatores primos. Se um mesmo primo é múltiplo na decomposição, ele aparecerá com essa multiplicidade na lista de fatores. Por exemplo, para 24 devemos ter [2, 2, 2, 3]; para 17 teremos [17].

In [12]:
def fatores_primos(n):
 # Começamos com uma lista vazia de fatores
 fatores = []
 # Calculamos a raiz quadrada de n
 raiz_n = round(math.sqrt(n))
 # Encontramos uma lista de primos até raiz_n
 primos = primos_ate(raiz_n)
 # Para cada um dos primos nessa lista, verificamos se ele é
 # fator de n (e quantas vezes)
 for primoatual in primos:
 # Enquanto n for divisível por primoatual, adicionamos
 # esse fator na lista de fatores e retiramos esse fator de n.
 # Note que se n não é divisível por primoatual, nada ocorre.
 while n % primoatual == 0:
 fatores.append(primoatual)
 # Temos que usar // aqui, para divisão inteira
 n //= primoatual
 # Por fim, após dividir por todos os primos menores ou iguais à
 # raiz quadrada, o fator que sobrar (se diferente de 1) é também
 # um fator primo (prove isso!).
 if n != 1:
 fatores.append(n)
 return fatores

In [13]:
fatores_primos(14)

[2, 7]

In [14]:
fatores_primos(100)

[2, 2, 5, 5]

In [15]:
fatores_primos(9)

[3, 3]

In [16]:
fatores_primos(1892832876219)

[3, 283, 2229485131]

In [17]:
eh_primo(2229485131)

True

## Algumas funções úteis adicioais

Em primeiro lugar, `abs` pode ser usado para encontrar o valor absoluto, adaptado para os diversos tipos de números.

In [18]:
abs(2)

2

In [19]:
abs(-2)

2

In [20]:
abs(-.00123)

0.00123

In [21]:
abs(3+4j)

5.0

`min` e `max` podem ser usados para achar o mínimo ou máximo, respectivamente, de diversos valores (adaptadas a diversos tipos).

In [22]:
min(2, 4, 5, 1, 8, 9)

1

In [23]:
max(2, 4, 5, 1, 8, 9)

9

In [24]:
min('agora', 'isso', 'é', 'estranho')

'agora'

As funções também operam com listas:

In [25]:
min([1, 4, 6, 0, 10, -2, 6])

-2

In [26]:
max([1, 4, 6, 0, 10, -2, 6])

10

## Números de ponto fixo

O módulo `decimal` permite lidar com números de ponto fixo (quantidade fixa de casas decimais depois da vírgula).

In [27]:
from decimal import Decimal

Os valores podem ser fornecidos por strings.

In [28]:
a = Decimal('1.34')

In [29]:
b = Decimal('2.45')

In [30]:
a + b

Decimal('3.79')

In [31]:
a - b

Decimal('-1.11')

In [32]:
a * b

Decimal('3.2830')

Note como o número de casas decimais se adaptou de acordo com a necessidade (produto de dois números com 2 casas decimais cada gera um número com 4 casas decimais de precisão, incluindo o zero no final para garantir esse número de casas).

No caso da divisão, a precisão do resultado pode depender dos valores fornecidos.

In [33]:
a / b

Decimal('0.5469387755102040816326530612')

No caso acima, o resultado foi truncado para 28 casas decimais, que é o default do tipo Decimal (esse valor pode ser ajustado, veja documentação do tipo).

In [34]:
Decimal('2.4')/Decimal('1.2')

Decimal('2')

Além de permitir lidar com várias casas decimais, outra vantagem da classe é que os cálculos serão precisos dentro da representação decimal usada. Lembre-se do exemplo de erro de aproximação com número de ponto flutuante:

In [35]:
0.1 + 0.1 + 0.1 - 0.3

5.551115123125783e-17

Usando Decimal, o valores são precisos:

In [36]:
a = Decimal('0.1')
b = Decimal('0.3')

In [37]:
a + a + a - b

Decimal('0.0')

Existem também formas de criar valores Decimal a partir de inteiros ou números de ponto flutuante:

In [38]:
Decimal(2)

Decimal('2')

In [39]:
Decimal(0.5)

Decimal('0.5')

In [40]:
Decimal(2.3)

Decimal('2.29999999999999982236431605997495353221893310546875')

In [41]:
Decimal(0.1)

Decimal('0.1000000000000000055511151231257827021181583404541015625')

In [42]:
Decimal(0.3)

Decimal('0.299999999999999988897769753748434595763683319091796875')

## "Compreensão" de lista

O Python tem uma forma abreviada de se criar objetos como listas, dicionários e conjuntos, denominado _list comprehension_.

Suponhamos que você deseja uma lista com todos os pares entre 0 e 10 (inclusive).

Você pode usar um loop para criar a lista:

In [43]:
pares = []
for i in range(0, 11, 2):
 pares.append(i)

In [44]:
pares

[0, 2, 4, 6, 8, 10]

Neste caso, que não envolve cálculos, na verdade basta converter a `range` usada no for para lista:

In [45]:
list(range(0,11,2))

[0, 2, 4, 6, 8, 10]

Mas vamos supor que o que você quer é uma lista com o quadrado dos pares entre 0 e 10 (inclusive).

Novamente, um for resolve isso:

In [46]:
quapares = []
for i in range(0, 11, 2):
 quapares.append(i * i)

In [47]:
quapares

[0, 4, 16, 36, 64, 100]

No entanto, como os valores não são igualmente espaçados, não podemos usar o truque de converter uma `range` para uma lista.

Para esses casos, usamos a sintaxe compreensão de lista:

In [48]:
[i * i for i in range(0, 11, 2)]

[0, 4, 16, 36, 64, 100]

A sintaxe é `[ expressao for var in col ]` onde `col` é uma coleção de valores (que pode ser varrida por um `for`), `var` é um nome de variável e expressao é uma expressão (que em geral usa o valor de `var`). 

A lista será formada colocando em `var` cada um dos valores de `col`, calculando a expressao para esse valor e inserindo o resultado em uma lista.

No exemplo acima, `i` recebe sucessivamente os pares de 0 a 10 (inclusive) e na lista são inseridos os correspondente valores do quadrado de `i`.

Os colchetes em volta dizem que queremos formar uma lista. Se usarmos chaves, então queremos um conjunto:

In [49]:
{ i * i for i in range(0, 11, 2) }

{0, 4, 16, 36, 64, 100}

É possível também termos mais do que um `for` para a geração da lista.

In [50]:
[ i - j for i in range(0, 4) for j in range(0,4)]

[0, -1, -2, -3, 1, 0, -1, -2, 2, 1, 0, -1, 3, 2, 1, 0]

Neste caso, tanto i quanto j estão sendo variados de 0 a 3, com j variando mais rapidamente que i (isto é, para cada valor de i consideramos todos os valores de j, na ordem).

Outra possibilidade é incluir um _filtro_, quer dizer, uma condição que será usada para testar se o valor deve ser inserido na lista ou não. Se a condição for verdadeira, o correspondente valor será inserido, senão ele será ignorado.

Por exemplo, a lista abaixo tem os quadrados dos valores de i de 2 a 29, mas apenas se i for primo; isto é, ela tem os valores dos quadrados dos primos de 2 a 29.

In [51]:
[i * i for i in range(2,30) if eh_primo(i)]

[4, 9, 25, 49, 121, 169, 289, 361, 529, 841]

## Mais algumas funções úteis

Frequentemente, queremos operar em elementos de listas correspondentes (isto é, o primeiro elemento da primeira lista com o primeiro da segunda, o segundo da primeira com o segundo da segunda, etc.)

Para isso, a forma mais fácil é usar a função `zip`, que percorre esses elementos retornando tuplas com os objetos correspondentes.

In [52]:
list(zip([1,2,3], [3,4,5]))

[(1, 3), (2, 4), (3, 5)]

Isso é especialmente útil em operações com `for`, tanto o normal como o de compreensões de lista.

In [53]:
[i - j for i,j in zip([1,2,3],[4,5,6])]

[-3, -3, -3]

O código acima cria, com `zip`, uma coleção com os elementos (1,4), (2,5) e (3,6). Cada uma dessas tuplas é então, uma por vez, desempacotada colocando o primeiro elemento em `i` e o segundo em `j`. Esses valores de `i` e `j` são então usados na expressão `i-j` para formar a lista resultante.

Se uma das listas for menor que a outra, o zip termina quando a menor termina.

In [54]:
a = [10, 20, 30]
b = [5, 15]
list(zip(a,b)), list(zip(b,a))

([(10, 5), (20, 15)], [(5, 10), (15, 20)])

Uma outra função interessante é o `enumerate`, que permite percorrer uma lista verificando simultaneamente o índice e o valor de cada elemento (numa tupla).

In [55]:
lista = [10, 11, 12, 13]

In [56]:
list(enumerate(lista))

[(0, 10), (1, 11), (2, 12), (3, 13)]

Isso é bastante útil quando queremos varrer uma lista acessando tanto o valor dos seus elementos quanto o índice em um `for`:

In [57]:
for i, v in enumerate(lista):
 print('A posição', i, 'tem valor', v)

A posição 0 tem valor 10
A posição 1 tem valor 11
A posição 2 tem valor 12
A posição 3 tem valor 13


## Algumas opções de leitura de arquivos

Já vimos que é possível ler todo o conteúdo de um arquivo em uma única string usando o método `read`:

In [58]:
f = open('teste.txt', 'r')
conteudo = f.read()

In [59]:
conteudo

'Este é um teste.\nSegunda linha\n\nEm cima foi um espaco.\n\n\n\n\n\nAcabou.\n'

In [60]:
f.close()

Isso é um método bastante conveniente e funciona bem quando o arquivo não é muito grande. Para arquivos muito grandes, esse método ocupa muita memória, e pode ser mais adequado ler o arquivo aos pedaços.

Uma forma de fazer isso é, ao chamar o método `read`, especificar o número de caracteres que queremos que sejam lidos. Neste caso, o método retorna uma sring com até esse número de caracteres, ou uma string vazia se o arquivo já acabou:

In [61]:
f = open('teste.txt')
# Como não sabemos o tamanho do arquivo, usamos um loop infinito
while True:
 c = f.read(2)
 # Interrompemos o loop se nada foi lido (fim do arquivo)
 if not c: break
 print(c)
f.close()

Es
te
 é
 u
m 
te
st
e.

S
eg
un
da
 l
in
ha



Em
 c
im
a 
fo
i 
um
 e
sp
ac
o.









Ac
ab
ou
.



Um outro método de leitura, mais conveniente para arquivos de texto, é o `readline` que lê uma linha por vez do arquivo:

In [62]:
f = open('teste.txt')
while True:
 linha = f.readline()
 if not linha: break
 # Só para variar, vamos limpar os espaços e converter para maiúsculas
 linha = linha.strip()
 print(linha.upper())
f.close()

ESTE É UM TESTE.
SEGUNDA LINHA

EM CIMA FOI UM ESPACO.





ACABOU.


Também podemos usar o `readlines`, que lê todo o arquivo de uma única vez mas, em contraste com o `read`, retorna uma lista com uma string para cada linha lida:

In [63]:
f = open('teste.txt')
for linha in f.readlines():
 print(linha.strip())
f.close()

Este é um teste.
Segunda linha

Em cima foi um espaco.





Acabou.


Nada impede de usar esses métodos dentro de uma compreensão de lista. Por exemplo, o código seguinte coloca numa lista apenas as linhas do arquivo `teste.txt` que contenham a subcadeia `me`:

In [65]:
arq = open('teste.txt')
[linha for linha in arq.readlines() if linha.find('um') != -1]

['Este é um teste.\n', 'Em cima foi um espaco.\n']