# Listas

Listas são as estruturas de dados mais básicas de Python, substituindo os arrays de C. Por exemplo, strings são casos especiais de listas.

Representamos uma lista colocando os valores separados por vírgulas entre [ e ].

In [1]:
[1, 2, 3, 4, 5]

[1, 2, 3, 4, 5]

Listas podem ser indexadas.

In [2]:
minhalista = [1, 2, 4, 8, 16, 32, 64]

In [3]:
minhalista[0], minhalista[3]

(1, 8)

In [4]:
minhalista[2:5]

[4, 8, 16]

Ao contrário de strings, as listas podem ser alteradas (elas são mutáveis).

In [5]:
minhalista[0] = -1

In [6]:
minhalista

[-1, 2, 4, 8, 16, 32, 64]

O método `append` adiciona um valor ao final da lista.

In [7]:
minhalista.append(128)

In [8]:
minhalista

[-1, 2, 4, 8, 16, 32, 64, 128]

O método `pop` retorna o último valor da lista e o retira da lista.

In [9]:
minhalista.pop()

128

In [10]:
minhalista

[-1, 2, 4, 8, 16, 32, 64]

In [11]:
len(minhalista)

7

In [12]:
minhalista[8]

IndexError: list index out of range

As listas guardam apenas *referências* para objetos. Portanto, como variáveis, cada elemento da lista pode se referir a objetos de tipos distintos. Isto é, as listas podem ser mistas.

In [13]:
listamista = [1, 2.3, 2 + 3j, 'esquisito']

In [14]:
listamista

[1, 2.3, (2+3j), 'esquisito']

Podemos inclusive colocar outras listas dentro de uma lista, formando uma estrutura aninhada.

In [15]:
listaesquisita = [3, 4, listamista, minhalista]

In [16]:
listaesquisita

[3, 4, [1, 2.3, (2+3j), 'esquisito'], [-1, 2, 4, 8, 16, 32, 64]]

In [17]:
listaesquisita[1]

4

In [18]:
listaesquisita[2][1]

2.3

Lembre-se que nesses casos estamos guardando apenas referências para as listas aninhadas.

Se dentro da lista `l3` guardamos uma referência para outra lista `l2`, então, ao alterarmos o conteúdo de `l2` essa alteração será visível em `l3`.

In [19]:
l1 = [1, 2, 3]
l2 = [5, 4, 3]
l3 = [0, l1, l2]

In [20]:
l3

[0, [1, 2, 3], [5, 4, 3]]

In [21]:
l2[1] = -1

In [22]:
l2

[5, -1, 3]

In [23]:
l3

[0, [1, 2, 3], [5, -1, 3]]

In [24]:
l1.append(4)

In [25]:
l3

[0, [1, 2, 3, 4], [5, -1, 3]]

Em princípio, nada impede que façamos a inserção de uma referência para a lista dentro da própria lista. Nesse caso, tem-se que tomar cuidado ao manipular essa lista, para evitar problemas de código em *loop* infinito.

In [26]:
l4 = [1,2]

In [27]:
l4

[1, 2]

In [28]:
l4.append(l4)

In [29]:
l4

[1, 2, [...]]

In [30]:
l4.append(3)

In [31]:
l4

[1, 2, [...], 3]

In [52]:
par1 = [1, 2]
par2 = [3, 4]
par1.append(par2)
par2.append(par1)

In [53]:
par1

[1, 2, [3, 4, [...]]]

In [54]:
par2

[3, 4, [1, 2, [...]]]

Lembre-se que se mais de uma variável referencia a mesma lista então ao alteramos a lista por meio de uma variável ela terá valor alterado quando acessada por outra variável. 

In [32]:
x = [1,2,3]

In [33]:
y = x

In [34]:
x

[1, 2, 3]

In [35]:
y

[1, 2, 3]

In [36]:
x[2]=4

In [37]:
x

[1, 2, 4]

In [38]:
y

[1, 2, 4]

Se queremos evitar isso, precisamos fazer uma cópia da lista ao colocar em outra variável.

In [39]:
z = x.copy()

In [40]:
z

[1, 2, 4]

In [41]:
x[2] = 3

In [42]:
x

[1, 2, 3]

In [43]:
y

[1, 2, 3]

In [44]:
z

[1, 2, 4]

No caso de listas, uma outra forma de fazer cópia é simplesmente acessar um slice com todos os elementos.

In [45]:
z = x[:]

In [46]:
x

[1, 2, 3]

In [47]:
z

[1, 2, 3]

In [48]:
x[0] = -1

In [49]:
x

[-1, 2, 3]

In [50]:
y

[-1, 2, 3]

In [51]:
z

[1, 2, 3]

# Dicionários

Dicionários são estruturas de dados que armazenam "valores" associados com certas "chaves". Isto é, dado uma chave, queremos o valor corresponde.

Eles funcionam como uma generalização de listas, onde a indexação não precisa ser por inteiros consecutivos: a chave funciona como o índice e pode ser de qualquer tipo, inclusive inteiro, caso útil quando apenas alguns valores inteiros são de interesse.

In [55]:
idade = {'jose': 20, 'joão': 21, 'maria': 18}

In [56]:
idade['jose']

20

In [57]:
idade['maria']

18

Se tentamos indexar o dicionário por uma chave inexistente, isso é um erro.

In [58]:
idade['pedro']

KeyError: 'pedro'

Dicionários podem ser impressos diretamente usando `print`, se o formato padrão for suficiente.

In [59]:
idade

{'jose': 20, 'joão': 21, 'maria': 18}

In [60]:
print(idade)

{'jose': 20, 'maria': 18, 'joão': 21}


Um dicionário onde as chaves são inteiras permite guarda valores apenas para alguns inteiros escolhidos. Note que o valor associado às chaves pode ser de qualquer tipo.

In [61]:
di = {12: 0, 17: 2.3, 9: 'oi'}

In [62]:
di[12], di[17]

(0, 2.3)

In [63]:
di[15]

KeyError: 15

A forma mais comumente usada de associar um valor a uma nova chave é através do operador de atribuição.

In [64]:
idade

{'jose': 20, 'joão': 21, 'maria': 18}

In [65]:
idade['pedro'] = 25

In [66]:
idade

{'jose': 20, 'joão': 21, 'maria': 18, 'pedro': 25}

In [67]:
idade['jose'] = 21

In [68]:
idade

{'jose': 21, 'joão': 21, 'maria': 18, 'pedro': 25}

Como já comentado, acesso a uma chave que não tem valor associado no dicionário é um erro.

In [69]:
idade['antonio']

KeyError: 'antonio'

Portanto, precisamos de uma forma de testar se um dicionário já tem valor para uma dada chave (antes de ocasionar um erro na execução).

Há duas formas principais de fazer isso:

- Usar o operador `in`.
- Usar o método `get`.

O operador `in` retorna `True` se a chave especificada à esquerda tem valor associado no dicionário à direita.

In [70]:
'antonio' in idade

False

Na verdade, o operador `in` funciona não apenas para dicionários. Por exemplo, podemos ver se uma lista contém um valor especificado.

In [71]:
2 in [2, 3, 4, 5]

True

In [72]:
7 in [2, 3, 4, 5]

False

O método `get`, aplicado sobre um objeto do tipo dicionário, recebe dois parâmetros: o primeiro é a chave que se busca, o segundo é um valor. Se a chave for encontrada no dicionário, o método retorna o valor associado à chave; se a chave não for encontrada no dicionário, ele retorna o valor fornecido na chamada.

In [73]:
idade

{'jose': 21, 'joão': 21, 'maria': 18, 'pedro': 25}

In [74]:
idade.get('maria', 0)

18

In [75]:
idade.get('antonio', 0)

0

É frequente que queiramos percorrer todas as chaves presentes em um dicionário. Para isso, usamos o método `keys`, que retorna essas chaves.

In [76]:
idade.keys()

dict_keys(['pedro', 'jose', 'maria', 'joão'])

A ordem das chaves retornada por `keys` não é garantida, mas é a que permite percorrer o dicionário de forma mais eficiente.

Se quisermos uma ordem específica (por exemplo, ordem crescente do valor das chaves), então devemos usar a função `sorted`:

In [77]:
sorted(idade)

['jose', 'joão', 'maria', 'pedro']

# Tuplas

Tuplas são sequências ordenadas de valores (de possivelmente diferentes tipos). Ao contrário das listas, elas são *imutáveis*, isto é, uma vez formada uma tupla com certos objetos, essa tupla sempre se referenciará aos mesmos objetos.

Tuplas são indicadas por listas entre parêntesis separadas por vírgulas.

In [78]:
t1 = (1, 2, 3, 4)

In [79]:
t2 = (4, 7)

In [80]:
t3 = ("Casa", 12, 0.012)

Os objetos individuais das tuplas podem ser acessados por indexação.

In [81]:
t1[0]

1

In [82]:
t2[1]

7

Como convencional em Python, o índice fornecido é verificado.

In [83]:
t3[4]

IndexError: tuple index out of range

No caso (frequente) em que não há confusão, os parêntesis podem ser omitidos.

In [84]:
t4 = -1, -2, -3, -4

In [85]:
t4

(-1, -2, -3, -4)

Novamente, nada impede que uma tupla seja aninhada dentro de outra, ou mesmo que tenhamos tuplas dentro de listas ou listas dentro de tuplas, ou dicionários dentro de listas, dentro de tuplas...

In [86]:
t5 = (t1, t2, t3)

In [87]:
t5

((1, 2, 3, 4), (4, 7), ('Casa', 12, 0.012))

In [88]:
umalista = [4, 5]
t6 = (0, umalista)

In [89]:
t6

(0, [4, 5])

A imutabilidade das tuplas significa que elas sempre se referenciam aos mesmos objetos da criação. No entanto, esses objetos podem ser alterados (se eles mesmos não forem imutáveis).

In [90]:
umalista.append(6)

In [91]:
t6

(0, [4, 5, 6])

In [92]:
umalista.append(t6)

In [93]:
umalista

[4, 5, 6, (0, [...])]

In [94]:
t6

(0, [4, 5, 6, (...)])

Lembre-se que, ao inserir um objeto em qualquer elemento (listas, tuplas, dicionários, ...) inserimos uma *referência* para esse objeto. Caso o objeto seja alterado, a alteração irá se manifestar em todos os lugares que mantém uma referência para esse objeto. No entanto, trocar uma das referências para outro objeto não afeta as referência anteriores.

Por exemplo, inserimos em `t6` uma referência para o objeto referenciado por `umalista` (indicado acima). Se mudarmos o objeto ao qual a variável `umalista` referencia, isso não afeta o objeto `t6`.

In [95]:
umalista = [0, -1, 1]

In [96]:
umalista

[0, -1, 1]

In [97]:
t6

(0, [4, 5, 6, (...)])

In [98]:
t6[1].append(-1)

In [99]:
t6

(0, [4, 5, 6, (...), -1])

No caso acima, foi possível alterar o objeto lista referenciado por `t6` pois uma lista é mutável, e estamos apenas mexendo em seu conteúdo (sem mudar o objeto).

No caso de inteiros, mudar o conteúdo é correspondente a trocar de objeto. Por exemplo, quando usamos o operador `+=`, na verdade estamos criando um novo objeto. Isso não é permitido em tuplas.

In [100]:
a = 1

In [101]:
a += 2

In [102]:
a

3

In [103]:
t7 = (2, a)

In [104]:
t7

(2, 3)

In [105]:
a += 5

In [106]:
t7

(2, 3)

In [107]:
t6[0] += 1

TypeError: 'tuple' object does not support item assignment

O método `len` pode ser usado também para tuplas.

In [108]:
len(t1), len(t2), len(t6)

(4, 2, 2)

Em algumas situações especiais, queremos criar tuplas com apenas um elemento. No entanto, a notação óbvia não funciona, pois o Python entende isso como uma expressão entre parêntesis, e não uma tupla.

In [109]:
(7)

7

Para resolver isso, devemos incluir uma vírgula, mesmo que apenas um elemento exista na tupla.

In [110]:
t7 = (7,)

In [111]:
t7[0]

7

In [112]:
t7[1]

IndexError: tuple index out of range

# Conjuntos

Um outro tipo de dados da linguagem é o "conjunto", que representa uma conjunto de valores sem duplicação. Isto é, um certo valor está presente ou não no conjunto.

Conjuntos são representados por valores entre `{` e `}` separados por vírgulas.

In [113]:
s = {1, 5, 6}

A operação mais básica é verificar se um certo valor está no conjunto, o que se consegue usando o operador `in`.

In [114]:
5 in s

True

Também temos operações de teoria dos conjuntos:

- Intersecção, com `&`
- União, com `|`
- Diferença de conjuntos, com `-`
- Relações de subconjunto, com `<` e `>`

In [115]:
s2 = {1, 3, 6}

In [116]:
s

{1, 5, 6}

In [117]:
s & s2

{1, 6}

In [118]:
s | s2

{1, 3, 5, 6}

In [119]:
s - s2

{5}

In [120]:
s2 - s

{3}

In [121]:
s < s2

False

In [122]:
s2 < s

False

In [123]:
{1, 3} < s

False

In [124]:
{1, 3} < s2

True

In [125]:
s2 > {1, 3}

True

Como nos tipos `int`, `float` e `double`, podemos usar os nomes dos tipos para conversão entre `list` e `set`.

In [126]:
s3 = set([1, 2])

In [127]:
s3

{1, 2}

In [128]:
list(s3)

[1, 2]

Uma utilidade disso é quando queremos eliminar valores duplicados em listas (e não nos importamos com a ordem dos valores): Convertemos a lista para um conjunto, como o conjunto não tem duplicações, os valores duplicados são eliminados; em seguida, convertemos novamente o conjunto em uma lista.

In [129]:
l7 = [1, 2, 3, 1, 2, 4, 1, 7, 9, 2, 4, 8]

In [130]:
l7

[1, 2, 3, 1, 2, 4, 1, 7, 9, 2, 4, 8]

In [131]:
l8 = list(set(l7))

In [132]:
l8

[1, 2, 3, 4, 7, 8, 9]

# A referência `None`

Em algumas situações, queremos ter uma variável para se referenciar a um objeto, mas o objeto ainda não é conhecido. O mesmo ocorre dentro de estruturas como listas ou dicionários. Se não conhecemos inicialmente o objeto a ser referenciado, podemos usar a referência `None`, que indica que uma referência nula (nenhum objeto).

In [133]:
None

In [134]:
x = None

In [135]:
l9 = [1, 2, x]

In [136]:
x = 7

In [137]:
l9

[1, 2, None]

# Arquivos

Vejamos agora algumas operações básicas para acesso de arquivos.

Se quisermos abrir um arquivo para leitura, basta usar a função `open`.

In [142]:
f = open('teste.txt')

Um método simples e eficiente (quando o arquivo não é muito grande) de leitura do arquivo é o `read`, que lê o arquivo todo como uma cadeia de caracteres. Mudanças de linha no arquivo aparecem como o caracter `\n` na cadeia.

In [143]:
texto = f.read()

In [144]:
texto

'Este é um teste.\nSegunda linha\n\nEm cima foi um espaco.\n\n\n\n\n\nAcabou.\n'

Após acessar o arquivo, devemos fechá-lo, para liberar recursos usados pelo sistema operacional.

In [145]:
f.close()

Uma vez que temos o conteúdo do arquivo em uma cadeia, podemos usar os métodos de cadeias de caracteres para processá-lo.

In [147]:
texto.find('Segunda')

17

Na verdade, a sintaxe apresentada acima é uma abreviação da sintaxe mais completa, que tem um segundo parâmetro que especifica o modo de abertura ('r' para leitura, 'w' para escrita).

In [None]:
f = open('teste.txt', 'r')

In [None]:
f.close()

In [148]:
f = open('outro.txt', 'w')

In [149]:
novotexto = texto.upper()

Para escrever num arquivo, produzimos a cadeia de caracteres que queremos escrever e depois usamos o método `write`.

In [150]:
novotexto

'ESTE É UM TESTE.\nSEGUNDA LINHA\n\nEM CIMA FOI UM ESPACO.\n\n\n\n\n\nACABOU.\n'

In [151]:
f.write(novotexto)

68

In [152]:
f.close()

# Estruturas de controle

Vejamos agora as estruturas de controle simples de Python.

O primeiro ponto a notar é que os blocos de comandos em Python são delimitados pela quantidade de indentação no texto do código. Comandos consecutivos que são indentados pelo mesmo número de espaços em branco estão dentro do mesmo bloco. Um bloco é começado pela presença de `:` no final da linha.

Por exemplo, o código abaixo imprime "sei matemática" se 2 for menor que 3.

In [157]:
if 2 < 3:
 print('Sei matemática')
 print('Ufa!')

Sei matemática
Ufa!


No código abaixo, os dois `print` estão no mesmo bloco (aquele dentro do `if`), pois são indentados de quantidades idênticas de espaços.

In [158]:
if 1 > 0:
 print('Que tal exemplos melhores?')
 print('Alguém achou criativo')

Que tal exemplos melhores?
Alguém achou criativo


Já no código abaixo temos um erro, pois o segundo print está indentado de quantidade diferente do anterior, e não se encontra dentro de um novo bloco.

In [159]:
if 1 > 0:
 print('Que tal exemplos melhores?')
 print('Alguém achou criativo')

IndentationError: unindent does not match any outer indentation level (, line 3)

A expressão da condição no `if` não precisa de parêntesis e pode ser tão complexa quanto necessário.

In [160]:
if 1 > 0 and -1 < 0:
 print('OK')

OK


Se temos pouco código dentro de um bloco, o bloco pode ser colocado na mesma linha do `:`.

In [None]:
if 1 > 0 and -1 < 0: print('OK')

Também podemos colocar mais de um comando na mesma linha, separando-os com `;`

In [161]:
print('a')
print('b')

a
b


In [162]:
print('a'); print('b')

a
b


Por outro lado, a expressão condicional precisa estar na mesma linha do `if`

In [163]:
if 
 0 < 1:
 print('OK')

SyntaxError: invalid syntax (, line 1)

Quebras de linha em um mesmo comando são permitidas apenas em alguns casos especiais. O principal deles é depois de uma vírgula, dentro de expressões delimitadas por `()`, `[]` ou `{}`, para permitir colocar valores literais de tuplas, parâmetros de função, listas, dicionários e conjuntos em múltiplas linhas.

In [164]:
[1, 2, 3,
 4, 5, 6]
{1, 2, 3,
 4, 5, 6}

{1, 2, 3, 4, 5, 6}

Quando queremos executar uma operação também quando a condição é falsa, usamos um `else`, com notação similar.

In [165]:
a = 1
b = 2
if a > b:
 print('a é maior')
else:
 print('a não é maior')

a não é maior


Se tivermos várias condições a testar, podemos usar tantos `elif` (seguidos de condição) quanto necessários. A condição de um `elif` somente será testada se todas as condições anteriores forem falsas.

In [166]:
a = 1
b = 2
if a < b:
 print('a é menor')
elif a == b:
 print('são iguais')
else:
 print('a é maior')

a é menor


Existe uma forma abreviada de `if`, remanescente do operador `?:` de C. Ela tem o formato

`val1 if cond else val2`

e significa que se `cond` for verdadeira, o valor será `val1` e se ela for falsa, será `val2`.

In [167]:
a = 2
b = -1 if a < 0 else 1
b

1

*Loops* são expressos por `while`, seguido da condição de repetição.

In [168]:
a = 0
while a < 10:
 print(a)
 a += 1
print('Acabou')

0
1
2
3
4
5
6
7
8
9
Acabou


Como em C, você pode usar um `break` para sair do *loop* antes que a condição seja falsa.

In [169]:
a = 0
while a < 10:
 if a == 7: break
 print(a)
 a += 1

0
1
2
3
4
5
6


Ou pode usar um `continue` para descartar o restante desta interação e voltar para o teste da condição.

In [170]:
a = 0
while a < 10:
 a += 1
 if a == 7: continue
 print(a)


1
2
3
4
5
6
8
9
10


Estranhamente, o `while` possui um `else`, que será executado apenas quando o *loop* terminar porque a condição ficou falsa (isto é, não é executado se o *loop* for interrompido por um `break`.

In [171]:
a = 0
while a < 10:
 if a > 20: break
 print(a)
 a += 1
else:
 print('Loop não interrompido')

0
1
2
3
4
5
6
7
8
9
Loop não interrompido


In [172]:
a = 0
while a < 10:
 if a == 7: break
 print(a)
 a += 1
else:
 print('Loop não interrompido')

0
1
2
3
4
5
6


Uma outra forma de executar *loops* é o `for`. Ele permite avaliar todos os valores de uma sequência de valores fornecida. A sintaxe é:

 for x in seq:
 comandos

onde `seq` é uma "sequência" de objetos (veremos em aulas posteriores a definição mais precisa), `x` é uma variável que vai referenciar cada um dos objetos na ordem determinada pela sequência, e `comandos` são os comandos a executar (em geral, fazem referência a `x`).

In [173]:
minhalista = [0, 2, 4, 6, 1, 3, 5, 7]
for x in minhalista:
 print(x/2)

0.0
1.0
2.0
3.0
0.5
1.5
2.5
3.5


In [174]:
for x in minhalista:
 if x % 2 == 0:
 print(x)

0
2
4
6


Uma forma bastante útil de conseguir valores para um `for` é através da função `range`. Se fornecemos apenas um valor inteiro `n`, ela retorna uma seqüência com os valores de `0` a `n-1`.

In [175]:
range(10)

range(0, 10)

In [176]:
list(range(10))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [177]:
for i in range(10):
 print(i ** 2)

0
1
4
9
16
25
36
49
64
81


Se fornecermos dois valores `n1` e `n2`, ela retorna os valores de `n1` até `n2` (excluindo `n2`, como convencional em Python).

In [178]:
for i in range(10, 25):
 print(i)

10
11
12
13
14
15
16
17
18
19
20
21
22
23
24


Se adicionarmos um terceiro parâmetro, esse novo parâmetro é o passo entre dois valores consecutivos da sequência.

In [179]:
for i in range(0,100, 10):
 print(i)

0
10
20
30
40
50
60
70
80
90


O limite superior não precisa ser atingido exatamente: o range termina ao chegar em um valor maior ou igual ao limite superior.

In [180]:
list(range(0, 95, 10))

[0, 10, 20, 30, 40, 50, 60, 70, 80, 90]

`range` é freqüentemente usado, junto com `len` para percorrer todos os elementos de uma lista.

In [181]:
for i in range(len(minhalista)):
 print(i, minhalista[i])

0 0
1 2
2 4
3 6
4 1
5 3
6 5
7 7


Apesar de que para isso existe uma função de enumeração.

In [182]:
for i, x in enumerate(minhalista):
 print(i, x)

0 0
1 2
2 4
3 6
4 1
5 3
6 5
7 7
