# NumPy

O NumPy é um pacote para realizar cálculos numéricos com facilidade e eficiência. Ele é tradicionalmente importado com o nome `np`, como no comando abaixo.

In [31]:
import numpy as np

A principal estrutura de dados do NumPy é o *array*, que representa um array similar aos de C, mas com diversas operações simplificadas, como veremos.

Uma forma de criar arrays é criando arrays com todos os elementos nulos ou todos os elementos unitários.

In [32]:
np.zeros(10)

array([ 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [33]:
np.zeros(10, dtype=np.int)

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

In [34]:
np.ones(10)

array([ 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

Outra forma é convertendo uma lista Python em um array.

In [35]:
potencias_10 = np.array([1, 10, 100, 1000, 10000])

Arrays podem ser indexados da mesma forma que listas.

In [36]:
potencias_10[2]

100

Outras formas úteis de criar arrays permitem gerar valores consecutivos. Por exemplo, temos uma generalização do `range` de Python, mas que aceita valores de ponto flutuante:

In [37]:
np.arange(10)

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [38]:
np.arange(1, 10)

array([1, 2, 3, 4, 5, 6, 7, 8, 9])

In [39]:
np.arange(1, 10, 2)

array([1, 3, 5, 7, 9])

In [None]:
np.arange(1, 10, 1.5)

Outra opção similar é especificar o número de intervalos desejados entre o início e o final, ao invés de especificar a separação entre os valores (como acontece no `arange`).

In [40]:
np.linspace(1, 10, 10)

array([ 1., 2., 3., 4., 5., 6., 7., 8., 9., 10.])

In [41]:
np.linspace(0, 10, 10)

array([ 0. , 1.11111111, 2.22222222, 3.33333333,
 4.44444444, 5.55555556, 6.66666667, 7.77777778,
 8.88888889, 10. ])

In [42]:
np.linspace(0, 10, 10+1)

array([ 0., 1., 2., 3., 4., 5., 6., 7., 8., 9., 10.])

Podemos conserguir algumas informações sobre um array acessando alguns campos informativos, como abaixo.

In [43]:
potencias_10

array([ 1, 10, 100, 1000, 10000])

Chamamos de shape a descrição do número de elementos em cada dimensão do array.

In [44]:
potencias_10.shape

(5,)

Arrays podem ser criados com mais do que uma dimensão. Para isso, passamos uma tupla com os tamanhos nas diversas dimensões.

In [45]:
m0 = np.zeros((5, 10))

Mais tarde podemos consultar o shape para saber o formato do array.

In [46]:
m0.shape

(5, 10)

In [47]:
m3 = np.ones((2,2,3))

In [48]:
m3

array([[[ 1., 1., 1.],
 [ 1., 1., 1.]],

 [[ 1., 1., 1.],
 [ 1., 1., 1.]]])

In [49]:
m3.shape

(2, 2, 3)

Também podemos verificar qual o tipo de cada um dos elementos do array.

In [50]:
m3.dtype

dtype('float64')

In [51]:
zzeros = np.ones(10, dtype=np.complex)

In [52]:
zzeros

array([ 1.+0.j, 1.+0.j, 1.+0.j, 1.+0.j, 1.+0.j, 1.+0.j, 1.+0.j,
 1.+0.j, 1.+0.j, 1.+0.j])

In [53]:
zzeros.dtype

dtype('complex128')

O tamanho de um array é o número total de elementos, considerando todas as dimensões.

In [54]:
m3.size

12

In [55]:
potencias_10.size

5

Uma das coisas que fazem com que os arrays permitam uma programação simples é que podemos realizar operações algébricas sobre um array, o que significa realizar essas operações sobre cada elemento do array.

In [56]:
2 * np.ones(10)

array([ 2., 2., 2., 2., 2., 2., 2., 2., 2., 2.])

In [57]:
dois = 2 * np.ones(10)
meio = 0.5 * np.ones(10)

In [58]:
dois - meio

array([ 1.5, 1.5, 1.5, 1.5, 1.5, 1.5, 1.5, 1.5, 1.5, 1.5])

In [59]:
dois * meio

array([ 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

In [60]:
dois / meio

array([ 4., 4., 4., 4., 4., 4., 4., 4., 4., 4.])

In [61]:
3 * dois - meio / 0.1 + 4

array([ 5., 5., 5., 5., 5., 5., 5., 5., 5., 5.])

In [62]:
3 * np.arange(10) - np.ones(10)

array([ -1., 2., 5., 8., 11., 14., 17., 20., 23., 26.])

O NumPy também define diversas funções matemáticas que operam sobre arrays aplicando a função a cada um dos elementos do array.

In [63]:
np.exp(np.arange(10))

array([ 1.00000000e+00, 2.71828183e+00, 7.38905610e+00,
 2.00855369e+01, 5.45981500e+01, 1.48413159e+02,
 4.03428793e+02, 1.09663316e+03, 2.98095799e+03,
 8.10308393e+03])

In [64]:
np.exp(1)

2.7182818284590451

In [65]:
np.sin(np.linspace(0, 2*np.pi,10))

array([ 0.00000000e+00, 6.42787610e-01, 9.84807753e-01,
 8.66025404e-01, 3.42020143e-01, -3.42020143e-01,
 -8.66025404e-01, -9.84807753e-01, -6.42787610e-01,
 -2.44929360e-16])

Também é fornecido um módulo de geração de números pseudo-aleatórios:

In [66]:
np.random.random(10)

array([ 0.71844584, 0.17955122, 0.82085157, 0.08282654, 0.71249316,
 0.41415227, 0.99526596, 0.54902252, 0.25519737, 0.64346826])

In [67]:
np.random.random((4,4))

array([[ 0.12193517, 0.93275868, 0.14238606, 0.99065488],
 [ 0.03175839, 0.40818423, 0.91922019, 0.22576668],
 [ 0.13936801, 0.45935382, 0.52392021, 0.44102865],
 [ 0.61910056, 0.49815433, 0.03153276, 0.98233315]])

Algumas funções especiais sobre arrays:

In [68]:
np.sum(np.ones(10))

10.0

In [69]:
np.sum(np.arange(10))

45

In [70]:
np.prod(np.arange(1,10))

362880

In [71]:
alea = np.random.random(100)

In [72]:
np.min(alea)

0.0023556637749171383

In [73]:
np.max(alea)

0.99134662238625104

In [74]:
np.cumsum(np.arange(10))

array([ 0, 1, 3, 6, 10, 15, 21, 28, 36, 45])

Vejamos agora algumas formas de indexar arrays.

In [75]:
sequencia = np.arange(100)

In [76]:
sequencia[2]

2

In [77]:
sequencia[1:4]

array([1, 2, 3])

In [78]:
sequencia[10:-10]

array([10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26,
 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43,
 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60,
 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77,
 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89])

Arrays multidimensionais são indexados usando uma tupla como índice.

In [79]:
mat = np.array([[1, 2, 3], [10, 20, 30]])

In [80]:
mat

array([[ 1, 2, 3],
 [10, 20, 30]])

In [81]:
mat[0, 2]

3

In [82]:
mat[1, 1]

20

In [83]:
mat[:, 2]

array([ 3, 30])

In [84]:
mat[:, 0:2]

array([[ 1, 2],
 [10, 20]])

Também podemos fornecer um array de índices:

In [85]:
ind = np.arange(10, 90, 2)

In [86]:
ind

array([10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42,
 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76,
 78, 80, 82, 84, 86, 88])

In [87]:
sequencia[ind]

array([10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42,
 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76,
 78, 80, 82, 84, 86, 88])

Ou uma lista de índices (que será convertida para um array).

In [88]:
sequencia[[4, 7]]

array([4, 7])

Um fator importante a considerar é que quando indexamos um array, o valor retornado não é uma cópia dos valores do array original (como ocorre no caso de listas), mas sim o que é chamado de uma nova visão dos elementos indexados.

Isso quer dizer que podemos alterar os elementos indexados diretamente.

In [89]:
sequencia

array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16,
 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,
 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50,
 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67,
 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84,
 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99])

In [90]:
sequencia[ind] = -sequencia[ind]

In [91]:
sequencia

array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, -10, 11, -12,
 13, -14, 15, -16, 17, -18, 19, -20, 21, -22, 23, -24, 25,
 -26, 27, -28, 29, -30, 31, -32, 33, -34, 35, -36, 37, -38,
 39, -40, 41, -42, 43, -44, 45, -46, 47, -48, 49, -50, 51,
 -52, 53, -54, 55, -56, 57, -58, 59, -60, 61, -62, 63, -64,
 65, -66, 67, -68, 69, -70, 71, -72, 73, -74, 75, -76, 77,
 -78, 79, -80, 81, -82, 83, -84, 85, -86, 87, -88, 89, 90,
 91, 92, 93, 94, 95, 96, 97, 98, 99])

In [92]:
sequencia[ind] = -1

In [93]:
sequencia

array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, -1, 11, -1, 13, -1, 15, -1,
 17, -1, 19, -1, 21, -1, 23, -1, 25, -1, 27, -1, 29, -1, 31, -1, 33,
 -1, 35, -1, 37, -1, 39, -1, 41, -1, 43, -1, 45, -1, 47, -1, 49, -1,
 51, -1, 53, -1, 55, -1, 57, -1, 59, -1, 61, -1, 63, -1, 65, -1, 67,
 -1, 69, -1, 71, -1, 73, -1, 75, -1, 77, -1, 79, -1, 81, -1, 83, -1,
 85, -1, 87, -1, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99])

Podemos também gerar outra visão de um array simplesmente encarando os mesmos valores como se fossem um array de outras dimensões.

In [94]:
ret = sequencia.reshape((10, 10))

In [95]:
ret.size

100

In [96]:
ret.shape

(10, 10)

In [97]:
ret

array([[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
 [-1, 11, -1, 13, -1, 15, -1, 17, -1, 19],
 [-1, 21, -1, 23, -1, 25, -1, 27, -1, 29],
 [-1, 31, -1, 33, -1, 35, -1, 37, -1, 39],
 [-1, 41, -1, 43, -1, 45, -1, 47, -1, 49],
 [-1, 51, -1, 53, -1, 55, -1, 57, -1, 59],
 [-1, 61, -1, 63, -1, 65, -1, 67, -1, 69],
 [-1, 71, -1, 73, -1, 75, -1, 77, -1, 79],
 [-1, 81, -1, 83, -1, 85, -1, 87, -1, 89],
 [90, 91, 92, 93, 94, 95, 96, 97, 98, 99]])

Como essa é uma outra visão, se alteramos o array `ret` estamos também alterando o array orginal `sequencia`.

In [98]:
ret[9,9] = 9999

In [99]:
ret

array([[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
 [ -1, 11, -1, 13, -1, 15, -1, 17, -1, 19],
 [ -1, 21, -1, 23, -1, 25, -1, 27, -1, 29],
 [ -1, 31, -1, 33, -1, 35, -1, 37, -1, 39],
 [ -1, 41, -1, 43, -1, 45, -1, 47, -1, 49],
 [ -1, 51, -1, 53, -1, 55, -1, 57, -1, 59],
 [ -1, 61, -1, 63, -1, 65, -1, 67, -1, 69],
 [ -1, 71, -1, 73, -1, 75, -1, 77, -1, 79],
 [ -1, 81, -1, 83, -1, 85, -1, 87, -1, 89],
 [ 90, 91, 92, 93, 94, 95, 96, 97, 98, 9999]])

In [100]:
sequencia

array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, -1,
 11, -1, 13, -1, 15, -1, 17, -1, 19, -1, 21,
 -1, 23, -1, 25, -1, 27, -1, 29, -1, 31, -1,
 33, -1, 35, -1, 37, -1, 39, -1, 41, -1, 43,
 -1, 45, -1, 47, -1, 49, -1, 51, -1, 53, -1,
 55, -1, 57, -1, 59, -1, 61, -1, 63, -1, 65,
 -1, 67, -1, 69, -1, 71, -1, 73, -1, 75, -1,
 77, -1, 79, -1, 81, -1, 83, -1, 85, -1, 87,
 -1, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98,
 9999])

Podemos também construir um array juntando pedaços de outros arrays.

In [101]:
p1 = np.zeros(8)

In [102]:
p2 = np.ones(8)

In [103]:
np.concatenate((p1, p2), axis=0)

array([ 0., 0., 0., 0., 0., 0., 0., 0., 1., 1., 1., 1., 1.,
 1., 1., 1.])

In [104]:
np.concatenate((p1.reshape((8,1)), p2.reshape(8,1)), axis=1)

array([[ 0., 1.],
 [ 0., 1.],
 [ 0., 1.],
 [ 0., 1.],
 [ 0., 1.],
 [ 0., 1.],
 [ 0., 1.],
 [ 0., 1.]])

In [105]:
np.concatenate((p1.reshape((1,8)), p2.reshape(1,8)), axis=0)

array([[ 0., 0., 0., 0., 0., 0., 0., 0.],
 [ 1., 1., 1., 1., 1., 1., 1., 1.]])

Ou podemos separar um array em diversos pedaços.

In [106]:
a, b = np.split(np.arange(20), 2)

In [107]:
a

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [108]:
b

array([10, 11, 12, 13, 14, 15, 16, 17, 18, 19])