Julio Biason
5 years ago
2 changed files with 550 additions and 0 deletions
@ -0,0 +1,273 @@ |
|||||||
|
+++ |
||||||
|
title = "You Don't Need range()" |
||||||
|
date = 2020-04-16 |
||||||
|
|
||||||
|
[taxonomies] |
||||||
|
tags = ["code", "python", "range"] |
||||||
|
+++ |
||||||
|
|
||||||
|
Beginners in Python tend to use `range()` for iterating over lists. This is |
||||||
|
not really necessary. |
||||||
|
|
||||||
|
<!-- more --> |
||||||
|
|
||||||
|
When people start programming Python, they tend to use constructions coming |
||||||
|
from other languages, so they iterate over a list with something like: |
||||||
|
|
||||||
|
```python |
||||||
|
a_list = [1, 2, 3, 4] |
||||||
|
for i in range(len(a_list)): |
||||||
|
print(a_list[i]) |
||||||
|
``` |
||||||
|
|
||||||
|
But Python have the concept of "iterable", meaning some things can be iterated |
||||||
|
over, without the need of accessing each element individually. For example, |
||||||
|
our previous list can be iterated with: |
||||||
|
|
||||||
|
```python |
||||||
|
a_list = [1, 2, 3, 4] |
||||||
|
for value in a_list: |
||||||
|
print(value) |
||||||
|
``` |
||||||
|
|
||||||
|
"For every element in `a_list`, retrieve it and name it `value`." |
||||||
|
|
||||||
|
A lot of elements are iterable: Strings are iterable, returning every |
||||||
|
character in them; dictionaries are iterable, returning every key in them; |
||||||
|
sets are iterable, returning every element in them; tuples are iterable, |
||||||
|
returning every value in them; generators are iterable, return the next value |
||||||
|
they can produce. |
||||||
|
|
||||||
|
But what if you need to iterate over more than one iterable at the same time? |
||||||
|
|
||||||
|
## Enters `zip()` |
||||||
|
|
||||||
|
That's where `zip()` comes in. `zip()` allows you to merge iterables: |
||||||
|
|
||||||
|
```python |
||||||
|
a_list = [1, 2, 3, 4] |
||||||
|
a_tuple = ('a', 'b', 'c', 'd') |
||||||
|
for mixed_tuple in zip(a_list, a_tuple): |
||||||
|
print(mixed_tuple) |
||||||
|
``` |
||||||
|
|
||||||
|
This code prints out: |
||||||
|
|
||||||
|
``` |
||||||
|
(1, 'a') |
||||||
|
(2, 'b') |
||||||
|
(3, 'c') |
||||||
|
(4, 'd') |
||||||
|
``` |
||||||
|
|
||||||
|
What `zip()` does is create a tuple with the first element of the first |
||||||
|
iterable and the first element of the second iterable; then the second element |
||||||
|
of the first iterable and the second element of the second iterable; and so |
||||||
|
on. You can put as many iterables as you want in `zip()` and it will just |
||||||
|
create larger tuples for each interaction. |
||||||
|
|
||||||
|
## Interlude: Destructuring |
||||||
|
|
||||||
|
One of the cool things in Python is "destructuring". Destructuring |
||||||
|
(de-structuring or more like "breaking apart a structure") allows one to |
||||||
|
extract elements from a iterable directly. |
||||||
|
|
||||||
|
For example, if you have a tuple with two elements: |
||||||
|
|
||||||
|
```python |
||||||
|
a_tuple = (1, 2) |
||||||
|
``` |
||||||
|
|
||||||
|
... you'd probably take every element of it in separate variables with |
||||||
|
something like |
||||||
|
|
||||||
|
```python |
||||||
|
a = a_tuple[0] |
||||||
|
b = a_tuple[1] |
||||||
|
``` |
||||||
|
|
||||||
|
But with destructuring, you can do this in a single pass with |
||||||
|
|
||||||
|
```python |
||||||
|
(a, b) = a_tuple |
||||||
|
``` |
||||||
|
|
||||||
|
This code and the one above it will do exactly the same thing. |
||||||
|
|
||||||
|
But why destructuring is important if we are talking about iterating over |
||||||
|
elements? 'Cause `for` also has the destructuring capabilities: |
||||||
|
|
||||||
|
```python |
||||||
|
a_list = [1, 2, 3, 4] |
||||||
|
a_tuple = ('b', 'c', 'd', 'f') |
||||||
|
a_string = 'aeio' |
||||||
|
|
||||||
|
for (a_number, lowercase_char, uppercase_char) in zip(a_list, a_tuple, a_string): |
||||||
|
print(a_number) |
||||||
|
print(lowercase_char) |
||||||
|
print(uppercase_char) |
||||||
|
print() |
||||||
|
``` |
||||||
|
|
||||||
|
{% note() %} |
||||||
|
Remember that I said that strings are also iterables and each iteration would |
||||||
|
return a character? That's it. |
||||||
|
{% end %} |
||||||
|
|
||||||
|
But what happens when one of the iterables is smaller than the other one? |
||||||
|
|
||||||
|
```python |
||||||
|
a_short_list = [1, 2] |
||||||
|
a_long_list [10, 20, 30, 40, 50, 60, 70, 80, 90] |
||||||
|
for (small, big) in zip(a_short_list, a_long_list): |
||||||
|
print(small, big) |
||||||
|
``` |
||||||
|
|
||||||
|
That will print |
||||||
|
|
||||||
|
``` |
||||||
|
1 10 |
||||||
|
2 20 |
||||||
|
``` |
||||||
|
|
||||||
|
`zip()` stops when the shortest iterable have no more elements. To go as far |
||||||
|
as the longest iterable, you need `itertools.zip_longest()`. |
||||||
|
|
||||||
|
## `itertools.zip_longest()` |
||||||
|
|
||||||
|
`zip_longest()`, part of the `itertools` module, will transverse the iterables |
||||||
|
till every one of them have no more elements. What happens with the shortest |
||||||
|
of those is that its value will be replaced with `None`. Using our previous |
||||||
|
example: |
||||||
|
|
||||||
|
```python |
||||||
|
import itertools |
||||||
|
|
||||||
|
a_short_list = [1, 2] |
||||||
|
a_long_list [10, 20, 30, 40, 50, 60, 70, 80, 90] |
||||||
|
for (small, big) in itertools.zip_longest(a_short_list, a_long_list): |
||||||
|
print(small, big) |
||||||
|
``` |
||||||
|
|
||||||
|
That will print: |
||||||
|
|
||||||
|
``` |
||||||
|
1 10 |
||||||
|
2 20 |
||||||
|
None 30 |
||||||
|
None 40 |
||||||
|
None 50 |
||||||
|
None 60 |
||||||
|
None 70 |
||||||
|
None 80 |
||||||
|
None 90 |
||||||
|
``` |
||||||
|
|
||||||
|
## Careful with generators |
||||||
|
|
||||||
|
One thing you must be careful when using `zip()` and `zip_longest()` are |
||||||
|
generators. Why? Because some of them have no end. |
||||||
|
|
||||||
|
Let's take one example: `cycle()`. `cycle()`, also part of the itertools |
||||||
|
module, is a generator that, on request, returns the next element of an |
||||||
|
iterable but, as soon as this iterable is over, it starts over. For example |
||||||
|
(and I'm tacking `zip()` around this just for the sake of staying on topic, |
||||||
|
and you don't need to use `zip()` with `cycle()`): |
||||||
|
|
||||||
|
```python |
||||||
|
a_list = [10, 20, 30, 40, 50, 60, 70, 80, 90] |
||||||
|
for (bullet, value) in zip(cycle(['-', '*', '.']), a_list): |
||||||
|
print(bullet, value) |
||||||
|
``` |
||||||
|
|
||||||
|
That will produce: |
||||||
|
|
||||||
|
``` |
||||||
|
- 10 |
||||||
|
* 20 |
||||||
|
. 30 |
||||||
|
- 40 |
||||||
|
* 50 |
||||||
|
. 60 |
||||||
|
- 70 |
||||||
|
* 80 |
||||||
|
. 90 |
||||||
|
``` |
||||||
|
|
||||||
|
What happened here is that `zip()` took the first value of the first iterable, |
||||||
|
our `cycle(['-', '*', '.'])`, which was the first value of its iterable, |
||||||
|
`'-'`, and the second value of the second iterable, `10`; next iteration, the |
||||||
|
second value of `cycle()` was `'*'` and the second value of `a_list` was `20`; |
||||||
|
third iteration, `cycle()` returned `'.'` and `a_list` returned `30`; now, on |
||||||
|
the fourth iteration, `cycle()` was asked for a value and, with its iterable |
||||||
|
exhausted, it returned to the first value, returning `'-'` again. |
||||||
|
|
||||||
|
Ok, cool? |
||||||
|
|
||||||
|
So, what's the problem with generators? |
||||||
|
|
||||||
|
Some generators -- like `cycle()` above -- do not have an end. If you replace |
||||||
|
`zip()` with `zip_longest()` on the code above, you'll see that the code will |
||||||
|
never stop. It's not every generator the can produce values continuously, |
||||||
|
though, so you can mess with them with no issue. |
||||||
|
|
||||||
|
{% note() %} |
||||||
|
It's not `zip_longest()` that may have an issue. You can put two `cycle()`s in |
||||||
|
a `zip()` and it will keep producing tuples with no end. |
||||||
|
{% end %} |
||||||
|
|
||||||
|
All nice and dandy, but what if I need to show the index itself? |
||||||
|
|
||||||
|
## `enumerate()` to the rescue! |
||||||
|
|
||||||
|
Ok, so we talked about mixing more than one iterable, but what if we need the |
||||||
|
position? What if we have a list of ordered results and we need to show the |
||||||
|
position itself? |
||||||
|
|
||||||
|
Again, you may be temped to use `range()`: |
||||||
|
|
||||||
|
```python |
||||||
|
winners = ['first place', 'second place', 'third place', 'fourth place'] |
||||||
|
for pos in range(len(winners)): |
||||||
|
print(pos + 1, winners[pos].capitalize()) |
||||||
|
``` |
||||||
|
|
||||||
|
That will print: |
||||||
|
|
||||||
|
``` |
||||||
|
1 First place |
||||||
|
2 Second place |
||||||
|
3 Third place |
||||||
|
4 Fourth place |
||||||
|
``` |
||||||
|
|
||||||
|
One may also try to be clever and mix our newly found knowledge about `zip()` |
||||||
|
and do: |
||||||
|
|
||||||
|
```python |
||||||
|
winners = ['first place', 'second place', 'third place', 'fourth place'] |
||||||
|
for (pos, name) in zip(range(len(winners)), winners): |
||||||
|
print(pos + 1, name.capitalize()) |
||||||
|
``` |
||||||
|
|
||||||
|
... which ,personally, looks even more cumbersome than the first option. But |
||||||
|
Python have another generator called `enumerate()` that takes one single |
||||||
|
iterable, but produces tuples with the index of it and its value: |
||||||
|
|
||||||
|
```python |
||||||
|
winners = ['first place', 'second place', 'third place', 'fourth place'] |
||||||
|
for (pos, name) in enumerate(winners): |
||||||
|
print(pos + 1, name.capitalize()) |
||||||
|
``` |
||||||
|
|
||||||
|
Even better, `enumerate()` have an option to define with will be the value of |
||||||
|
the first element, so instead of that `pos + 1` in the `print()` statement, we |
||||||
|
can replace the enumerate to `enumerate(winners, start=1)` and remove the |
||||||
|
addition in `print()`. |
||||||
|
|
||||||
|
## Conclusion |
||||||
|
|
||||||
|
Iterables is one of the powerhouses of Python, as you may have noticed in the |
||||||
|
beginning with the number of things that can be iterated over. Understanding |
||||||
|
those will help you write better and more concise Python code, without losing |
||||||
|
meaning. |
@ -0,0 +1,277 @@ |
|||||||
|
+++ |
||||||
|
title = "Você Não Precisa de range()" |
||||||
|
date = 2020-04-16 |
||||||
|
|
||||||
|
[taxonomies] |
||||||
|
tags = ["código", "python", "range"] |
||||||
|
+++ |
||||||
|
|
||||||
|
Quem está começando com Python tende a usar `range()` quando precisa iterar |
||||||
|
sobre listas. Mas isso não é realmente necessário. |
||||||
|
|
||||||
|
<!-- more --> |
||||||
|
|
||||||
|
Quando as pessoas começam a programar em Python, elas tendem a usar |
||||||
|
construções vindas de outras linguagens, e por isso iteram sobre uma lista da |
||||||
|
seguinte forma: |
||||||
|
|
||||||
|
```python |
||||||
|
a_list = [1, 2, 3, 4] |
||||||
|
for i in range(len(a_list)): |
||||||
|
print(a_list[i]) |
||||||
|
``` |
||||||
|
|
||||||
|
Mas Python tem o conceito de "iteráveis", o que quer dizer que algumas coisas |
||||||
|
podem ser iteradas diretamente, sem precisar acessar cada elemento |
||||||
|
individualmente. Por exemplo, nossa lista anterior poderia ser iterada com: |
||||||
|
|
||||||
|
```python |
||||||
|
a_list = [1, 2, 3, 4] |
||||||
|
for value in a_list: |
||||||
|
print(value) |
||||||
|
``` |
||||||
|
|
||||||
|
"Para cada elemento em `a_list`, recupere-o e chame-o de `value`." |
||||||
|
|
||||||
|
Vários elementos são iteráveis: Strings são iteráveis, retornando cada |
||||||
|
caractere nelas; dicionários são iteráveis, retornado cada chave neles; |
||||||
|
conjuntos são iteráveis, retornado cada elemento neles; tuplas são iteráveis, |
||||||
|
retornando cada elemento nelas; generators são iteráveis, retornando o próximo |
||||||
|
valor que eles conseguem produzir. |
||||||
|
|
||||||
|
Mas e se precisássemos iterar sobre mais de um elemento ao mesmo tempo? |
||||||
|
|
||||||
|
## Entra o `zip()` |
||||||
|
|
||||||
|
É aí que o `zip()` entra. `zip()` permite que você junte dois iteráveis: |
||||||
|
|
||||||
|
```python |
||||||
|
a_list = [1, 2, 3, 4] |
||||||
|
a_tuple = ('a', 'b', 'c', 'd') |
||||||
|
for mixed_tuple in zip(a_list, a_tuple): |
||||||
|
print(mixed_tuple) |
||||||
|
``` |
||||||
|
|
||||||
|
Esse código imprime: |
||||||
|
|
||||||
|
``` |
||||||
|
(1, 'a') |
||||||
|
(2, 'b') |
||||||
|
(3, 'c') |
||||||
|
(4, 'd') |
||||||
|
``` |
||||||
|
|
||||||
|
O que o `zip()` faz é criar uma tupla com o primeiro elemento do primeiro |
||||||
|
iterável e o primeiro elemento do segundo iterável; depois com o segundo |
||||||
|
elemento do primeiro iterável e o segundo elemento do segundo iterável; e |
||||||
|
assim por diante. Você pode colocar quantos iteráveis você quiser no `zip()` e |
||||||
|
ele ira produzir tuplas maiores em cada iteração. |
||||||
|
|
||||||
|
## Interlúdio: Destruturação |
||||||
|
|
||||||
|
Uma das coisas legais de Python é "destruturação". Destruturação |
||||||
|
(de-estruturar ou mais como "quebrar uma estrutura") permite que elementos de |
||||||
|
um iterável sejam extraídos diretamente. |
||||||
|
|
||||||
|
Por exemplo, se você tem uma tupla com dois elementos: |
||||||
|
|
||||||
|
```python |
||||||
|
a_tuple = (1, 2) |
||||||
|
``` |
||||||
|
|
||||||
|
... você provavelmente iria extrair cada um dos elementos com alguma coisa do |
||||||
|
tipo: |
||||||
|
|
||||||
|
|
||||||
|
```python |
||||||
|
a = a_tuple[0] |
||||||
|
b = a_tuple[1] |
||||||
|
``` |
||||||
|
|
||||||
|
Mas com destruturação, você pode fazer isso numa única passada com: |
||||||
|
|
||||||
|
```python |
||||||
|
(a, b) = a_tuple |
||||||
|
``` |
||||||
|
|
||||||
|
Este código e o acima dele fazem exatamente a mesma coisa. |
||||||
|
|
||||||
|
Mas porque destruturação é importante se estamos falando sobre iterar sobre |
||||||
|
elementos? Porque `for` também tem a capacidade de destruturar: |
||||||
|
|
||||||
|
```python |
||||||
|
a_list = [1, 2, 3, 4] |
||||||
|
a_tuple = ('b', 'c', 'd', 'f') |
||||||
|
a_string = 'aeio' |
||||||
|
|
||||||
|
for (a_number, lowercase_char, uppercase_char) in zip(a_list, a_tuple, a_string): |
||||||
|
print(a_number) |
||||||
|
print(lowercase_char) |
||||||
|
print(uppercase_char) |
||||||
|
print() |
||||||
|
``` |
||||||
|
|
||||||
|
{% note() %} |
||||||
|
Lembra que eu falei que strings também eram iteráveis e cada iteração traz um |
||||||
|
caractere? É isso. |
||||||
|
{% end %} |
||||||
|
|
||||||
|
Mas o que acontece quando um dos iteráveis é menor que o outro? |
||||||
|
|
||||||
|
```python |
||||||
|
a_short_list = [1, 2] |
||||||
|
a_long_list [10, 20, 30, 40, 50, 60, 70, 80, 90] |
||||||
|
for (small, big) in zip(a_short_list, a_long_list): |
||||||
|
print(small, big) |
||||||
|
``` |
||||||
|
|
||||||
|
Esse código imprime: |
||||||
|
|
||||||
|
``` |
||||||
|
1 10 |
||||||
|
2 20 |
||||||
|
``` |
||||||
|
`zip()` pára quando o menor iterável não tem mais elementos. Para consumir |
||||||
|
todos os elementos do iterável mais longo, você precisa de |
||||||
|
`itertools.zip_longest()`. |
||||||
|
|
||||||
|
## `itertools.zip_longest()` |
||||||
|
|
||||||
|
`zip_longest()`, parte do módulo `itertools`, irá percorrer os iteráveis até |
||||||
|
que nenhum deles tenha mais elementos. O que acontece com o menor deles é que |
||||||
|
os seus valores são substituídos por `None`. Usando nosso exemplo anterior: |
||||||
|
|
||||||
|
```python |
||||||
|
import itertools |
||||||
|
|
||||||
|
a_short_list = [1, 2] |
||||||
|
a_long_list [10, 20, 30, 40, 50, 60, 70, 80, 90] |
||||||
|
for (small, big) in itertools.zip_longest(a_short_list, a_long_list): |
||||||
|
print(small, big) |
||||||
|
``` |
||||||
|
|
||||||
|
Isso irá imprimir: |
||||||
|
|
||||||
|
``` |
||||||
|
1 10 |
||||||
|
2 20 |
||||||
|
None 30 |
||||||
|
None 40 |
||||||
|
None 50 |
||||||
|
None 60 |
||||||
|
None 70 |
||||||
|
None 80 |
||||||
|
None 90 |
||||||
|
``` |
||||||
|
|
||||||
|
## Cuidado com generators |
||||||
|
|
||||||
|
Uma coisa que você precisa ter cuidado quando estiver usando `zip()` ou |
||||||
|
`zip_longest()` são generators. Por que? Porque alguns deles não tem fim. |
||||||
|
|
||||||
|
Vamos usar um exemplo: `cycle()`. `cycle()`, também parte do módulo itertools, |
||||||
|
é um generator que, quando for pedido um valor, retorna o próximo valor de um |
||||||
|
iterável mas, quando chegar ao fim deste, retorna pro começo. Por exemplo (e |
||||||
|
eu estou usando `zip()` apenas para nos mantermos no tópico, mas não é preciso |
||||||
|
usar `zip()` para usar `cycle()`): |
||||||
|
|
||||||
|
```python |
||||||
|
a_list = [10, 20, 30, 40, 50, 60, 70, 80, 90] |
||||||
|
for (bullet, value) in zip(cycle(['-', '*', '.']), a_list): |
||||||
|
print(bullet, value) |
||||||
|
``` |
||||||
|
|
||||||
|
Este código produz: |
||||||
|
|
||||||
|
``` |
||||||
|
- 10 |
||||||
|
* 20 |
||||||
|
. 30 |
||||||
|
- 40 |
||||||
|
* 50 |
||||||
|
. 60 |
||||||
|
- 70 |
||||||
|
* 80 |
||||||
|
. 90 |
||||||
|
``` |
||||||
|
|
||||||
|
O que acontece é que `zip()` pegou o primeiro elemento do primeiro iterável, |
||||||
|
nosso `cycle(['-', '*', '.'])`, que tem como primeiro valor no seu iterável |
||||||
|
`'-'` e o segundo valor do segundo iterável, `10`; na próxima iteração, o |
||||||
|
segundo valor de `cycle()` foi `'*'` e o segundo valor de `a_list` foi `20`; |
||||||
|
na terceira iteração, `cycle()` retornou `'.'` e `a_list` `30`; agora, na |
||||||
|
quarta iteração, foi pedido um valor ao `cycle()` e, como o seu iterável |
||||||
|
terminou, ele retorno o primeiro valor, retornando `'-'` de novo. |
||||||
|
|
||||||
|
Certo? |
||||||
|
|
||||||
|
Então qual o problema com generators? |
||||||
|
|
||||||
|
Alguns generators -- como o `cycle()` acima -- não tem fim. Se você trocar |
||||||
|
`zip()` por `zip_longest()` no exemplo acima, você vai ver que o código não |
||||||
|
irá terminar. Não são todos os generators que produzem valores de forma |
||||||
|
infinita, e você pode usá-los sem problema. |
||||||
|
|
||||||
|
{% note() %} |
||||||
|
Não é só `zip_longest()` que tem problemas. Você pode botar dois `cycle()`s |
||||||
|
num `zip()` e ele vai ficar gerando tuplas sem parar. |
||||||
|
{% end %} |
||||||
|
|
||||||
|
Certo, legal, mas e se eu precisar mostrar o índice também? |
||||||
|
|
||||||
|
## `enumerate()` ao resgate! |
||||||
|
|
||||||
|
Então, nós falamos sobre usar dois iteráveis ao mesmo tempo, mas e se |
||||||
|
precisarmos da posição também? E se a nossa lista for uma lista de resultados |
||||||
|
ordenados e nós precisamos mostrar a posição em si? |
||||||
|
|
||||||
|
De novo, você pode ficar tentado a usar `range()`: |
||||||
|
|
||||||
|
```python |
||||||
|
winners = ['first place', 'second place', 'third place', 'fourth place'] |
||||||
|
for pos in range(len(winners)): |
||||||
|
print(pos + 1, winners[pos].capitalize()) |
||||||
|
``` |
||||||
|
|
||||||
|
Isso irá imprimir: |
||||||
|
|
||||||
|
``` |
||||||
|
1 First place |
||||||
|
2 Second place |
||||||
|
3 Third place |
||||||
|
4 Fourth place |
||||||
|
``` |
||||||
|
|
||||||
|
Uma das coisas que você pode tentar ser esperto é tentar misturar o seu novo |
||||||
|
conhecimento sobre `zip()` e fazer: |
||||||
|
|
||||||
|
```python |
||||||
|
winners = ['first place', 'second place', 'third place', 'fourth place'] |
||||||
|
for (pos, name) in zip(range(len(winners)), winners): |
||||||
|
print(pos + 1, name.capitalize()) |
||||||
|
``` |
||||||
|
|
||||||
|
... que, pessoalmente, parece mais complexo do que a primeira opção. Mas |
||||||
|
Python tem outro generator chamado `enumerate()` que recebe um único iterável, |
||||||
|
mas produz tuplas com o índice e seu valor: |
||||||
|
|
||||||
|
```python |
||||||
|
winners = ['first place', 'second place', 'third place', 'fourth place'] |
||||||
|
for (pos, name) in enumerate(winners): |
||||||
|
print(pos + 1, name.capitalize()) |
||||||
|
``` |
||||||
|
|
||||||
|
Melhor ainda, `enumerate()` tem uma opção para definir o valor inicial do |
||||||
|
primeiro elemento, e ao invés de usar `pos + 1` no `print()`, nós podemos |
||||||
|
mudar o enumerate para `enumerate(winners, start=1)` e remover a adição no |
||||||
|
`print()`. |
||||||
|
|
||||||
|
## Conclusão |
||||||
|
|
||||||
|
Iteráveis são as grandes potências de Python, como você pode ter percebido com |
||||||
|
a lista de coisas que podem ser iteradas. Entendendo-os vai lhe ajudar a |
||||||
|
escrever código Python melhor e mais conciso, sem perda de significado. |
||||||
|
|
||||||
|
<!-- |
||||||
|
vim:spelllang=pt: |
||||||
|
--> |
Loading…
Reference in new issue