O módulo os fornece dúzias de funções para interagir com o sistema operacional:
>>> import os
>>> os.getcwd() # Devolve o diretório de trabalho atual
'C:\\Python26'
>>> os.chdir('/server/accesslogs') # Altera o diretório de trabalho atual
>>> os.system('mkdir today') # Executa o comando mkdir no shell do sistema
0
Tome cuidado para usar a forma import os ao invés de from os import *. Isso evitará que os.open() oculte a função open() que opera de forma muito diferente.
As funções embutidas dir() e help() são úteis como um sistema de ajuda interativa pra lidar com módulos grandes como os:
>>> import os
>>> dir(os)
<devolve uma lista com todas as funções do módulo>
>>> help(os)
<devolve uma extensa página de manual criada a partir das docstrings do módulo>
Para tarefas de gerenciamento cotidiano de arquivos e diretórios, o módulo shutil fornece uma interface de alto nível que é mais simples de usar:
>>> import shutil
>>> shutil.copyfile('data.db', 'archive.db')
>>> shutil.move('/build/executables', 'installdir')
O módulo glob fornece uma função para criar listas de arquivos a partir de buscas em diretórios usando caracteres curinga:
>>> import glob
>>> glob.glob('*.py')
['primes.py', 'random.py', 'quote.py']
Scripts geralmente precisam processar argumentos passados na linha de comando. Esses argumentos são armazenados como uma lista no atributo argv do módulo sys. Por exemplo, teríamos a seguinte saída executando python demo.py one two three na linha de comando:
>>> import sys
>>> print sys.argv
['demo.py', 'one', 'two', 'three']
O módulo getopt processa os argumentos passados em sys.argv usando as convenções da função Unix getopt. Um processamento mais poderoso e flexível é fornecido pelo módulo argparse.
O módulo sys também possui atributos para stdin, stdout e stderr. O último é usado para emitir avisos e mensagens de erros visíveis mesmo quando stdout foi redirecionado:
>>> sys.stderr.write('Aviso: iniciando novo arquivo de log\n')
Aviso: iniciando novo arquivo de log
A forma mais direta de encerrar um script é usando sys.exit().
O módulo re fornece ferramentas para lidar com processamento de strings através de expressões regulares. Para reconhecimento de padrões complexos, expressões regulares oferecem uma solução sucinta e eficiente:
>>> import re
>>> re.findall(r'\bf[a-z]*', 'which foot or hand fell fastest')
['foot', 'fell', 'fastest']
>>> re.sub(r'(\b[a-z]+) \1', r'\1', 'cat in the the hat')
'cat in the hat'
Quando as exigências são simples, métodos de strings são preferíveis por serem mais fáceis de ler e depurar:
>>> 'tea for too'.replace('too', 'two')
'tea for two'
O módulo math oferece acesso as funções da biblioteca C para matemática de ponto flutuante:
>>> import math
>>> math.cos(math.pi / 4.0)
0.70710678118654757
>>> math.log(1024, 2)
10.0
O módulo random fornece ferramentas para gerar seleções aleatórias:
>>> import random
>>> random.choice(['apple', 'pear', 'banana'])
'apple'
>>> random.sample(xrange(100), 10) # sampling without replacement
[30, 83, 16, 4, 8, 81, 41, 50, 18, 33]
>>> random.random() # float aleatório entre 0 e 1 exclusive
0.17970987693706186
>>> random.randrange(6) # inteiro aleatório escolhido entre range(6)
4
Há diversos módulos para acesso e processamento de protocolos da internet. Dois dos mais simples são urllib2 para efetuar download de dados a partir de urls e smtplib para enviar mensagens de correio eletrônico:
>>> import urllib2
>>> for line in urllib2.urlopen('http://tycho.usno.navy.mil/cgi-bin/timer.pl'):
... if 'EST' in line or 'EDT' in line: # procurar pela hora do leste
... print line
<BR>Nov. 25, 09:43:32 PM EST
>>> import smtplib
>>> server = smtplib.SMTP('localhost')
>>> server.sendmail('soothsayer@example.org', 'jcaesar@example.org',
... """To: jcaesar@example.org
... From: soothsayer@example.org
...
... Beware the Ides of March.
... """)
>>> server.quit()
(Note que o segundo exemplo precisa de um servidor de email rodando em localhost.)
O módulo datetime fornece classes para manipulação de datas e horas nas mais variadas formas. Apesar da disponibilidade de aritmética com data e hora, o foco da implementação é na extração eficiente dos membros para formatação e manipulação. O módulo também oferece objetos que levam os fusos horários em consideração.
>>> # é fácil construir e formatar datas
>>> from datetime import date
>>> now = date.today()
>>> now
datetime.date(2003, 12, 2)
>>> now.strftime("%m-%d-%y. %d %b %Y is a %A on the %d day of %B.")
'12-02-03. 02 Dec 2003 is a Tuesday on the 02 day of December.'
>>> # datas implementam operações aritméticas
>>> birthday = date(1964, 7, 31)
>>> age = now - birthday
>>> age.days
14368
Formatos comuns de arquivamento e compressão de dados estão disponíveis diretamente através de alguns módulos, entre eles: zlib, gzip, bz2, zipfile e tarfile.
>>> import zlib
>>> s = 'witch which has which witches wrist watch'
>>> len(s)
41
>>> t = zlib.compress(s)
>>> len(t)
37
>>> zlib.decompress(t)
'witch which has which witches wrist watch'
>>> zlib.crc32(s)
226805979
Alguns usuários de Python desenvolvem um interesse profundo pelo desempenho relativo de diferentes abordagens para o mesmo problema. Python oferece uma ferramenta de medição que esclarece essas dúvidas rapidamente.
Por exemplo, pode ser tentador usar o empacotamento e desempacotamento de tuplas ao invés da abordagem tradicional de permutar os argumentos. O módulo timeit rapidamente mostra uma modesta vantagem de desempenho:
>>> from timeit import Timer
>>> Timer('t=a; a=b; b=t', 'a=1; b=2').timeit()
0.57535828626024577
>>> Timer('a,b = b,a', 'a=1; b=2').timeit()
0.54962537085770791
Em contraste com granulidade fina do módulo timeit, os módulos profile e pstats oferecem ferramentas para identificar os trechos mais críticos em grandes blocos de código.
Uma das abordagens usadas no desenvolvimento de software de alta qualidade é escrever testes para cada função à medida que é desenvolvida e executar esses testes frequentemente durante o processo de desenvolvimento.
O módulo doctest oferece uma ferramenta para realizar um trabalho de varredura e validação de testes escritos nas strings de documentação (docstrings) de um programa. A construção dos testes é tão simples quanto copiar uma chamada típica juntamente com seus resultados e colá-los na docstring. Isto aprimora a documentação, fornecendo ao usuário um exemplo real, e permite que o módulo doctest verifique se o código continua fiel à documentação:
def media(valores):
"""Calcula a média aritmética de uma lista de números.
>>> print media([20, 30, 70])
40.0
"""
return sum(valores, 0.0) / len(valores)
import doctest
doctest.testmod() # Automaticamente valida os testes embutidos
O módulo unittest não é tão simples de usar quanto o módulo doctest, mas permite que um conjunto muito maior de testes seja mantido em um arquivo separado:
import unittest
class TestStatisticalFunctions(unittest.TestCase):
def test_average(self):
self.assertEqual(average([20, 30, 70]), 40.0)
self.assertEqual(round(average([1, 5, 7]), 1), 4.3)
self.assertRaises(ZeroDivisionError, average, [])
self.assertRaises(TypeError, average, 20, 30, 70)
unittest.main() # Chamando da linha de comando, executa todos os testes
Python tem uma filosofia de “baterias incluídas”. Isso fica mais evidente através da sofisticação e robustez dos seus maiores pacotes. Por exemplo: