sábado, 15 de janeiro de 2011

Programa em Python para encontrar e-mails em arquivos utilizando 'regexp'

O programa abaixo executa, por meio da expressão regular r'[\w.]+@[\w.]+, uma busca dentro de qualquer arquivo (.html, .txt, .py entre outros) pelo padrão associado a endereços eletrônicos (tal como foobar1@gmail.com ou helloartelivre.arte@ig.com.jp) e organiza estes separados por vírgula.

Segue o código:


#!/usr/bin/env python


import re


def Search(pat, text):
    s_results = re.findall(pat, text)
    for s_result in s_results:
    print s_result +','


#Opening file: File's path, in this case is my home dir (Files dir exactly).
f = open('/home/marcker/python_tests/Files/emails.txt', 'r')
content = f.read()


def main():
    Search(r'[\w.]+@[\w.]+', content)


if __name__=='__main__':
    main()




O vídeo abaixo ilustra o programa em operação. No vídeo em questão utilizei alguns comandos simples do Shell/UNIX e suas opções: wget, sort, rm, ls e cd. Recomendo que estudem!






Nenhum comentário: