Hoje trago uma sugestão de disciplina, especialmente para meus colegas do Programa de Pós-Graduação em Linguística da Universidade Federal do Ceará, mas também para qualquer aluno de qualquer programa de pós-graduação da UFC. A disciplina se entitula Text Analysis with Python and NLTK (Análise de Texto com Python e NLTK), é ofertada pelo Programa de Pós-Graduação em Estudos da Tradução da mesma universidade e é ministrada pelo Prof. Dr. Robert de Brose. Abaixo apresento uma versão traduzida e adaptada da ementa em inglês da disciplina, na qual encontramos a justificativa, os objetivos, a ementa em si e as referências.

Atualmente grande parte da linguística praticada no Brasil ainda se dá através de um paradigma que se limita a quantidades minúsculas de textos escritos. Há muitas vantagens práticas e teóricas no tratamento de uma quantidade maior de dados. A maior delas é uma validação mais concreta das hipóteses levantadas nos estudos linguísticos.

Muitos linguistas pensarm que esse tipo de abordagem só tem aplicação dentro do chamado núcleo duro da linguística, quando na verdade o domínio e o uso desse tipo de recursos fornece um alcance maior para vários ramos dessa ciência, seja Linguística de Texto, seja Sociolinguística, seja toda linha de Linguística Aplicada entre outros. É por esse motivo que sugiro que se matriculem nessa disciplina. Há muito o que se aprender nela.

Abaixo descrevo como localizar a disciplina no SIGAA-UFC. Acesse o sistema normalmente, clique em Ensino > Matrícula On-Line > Realizar Matrícula. Ao chegar à tela abaixo, clique em “Disciplinas”.

opções-de-matrícula

Clique em “Ver as turmas de outros programas”.

outros-programas

Procure por “PROGRAMA DE PÓS-GRADUAÇÃO EM ESTUDOS DA TRADUÇÃO” no menu “Unidade Responsável” e clique em “Buscar”.

turmas-abertas

Localize a primeira turma da lista, selecione-a e clique em “Adicionar Turmas”.

turmas-encontradas

Por fim, clique em “Confirmar Matrículas”.

outros-programas

Não perca tempo. Você tem até amanhã, 28/04, para se matricular. Vejo você dia 17/05 na disciplina de Introdução ao Python para Análise de Textos!



Análise de Texto com Python e NLTK

Código: HGP9029
Créditos: 4 (64h)

Justificativa

A análise de texto através da manipulação computacional de corpora é uma habilidade indispensável para qualquer pesquisador interessado em conduzir pesquisa no campo da Análise do Discurso, da Tradução Automática, Análise de Método Quantitativos em Linguística etc., que interseccionam com Estudos da Tradução. A plataforma mais amplamente usada para conduzir análise de texto hoje é o Natural Language Toolkit (NLTK) combinado a linguagem de programação Python. Ambas são de acesso livre e são usadas e implementadas nos mais diversos projetos no campo da linguística computacional. Pesquisadores e alunos dos Estudos da Tradução geralmente precisam lidar com corpora assim como executar análise estatítica e outros tipos de manipulação de dados linguísticos e textuais de modo que a aquisição de habilidades de programação vem preencher uma lacuna em sua formação.

Objetivos

  • Fornecer aos alunos técnicas de Python para manipular, transformar, extrair e analisar textos armazenados em diferentes corpora;
  • Apresentar e treinar alunos na biblioteca Natural Language Toolkit (NLTK).

Ementa

Essa disciplina apresentará alunos às técnicas de Python necessárias para acessar, transformar e analisar diferentes corpora usando Python e NLTK.

Referências

BENGFORT, B.; BILBRO, R.; OJEDA, T. Applied Text Analysis with Python: Enabling Language-Aware Data Products with Machine Learning. O’Reilly Media, 2018.
I BIRD, S.; KLEIN, E.; LOPER, E. Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit. O’Reilly Media, 2009. ISBN 978059655.
GUTTAG, J. Introduction to Computation and Programming Using Python: With Application to Understanding Data. MIT Press, 2016. ISBN 9780262529624.
HAMMOND, M. Python for Linguists. Cambridge University Press, 2020. ISBN 9781108493444.
HARDENIYA, N. et al. Natural Language Processing: Python and NLTK. Packt Publishing, 2016. ISBN 9781787287846.
HARRISON, M. Tiny Python 3.6 Notebook: Curated Examples. CreateSpace Independent Publishing Platform, 2017. ISBN 9781542883252.
MATTHES, E. Python Crash Course, 2nd Edition: A Hands-On, Project-Based Introduction to Programming. No Starch Press, 2019. ISBN 9781593279295.
VASILIEV, Y. Natural Language Processing with Python and spaCy: A Practical Introduction. No Starch Press, 2020. ISBN 9781718500532.