Sábado, Julho 04, 2009

Palavras e genes

A idéia me chegou há menos de 10 minutos, enquanto lia Freud [1] e associava a Saussure sob o ponto de vista de um doutor em biologia computacional. De fato, muitas de suas bases já vinham sendo montadas há tempo, mas só agora elas se ligaram num todo coerente. A idéia que aqui descrevo tem relação com o que Susan Blackmore chamou de darwinismo universal [2]. E tem também a ver com a idéia de que a língua evolui de uma forma similar aos organismos biológicos. E então o darwinismo opera em diferentes meios, permitindo-nos traçar analogias e transferir o conhecimento de uma área para a outra. Falo agora da linguística computacional que herda da biologia computacional (bioinformática) muito de sua metodologia de trabalho, embora o foco e as questões sejam bastante diferentes. Enquanto uma quer entender a evolução das línguas e fonemas falados pelo ser humano, outra quer entender a evolução dos organismos e da vida em nosso planeta. E ao formalizarmos algumas metáforas de ligação e adaptarmos certos casos, para uma realidade não idêntica, porém similar, podemos utilizar a força da ciência experimental para compreendermos e evolução de nossa linguagem.


A primeira analogia que faço é a analogia gene-palavra. E daí podemos extrapolar, mantendo o pé no chão, para sabermos como as tecnologias de análise computacional da biologia podem servir à linguística, essas maravilhosas áreas do conhecimento humano. Se o gene é a palavra e o conjunto de genes é o genoma; o conjunto das palavras é o dicionário. Assim como o genoma contém todos os genes, o dicionário contém todas as palavras; assim como cada gene pode ser mais ou menos expresso num tecido, palavras podem ser mais ou menos utilizadas em diferentes contextos sociais específicos. Em determinados tecidos, como o coração, há genes normalmente mais ou menos expressos; em um determinada obra de um pensador, há palavras mais ou menos utilizadas. No embrião, quase todos os genes do genoma se expressam e há enciclopédias que podem conter a grande maioria das palavras do dicionário. Mas tenhamos a temperança de parar a extrapolação quando ela não mais se torna útil e a língua é certamente mais fluida e evolui mais rápido do que os organismos biológicos. De fato, o entendimento da evolução linguística pode retornar à biologia molecular padrões e métodos mais precisos para tratar casos onde a evolução (mesmo a biológica) acontece de forma rápida [3].


Métodos de inteligência artificial podem hoje identificar qual é um organismo por seu DNA e pode-se supor métodos computacionais linguísticos (aprendizagem supervisionada) onde seja possível identificar as características do texto de um autor e saber se determinado texto tenha sido ou não escrito por ele. Ao quantificar palavras e dividí-las de acordo com suas características funcionais (como os genes), poderemos contar quantos artigos e verbos e sujeitos e pronomes e adjetivos presentes num texto e conseguir de certa forma forma um padrão que caracterize um determinado pensador, corrente de pensamento ou assunto tratado. É claro que a tarefa não será tão simples, como também não são as análises de genes. Haverão inquietudes e dúvidas por todo o lado; será preciso utilizar a estatística. Talvez fosse interessante para a história universal saber quão diferentes são os estilos de escrita, quais textos de cada pensador estão mais embutidos numa corrente de pensamento, quais vão mais à beira de uma idéia. Tudo isso, estou convencido, pode ser obtido a partir de uma análise linguística computacional e científica, tomando como base o que vem sendo feito há algum tempo na biologia molecular. O DNA, afinal, consiste em informação codificada em caracteres especifícos: A, C, G e T. O DNA é um vocabulário e as ferramentas computacionais de mineração de textos têm feito avanços fantásticos nos últimos anos. É hora de utilizar esta tecnologia no estudo da própria linguística.


Em nossa analogia biologia-linguística, está claro também que o equivalente a uma espécie seria o idioma. A mesma briga que existe entre os taxônomos para decidir quando chamar um organismo como espécie diferente é a briga que há entre linguístas para definir as fronteiras de uma língua. É sempre uma questão de definir limites e métricas estudadas e enviesadas para realizar a separação conceitual. De qualquer modo, no mundo real, não há esta barreira de espécie ou linguística e todos os organismos e línguas interagem entre si de uma forma emaranhante. As línguas ainda mais do que as espécies.


A criação de novas palavras ou genes é coisa que acontece a todo instante a partir da junção de partes de entidades anteriormente existentes. Se a nova entidade mista é ruim, a seleção natural a removerá do conjunto de entidades (palavras ou genes) existentes. Se ela é boa, provavelmente se replicará e passará a ocupar cada vez mais o vocabulário do falante. Além do mais, com relação às palavras há também um vocabulário fonético internacional, de acordo com o qual palavras podem ser agrupadas de acordo com seus sons. A leitura de poesias e canções através desta técnica pode nos permitir classificá-las foneticamente em grupos que talvez revelem padrões de ordem definidos. Podemos assim talvez traduzir poesias de uma língua em outra pelo conhecido grupo fonético, ao vez de apelarmos assim tão fortemente para o significado. Não são a poesia e música a expressão maior dos sentimentos? Será que sentimentos podem ser realmente traduzidos através de significados estritos? A boa tradução é quase sempre a tradução mais livre possível; ela é, de fato, uma outra obra, de um outro autor. Não acredite em livros traduzidos, leia-os no original, sempre que possível.

-- BRAINSTORM --


Um pouco ainda além, o que me despertou essa idéia foi a leitura do livro de Freud "A psicopatologia da vida cotidiana". Ele dizia que havia se esquecido o nome de um pintor e colocou uma série de palavras cujo fonema está relacionado para tentar explicar como havia reprimido seu pensamento sobre o assunto. Talvez ao examinarmos as línguas, podemos conhecer seus povos, a partir de uma antropolinguística. Parece-me um trabalho imenso, complexo e que pode ser facilmente questionável, mas talvez nos permita identificar, em cada cultura, quais tipos de pensamentos que a língua -- através de associações fonéticas -- evita que sejam lembradas. Cão e mão possuem associação fonética no português, mas não no inglês hand, dog. Poderá esse tipo de relação e desrelação fonética revelar algo sobre a cultura dos povos?

--


Nos jornais e e-mails pessoais e livros contemporâneos aprenderemos sobre a expressão de palavras. Quais são mais usadas em cada labirinto cultural específico. Ao pegarmos o conjunto de obras de um certo tempo, num certo estado, poderemos reconstituir a forma como falavam as classes alta e baixa. Poderemos saber dos desniveis sociais e teremos idéia sobre como as palavras e a gramática evoluíram. Podemos também classificar as frases gramaticamente, de acordo com a ordem de sujeito e verbo e objeto e adjetivo. Consideremos frases como vias bioquímicas onde cada proteína interage com outra por um bem comum: quebrar o açúcar; ou onde palavras interagem com outras para outro bem comum: a compreensão. A visão da biologia molecular e da biologia computacional sobre a linguística é de uma fertilidade inominável.


Alguém está disposto a financiar um estudante de linguística computacional?


===

[1] Freud, . Psicopatology of everyday life.
[2] Blackmore, S. The meme machine.
[3] De fato, pode-se vislumbrar algum método para compreender melhor a evolução de organismos que se reproduzam rápida e promiscuamente (como os vírus) utilizando modelos de palavras, caso eles sejam produzidos algum dia.

Marcadores:

2 Comments:

Blogger IcaroReverso said...

uau, que medo da ciência e que admiração sinto pelo cientista!

tenho medo da filosofia analítica, das correspondências estruturalistas entre linguagem e mundo. E tenho medo de mim. Tenho medo da suplantação da psicologia em prol de uma gramática universal, tenho medo de ser quantificado mesmo sabendo que minha libido é um quantum. Tenho medo de ser codificado, mesmo sabendo que estou abarcado num corpo dentro de corpos, numa sucessão finita maior que eu.

o limite é o corpo. por isso admiro o biólogo. e seus esquemas hediondos. pagaria um café por uma prosa plural. se não é possível, alguma visita às tuas terras blogueiras.

abraços, com admiração, Ícaro

2:21 PM  
Anonymous Anônimo said...

Que orgulho trilhar os caminhos do saber com essa figuraça.
Um dos arautos da ciência. Por sinal, um dos mais eloqüentes já que conheci.
Grande abraço da sua aluna Edjane (Biologia Molecular 4AB - UCB)
Professor... Precisava muito tirar uma dúvida. Será que poderia me passar seu e-mail? Grata!
edjane.ucb1@gmail.com

1:46 PM  

Postar um comentário

<< Home