L'anàlisi lèxica de Twitter revela l'existència de regions culturals diferents als Estats Units

20 de abril de 2023

Un equip internacional d'investigadors, liderat per científics de l’IFISC (UIB-CSIC), ha fet el mapatge de les diferents regions culturals als Estats Units d'Amèrica mitjançant una anàlisi lèxica del contingut que els mateixos ciutadans pengen a les xarxes socials. Els resultats evidencien una separació clara entre les cultures del nord i del sud, influïda per la població afroamericana, així com també diferències més subtils entre l'eix est-oest i poblacions urbanes o rurals. Per obtenir les fronteres entre aquestes regions, van calcular la freqüència d'aparició de paraules en 3.300 milions de piulades geolocalitzades, entre els anys 2015 i 2021. Això els va permetre de trobar les zones on es mantenien discussions o debats sobre temes concrets. L'article s'acaba de publicar a la revista Humanities and Social Sciences Communications, del grup Nature

La idea de l'existència d'àrees culturals als Estats Units d'Amèrica s'utilitza com a cas d'estudi a diversos camps de les ciències socials. No obstant això, la selecció de característiques comunes que conformen una regió cultural pot ser arbitrària i estar influenciada per prejudicis i biaixos. Per tant, es necessita un enfocament que permeti identificar aquestes regions culturals sense prejudicis i de manera més objectiva. Aprofitar l'enorme quantitat de dades que es generen a internet, especialment a través de les xarxes socials, representa una oportunitat relativament nova i amb un potencial alt.

 Els investigadors van decidir analitzar el cas dels Estats Units per diferents motius. Un d’aquests motius és perquè disposaven d’un conjunt enorme de dades de Twitter geolocalitzades. A més, la gran majoria de nord-americans parlen el mateix idioma (anglès), una característica crucial per poder utilitzar les eines d'anàlisi. Un altre aspecte rellevant, expliquen els autors, és que la història dels EUA és relativament recent però rica i variada, així que és possible la formació de regions culturals diferents dins el mateix territori nacional. 

El mètode presentat en aquest treball es basa en el principi que l'afiliació cultural es pot inferir a partir dels temes que les persones discuteixen entre si. Com més missatges s'enviïn des d'una regió, més és l'interès de la població d'aquesta zona pels temes que contenen les piulades. Específicament, els autors van mesurar les variacions regionals en el discurs escrit a les xarxes socials estatunidenques a partir de les distribucions de freqüència de paraules de contingut en piulades geolocalitzades, per trobar les zones on uns certs temes apareixien amb més freqüència que a les altres. A partir d'aquí, es van derivar els components principals de la variació regional i es va aplicar una anàlisi jeràrquica de clusterització per obtenir les diverses àrees culturals i els temes de discussió que les defineixen. 

L'estudi va trobar una separació clara nord-sud determinada principalment per la cultura afroamericana, així com altres divisions que proporcionen una imatge completa de les àrees culturals estatunidenques modernes. Encara que el treball ha confirmat que factors com l'ètnia i la religió són importants per definir les regions culturals estatunidenques, també s'han trobat variacions substancials en la rellevància d'aquests factors de cap a cap del país. És a dir, l'estudi no sols ha permès traçar un mapa de les regions culturals, sinó que també ha identificat els factors culturals que són importants per definir aquestes regions. A més, l'anàlisi va identificar altres patrons culturals més subtils com són l'atenció a la interacció social, l'interès per activitats a l'aire lliure, la família o l'oci. La identificació d'aquests patrons suposa una novetat en l'anàlisi de la societat estatunidenca, ja que són dades difícils d'obtenir mitjançant anàlisis tradicionals.

Els autors de l'estudi conclouen que, encara que el seu mètode només ha analitzat una tipologia de l'anglès estatunidenc, podria aplicar-se a qualsevol recurs de dades massives amb valor lingüístic i proporcionar una base per obtenir una imatge més completa del paisatge cultural, tant en el cas estatunidenc com en altres països.


Louf, T., Gonçalves, B., Ramasco, J.J. et al. American cultural regions mapped through the lexical analysis of social media. Humanit Soc Sci Commun 10, 133 (2023). https://doi.org/10.1057/s41599-023-01611-3 twitter-coffee

Projectes d'investigació relacionats

APASOS

A Physics approach to sociotechnical systems: from theory to data analysis.

I.P.: Tobias Galla, Sandro Meloni, Maxi San Miguel, Raúl Toral
APASOS objective is to use mathematical and computational methods combined with data and physics thinking to model complex socio-technical systems. APASOS is organized into two workpackages (WP). WP 1 focuses on models ...

CAFECONMIEL

Corpus Automático y Fenómenos de Contacto en Mallorca: Inteligencia, Entrenamiento y Lengua

I.P.: David Sánchez
El presente proyecto tiene como objetivo avanzar en el conocimiento de la variedad de español en contacto con el catalán en Mallorca mediante la creación de un macrocorpus multiformato y la aplicación ...

Línies d'investigació relacionades


Aquesta web utilitza cookies per a la recollida de dades amb un propòsit estadístic. Si continues navegant, vol dir que acceptes la instal·lació de la cookie.


Més informació D'accord