Age prediction of Spanish-speaking Twitter users

Tortorella Pérez, Verónica Andrea

Resumen:

La predicción de la edad en la red social Twitter surge como necesidad para el mejoramiento de herramientas como pueden ser el marketing online, así como para colaborar en la detección de pedofilia en la red social, identificando a los usuarios que fingen ser menores de edad mediante el uso de perfiles falsos. En el presente trabajo se analizan diferentes soluciones a este problema, prediciendo el rango de edad de una persona a partir de una colección de textos cortos escrita por la misma. Se analizan tres tipos de atributos: metadatos del usuario, atributos de estilometría sobre el texto de los tuits y atributos resultantes de la aplicación de técnicas de Procesamiento de Lenguaje Natural sobre tuits, así como listas de suscripción las cuales contienen información acerca de los intereses del usuario. También se incluyen una serie de atributos que modelan la vinculación del perfil de Twitter con otras redes sociales. Dichos atributos recolectados son posteriormente utilizados para entrenar los modelos de Aprendizaje Automático, con el fin de predecir la edad de los usuarios y así proceder a clasificarlos en los rangos etarios definidos. Finalmente se realizó una serie de experimentos con distintos set de datos y algoritmos. Los resultados experimentales muestran que los atributos extraídos constituyen un elemento muy útil a la hora de detectar la edad de los usuarios.


Detalles Bibliográficos
2018
PROYECTOS-MI
APRENDIZAJE AUTOMÁTICO
PREDICCIÓN DE EDAD
REDES SOCIALES
TWITTER
ESPAÑOL-USO
Inglés
Universidad ORT Uruguay
RAD
http://hdl.handle.net/20.500.11968/3724
Acceso abierto
_version_ 1807261360882450432
author Tortorella Pérez, Verónica Andrea
author_facet Tortorella Pérez, Verónica Andrea
author_role author
bitstream.checksum.fl_str_mv ee8b714c08004377a493b406e30f7645
348e5cac524de73325feebafc0b5b3a4
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
bitstream.url.fl_str_mv https://rad.ort.edu.uy/bitstreams/b70c583d-fce3-43e1-85db-75a0ee1edecc/download
https://rad.ort.edu.uy/bitstreams/b270d968-6ce8-4aa8-ad5e-611b22869125/download
collection RAD
dc.contributor.advisor.none.fl_str_mv Yovine Seijas, Sergio Fabián
dc.contributor.tribunal.es.fl_str_mv Garat Baridon, Diego
Giménez, Eduardo
dc.creator.none.fl_str_mv Tortorella Pérez, Verónica Andrea
dc.date.accessioned.none.fl_str_mv 2018-04-10T08:00:46Z
dc.date.available.none.fl_str_mv 2018-04-10T08:00:46Z
dc.date.issued.es.fl_str_mv 2018
dc.description.abstract.none.fl_txt_mv La predicción de la edad en la red social Twitter surge como necesidad para el mejoramiento de herramientas como pueden ser el marketing online, así como para colaborar en la detección de pedofilia en la red social, identificando a los usuarios que fingen ser menores de edad mediante el uso de perfiles falsos. En el presente trabajo se analizan diferentes soluciones a este problema, prediciendo el rango de edad de una persona a partir de una colección de textos cortos escrita por la misma. Se analizan tres tipos de atributos: metadatos del usuario, atributos de estilometría sobre el texto de los tuits y atributos resultantes de la aplicación de técnicas de Procesamiento de Lenguaje Natural sobre tuits, así como listas de suscripción las cuales contienen información acerca de los intereses del usuario. También se incluyen una serie de atributos que modelan la vinculación del perfil de Twitter con otras redes sociales. Dichos atributos recolectados son posteriormente utilizados para entrenar los modelos de Aprendizaje Automático, con el fin de predecir la edad de los usuarios y así proceder a clasificarlos en los rangos etarios definidos. Finalmente se realizó una serie de experimentos con distintos set de datos y algoritmos. Los resultados experimentales muestran que los atributos extraídos constituyen un elemento muy útil a la hora de detectar la edad de los usuarios.
dc.description.es.fl_txt_mv Incluye bibliografía y anexos.
Incluye archivos complementarios.
dc.format.extent.es.fl_str_mv 87 p. il., fot., maps. tbls., grafs
dc.identifier.citation.es.fl_str_mv Tortorella Pérez, V. A. (2018). Age prediction of Spanish-speaking Twitter users (Desarrollo de Tesis). Universidad ORT Uruguay, Facultad de Ingeniería. Recuperado de https://rad.ort.edu.uy/handle/20.500.11968/3724
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.11968/3724
http://hdl.handle.net/20.500.11968/3724
dc.language.iso.none.fl_str_mv Inglés
eng
dc.publisher.es.fl_str_mv Universidad ORT Uruguay
dc.relation.other.es.fl_str_mv https://bibliotecas.ort.edu.uy/bibid/86825
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:RAD
instname:Universidad ORT Uruguay
instacron:Universidad ORT
dc.subject.es.fl_str_mv PROYECTOS-MI
APRENDIZAJE AUTOMÁTICO
PREDICCIÓN DE EDAD
REDES SOCIALES
TWITTER
ESPAÑOL-USO
dc.title.none.fl_str_mv Age prediction of Spanish-speaking Twitter users
dc.type.es.fl_str_mv Trabajo final de carrera
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/publishedVersion
description Incluye bibliografía y anexos.
eu_rights_str_mv openAccess
format bachelorThesis
id RAD_77924312c3ea9d70f7dc7be2e27b6954
identifier_str_mv Tortorella Pérez, V. A. (2018). Age prediction of Spanish-speaking Twitter users (Desarrollo de Tesis). Universidad ORT Uruguay, Facultad de Ingeniería. Recuperado de https://rad.ort.edu.uy/handle/20.500.11968/3724
instacron_str Universidad ORT
institution Universidad ORT
instname_str Universidad ORT Uruguay
language eng
language_invalid_str_mv Inglés
network_acronym_str RAD
network_name_str RAD
oai_identifier_str oai:rad.ort.edu.uy:20.500.11968/3724
publishDate 2018
reponame_str RAD
repository.mail.fl_str_mv rodriguez_v@ort.edu.uy
repository.name.fl_str_mv RAD - Universidad ORT Uruguay
repository_id_str 3927
spelling Yovine Seijas, Sergio FabiánGarat Baridon, DiegoGiménez, EduardoTortorella Pérez, Verónica Andrea2018-04-10T08:00:46Z2018-04-10T08:00:46Z2018Incluye bibliografía y anexos.Incluye archivos complementarios.La predicción de la edad en la red social Twitter surge como necesidad para el mejoramiento de herramientas como pueden ser el marketing online, así como para colaborar en la detección de pedofilia en la red social, identificando a los usuarios que fingen ser menores de edad mediante el uso de perfiles falsos. En el presente trabajo se analizan diferentes soluciones a este problema, prediciendo el rango de edad de una persona a partir de una colección de textos cortos escrita por la misma. Se analizan tres tipos de atributos: metadatos del usuario, atributos de estilometría sobre el texto de los tuits y atributos resultantes de la aplicación de técnicas de Procesamiento de Lenguaje Natural sobre tuits, así como listas de suscripción las cuales contienen información acerca de los intereses del usuario. También se incluyen una serie de atributos que modelan la vinculación del perfil de Twitter con otras redes sociales. Dichos atributos recolectados son posteriormente utilizados para entrenar los modelos de Aprendizaje Automático, con el fin de predecir la edad de los usuarios y así proceder a clasificarlos en los rangos etarios definidos. Finalmente se realizó una serie de experimentos con distintos set de datos y algoritmos. Los resultados experimentales muestran que los atributos extraídos constituyen un elemento muy útil a la hora de detectar la edad de los usuarios.87 p. il., fot., maps. tbls., grafsTortorella Pérez, V. A. (2018). Age prediction of Spanish-speaking Twitter users (Desarrollo de Tesis). Universidad ORT Uruguay, Facultad de Ingeniería. Recuperado de https://rad.ort.edu.uy/handle/20.500.11968/3724http://hdl.handle.net/20.500.11968/3724http://hdl.handle.net/20.500.11968/3724InglésengUniversidad ORT Uruguayhttps://bibliotecas.ort.edu.uy/bibid/86825PROYECTOS-MIAPRENDIZAJE AUTOMÁTICOPREDICCIÓN DE EDADREDES SOCIALESTWITTERESPAÑOL-USOAge prediction of Spanish-speaking Twitter usersTrabajo final de carrerainfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionreponame:RADinstname:Universidad ORT Uruguayinstacron:Universidad ORTinfo:eu-repo/semantics/openAccessFI - Master en Ingeniería - MIFacultad de IngenieríaMasterMaster en IngenieríaDesarrollo de TesisDesarrollo de Tesis (Master). Universidad ORT Uruguay, Facultad de IngenieríaTHUMBNAILMaterial completo.pdf.jpgMaterial completo.pdf.jpgGenerated Thumbnailimage/jpeg3345https://rad.ort.edu.uy/bitstreams/b70c583d-fce3-43e1-85db-75a0ee1edecc/downloadee8b714c08004377a493b406e30f7645MD53ORIGINALMaterial completo.pdfMaterial completo.pdfdescriptionapplication/pdf7961805https://rad.ort.edu.uy/bitstreams/b270d968-6ce8-4aa8-ad5e-611b22869125/download348e5cac524de73325feebafc0b5b3a4MD5120.500.11968/37242024-07-22 16:13:31.768oai:rad.ort.edu.uy:20.500.11968/3724https://rad.ort.edu.uyUniversidadhttps://www.ort.edu.uy/https://rad.ort.edu.uy/server/oai/requestrodriguez_v@ort.edu.uyUruguayopendoar:39272024-07-22T16:13:31RAD - Universidad ORT Uruguayfalse
spellingShingle Age prediction of Spanish-speaking Twitter users
Tortorella Pérez, Verónica Andrea
PROYECTOS-MI
APRENDIZAJE AUTOMÁTICO
PREDICCIÓN DE EDAD
REDES SOCIALES
TWITTER
ESPAÑOL-USO
status_str publishedVersion
title Age prediction of Spanish-speaking Twitter users
title_full Age prediction of Spanish-speaking Twitter users
title_fullStr Age prediction of Spanish-speaking Twitter users
title_full_unstemmed Age prediction of Spanish-speaking Twitter users
title_short Age prediction of Spanish-speaking Twitter users
title_sort Age prediction of Spanish-speaking Twitter users
topic PROYECTOS-MI
APRENDIZAJE AUTOMÁTICO
PREDICCIÓN DE EDAD
REDES SOCIALES
TWITTER
ESPAÑOL-USO
url http://hdl.handle.net/20.500.11968/3724