Age prediction of Spanish-speaking Twitter users
Resumen:
La predicción de la edad en la red social Twitter surge como necesidad para el mejoramiento de herramientas como pueden ser el marketing online, así como para colaborar en la detección de pedofilia en la red social, identificando a los usuarios que fingen ser menores de edad mediante el uso de perfiles falsos. En el presente trabajo se analizan diferentes soluciones a este problema, prediciendo el rango de edad de una persona a partir de una colección de textos cortos escrita por la misma. Se analizan tres tipos de atributos: metadatos del usuario, atributos de estilometría sobre el texto de los tuits y atributos resultantes de la aplicación de técnicas de Procesamiento de Lenguaje Natural sobre tuits, así como listas de suscripción las cuales contienen información acerca de los intereses del usuario. También se incluyen una serie de atributos que modelan la vinculación del perfil de Twitter con otras redes sociales. Dichos atributos recolectados son posteriormente utilizados para entrenar los modelos de Aprendizaje Automático, con el fin de predecir la edad de los usuarios y así proceder a clasificarlos en los rangos etarios definidos. Finalmente se realizó una serie de experimentos con distintos set de datos y algoritmos. Los resultados experimentales muestran que los atributos extraídos constituyen un elemento muy útil a la hora de detectar la edad de los usuarios.
2018 | |
PROYECTOS-MI APRENDIZAJE AUTOMÁTICO PREDICCIÓN DE EDAD REDES SOCIALES ESPAÑOL-USO |
|
Inglés | |
Universidad ORT Uruguay | |
RAD | |
http://hdl.handle.net/20.500.11968/3724 | |
Acceso abierto |
_version_ | 1807261360882450432 |
---|---|
author | Tortorella Pérez, Verónica Andrea |
author_facet | Tortorella Pérez, Verónica Andrea |
author_role | author |
bitstream.checksum.fl_str_mv | ee8b714c08004377a493b406e30f7645 348e5cac524de73325feebafc0b5b3a4 |
bitstream.checksumAlgorithm.fl_str_mv | MD5 MD5 |
bitstream.url.fl_str_mv | https://rad.ort.edu.uy/bitstreams/b70c583d-fce3-43e1-85db-75a0ee1edecc/download https://rad.ort.edu.uy/bitstreams/b270d968-6ce8-4aa8-ad5e-611b22869125/download |
collection | RAD |
dc.contributor.advisor.none.fl_str_mv | Yovine Seijas, Sergio Fabián |
dc.contributor.tribunal.es.fl_str_mv | Garat Baridon, Diego Giménez, Eduardo |
dc.creator.none.fl_str_mv | Tortorella Pérez, Verónica Andrea |
dc.date.accessioned.none.fl_str_mv | 2018-04-10T08:00:46Z |
dc.date.available.none.fl_str_mv | 2018-04-10T08:00:46Z |
dc.date.issued.es.fl_str_mv | 2018 |
dc.description.abstract.none.fl_txt_mv | La predicción de la edad en la red social Twitter surge como necesidad para el mejoramiento de herramientas como pueden ser el marketing online, así como para colaborar en la detección de pedofilia en la red social, identificando a los usuarios que fingen ser menores de edad mediante el uso de perfiles falsos. En el presente trabajo se analizan diferentes soluciones a este problema, prediciendo el rango de edad de una persona a partir de una colección de textos cortos escrita por la misma. Se analizan tres tipos de atributos: metadatos del usuario, atributos de estilometría sobre el texto de los tuits y atributos resultantes de la aplicación de técnicas de Procesamiento de Lenguaje Natural sobre tuits, así como listas de suscripción las cuales contienen información acerca de los intereses del usuario. También se incluyen una serie de atributos que modelan la vinculación del perfil de Twitter con otras redes sociales. Dichos atributos recolectados son posteriormente utilizados para entrenar los modelos de Aprendizaje Automático, con el fin de predecir la edad de los usuarios y así proceder a clasificarlos en los rangos etarios definidos. Finalmente se realizó una serie de experimentos con distintos set de datos y algoritmos. Los resultados experimentales muestran que los atributos extraídos constituyen un elemento muy útil a la hora de detectar la edad de los usuarios. |
dc.description.es.fl_txt_mv | Incluye bibliografía y anexos. Incluye archivos complementarios. |
dc.format.extent.es.fl_str_mv | 87 p. il., fot., maps. tbls., grafs |
dc.identifier.citation.es.fl_str_mv | Tortorella Pérez, V. A. (2018). Age prediction of Spanish-speaking Twitter users (Desarrollo de Tesis). Universidad ORT Uruguay, Facultad de Ingeniería. Recuperado de https://rad.ort.edu.uy/handle/20.500.11968/3724 |
dc.identifier.uri.none.fl_str_mv | http://hdl.handle.net/20.500.11968/3724 http://hdl.handle.net/20.500.11968/3724 |
dc.language.iso.none.fl_str_mv | Inglés eng |
dc.publisher.es.fl_str_mv | Universidad ORT Uruguay |
dc.relation.other.es.fl_str_mv | https://bibliotecas.ort.edu.uy/bibid/86825 |
dc.rights.none.fl_str_mv | info:eu-repo/semantics/openAccess |
dc.source.none.fl_str_mv | reponame:RAD instname:Universidad ORT Uruguay instacron:Universidad ORT |
dc.subject.es.fl_str_mv | PROYECTOS-MI APRENDIZAJE AUTOMÁTICO PREDICCIÓN DE EDAD REDES SOCIALES ESPAÑOL-USO |
dc.title.none.fl_str_mv | Age prediction of Spanish-speaking Twitter users |
dc.type.es.fl_str_mv | Trabajo final de carrera |
dc.type.none.fl_str_mv | info:eu-repo/semantics/bachelorThesis |
dc.type.version.none.fl_str_mv | info:eu-repo/semantics/publishedVersion |
description | Incluye bibliografía y anexos. |
eu_rights_str_mv | openAccess |
format | bachelorThesis |
id | RAD_77924312c3ea9d70f7dc7be2e27b6954 |
identifier_str_mv | Tortorella Pérez, V. A. (2018). Age prediction of Spanish-speaking Twitter users (Desarrollo de Tesis). Universidad ORT Uruguay, Facultad de Ingeniería. Recuperado de https://rad.ort.edu.uy/handle/20.500.11968/3724 |
instacron_str | Universidad ORT |
institution | Universidad ORT |
instname_str | Universidad ORT Uruguay |
language | eng |
language_invalid_str_mv | Inglés |
network_acronym_str | RAD |
network_name_str | RAD |
oai_identifier_str | oai:rad.ort.edu.uy:20.500.11968/3724 |
publishDate | 2018 |
reponame_str | RAD |
repository.mail.fl_str_mv | rodriguez_v@ort.edu.uy |
repository.name.fl_str_mv | RAD - Universidad ORT Uruguay |
repository_id_str | 3927 |
spelling | Yovine Seijas, Sergio FabiánGarat Baridon, DiegoGiménez, EduardoTortorella Pérez, Verónica Andrea2018-04-10T08:00:46Z2018-04-10T08:00:46Z2018Incluye bibliografía y anexos.Incluye archivos complementarios.La predicción de la edad en la red social Twitter surge como necesidad para el mejoramiento de herramientas como pueden ser el marketing online, así como para colaborar en la detección de pedofilia en la red social, identificando a los usuarios que fingen ser menores de edad mediante el uso de perfiles falsos. En el presente trabajo se analizan diferentes soluciones a este problema, prediciendo el rango de edad de una persona a partir de una colección de textos cortos escrita por la misma. Se analizan tres tipos de atributos: metadatos del usuario, atributos de estilometría sobre el texto de los tuits y atributos resultantes de la aplicación de técnicas de Procesamiento de Lenguaje Natural sobre tuits, así como listas de suscripción las cuales contienen información acerca de los intereses del usuario. También se incluyen una serie de atributos que modelan la vinculación del perfil de Twitter con otras redes sociales. Dichos atributos recolectados son posteriormente utilizados para entrenar los modelos de Aprendizaje Automático, con el fin de predecir la edad de los usuarios y así proceder a clasificarlos en los rangos etarios definidos. Finalmente se realizó una serie de experimentos con distintos set de datos y algoritmos. Los resultados experimentales muestran que los atributos extraídos constituyen un elemento muy útil a la hora de detectar la edad de los usuarios.87 p. il., fot., maps. tbls., grafsTortorella Pérez, V. A. (2018). Age prediction of Spanish-speaking Twitter users (Desarrollo de Tesis). Universidad ORT Uruguay, Facultad de Ingeniería. Recuperado de https://rad.ort.edu.uy/handle/20.500.11968/3724http://hdl.handle.net/20.500.11968/3724http://hdl.handle.net/20.500.11968/3724InglésengUniversidad ORT Uruguayhttps://bibliotecas.ort.edu.uy/bibid/86825PROYECTOS-MIAPRENDIZAJE AUTOMÁTICOPREDICCIÓN DE EDADREDES SOCIALESTWITTERESPAÑOL-USOAge prediction of Spanish-speaking Twitter usersTrabajo final de carrerainfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionreponame:RADinstname:Universidad ORT Uruguayinstacron:Universidad ORTinfo:eu-repo/semantics/openAccessFI - Master en Ingeniería - MIFacultad de IngenieríaMasterMaster en IngenieríaDesarrollo de TesisDesarrollo de Tesis (Master). Universidad ORT Uruguay, Facultad de IngenieríaTHUMBNAILMaterial completo.pdf.jpgMaterial completo.pdf.jpgGenerated Thumbnailimage/jpeg3345https://rad.ort.edu.uy/bitstreams/b70c583d-fce3-43e1-85db-75a0ee1edecc/downloadee8b714c08004377a493b406e30f7645MD53ORIGINALMaterial completo.pdfMaterial completo.pdfdescriptionapplication/pdf7961805https://rad.ort.edu.uy/bitstreams/b270d968-6ce8-4aa8-ad5e-611b22869125/download348e5cac524de73325feebafc0b5b3a4MD5120.500.11968/37242024-07-22 16:13:31.768oai:rad.ort.edu.uy:20.500.11968/3724https://rad.ort.edu.uyUniversidadhttps://www.ort.edu.uy/https://rad.ort.edu.uy/server/oai/requestrodriguez_v@ort.edu.uyUruguayopendoar:39272024-07-22T16:13:31RAD - Universidad ORT Uruguayfalse |
spellingShingle | Age prediction of Spanish-speaking Twitter users Tortorella Pérez, Verónica Andrea PROYECTOS-MI APRENDIZAJE AUTOMÁTICO PREDICCIÓN DE EDAD REDES SOCIALES ESPAÑOL-USO |
status_str | publishedVersion |
title | Age prediction of Spanish-speaking Twitter users |
title_full | Age prediction of Spanish-speaking Twitter users |
title_fullStr | Age prediction of Spanish-speaking Twitter users |
title_full_unstemmed | Age prediction of Spanish-speaking Twitter users |
title_short | Age prediction of Spanish-speaking Twitter users |
title_sort | Age prediction of Spanish-speaking Twitter users |
topic | PROYECTOS-MI APRENDIZAJE AUTOMÁTICO PREDICCIÓN DE EDAD REDES SOCIALES ESPAÑOL-USO |
url | http://hdl.handle.net/20.500.11968/3724 |