Show simple item record

dc.rights.licenseAtribución-NoComercial 4.0 Internacional
dc.contributor.authorLópez, Freddy
dc.date.accessioned2019-06-28T09:40:46Z
dc.date.available2019-06-28T09:40:46Z
dc.date.issued2011
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/40785
dc.description.abstractEn este artículo se aplican algunos métodos de clasificación a un conjunto de textos con el objetivo de estudiar la probabilidad que el libro Novela de la tía fingida haya sido escrita por Miguel de Cervantes. Esta novela se le ha atribuido históricamente, pero existen algunas posiciones encontradas al respecto. Los métodos usados en este artículo contemplan: regresión logística, regresión logística aditiva, análisis discriminante lineal, cuadrático, regularizado, de mezclas y flexible, árboles de clasificación, método de los k-ésimos vecinos más cercanos, método de Bayes ingenuo y máquinas de soporte vectorial. Los métodos fueron calibrados y aplicados utilizando un corpus de autores contemporáneos a Cervantes (Lope de Vega, Jerónimo de Pasamonte, Alonso Fernández de Avellaneda, Mateo Alemán y Francisco de Quevedo) junto con más de cuarenta variables, principalmente palabras y signos de puntuación, medidas sobre muestras de los textos escritos por estos autores. Con respecto a estos métodos, la mayoría clasifica la obra como cervantina; sin embargo, es recomendable ampliar el corpus utilizado para el estudio e incluir más autores para la comparación.
dc.description.abstractIn this paper, some classification methods are applied to a set of texts with the aim of studying the probability that the book Novela de la tía fingida has been written by Miguel de Cervantes. This novel has been historically attributed to him but there are some encountered positions about this. The methods used in this paper range from: logistic regression, additive logistic regression, linear, quadratic, regularized, mixture and flexible discriminant analysis, classification tree, k-nearest neighbour, Naive Bayes method and support vector machines. Methods were trained and applied using a corpus of authors contemporary to Cervantes as Lope de Vega, Jerónimo de Pasamonte, Alonso Fernández de Avellaneda, Mateo Alemán, and Francisco de Quevedo and more than forty variables, mainly words and punctuation marks, measured over written texts by these authors. Respect to these methods, most of them classify the novel as another Cervantes’ work; however, is our recommendation to include more texts from these authors and more authors.
dc.format.mimetypeapplication/pdf
dc.language.isospa
dc.publisherUniversidad Nacional de Colombia
dc.relationhttp://revistas.unal.edu.co/index.php/estad/article/view/29882
dc.relation.ispartofUniversidad Nacional de Colombia Revistas electrónicas UN Revista Colombiana de Estadística
dc.relation.ispartofRevista Colombiana de Estadística
dc.relation.ispartofseriesRevista Colombiana de Estadística; Vol. 34, núm. 1 (2011); 15-37 Revista Colombiana de Estadística; Vol. 34, núm. 1 (2011); 15-37 0120-1751
dc.rightsDerechos reservados - Universidad Nacional de Colombia
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/
dc.titleDonde se muestran algunos resultados de atribución de autor en torno a la obra cervantina
dc.typeArtículo de revista
dc.type.driverinfo:eu-repo/semantics/article
dc.type.versioninfo:eu-repo/semantics/publishedVersion
dc.identifier.eprintshttp://bdigital.unal.edu.co/30882/
dc.relation.referencesLópez, Freddy (2011) Donde se muestran algunos resultados de atribución de autor en torno a la obra cervantina. Revista Colombiana de Estadística; Vol. 34, núm. 1 (2011); 15-37 Revista Colombiana de Estadística; Vol. 34, núm. 1 (2011); 15-37 0120-1751 .
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.subject.proposalanálisis discriminante
dc.subject.proposalárboles de clasificación
dc.subject.proposalmáquinas de aprendizaje
dc.subject.proposalregla de Bayes
dc.subject.proposalregresión logística
dc.subject.proposalvalidación cruzada
dc.subject.proposalBayes rule
dc.subject.proposalClassification tree
dc.subject.proposalCross validation
dc.subject.proposalDiscriminant Analysis
dc.subject.proposalLogistic regression
dc.type.coarhttp://purl.org/coar/resource_type/c_6501
dc.type.coarversionhttp://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.contentText
dc.type.redcolhttp://purl.org/redcol/resource_type/ART
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Atribución-NoComercial 4.0 InternacionalThis work is licensed under a Creative Commons Reconocimiento-NoComercial 4.0.This document has been deposited by the author (s) under the following certificate of deposit