Estimación de la prevalencia de una pregunta sensible multicategórica en poblaciones finitas.
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2017-09-08Metadata
Show full item recordSummary
A veces, debido a la vergüenza, miedo de tener alguna consecuencia personal como recibir multas, castigo o simplemente porque las personas no quieren revelar su intimidad, los encuestados en un estudio pueden negarse a participar. Por otro lado, algunas personas que responden a la encuesta podrían dar respuestas falsas a algún tipo específico de preguntas, inclusive en estudios hechos por oficinas nacionales de estadística. Para los investigadores, en particular para los estadísticos, el primer problema se conoce como error de no respuesta y el segundo como sesgo en la respuesta. El acceso a información relacionada con una característica sensible en la población induce estos dos problemas particulares: no respuesta y sesgo en las respuestas proporcionadas. Las dos fuentes de error suelen ser un problema cuando la característica de interés a estimar corresponde a preguntas sensibles relacionadas con fenómenos como opinión sobre el aborto, violencia doméstica, eutanasia, fraude y plagio, ingresos, racismo, preferencias sexuales, evasión de impuestos, consumo de drogas, entre muchos otros. Técnicas de Respuesta Aleatorizada (TRAs) y Técnicas de Conteo de Items (TCIs) son útiles para obtener una respuesta confiable, pero también manteniendo la confidencialidad y el anonimato de los encuestados. En particular, las TRAs son diseñadas, principalmente, para estimar la prevalencia de una pregunta sensible en la población con dos respuestas posibles: sí o no. Este trabajo propone un método alternativo para estimar la prevalencia de una pregunta sensible con tres o mas categorías bajo cualquier diseño muestral complejo. Las propiedades de los estimadores propuestos son estudiadas tanto teóricamente como a través de simulaciones Monte Carlo. Una aplicación real a trabajadores administrativos de la Universidad Nacional de Colombia en Bogotá se muestra con el fin de estimar la prevalencia del acoso sexual entre ellos.Summary
Abstract: Sometimes due to embarrassment; fear of having any personal consequences as receiving fines, punishment or simply because people does not want to reveal their intimacy, the respondents in a survey can refuse to participate. On the other hand, some people answering the survey could give false answers for some specific type of questions because they do not want to reveal the truth even in surveys from national statistical offices. For researchers and in particular for statisticians, the first problem is known as a nonresponse error and the second one is known as a bias in the response. Accessing information regarding a sensitive characteristic in the population induces these two particular problems: nonresponse and non-truthful answers. The two sources of error frequently appear to be a problem when the characteristic of interest being estimated corresponds to sensitive questions related to phenomena such as abortion, domestic violence, euthanasia, fraud and plagiarism, income, racism, sexual preferences, tax evasion, use of illegal drugs, among many others. Randomized Response Techniques (RRTs) and Item Count Techniques (ICTs) are useful in order to get a trustful answer but also keeping the confidentiality of the respondents. In particular, RRTs are mostly designed in order to estimate the prevalence of a sensitive question in the population with two possible answers: yes or no. This thesis proposes an alternative method in order to estimate the prevalence of a sensitive question with three categories or more under any complex survey design. The properties of the proposed estimators are studied both theoretically and through Monte Carlo simulations. An actual application to the staff in a public university in Bogota is shown in order to estimate the prevalence of sexual harassment among them.Keywords
Collections
