A computational model for interpretable visual category discovery of foliar shapes
Director
Tipo de contenido
Trabajo de grado - Doctorado
Idioma del documento
InglésFecha de publicación
2023-08-22Resumen
Los estudios de descripción morfológica de hojas son complejos en la medida que requieren de personal altamente entrenado y de la consulta de una gran cantidad de documentación disponible como i.e., sistemas de categorías visuales en manuales botánicos, libros, bases de datos en línea, herbarios, inclusive contrastar hallazgos con otros expertos. Por tanto, estos estudios demandan una inversión significativa de recursos y tienen una alta carga de trabajo manual. Por otro lado, la cantidad de botánicos disponibles y en formación no logra suplir las necesidades actuales de la creciente cantidad de informaci\'on foliar resultante de la automatización y la creciente complejidad de las preguntas de investigación. En este escenario se requieren procesos computacionales automáticos que proveen una descripción morfológica cualitativa y cuantitativa que alivian en gran medida la carga de trabajo de los expertos. La dificultad de usar enfoques automáticos en análisis morfológicos se materializa si hace falta alguna de estas funcionalidades: 1. extraer los rasgos relevantes de la forma para que puedan analizarse por separado, 2. producir categorías robustas que emergen de la representaci\'on de cada rasgo, y 3. capacidad de explicación de las categorías en el contexto del problema biológico. En este trabajo se propone una estrategia computacional para el descubrimiento de categorías de formas de hojas que ayuda a automatizar estas funcionalidades clave. Primero, un algoritmo extrae cada rasgo y lo representa de manera adecuada (contractiva) en un espacio de características (morfoespacio) específico. Luego, la muestra proyectada en el morfoespacio es analizada y organizada bajo los conceptos de vecindad, cohesión y persistencia. Este método realiza un análisis del n\'umero de grupos para todos los tama\~nos vecindad y escoge la cantidad de grupos óptima, en otras palabras, las categorías. Este sistema de categorías tiene la propiedad de explicar el fenómeno subyacente de manera cualitativa y cuantitativa. De esta forma, durante el análisis de vecindad surge el dendrograma de la categorizaci\'on. La interpretación de los resultados est\'a dada por el morfoespacio y por el dendrograma. La efectividad del enfoque propuesto se eval\'ua frente a sistemas de categorías establecidos por expertos. Los resultados evidencian que el enfoque puede producir categorizaciones razonables similares a lo reportado en el manual de Hickey. Este enfoque permitirá a los biólogos hacer descripciones cualitativas y cuantitativas de la morfología útiles en estudios de variabilidad morfológica, taxonomía, plasticidad, adaptación y ecología. (Texto tomado de la fuente)Abstract
Leaf morphological description studies are complex because they require highly trained personnel and the consultation of a large amount of available documentation, such as visual category systems in botanical manuals, books, online databases, and herbariums, and commonly should be contrasted with other experts. These studies require a significant resource investment and a high manual workload. On the other hand, the number of botanists available and in training for performing these studies cannot meet the current needs of the growing amount of foliar information resulting from automation and the increasing complexity of research questions. In this scenario, automatic computational processes are required to provide a qualitative and quantitative morphological description that significantly alleviates the experts' workload. The difficulty of using automatic approaches in morphological analysis materializes if any of these functionalities are missing: 1. extracting the relevant features from the shape so that they can be analyzed separately, 2. producing robust categories that emerge from the representation of each feature, and 3. explanatory capacity of the categories in the context of the biological problem. This work proposes a computational strategy for discovering leaf-shape categories that helps to overcome these limitations. First, an algorithm extracts each feature and represents it appropriately (contractive) in a specific feature space (morphospace). Then, the points in the morphospace are analyzed and organized under the concepts of neighborhood, cohesion, and persistence. The method accounts for these features and analyzes the number of clusters for all neighborhood sizes, and chooses the optimal number of clusters, in other words, the number of categories. This system of categories has the property of explaining the underlying phenomenon qualitatively and quantitatively. In this way, during the neighborhood analysis, the categorization dendrogram emerges. Finally, the interpretation of the results is given by the morphospace and by the dendrogram. The effectiveness of the proposed approach is evaluated against category systems established by experts. The results show that the proposed approach can produce useful categorizations similar to what is reported in Hickey's manual, a widely used botanist manual. This approach allows biologists to make qualitative and quantitative descriptions of leaf morphology, helping them to describe variability, taxonomy, plasticity, adaptation, and ecological changes.Palabras clave
Descripción Física/Lógica/Digital
ilustraciones, diagramas
Colecciones
Esta obra está bajo licencia internacional Creative Commons Reconocimiento-NoComercial 4.0.Este documento ha sido depositado por parte de el(los) autor(es) bajo la siguiente constancia de depósito