Design of Fault Tolerant Embedded Systems using Approximate Computing Techniques.
Tipo de contenido
Trabajo de grado - Doctorado
Idioma del documento
InglésFecha de publicación
2023-11-08Abstract
Due to technological scaling, the susceptibility of modern systems to radiation effects has been steadily increasing. Consequently, it has become essential to protect systems against such faults. While these faults, referred to as soft errors, can be transient rather than permanent, they can disrupt system behavior, leading to malfunctions or crashes in electronic systems. Researchers have proposed fault tolerance techniques encompassing various approaches to address this problem. These techniques range from modifying chip materials and manufacturing processes to alternative design-level solutions. Such design-level alternatives include mitigation approaches based on hardware, software, or a combination of both, commonly known as hybrid methods. However, many of these techniques rely on redundancy, which imposes significant computational overhead. To address this challenge, Approximate Computing (AC) techniques have gained attention as an alternative to reduce the overhead associated with transient faults mitigation. These proposals have demonstrated that AC can improve efficiency by balancing fault coverage, overheads, and result accuracy. However, most of these proposals focus primarily on the circuit level, requiring physical modifications to the system or specific implementation requirements tailored to particular solutions. In this thesis, we present FTxAC, a novel strategy for designing radiation-induced fault-tolerant embedded systems that aims to reduce overheads. This strategy involves the use of approximate computing techniques in conjunction with radiation-induced fault mitigation strategies. FTxAC exhibits flexibility to incorporate various AC techniques and fault mitigation strategies. The proposed method has been thoroughly validated, considering reliability, result precision, and overheads. Fault injection experiments were conducted on four case studies encompassing various AC techniques and fault tolerance strategies. The results of these tests confirm the effectiveness of the presented design strategy. The improvements achieved in the approximation stage compensate for the overheads incurred in the hardening process. (Texto tomado de la fuente)Resumen
Debido a la escala tecnológica, la susceptibilidad de los sistemas modernos a los efectos de la radiación ha aumentado constantemente. En consecuencia, se ha vuelto esencial proteger los sistemas contra tales fallos. Si bien estos fallos, denominados \textit{soft errors}, pueden ser transitorios en lugar de permanentes, pueden alterar el comportamiento del sistema y provocar mal funcionamiento o fallas en los sistemas electrónicos. Los investigadores han propuesto técnicas de tolerancia a fallos que abarcan varios enfoques para abordar este problema. Estas técnicas van desde la modificación de materiales de chips y procesos de fabricación hasta soluciones alternativas a nivel de diseño. Estas alternativas a nivel de diseño incluyen enfoques de mitigación basados en hardware, software o una combinación de ambos, comúnmente conocidos como métodos híbridos. Sin embargo, muchas de estas técnicas se basan en la redundancia, lo que impone una importante sobrecarga computacional. Para abordar este desafío, las técnicas de Computación Aproximada (CA) han llamado la atención como una alternativa para reducir los sobrecostos asociados con la mitigación de fallos transitorios. Estas propuestas han demostrado que la CA puede mejorar la eficiencia al equilibrar la cobertura de fallas, los sobrecostos y la precisión de los resultados. Sin embargo, la mayoría de estas propuestas se centran principalmente en el nivel de circuito, lo que requiere modificaciones físicas en el sistema o requisitos de implementación específicos adaptados a soluciones particulares. En esta tesis, presentamos FTxAC, una estrategia novedosa para diseñar sistemas embebidos tolerantes a fallos inducidos por radiación que tiene como objetivo reducir los sobrecostos. Esta estrategia implica el uso de técnicas de computación aproximada junto con estrategias de mitigación de fallos inducidas por radiación. FTxAC muestra flexibilidad para incorporar varias técnicas de CA y estrategias de mitigación de fallos. El método propuesto ha sido validado exhaustivamente, considerando la confiabilidad, la precisión de los resultados y los sobrecostos. Se realizaron experimentos de inyección de fallos en cuatro estudios de caso que abarcan diversas técnicas de CA y estrategias de tolerancia a fallos. Los resultados de estas pruebas confirman la efectividad de la estrategia de diseño presentada. Las mejoras logradas en la etapa de aproximación compensan los sobrecostos incurridos en el proceso de endurecimiento.Palabras clave
Descripción Física/Lógica/Digital
ilustraciones, diagramas, fotografías
Colecciones
Esta obra está bajo licencia internacional Creative Commons Reconocimiento-NoComercial 4.0.Este documento ha sido depositado por parte de el(los) autor(es) bajo la siguiente constancia de depósito