Cada vez más datos son recopilados de forma masiva en distintos ámbitos, como pueden ser el bancario o el médico. Estos datos son una fuente valiosa de información para la toma de decisiones, pero su tratamiento presenta un gran desafío en cuanto a su privacidad y seguridad.
Actualmente estamos familiarizados con dos tipos de mecanismos de seguridad de los datos:
- Transporte de los datos. Mecanismos que se aplican en el transporte de los datos, es decir, mientras viajan entre dos puntos de una red de comunicación. Ejemplo de ello es el protocolo TLS (Transport Layer Security).
- Almacenamiento de los datos. Mecanismos que se aplican en el almacenamiento de los datos como, por ejemplo, los algoritmos de cifrado RSA o AES.
Sin embargo, lo que ocasiona una mayor preocupación en cuanto al acceso indebido a los datos es la computación de los mismos. Actualmente, cuando se opera con datos (por ejemplo, en la evaluación de un algoritmo de machine learning) se hace en claro, es decir, con los datos sin cifrar, lo que puede ocasionar un cierto riesgo de confidencialidad.
En este escenario aparece el concepto de cifrado homomórfico, una solución para poder realizar cálculos sobre datos cifrados y así no comprometer en ningún momento el valor original de los mismos. En este artículo, explicamos qué es el cifrado homomórfico, sus aplicaciones y limitaciones.
¿Qué es el cifrado homomórfico?
El cifrado homomórfico, también llamado encriptación homomórfica por su traducción del inglés (homomorphic encryption), es una técnica que permite realizar operaciones matemáticas sobre datos cifrados sin necesidad de descifrarlos. Esta propiedad hace que sea posible preservar la privacidad y confidencialidad de los datos.
A pesar de los beneficios que aporta, las técnicas actuales se enfrentan a una gran limitación que es el número de operaciones permitidas antes de que el dato sea indescifrable. A medida que se van realizando operaciones, el ruido presente en el dato cifrado aumenta, de tal modo, que cuando supera un cierto umbral, el dato en claro no puede recuperarse.
Para reducir el nivel de ruido, existe una operación llamada bootstrapping, mediante la cual se podrían realizar “infinitas” operaciones matemáticas sobre los datos cifrados pudiendo siempre recuperar el texto en claro al final del proceso. No obstante, esta operación suele ser bastante costosa a nivel de computación.
Tipos de cifrado homomórfico
Atendiendo al número de operaciones que se pueden realizar sobre los datos, existen tres tipos distintos de cifrado homomórfico:
- Partial Homomorphic Encryption (PHE). Permite realizar solamente un tipo de operación: la suma o la multiplicación. Aunque tiene grandes limitaciones en cuanto al tipo de operaciones que se pueden realizar, para algunos casos de uso puede ser suficiente. Por ejemplo, el esquema de cifrado RSA es parcialmente homomórfico en la operación de multiplicación, aunque en la práctica, RSA no es usado.
- Somewhat Homomorphic Encryption (SHE). Permite realizar tanto operaciones de suma como de multiplicación, pero con un límite máximo de operaciones. Los esquemas BFV y CKKS son ejemplos de este tipo de cifrado homomórfico.
- Fully Homomorphic Encryption (FHE). No presenta restricciones en cuanto al tipo operaciones o cuántas se pueden realizar. Históricamente, los esquemas de cifrado FHE han sido computacionalmente muy costosos, aunque poco a poco se está logrando reducir estos costes computacionales. TFHE es un esquema de cifrado completamente homomórfico.
Aplicaciones del cifrado homomórfico
Son numerosas las aplicaciones donde se podría incluir un cifrado homomórfico, pero cabe pensar que las más lógicas son aquellas donde la privacidad y confidencialidad de los datos juegan un papel clave. A alto nivel, podemos pensar como aplicación directa una comunicación desde un cliente que quiere preservar la confidencialidad de los datos con un servidor encargado de realizar ciertas computaciones.
El sector bancario, al trabajar con datos personales, es candidato a aplicar esta tecnología. A la hora de conceder préstamos, por ejemplo, los empleados no tendrían que conocer los datos de los clientes. Y también podría ser usada en los sistemas de pago, de manera que, si la transacción tiene que salir a algún servidor de cómputo, este servidor no tenga por qué conocer los datos exactos de la misma.
A pesar de los avances, en muchas ocasiones, los modelos de machine learning evalúan datos confidenciales que tienen que ser descifrados antes de ser introducidos al modelo. Aunque es una aplicación que aún está en desarrollo, existen librerías que están tratando de adaptar modelos de machine learning para que sean compatibles con el cifrado homomórfico. Además, con el auge de los modelos LLM en el campo del Procesamiento del Lenguaje Natural (PLN), cobra una especial relevancia.
Desafíos, limitaciones y futuro del cifrado homomórfico
El cifrado homomórfico es aún una tecnología que está creciendo y necesita seguir madurando para hacer frente a sus limitaciones. Algunas de estas son:
- Rendimiento. Las operaciones que se realizan para garantizar la seguridad y privacidad de los datos suelen ser más ineficientes que los sistemas convencionales. Además, la operación de bootstrapping, que permite que los datos puedan ser descifrados antes de que superen el umbral de ruido, es todavía computacionalmente muy costosa.
- Restricciones en el tipo de datos. Algunos esquemas de cifrado solo permiten trabajar con números enteros, lo que puede ser una limitación si nuestra aplicación requiere de tipos de datos más complejos.
El futuro del cifrado homomórfico pasa por la adopción de esta tecnología por parte de la industria. Aunque actualmente sufra de las limitaciones comentadas, la continua investigación y la necesidad de preservar la seguridad de los datos hará que poco a poco se vayan implementando mejores mecanismos. Esto hace pensar que esta tecnología pueda convertirse en un estándar para ciertos sectores, como el bancario y el médico.
Así pues, aunque el cifrado homomórfico es una tecnología que presenta grandes avances en la computación segura de los datos, aún presenta ciertas limitaciones en términos de eficiencia. No obstante, la necesidad de asegurar la privacidad y confidencialidad de los datos hace que sea un área de investigación y en continuo desarrollo donde cada vez aparecen más librerías y más prometedoras. A medida que se vayan superando los obstáculos actuales y el uso de las librerías sea más sencillo, el cifrado homomórfico jugará un papel clave en la computación segura del futuro.