David Pérez Fernández, del Gabinete del Secretario de Estado de Telecomunicaciones y para la Sociedad de la Información del Ministerio de Industria, Energía y Turismo (MINETUR), intervino en Big Boom Data: La explosión de los datos para hablar de las ventajas de usar técnicas Big Data para tratar texto libre e impulsar el desarrollo de las tecnologías del lenguaje.
Dentro de su discurso trató el Plan de Impulso de las Tecnologías del Lenguaje, que incluye el desarrollo de infraestructuras lingüísticas, actuaciones destinadas a impulsar la industria de las tecnologías del lenguaje, el papel de la Administración como impulsor de estos proyectos y los campos específicos donde aplicar estas tecnologías.
Big Data en el sector TIC
El sector TIC es un sector muy dinámico y con alto grado de especialización, presente en ámbitos productivos y sociales muy diversos. Se caracteriza además por sus carencias en el conocimiento estadístico: sector mal censado, retraso en la elaboración de estadísticas, escasa granularidad de información, cruce de clasificaciones. Por todo ello, es necesario mejorar el conocimiento del sector TIC para diseñar políticas públicas más eficaces.
Mejorar el procedimiento de ayudas a la I+D+i en TIC ayudaría a tener una visión de conjunto del sistema de fomento de la investigación, desarrollo e innovación, evaluar multitud de tecnologías y proyectos y contrastar el contenido de las ayudas solicitadas con las concedidas por otros organismos.
A través de técnicas de Procesamiento de Lenguaje Natural, se desarrollan corpus lingüísticos para comparar temáticas y crear modelos que puedan detectar similitudes entre las ayudas y patentes presentadas a diferentes organismos del estado, y así poder ver si se han duplicado peticiones en diferentes organismos. Los objetivos principales de estas acciones son asistir al evaluador en la tarea de examen de patentes y mejorar la visión de conjunto de una colección de patentes.
Plan de Impulso de las Tecnologías del Lenguaje
El Plan de Impulso de las Tecnologías del Lenguaje persigue elaborar y ejecutar un plan de desarrollo de infraestructuras lingüísticas de propósito general en español y lenguas cooficiales. Se pretende con ello impulsar la industria de las Tecnologías del Lenguaje para una mejora de la visibilidad y de la transferencia del sector, además de apoyar su internacionalización y comercialización.
Se persigue que la Administración impulse la Industria del Lenguaje, siguiendo dos ejes de actuación: las plataformas de procesamiento de lenguaje natural y traducción automática y los recursos lingüísticos y la política de reutilización de la información. Todo esto tiene como objetivos principales promover servicios avanzados para el ciudadano y mejorar el funcionamiento de la Administración.
Finalmente, los proyectos faro donde se aplican estas tecnologías son, entre otros, el sector Salud, Justicia, Educación y Turismo, y tienen como principal objetivo la creación o mejora de la capacidad y calidad de los servicios públicos mediante la aplicación de tecnologías del lenguaje basadas en lingüística computacional y estadística que permitan realizar cálculos y análisis automático sobre cualquier tipo de dato en forma de texto para clasificar o buscar contenido no explícito y facilitar una tarea que generalmente se realiza de forma manual.