T I P

Text & Information Processing

  • Increase font size
  • Default font size
  • Decrease font size
English
Home Projects with students Catalogador automático de neologismos sufijales y prefijales - CANeo TIP

Catalogador automático de neologismos sufijales y prefijales - CANeo TIP

There are no translations available.

Proyecto fin de carrera terminado en julio de 2012

Autor: Raúl Jiménez Estupiñán

Tutor: Francisco Javier Carreras Riudavets

Haz click aquí para acceder al CANeo TIP

Un neologismo es una palabra nueva que aparece en una lengua, ya sea procedente de otra lengua o de nueva creación. La creación de neologismos se produce por modas y necesidades de nuevas denominaciones. Desde el punto de vista del purismo, hay neologismos innecesarios, como los que alargan las palabras convirtiéndolas en archisílabos, pero también hay otros neologismos necesarios como "bonobús" o "seropositivo". Hoy en día, los medios de comunicación son los principales propagadores de los neologismos y los préstamos lingüísticos. Algunos de estos términos tienen una vida efímera  (http://es.wikipedia.org/wiki/Neologismo)

Se pretende diseñar e implementar una aplicación web capaz de detectar un alto porcentaje de neologismos en el español actual, mediante el estudio y aplicación de las reglas de formación de palabras a través de los procesos sufijación y prefijación. El objetivo principal de este proyecto es el desarrollo de una aplicación web que detecte el mayor porcentaje posible de neologismos del español actual que se hayan formado mediante los procesos de sufijación o prefijación. Esta herramienta puede ser integrada en la Sociedad de la Información para adaptar los tiempos de estudio y tratamiento de estas nuevas palabras a la velocidad con que se genera texto en el mundo de las Tecnologías de la Información. El segundo objetivo es describir el comportamiento de los sufijos y prefijos más productivos para la formación de palabras en español, mediante el estudio de un volumen de palabras suficientemente representativo.

  • Definir un modelo de datos relacional, sin ambigüedades, capaz de almacenar toda la información. El modelo debe contemplar las distintas entidades, las relaciones de consistencia, integridad referencial, validaciones, etc.
  • Definir un modelo de software aplicando los criterios aprendidos durante la carrera. Poniendo en práctica la programación modular, comentarios, las bases para la reutilización del código, haciendo uso de las distintas fases del ciclo de vida del software, aplicar criterios de calidad, etc.
  • Implementar un motor sobre una plataforma que permita su ejecución en Internet, para que pueda estar disponible de forma discrecional, usando lenguajes de programación actuales y compatibles con las nuevas tecnologías.
  • Diseñar y desarrollar una interfaz gráfica de acceso a la información léxica, sencilla y de fácil manejabilidad, mediante un motor basado principalmente en reglas que tenga en cuenta las relaciones entre los distintos elementos que integran la información léxica. Esta interfaz gráfica debe ser compatible con los navegadores actuales, de tal forma, que se acceda a la información a través de Internet.

En la etapa de análisis se aplicarán técnicas y herramientas de Ingeniería del Software, utilizando el lenguaje de modelado UML (Universal Modelling Language) que ofrece un estándar para describir un modelo del sistema, incluyendo aspectos conceptuales tales como procesos y funciones, y aspectos como expresiones de lenguajes de programación, esquemas de bases de datos y componentes reutilizables.

El enfoque metodológico, será el modelo de prototipos, en el que se abordarán las distintas fases considerando la realimentación una vez finalizado cada uno de ellos. Salvo la etapa de documentación que se irá completando a lo largo de la realización del proyecto.

La planificación y coordinación de las actividades del proyecto y de los recursos se realizarán haciendo uso de diagramas de Gantt con los cuales se mostrará el tiempo de dedicación previsto para diferentes tareas y actividades a lo largo del tiempo.