T I P

Text & Information Processing

  • Incrementar el tamaño de la fuente
  • Tamaño de la fuente predeterminado
  • Decrementar el tamaño de la fuente
Español
Inicio Proyectos con alumnos Parametrización morfológica de textos - ParamText TIP

Parametrización morfológica de textos - ParamText TIP

Proyecto fin de carrera terminado en julio de 2011

Autor: Juan Carlos Santana Herrera

Tutor: Francisco Javier Carreras Riudavets

Haz click aquí para acceder al ParamText TIP

La comunicación es un proceso que está presente a diario en la vida de las personas e influye enormemente en el desarrollo de estas, pudiendo distinguir dos tipos, la comunicación oral y la comunicación escrita, en ésta última se centra el presente proyecto. La comunicación escrita permite al escritor a través de sus textos expresar sentimientos, realidades y conocimientos, pero más importante aún, permite al lector enriquecerse de esos conocimientos y realidades. Enfrentarse a la redacción de un texto con el objetivo de comunicar algo puede parecer una tarea sencilla, pero desafortunadamente, a menudo nos encontramos con textos que no logran reflejar de forma clara la intención del autor, provocando no sólo que el lector no comprenda lo que se le pretendía comunicar sino haciéndole también perder su valioso tiempo.

Para que un texto, sea cual sea su género (literario, científico, periodístico, académico, informativo,…), consiga expresar de forma clara sus ideas debe cumplir ciertos requisitos, que son los factores que determinarán si se trata o no de un buen texto. Algunos de estos requisitos son la coherencia, cohesión, comprensión, intencionalidad, morfología, sintaxis, etc. la mayoría de los cuales implica la previa lectura del texto para poder determinar si finalmente se trata o no de un texto de calidad, ya que la mayor parte de estos requisitos son factores no cuantitativos.

Por todo ello, en la presente propuesta se propone realizar un software que tendrá una doble intencionalidad. La primera de ellas y más prioritaria (puesto que la segunda es dependiente del éxito de la primera), es que se desea obtener una aplicación que sea capaz de generar estadísticas completas de un texto basándose únicamente en sus aspectos morfológicos (sustantivos, verbos, adjetivos, artículos, determinantes, pronombres, etc.), los cuales sí son cuantificables, representando los resultados mediante gráficas que mostrarán la información solicitada por el usuario en cada momento, generando así la denominada Parametrización Morfológica del texto. Para la obtención de los datos morfológicos se valorará la utilización de sistemas o aplicaciones ya desarrolladas al efecto.

La segunda intención surge a partir de las ideas comentadas al inicio, las cuales pretenden saber si un texto es o no de calidad. Por tanto, se desea que una vez finalizada la implementación de la aplicación descrita y se pruebe su correcto funcionamiento, se genere la Parametrización Morfológica de una muestra representativa de textos que a día de hoy sean considerados textos de calidad, así como de textos considerados de baja calidad, con la intención de que a partir de los resultados obtenidos se intente, siempre que sea viable, obtener un patrón que nos permita establecer el nivel de calidad morfológica de un texto.

En resumen, la aplicación final debe generar la Parametrización Morfológica de un texto y determinar con respecto a un patrón o patrones el nivel de calidad morfológica del mismo, con lo que se pretende que el usuario pueda saber si el texto que ha escrito o pretende leer tiene calidad morfológica comparativamente con los patrones utilizados como referentes.

El objetivo de este proyecto es aumentar los recursos, disponibles en Internet, de ayuda a la generación y control de documentos. El análisis morfológico automático de textos ha evolucionado considerablemente en los últimos años, por lo que actualmente se está en disposición de implementar herramientas más avanzadas y finalistas que ayuden tanto al lector como al escritor a alcanzar mejor sus objetivos. El desarrollo de esta aplicación implicará además los siguientes objetivos concretos para el alumno:

  • Definir un modelo de software aplicando los criterios aprendidos durante la carrera. Poniendo en práctica la programación modular, comentarios, las bases para la reutilización del código, haciendo uso de las distintas fases del ciclo de vida del software, aplicar criterios de calidad, etc.
  • Diseñar y desarrollar una interfaz gráfica que muestre la información morfológica, de forma sencilla y clara. Esta interfaz gráfica debe ser compatible con los navegadores actuales, de tal forma, que se pueda usar la aplicación a través de Internet.
  • Crear una aplicación sobre una plataforma que permita su ejecución en Internet, para que pueda estar disponible de forma discrecional, usando lenguajes de programación actuales y compatibles con las nuevas tecnologías.