DE Universidad Nacional de Cuyo FINANCIACION DE Código

Anuncio
UNIVERSIDAD NACIONAL DE CUYO
SECRETARÍA DE CIENCIA, TÉCNICA Y
POSGRADO
PROYECTOS BIENALES
2005 – 2007
DIRECTOR:
Víctor M. Castel
Denominación del Proyecto
MODELIZACIÓN CONTEXTUAL Y LINGÜÍSTICA DEL
ABSTRACT DEL ARTÍCULO DE INVESTIGACIÓN
CIENTÍFICA, Y DESARROLLO DE UN SISTEMA DE
ESCRITURA ASISTIDA
(REDACTE IV)
Código:
Equipo:
Cristina Boccia, Ester C. Car, Ángela Diblasi, Samiah Hassan, Laura
Hlavacka, Ana M. Miret, Luis A. París y Susana Rezzano
UNIVERSIDAD NACIONAL DE CUYO
Secretaría de Ciencia, Técnica y Posgrado
FINANCIACIÓN
DE PROYECTOS
2005-2007
Código: 06/G327
1. IDENTIFICACIÓN DEL PROYECTO
1.1. Director
Apellido y Nombre :
Título Académico :
Doc. de Identidad :
Dom. Particular :
Teléfono :
Correo electrónico:
1.2.
CASTEL, Víctor Miguel
Doctor en Ciencias del Lenguaje (Especialidad: Lingüística Computacional)
LE 8.342.010.Ruta de Uspallata 2615, Luzuriaga (5513), Mendoza
0261 497 8716
Fax : 0261 428 7370
[email protected]
Co-Director
Apellido y Nombre :
MIRET, Ana María
Título Académico :
Magister en Lingüística Aplicada (Orientación: Enseñanza de Lenguas)
Doc. de Identidad :
4.714.635
Dom. Particular :
Manuel A. Sáez 766, Mendoza (5500)
Teléfono :
0261 4202395
Correo electrónico:
[email protected]
1.3.
Ubicación Académica
Unidad Académica :
Unidad Ejecutora :
Teléfono :
Correo electrónico:
1.4.
Facultad de Filosofía y Letras (UNCUYO) e INCIHUSA (CRICYT)
Departamento de Inglés y Unidad de Lingüística, respectivamente
0261 4288797 (Int. 108)
Fax : 0261 4287370
[email protected]
Denominación del Proyecto
MODELIZACIÓN CONTEXTUAL Y LINGÜÍSTICA DEL ABSTRACT DEL ARTÍCULO DE INVESTIGACIÓN
CIENTÍFICA EN INGLÉS, Y DESARROLLO DE UN SISTEMA DE ESCRITURA ASISTIDA. REDACTE IV.
1.5. Palabras Clave
Text Generation; Scientific Discourse; Register Theory; Computer-aided Teaching/Writing.
1.6. Tipo de Actividad
Investigación básica y aplicada.
1.7. Disciplina
Lingüística; Lingüística Computacional; Lingüística Sistémica Funcional; Natural Language Processing
1.8. Campo de Aplicación
10 Desarrollo de la Educación, la Ciencia y la Cultura; 1030 Metodología de la Educación; 1050 Información y
Documentación; 1099 Otros (Tecnología de la Información Aplicada a la Enseñanza). 11 Promoción general del
conocimiento; 1180 Varias ciencias: Lingüística Aplicada, Análisis del Discurso. 12 Otros campos: Industrias de la
Lengua; Ingeniería Lingüística.
Víctor M. Castel y otros : Modelización contextual y lingüística del Abstract (REDACTE IV)
2
1.9. Resumen Técnico
Este proyecto, Redacte IV, es continuación del proyecto Redacte I-III (Castel y otros 2002, 2005) en el que se
propuso definir principios de escritura de artículos de investigación científica en inglés (AICIs) sobre la base de una
descripción sistémico-funcional formal de (i) el potencial de la estructura genérica de las diferentes secciones del AICI,
a saber: Abstract, Introduction, Method, Results, Discussion y Conclusions, y (ii) la realización lexicogramatical de las
estructuras genéricas correspondientes a cada una de esas secciones. Redacte III logró producir, a partir de una muestra
de veinte disciplinas diferentes con masa crítica de científicos practicantes en Mendoza, descripciones con un grado
relativamente alto de delicadeza, tanto a nivel de estructura genérica cuanto a nivel de realización lexicogramatical, del
Abstract; en particular, pudo caracterizar una noción general de texto apropiado y una noción específica de texto
apropiado a la disciplina en cuestión, desde una modelización que surge de aplicar la Gramática Sistémico-Funcional al
objeto de estudio, particularmente las generalizaciones relativas a la proyección de configuraciones contextuales en
estructuras lexicogramaticales. Sin embargo, Redacte III no alcanzó a elaborar los principios de escritura prometidos ni,
en consecuencia, a desarrollar una aplicación pedagógica que los utilizara en un sistema de escritura asistida por
computadora. De estos aspectos pendientes se ocupará Redacte III que tiene en consecuencia los siguientes objetivos:
(1) la formalización de un sistema de principios de escritura fundados en la descripción sistémico-funcional provista por
Redacte III, (2) la adaptación pedagógica de dicha formalización, y (3) la implementación computacional de (2) de
modo de desarrollar una aplicación informática de asistencia retórico-lingüística en la escritura del Abstract del AICI. El
propósito de la aplicación resultante es asistir a científicos cuya lengua materna no es el inglés en la organización
retórica y la expresión lingüística prototípicas de los mencionados componentes del AICI. Esta asistencia retóricolingüística facilitará a nuestros científicos la comunicación en inglés de sus contribuciones específicas en publicaciones
periódicas de las correspondientes especialidades.
2. DESCRIPCIÓN DEL PROYECTO
2.1. Estado actual de conocimientos sobre el tema (Cf. §11 para bibliografía y referencias)
Son hoy numerosos los estudios sobre el discurso científico, en particular sobre las secciones Abstract, Introduction,
Method, Results, Discussion/Conclusions del artículo de investigación científica en inglés (AICI), especialmente desde
la perspectiva de la Lingüística Sistémica Funcional. Son escasos, sin embargo, los estudios sistémico-funcionales que
describen formalmente las propiedades sistémicas y estructurales del AICI y que se ocupan de formular generalizaciones
probabilísticas sobre la relación de realización entre los niveles superiores (género y registro) y los niveles inferiores
(léxico-gramática). Por otra parte, son también numerosos los estudios sobre generación de textos en diversos dominios,
incluido el científico, pero escasos los estudios sobre la generación de AICIs que parten de una modelización que
correlacione propiedades de estratos superiores con propiedades de estratos inferiores de modo de poder usar la
gramática textual subyacente como recurso en una asistencia retórico-lingüística interactiva. Existe, entonces, por un
lado, un vacío teórico-descriptivo en materia de modelización contextual y lingüística del AICI y, por el otro, un vacío
en el campo computacional aplicado que contribuya a resolver el problema de escritura que afecta al científico cuya
lengua materna no es el inglés y que para difundir su investigación a nivel internacional debe publicar en ese idioma.
Éste es el espacio conceptual en el cual se inserta el presente proyecto, RedACTe IV (Redacción Asistida por
Computadora de Textos, Fase IV).
El proyecto, que es continuación de RedACTe I-III (Castel y otros 2002, 2005), tiene como objeto de estudio el
Abstract del artículo de investigación científica en inglés (AbAICI). Como objetivo teórico-descriptivo, RedACTe IV se
propone elaborar una modelización sistémico-funcional formal, orientada a la generación de textos, de correlaciones
sistemáticas entre las propiedades contextuales y las propiedades lingüísticas del AbAICI, y, como objetivo aplicado, la
construcción de un sistema de principios de escritura asistida de AbAICIs basado en dicha modelización.
Las generalizaciones descriptivas se construirán y validarán sobre la base de un corpus de 1000 AICIs de 10
disciplinas diferentes manipulado con las herramientas informáticas propias de la Lingüística del Corpus.
La aplicación resultante tendrá las características distintivas de (i) captar, tanto a nivel de estratos superiores cuanto
a nivel de estratos inferiores, la unidad y la diversidad de las disciplinas objeto de la modelización, (ii) adaptar e
instrumentar pedagógicamente la imprescindible conceptualización retórico-lingüística, (iii) asistir a investigadores
locales en la redacción de AbAICIs bien formados, apropiados y competitivos, y (iv) contribuir así a superar la
desventaja comparativa que, por problemas de idiomaticidad, tienen nuestros científicos para publicar en revistas
especializadas.
2.2. Formulación y fundamentación del problema a investigar
Numerosos investigadores científicos locales tienen dificultades para comunicar en inglés sus contribuciones,
particularmente en las revistas de primer nivel, debido a que los evaluadores y editores responsables de las mismas
controlan cada día más la calidad de los textos a publicar. Un buen trabajo tiene más chances de “pasar el filtro” del
referato y por tanto de aparecer en dichas publicaciones si el aporte específico del que pretende dar cuenta está bien
presentado desde el punto de vista retórico-lingüístico.
Víctor M. Castel y otros : Modelización contextual y lingüística del Abstract (REDACTE IV)
3
El aprendizaje de la escritura en inglés de artículos de investigación se produce generalmente, según confiesan los
científicos hispano-hablantes consultados, de manera autodidacta y sobre la base de la copia de expresiones de otros
artículos escritos por colegas en principio anglo-parlantes de la misma comunidad de discurso. De lo contrario, el
investigador escribe el trabajo en castellano para luego hacerlo traducir al inglés, con los correspondientes costos
materiales e incluso intelectuales (en el caso de malas traducciones).
La solución ideal sería que nuestros científicos escribieran el artículo directamente en inglés. Para lograr este ideal,
el presente proyecto se apoya en las descripciones sistémico-funcionales provistas por Redacte III sobre el potencial de
la estructura genérica y su realización lexicogramatical del Abstract del AICI. Sobre la base de una formalización de
estas descripciones, Redacte IV se propone definir un sistema de principios de escritura que pueda ser implementado en
una aplicación informática de asistencia retórico-lingüística en la escritura del Abstract del AICI. Se espera que la
aplicación resultante asista a nuestros científicos de modo que estos dispongan de ayuda computacional en el nivel de
escritura que corresponda, esto es, a nivel de organización textual o a nivel de realización lingüística de estructuras
retóricas. La aplicación debería permitir al usuario acceder a las opciones de organización retórica del Abstract
características de su comunidad de discurso y, además, indicarle cómo expresar en “buen” inglés dicha organización.
La aplicación desplegaría, aprovecharía y adaptaría pedagógicamente generalizaciones del tipo siguiente. (i) La
estructura genérica del Abstract del AICI en disciplinas de carácter experimental se compone de cuatro constituyentes
(Introducción, Metodología, Resultados y Conclusiones/Recomendaciones), de los cuales dos, Introducción y
Resultados, son obligatorios (Car (2000), Hlavacka (2004)). (ii) El tipo de procesos verbales y configuraciones
asociadas de participantes que se instancian con mayor frecuencia en este tipo de texto varía significativamente entre
constituyentes pero no entre disciplinas, con un predominio, por ejemplo, de procesos mentales en ciertas subsecciones
de la Introducción y de procesos relacionales en la sección Resultados (Hlavacka (2004)). (iii) Si en el Abstract existe
una cláusula relativa, entonces el grado de condensación de la estructura de expansión que la organiza depende de tal y
cual continuo de condensación (Poj 2000). (iv) Para la expresión de los diferentes grados de certeza en el Abstract
entran en juego dos factores fundamentales: el grado de certeza que el autor desea expresar en relación a su afirmación
(alto o bajo) y hasta qué punto el autor está dispuesto a asumir responsabilidad explícita de su afirmación; debido a que
un alto porcentaje de esas expresiones son lexicalizaciones, existe tal y cual interfaz entre los sistemas interpersonal e
ideacional que rige la realización lexicogramatical (Rezzano (1999)).
2.3. Objetivos
2.3.1. Objetivo general
Modelizar las propiedades contextuales y lingüísticas del AbAICI desde la perspectiva de la Lingüística Sistémica
Funcional, y desarrollar un software de escritura asistida basado en el modelo resultante.
2.3.2. Objetivos específicos
2.3.2.1. Teórico-descriptivos
Describir formalmente en un marco sistémico-funcional orientado a la generación de textos:
2.3.2.1.1. el potencial de la estructura genérica del AbAICI;
2.3.2.1.2. el potencial de propiedades de campo, tenor y medio asociado con (sub) constituyentes genéricos del AbAICI;
2.3.2.1.3. el potencial de propiedades semánticas y léxico-gramaticales asociado con el potencial de §2.3.2.1.2;
2.3.2.1.4. el potencial de correlaciones sistemáticas entre las representaciones que resultan de los potenciales descriptos
en §§2.3.2.1.1-2.3.2.1.3;
2.3.2.1.5. el potencial de relaciones retóricas (Mann & Thompson 1992) asociado con (sub) constituyentes genéricos del
AbAICI.
2.3.2.2. Aplicados
2.3.2.2.1. Definir formalmente un sistema de principios de escritura basado en la descripción contextual y lingüística
desarrollada en §2.3.2.1.
2.3.2.2.2. Adaptar didácticamente el sistema formal definido en §2.3.2.2.1 de modo de definir un sistema interactivo de
principios de escritura de AbAICIs que asista desde el punto de vista contextual y lingüístico a investigadores científicos
locales cuya lengua materna no es el inglés.
2.3.2.2.3. Implementar computacionalmente el sistema de escritura asistida definido en §2.3.2.2.2.
2.4. Hipótesis de trabajo
2.4.1. Modelización teórico-descriptiva
2.4.1.1. Se puede modelizar el AbAICI, en términos sistémico-funcionales orientados a la generación de textos, tanto en
los aspectos contextuales como en los aspectos lingüísticos; en particular, es posible modelizar correlaciones
sistemáticas significativas (esto es, el potencial de regularidades de realización) entre los estratos ‘superiores’ que
modelizan la organización genérica, de campo, de tenor y de medio, por un lado, y los estratos ‘inferiores’ que
modelizan la organización semántica, sintáctica, lexical y de puntuación, por el otro.
Víctor M. Castel y otros : Modelización contextual y lingüística del Abstract (REDACTE IV)
4
2.4.1.1.1. Los estratos de §2.4.1.1 pueden ser conceptualizados y formalizados en términos de estructuras de rasgos.
(Para la noción de “estructura de rasgos”, véase Pollard y Sag 1987, 1994.)
2.4.1.1.2. Las correlaciones sistemáticas existentes entre los diversos estratos pueden ser formalizadas mediante un
sistema de reglas de realización del tipo utilizado en Fawcett y otros (1993).
2.4.1.1.3. Es posible formalizar el potencial de relaciones retoricas de cada constituyente genérico del AbAICI.
2.4.2. Desarrollo de un sistema de escritura asistida
2.4.2.1. Se puede concebir principios de escritura de AbAICIs que aprovechen pedagógicamente las generalizaciones
teórico-descriptivas que se obtengan con la substanciación de §2.4.1, en particular, de §§2.4.1.2-2.4.1.3.
2.4.2.1.1. Estos principios de escritura pueden ser también formalizados mediante un sistema de implicaciones basado
en estructuras de rasgos.
2.4.2.1.2. El sistema de principios resultante de §2.4.2.1.1 puede ser implementado computacionalmente.
2.4.2.1.3. La implementación que se logre en §2.4.2.1.2 permitirá concebir, diseñar y desarrollar una aplicación
informática de asistencia contextual y lingüística interactiva en la escritura de AbAICIs destinada a investigadores
científicos cuya lengua materna no es el inglés.
2.5. Metodología
2.5.0. En general, la ejecución del proyecto estará controlada por las condiciones usuales de adecuación y verificación
de hipótesis en los niveles de la observación y la descripción, aunque en el caso que nos ocupa aplicadas a textos, y no a
oraciones sueltas; la verificación depende así de la noción de texto apropiado a una circunstancia determinada. Por otra
parte, se hará la habitual evaluación estadística de los datos que surjan de observar una muestra de AICIs construida
sobre la base de las necesidades de científicos de universidades y centros de investigación de Mendoza, San Luis y San
Juan. Se adoptará también el concepto de “probabilidad asociada a rasgos” de la Gramática de Cardiff (Fawcett 2000)
de acuerdo con la distribución observada en la muestra de AICIs.
El proyecto prevé una interacción fluida con los expertos, esto es, los investigadores, ya que éstos, por ser los
destinatarios del sistema de escritura asistida a desarrollar, cumplen la doble función de (a) proveer el conocimiento
específico de las disciplinas que practican (campo) con sus prácticas y convenciones no siempre declaradas, y (b)
plantear los problemas característicos que enfrentan a la hora de redactar un AICI para enviarlo, con pedido de
publicación, a una revista internacional.
La ejecución del proyecto está guiada por las etapas definidas en el cronograma de trabajo presentado en §2.8 de
acuerdo con lo descripto a continuación.
2.5.1. Diseño y construcción de un corpus de AICIs
2.5.1.1. El estudio seguirá los lineamientos del diseño de corpus y análisis propuestos por Sinclair 1991, 2001, de
Beaugrande 2001 y Scott 2001. Nuestro propósito es construir un corpus de AICIs de tres millones de palabras.
Destacamos que, para los parámetros actuales, un corpus de un millón de palabras de un género determinado se
considera representativo (Sinclair 2001, viii).
El diseño del corpus propiamente dicho es central en esta propuesta ya que un estudio de corpus debe comenzar con
el diseño del corpus mismo porque la calidad de los resultados obtenidos dependerá de la calidad del corpus construido
(Sinclair 1991, Barnbrook 1996). La proporción de materiales, la representatividad, la especificidad del corpus, el uso
de documentos completos y la disponibilidad en formato digital serán aspectos a controlar en el diseño. Por ello, el
corpus tendrá las siguientes características:
2.5.1.1.1. Los documentos serán seleccionados de las versiones on-line de revistas científicas de calidad, que tengan un
alto índice de impacto según lo informado por el Science Citation Index (SCI) Report.
2.5.1.1.2. El corpus contendrá documentos completos con sus respectivos componentes: Title, Abstract, Introduction,
Method, Results y Discussion/Conclusions; excluyendo los agradecimientos, leyendas, referencias y apéndices.
2.5.1.1.3. El corpus será codificado de modo que los miembros del equipo puedan acceder a los documentos completos
o a algunos de sus componentes.
2.5.1.2. Software para la manipulación del corpus
El programa utilizado para el análisis es WordSmith Tools (Scott 1999), un grupo integrado de herramientas que
posibilita la observación del comportamiento de palabras en textos. Contiene seis herramientas, cada una adecuada para
tareas específicas, tres de las cuales se utilizarán en este estudio: Wordlist, Concord and Keywords.
La herramienta denominada Wordlist genera listas de palabras en orden alfabético y de frecuencia para la
comparación lexical entre textos. Además, proporciona estadísticas tales como el número total de palabras, extensión de
las mismas y número de oraciones. La herramienta denominada Concord genera listas de palabras en su contexto de
ocurrencia, encuentra colocaciones de las mismas, identifica frases comunes, y despliega un mapa que muestra la
ubicación de la palabra en el corpus. La herramienta Keywords identifica las palabras claves en un texto determinado.
Víctor M. Castel y otros : Modelización contextual y lingüística del Abstract (REDACTE IV)
5
Se denominan palabras claves aquellas cuya frecuencia es inusualmente alta en comparación con la de otros textos más
generales, lo que le permite al usuario caracterizar un texto o un género.
2.5.2. Etiquetado y análisis del corpus
2.5.2.1. El corpus se etiquetará con las categorías de análisis de la Lingüística Sistémica Funcional adaptadas a los
objetivos teórico-descriptivos de RedACTe IV, y orientadas a una manipulación de la muestra mediante las
herramientas propias de la Lingüística del Corpus.
2.5.2.2. El análisis del corpus tendrá en cuenta lo siguientes pasos y/o aspectos:
2.5.2.2.1. Identificación y categorización de propiedades de género.
2.5.2.2.2. Identificación y categorización de propiedades de registro: campo, tenor y medio.
2.5.2.2.3. Identificación y categorización de propiedades semánticas (ideacionales, interpersonales y textuales)
asociadas sistemáticamente a las propiedades de género y de registro relevadas en §§2.5.2.2.1-2.
2.5.2.2.4. Análisis de frecuencias de elementos.
2.5.2.2.5.Identificación de elementos lexicales basada en las listas de frecuencias.
2.5.2.2.6. Selección de elementos para el análisis desde el punto de vista de frecuencia y rango como así también su
asociación a funciones particulares del género.
2.5.2.2.7. Identificacion y etiquetado de las relaciones retóricas (Mann & Thompson 1992).
2.5.3. Definición de una gramática textual del AbAICI
Para substanciar las hipótesis de §9.3.1.1, guiados por los objetivos de §9.1.2 y sustentados en los datos obtenidos en
§§2.5.2.2.1-7, se construirá una gramática textual del AbAICI, en adelante GAbAICI, del tipo propuesto en Castel
(2004). GAbAICI entonces será un sistema de reglas para la definición, mediante estructuras de rasgos a la Pollard y
Sag 1987, 1994 de:
2.5.3.1.1. el potencial de la estructura genérica del AbAICI;
2.5.3.1.2. el potencial de propiedades de campo, tenor y medio asociado con (sub)constituyentes genéricos del AbAICI
mediante reglas a la Fawcett y otros (1993);
2.5.3.1.3. el potencial de propiedades semánticas y léxico-gramaticales asociado con el potencial de §9.3.1.1.1.2, a la
Fawcett y otros (1993) y Castel y otros (2000);
2.5.3.1.4. el potencial de correlaciones sistemáticas entre las representaciones que resultan de los potenciales descriptos
en §§9.3.1.1.1.1-3 a la Fawcett y otros (1993).
2.5.3.1.5. el potencial de correlaciones entre relaciones retóricas (Mann & Thompson 1992) y consituyentes genéricos.
2.5.4. Implementación computacional de GAbAICI
La implementación computacional de GAbAICI tendrá como punto de partida la implementación de la Gramática de
Cardiff de Castel (2003). Se introducirán todas las modificaciones que resulten necesarias a los fines de RedACTe IV,
tanto en los aspectos relativos a los estratos superiores y su interacción con los estratos inferiores, cuanto a la
imprescindible extensión de la léxico-gramática. Esta implementación permitirá, por un lado, la evaluación de la
adecuación empírica de GAbAICI, y, por el otro, la utilización de GAbAICI como recurso subyacente del sistema de
escritura asistida definido en §2.5.9.3.2.
2.5.5. Definición de un sistema de escritura asistida
2.5.5.1. Definición de principios de escritura basados en GAbAICI
Las propiedades contextuales y lingüísticas del AbAICI definidas por GAbAICI serán interpretadas en RedACTe IV
como aspectos esenciales de la información/conocimiento que debería poseer un investigador para escribir AbAICIs
bien formados y apropiados. GAbAICI se usará entonces para definir un prototipo de sistema de principios que asistan
al investigador científico en la escritura de AbAICIs tanto desde el punto de vista contextual cuanto desde el punto de
vista lingüístico. Estos principios de escritura serán también formalizados mediante un sistema de implicaciones basado
en estructuras de rasgos.
2.5.5.2. Transposición didáctica
Se hará una adaptación didáctica de la conceptualización requerida para la comprensión y funcionamiento del
prototipo de sistema de escritura asistida resultante de §§2.5.9.3.2.1-2.
2.5.5.3. Documentación
La documentación relativa al prototipo de sistema de escritura resultante de §§2.5.9.3.2.1-3 se elaborará como un
texto hipervinculado de modo de facilitar la implementación informática prevista en §2.5.9.3.2.9.3.2. Por
documentación entendemos un Manual de principios de escritura asistida de AbAICIs, un Glosario de términos
retórico-lingüísticos, y un Manual de uso de la aplicación.
Víctor M. Castel y otros : Modelización contextual y lingüística del Abstract (REDACTE IV)
6
2.5.5.4. Implementación informática
La implementación informática del prototipo de sistema de escritura asistida resultante de §§2.5.9.3.2.1-4 se hará en
Visual Basic para entorno Windows. Para una eventual etapa de comercialización se prevé una implementación en C++
también para entorno Windows.
2.5.5.5. Prueba y evaluación
El prototipo de sistema de escritura asistida resultante de se probará y evaluará con investigadores seleccionados de
San Juan, San Luis y Mendoza. La selección se hará sobre la base de las disciplinas representadas en el corpus y la masa
crítica de científicos practicantes de las mismas.
2.6. Resultados previos
A continuación destacamos, muy sucintamente por razones de espacio, sólo algunos aspectos del aporte de
RedACTe I-III al problema que nos ocupa y que constituye la base sobre la que se apoya RedACTe IV. En todos los
casos, el modelo teórico adoptado es el de la Lingüística Sistémica Funcional, y los estudios se han realizado sobre una
muestra de alrededor de 700 artículos de las siguientes disciplinas o campos de investigación: Lingüística, Climatología,
Estadística, Ecología, Investigaciones en zonas áridas, Glaciología, Arquitectura, Investigaciones sobre rumiantes,
Educación en ciencia, Ingeniería de aguas residuales, Arqueología, Sociología, Genética, Agricultura, Medicina,
Recursos hídricos, Robótica y Geofísica.
2.6.1. Aspectos descriptivos generales (Car 2000, García Brizuela 2002, Hlavacka 2004, Miret 2002, 2003, Rezzano
1999)
2.6.1.1. La estructura genérica del AbAICI en disciplinas de carácter experimental se compone de cuatro constituyentes
genéricos (Introduction, Method, Results y Discussion/Conclusions), de los cuales dos, Introduction y Results, son
obligatorios (Car 2000, Hlavacka 2004).
2.6.1.2. El tipo de procesos verbales y configuraciones asociadas de participantes que se instancian con mayor
frecuencia en este tipo de texto varía significativamente entre constituyentes genéricos pero no entre disciplinas, con un
predominio, por ejemplo, de procesos mentales en ciertas subsecciones de la Introduction y de procesos relacionales en
la sección Results (Hlavacka 2004).
2.6.1.3. Para la expresión de los diferentes grados de certeza en el AbAICI entran en juego dos factores fundamentales:
el grado de certeza que el autor desea expresar en relación a su afirmación (bajo, medio o alto) y hasta qué punto el
autor está dispuesto a asumir responsabilidad explícita de su afirmación (Rezzano 1999).
2.6.1.4. La sección Conclusions en AICIs de Ingeniería de Control consta de tres movimientos, dos de los cuales son
obligatorios: el primero, Confirmación del aporte, y el segundo, Síntesis del desarrollo central. El tercer movimiento,
Proyección hacia trabajos futuros, es optativo. Los recursos lexicogramaticales para condensación y transferencia de
información desde secciones internas del AICI se concretan principalmente mediante procesos materiales dispositivos y
creativos (García Brizuela 2002).
2.6.1.5. La sección Discussion en AICIs de Medicina consta de siete movimientos, cinco de los cuales son obligatorios:
Reiteración de resultados, Interpretación de resultados, Descripción del estudio, Referencia a estudios previos y
Recomendaciones y dos son optativos: Generalización de conocimiento científico establecido y Justificación del
estudio. Los recursos lexicogramaticales varian significativamente entre constituyentes genéricos. El constituyente
central, dada su frecuencia y distribución, es Interpretación de resultados. En los AbAICI en Medicina, el potencial de
la estructura genérica consta de cuatro constituyentes obligatorios (Introduction, Methods, Results y Conclusions). La
Interpretación de resultados de la sección Discussion del AICI aparece condensada en la sección Conclusion del
AbAICI. (Miret 2002, 2003)
2.6.2. Aspectos de la modelización de correlaciones sistemáticas entre propiedades genéricas, de campo,
semánticas y sintácticas (Castel y otros 2000, Castel 2004, Hlavacka 2003)
2.6.2.1. Un sistema de generación de AICIs incluye entre sus recursos una gramática que define el potencial de
representaciones de textos que son instancias posibles del género. Estas representaciones del AICI, y del Abstract como
uno de sus componentes, pueden formalizarse como estructuras de rasgos contextuales y lingüísticos. Castel y otros
2000, y Castel 2004 presentan, de manera resumida y simplificada, una gramática de texto capaz de generar
representaciones del AbAICI que dan cuenta de algunas de sus propiedades genéricas, de registro, semánticas y
sintácticas (Hlavacka 2003). Se muestra, en particular, cómo correlacionar formalmente propiedades de estratos
semióticos superiores con propiedades de estratos inferiores hasta llegar al texto "puro y duro" que finalmente las
expresa. Dicha gramática es concebida como uno de los recursos esenciales de un sistema de generación de textos que,
dentro de los objetivos aplicados a largo plazo del Proyecto RedACTe, evolucionará hacia un sistema informático de
escritura asistida de AICIs. Si bien son todavía muchos los problemas teórico-descriptivos por resolver, muchas las
propiedades de distinto tipo y nivel que necesitan ser explicitadas y correlacionadas para los distintos componentes del
objeto de estudio, y, probablemente, importantes las dificultades que surgirán al integrar la gramática como recurso con
Víctor M. Castel y otros : Modelización contextual y lingüística del Abstract (REDACTE IV)
7
algún modelo de proceso de utilización de la misma en la producción de AICIs, estos dos trabajos demuestran la
factibilidad del proyecto.
2.6.3. Aspectos de la implementación computacional de una gramática sistémico-funcional orientada a la
generación de textos (Castel 2003)
2.6.3.1. Castel 2003 es la implementación computacional de una (versión “mini” de) gramática sistémico-funcional del
inglés orientada a la generación de textos, la Gramática de Cardiff de Robin Fawcett y Gordon Tucker. RedACTe IV, en
su compromiso de construir un sistema de escritura asistida de AbAICIs, adaptará a sus fines específicos esta
implementación computacional de acuerdo con el modelo de gramática textual definido en Castel y otros 2000, y Castel
2004
2.6.4. Aspectos de la transposición didáctica
2.6.4.1. Castel y Rezzano 2003
La secuencia siguiente de “ventanas de diálogo” está extraída de Castel y Rezzano 2003 y cumple aquí el propósito
de ilustrar esquemáticamente el tipo de interfaz con el que RedACTe III aborda el problema de la utilización y
transposición didáctica de los resultados descriptivos obtenidos en Redacte I y II. La idea central es mostrar cómo asistir
al autor-investigador con el conocimiento relevante para escribir el texto apropiado a un contexto determinado. Razones
de espacio nos impiden detallar todos los aspectos que facilitarían la comprensión del sistema resultante. Apelamos
entonces a la imaginación del lector para compensar esta limitación.
Supondremos que el autor-investigador ya ha completado, en interacción con el sistema, la redacción de las secciones
Introduction, Method y Results. Supondremos además que ahora se dispone a escribir la Interpretación de los
Resultados de la sección Discussion.
La expresión en negrita “Ventana de diálogo ...” sugiere justamente una ventana de diálogo en un entorno Windows
con el título “...”. Los puntos suspensivos encorchetados representan estadios en el proceso de interacción entre el
usuario y el sistema, es decir, otras ventanas de diálogo. La expresión subrayada es un hipervínculo que remite a otro
texto cuya función es explicar, ilustrar y ejemplificar el concepto referido por la expresión subrayada. El texto en itálica
a continuación de cada ventana de diálogo es una nota/consigna para miembros del equipo RedACTe encargados de
desarrollar las tareas correspondientes.
[...]
Ventana de diálogo “Interpretación de los resultados”
En este momento, Ud. se encuentra en situación de expresar la Interpretación de los resultados dentro de la sección
Discusión del artículo de investigación científica en Medicina que está escribiendo interactivamente con nosotros. Pues
bien, lo asistiremos en la toma de algunas decisiones relativas a la Afirmación central, primero, y a las Afirmaciones
periféricas, después, de dicha interpretación.
Mostrar en la parte de arriba de la ventana el recorrido hecho hasta este punto: Artículo/Resultados/Interpretación de
resultados; permitir que el usuario elija Pasar a la ventana de diálogo siguiente o Cancelar el proceso o Volver a la
ventana de diálogo anterior; definir hipervínculo para las expresiones subrayadas de modo que el usuario pueda
acceder a las definiciones y ejemplos correspondientes.
[...]
Ventana de diálogo “Grado de certeza en la Afirmación central”
¿Con qué grado de certeza está Ud. dispuesto a presentar la siguiente Afirmación central de la Interpretación de los
resultados: A sustain B, que produjimos interactivamente?
Mostrar en la parte de arriba de la ventana el recorrido hecho hasta este punto; permitir que el usuario elija entre
Bajo o Medio o Alto; definir hipervínculo para las expresiones subrayadas y también para las opciones ofrecidas de
modo que el usuario pueda acceder a las definiciones y ejemplos correspondientes.
Ventana de diálogo “... en la Afirmación central”
Ud. acaba de elegir un grado bajo de certeza para presentar la Afirmación central A sustain B de la Interpretación de
los resultados. Ahora es necesario que Ud. nos indique si la afirmación A sustain B es posible o aparente.
Mostrar en la parte de arriba de la ventana el recorrido hecho hasta este punto; permitir que el usuario elija entre
Posible o Aparente; definir hipervínculo para las expresiones subrayadas y también para las opciones ofrecidas de
modo que el usuario pueda acceder a las definiciones y ejemplos correspondientes.
Ventana de diálogo “... en la Afirmación central”
Víctor M. Castel y otros : Modelización contextual y lingüística del Abstract (REDACTE IV)
8
Está claro que Ud. está dispuesto a presentar la Afirmación central de la Interpretación de los resultados, A sustain
B, como una posibilidad con un grado bajo de certeza. Es necesario ahora que nos indique si desea hacer esa
presentación de manera implícita o explícita.
Mostrar en la parte de arriba de la ventana el recorrido hecho hasta este punto; permitir que el usuario elija entre
Implícita o Explícita; definir hipervínculo para las expresiones subrayadas y también para las opciones ofrecidas de
modo que el usuario pueda acceder a las definiciones y ejemplos correspondientes.
Ventana de diálogo “Efectos del compromiso del autor con la Afirmación central”
Sabemos hasta este punto de nuestro recorrido interactivo que Ud. está dispuesto a presentar la Afirmación central
de la Interpretación de los resultados, A sustain B, como una posibilidad con un grado bajo de certeza y de manera
implícita. El efecto lexicogramatical de estas decisiones sobre su compromiso con la Afirmación central es que (i) no
habrá una referencia expresa a Ud. como responsable de la afirmación, y (ii) deberá optar por alguna de las siguientes
expresiones que acompañarán a sustain en el siguiente contexto A ___ sustain B1: may/might/could/can.
Mostrar en la parte de arriba de la ventana el recorrido hecho hasta este punto; permitir que el usuario elija entre
‘may’ o ‘might’ o ‘could’ o ‘can’; definir hipervínculo para las expresiones subrayadas y también para las opciones
ofrecidas de modo que el usuario pueda acceder a las definiciones y ejemplos correspondientes.
[...]
Ventana de diálogo “Efectos del compromiso del autor con la Afirmación central”
Sabemos hasta este punto de nuestro recorrido interactivo que Ud. está dispuesto a presentar la Afirmación central
de la Interpretación de los resultados, A sustain B, como una posibilidad con un grado bajo de certeza, y de manera
explícita y subjetiva. El efecto lexicogramatical de estas decisiones sobre su compromiso con la Afirmación central es
que (i) habrá una referencia expresa a Ud. como responsable de la afirmación, y (ii) deberá optar por alguna de las
siguientes expresiones: We hypothesize that A sustains B o ... .
2.6.4.2. Boccia y Castel 2003
Una interfaz análoga se discute en Boccia y Castel 2003 en torno a las correlaciones entre propiedades genéricas, de
campo y léxico-gramaticales del movimiento Establecimiento del nicho en la Introduction de AICIs en Medicina en los
casos en que el autor-investigador comunica una “evaluación positiva de una práctica terapéutica”. El trabajo muestra
cómo realizar lexicogramaticalmente mediante grupos nominales, con variado grado de complejidad, representaciones
de campo del “tratamiento” en tanto Thing en función de Actor/Sujeto, y representaciones de campo de la “enfermedad”
en tanto Thing en función de Meta/Complemento. Por otra parte, el trabajo ilustra como desarrolar una interfaz que
utiliza esas generalizaciones sobre la realización lexicogramatical de “evaluaciones positivas de una práctica
terapéutica”.
2.7. Resultados esperados
2.7.1. Resultados strictu sensu
2.7.1.1. Teórico-descriptivos
2.7.1.1.1. Comprender la estructura del AbAICI en los aspectos contextuales y lingüísticos.
2.7.1.1.2. Comprender la relación de realización que media entre propiedades contextuales y retóricas, y entre éstas y
propiedades lexicogramaticales.
2.7.1.1.3. Obtener perspectiva para proyectar la modelización sistémico-funcional del AbAICI a otros géneros
discursivos.
2.7.1.2. Aplicados
2.7.1.2.1. Proveer a la comunidad científica hispano-hablante de un sistema informático de asistencia retórico-lingüística
en la escritura de AbAICIs.
2.7.1.2.1. Utilizar este software en la enseñanza sistemática de la escritura de AbAICIs, particularmente en cátedras y
cursos de Inglés con Propósitos Específicos dirigidos a la comunidad científica local y nacional.
2.7.2. Comunicación de los resultados
Dos o más artículos en revistas de la especialidad y/o ponencias en congresos por parte de cada uno de los miembros
del equipo de investigación.
2.7.3. Formación de recursos humanos
1
Elegido como consecuencia de otras decisiones en un recorrido interactivo anterior a éste.
Víctor M. Castel y otros : Modelización contextual y lingüística del Abstract (REDACTE IV)
9
Al finalizar el proyecto sus miembros quedarán equipados con herramientas teórico-descriptivas y aplicadas potentes
con las cuales iniciar individualmente o en grupo otros proyectos de investigación relacionados con la utilización de la
Lingüística Sistémico-Funcional y la Lingüística Computacional en la solución de problemas de comunicación y
documentación.
Víctor M. Castel y otros : Modelización contextual y lingüística del Abstract (REDACTE IV)
10
2.8.
Cronograma de actividades
Este cronograma refiere y se organiza, excepto por §2.8.19, en torno a actividades que se desprenden de §2.5.
ACTIVIDADES
2.8.1. Diseño y construcción del corpus de AICIs: §2.5.1.
2.8.2. Análisis: §2.5.2.2.1.
2.8.3. Análisis: §2.5.2.2.2.
2.8.4. Análisis: §2.5.2.2.3.
2.8.5. Análisis: §2.5.2.2.4.
2.8.6. Análisis: §2.5.2.2.5.
2.8.7. Análisis: §2.5.2.2.6.
2.8.8. Análisis: §2.5.2.2.7.
2.8.9. GAbAICI: §2.5.3.1.1.
2.8.10. GAbAICI: §2.5.3.1.2.
2.8.11. GAbAICI: §2.5.3.1.3.
2.8.12. GAbAICI: §2.5.3.1.4.
2.8.13. Implementación computacional de GAbAICI:
§2.5.4.
2.8.14. Definición principios de escritura basados en
GAbAICI: §2.5.5.1.
2.8.15. Transposición didáctica: §2.5.5.2.
2.8.16. Documentación: §2.5.5.3.
2.8.17. Implementación informática: §2.5.5.4.
2.8.18. Prueba y evaluación: §2.5.5.5.
2.8.19. Publicación de resultados
1
X
2
X
3
X
4
5
6
7
8
9
X
X
X
X
X
X
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
3. TRANSFERENCIA Y BENEFICIARIOS
La aplicación informática resultante del proyecto será utilizada, en la fase de experimentación y evaluación, por
investigadores científicos de universidades y centros de investigación de Mendoza.
Superado el período de experimentación y evaluación, que permitirá ajustar y modificar el sistema de acuerdo con el
feedback de los usuarios expertos, se harán gestiones institucionales, editoriales y de propiedad intelectual para
desarrollar una versión del software de alcance nacional para ámbitos científicos y educativos también con carácter
experimental.
De resultar exitosas estas dos fases de experimentación, se iniciarán gestiones para desarrollar una versión comercial
de alcance más amplio aún.
Víctor M. Castel y otros : Modelización contextual y lingüística del Abstract (REDACTE IV)
11
4. EQUIPO DE TRABAJO
FUNCION
DIRECTOR
CODIRECTOR
GRADO DE
FORMACION(*)
APELLIDOS Y NOMBRES
Castel, Víctor M. (CONICET y UNCUYO)
Miret, Ana M. (UNCUYO)
Boccia, Cristina (UNCUYO)
Di Blasi, Ángela (UNCUYO)
Hlavacka, Laura E. (UNCUYO)
Rezzano, Susana (UNSL)
Hassan, Samiah (UNCUYO)
Inv. formado
Inv. formado
IF
Inv. formado
Inv. formado
Inv. formado
IF
CATEGORÍA DE
INVESTIGADOR(**)
I
III
IV
II
III
III
IV
CARGO
DOCENTE
Titular, DS
Titular, DEX
Titular, DEX
Titular, DSE
Asoc., DSE
Adj., DEX
Adj., DSE
TIEMPO
SEM.
20 hs.
20 hs.
20 hs.
05 hs.
10 hs.
05 hs.
05 hs.
INTEGRANTES
(*) Indicar en caso de ser : Investigador en formación, IF ; Becario graduado, BG; Becario Alumno, BA; Becario ad honorem, BAH; Becario de Posgrado, BP; Otros :
especificar.
(**) Según lo establece el programa de incentivos.
Personal de apoyo aportado por otra institución
INSTITUCIÓN
CONICET
CONICET
APELLIDOS Y NOMBRES
Car, Ester C.
París Molina, Luis A.
FUNCION
Tareas de apoyo a la investigación
Investigación
Víctor M. Castel y otros : Modelización contextual y lingüística del Abstract (REDACTE IV)
CARGO
Prof. Principal
Becario Posdoct.
TIEMPO
SEMANAL
20 hs.
20 hs.
12
Descargar