Grigori Sidorov, Alexander Gelbukh. La resolución de correferencia con un diccionario de escenarios. Proc. CIC-99, Simposium Internacional de Computación, November 15 - 19, 1999, CIC, IPN, Mexico D.F., pp. 382-391.

 

LA Resolución de correferencia
con un diccionario de escenarios

Grigori Sidorov y Alexander Gelbukh

Laboratorio de Lenguaje Natural,
Centro de Investigación en Computación,
Instituto Politécnico Nacional,
Av. Juan de Dios Batiz s/n, esq. Mendizabal, Zacatenco,
07738 México D.F, México.
{sidorov, gelbukh}@pollux.cic.ipn.mx

 


Abstract

The paper discusses an algorithm of indirect anaphora resolution based on the use of a dictionary of prototypic scenarios associated with each headword and a thesaurus of the standard type. An example of anaphora of the type being considered is “I bough a house. The kitchen is extra large.” The structure of the prototypic scenarios dictionary is discussed: in the simplest case, the dictionary lists with each headword all the words denoting the typical or possible participants of the situation described by the headword, e.g.: religionchurch, candle, priest, pray, Bible, etc. The algorithm looks for the intersection of the scenarios of the possible anaphor and antecedent or for inclusion of one of them into the scenario of the other. Also discussed is the combination of indirect anaphora with such complications as metaphor, hyponimic relations, derivation, subordinate clauses, etc. We argue that the method can be used to detect the very fact of the presence of the anaphoric relation and thus serve to determine the actual articulation of the phrase and the coherence of the text.

Keywords: Indirect anaphora, semantic analysis, ambiguity resolution, dictionary, natural language processing.

1.     Introducción

La resolución de correferencia es una de las tareas más importantes en el procesamiento del lenguaje natural (NLP). Es necesaria en una amplia gama de tareas de NLP, de la comprensión del lenguaje a la estadística, la traducción, y elaboración de resúmenes (Aone y McKee 1993; Carretero 1987; Cornish 1996; Zorro 1987; Fretheim y Gundel 1996; Hahn, Strube, y Markert 1996; Hirst 1981; Kameyama 1997; Mitkov 1997). A veces las relaciones de correferencia se llaman anafóricas.

Hay dos casos principales de relaciones de correferencia:

 

(1) la correferencia directa, como en el discurso “he visto una nueva casa ayer. Su cocina era excepcionalmente grande” (su = de la casa) y

(2) la correferencia llamada indirecta, como en el discurso “he visto una nueva casa ayer. La cocina era excepcionalmente grande” (la cocina = de la casa), ejemplo de (Chafe 1974).

 

En el último caso, la relación de correferencia se sostiene conceptualmente entre las dos palabras diferentes, cocina y casa; nótese que no hay ninguna correferencia explícita entre estas dos palabras. Como mostramos, la correferencia se sostiene entre la palabra cocina en el texto y la palabra cocina que está introducida implícitamente en el discurso por la palabra casa. Enfocamos principalmente a resolución de correferencia indirecta que es el caso más difícil, aunque aparece en textos con menos frecuencia.

La resolución de correferencia indirecta y aún el descubrimiento de la presencia de correferencia indirecta es especialmente difícil (Erku y Gundel 1987; Gundel, Hedberg, y Zacharski 1988; Indirect Anaphora 1996; Sanford et al. 1983). El marcador más frecuente de correferencia indirecta es la categoría de determinación, expresada en español por los sustantivos con artículos determinados, también véase (Ward y Birner 1994). En el caso de correferencia directa se usan casi siempre pronombres personales, así que para los ejemplos como (1) por lo menos la presencia de correferencia es obvia. En los ejemplos como (2), sin embargo, el artículo determinado no sólo puede usarse en la función anafórica, sino en las otras posibles funciones que son déixis, contraposición, etc. (ver más adelante).

Adicionalmente, el artículo determinado no es la única manera de expresión de correferencia indirecta. Un tipo particular de marcadores de la correferencia indirecta se encuentra en las expresiones con pronombres demostrativos, como en el ejemplo “Vendí una casa. ¿Qué puedo hacer con este dinero?.” Este ejemplo es aún más complicado ya que el pronombre demostrativo puede tener más sentidos que el artículo determinado.

Así, dos problemas surgen con respecto a la correferencia indirecta: (a) descubrir la presencia de la correferencia indirecta, y (b) resolver la ambigüedad de la relación de correferencia. Sin embargo, nos acercaremos al problema en el orden opuesto: nosotros intentaremos resolver la relación de correferencia, y si nosotros tenemos éxito, consideraremos que el elemento de esta relación se descubre en el discurso. Nuestro trabajo discute una manera de resolución manejada mediante un diccionario de correferencia indirecta.

La estructura del trabajo es siguiente. Primero, nosotros consideraremos algunos ejemplos útiles. Después formularemos condiciones necesarias por haber existido una relación de correferencia indirecta basados en un diccionario de escenarios. Finalmente, nosotros discutiremos un algoritmo que use estas condiciones para descubrir esa relación en el texto.

2.     Algunos ejemplos de correferencia indirecta

Permítanos considerar los ejemplos siguientes de correferencia indirecta. Para la discusión extensa necesitamos también la información sobre la posibilidad o imposibilidad de ocurrencia de pronombres demostrativos en varios contextos. Las variantes inaceptables se marcan con un asterisco.

 

1.      Compré una casa. La/*Esta cocina (paredes, techo) era sumamente grande.

2.      Compré una casa. Las/*Estas dimensiones eran 20x20.

3.      Compré una casa. El/*Este dueño anterior estaba contento.

4.      Estaba comprando una casa. Contaba el/*este dinero cuidadosamente.

5.      Vendí una casa. ¿Qué puedo hacer yo con el/este dinero?

6.      Compré una casa. Me gustó el/este precio.

7.      Juan estaba comiendo. La/* Esta mesa estaba sucia.

8.      Juan estaba comiendo. Estaba oscuro en el/*este bosque.

9.      Juan estaba comiendo. La/Esta comida estaba deliciosa.

10.  Juan estaba comiendo. Las/Estas manzanas estaban deliciosas.

11.  Juan estaba cantando. El/Este ruido perturbó a Pedro.

12.  Juan estaba cantando. Pedro detestó el/este ruido.

13.  Juan estaba leyendo. Le gustó el/este autor.

14.  Juan se murió. La/*Esta viuda estaba loca de dolor.

 

En el ejemplo 1 la relación de la correferencia indirecta se sostiene entre la cocina y casa: la cocina es la cocina de esa casa. En cada uno de estas frases, nosotros consideramos una relación como puramente anafórica del artículo determinado o del pronombre; por lo menos estos ejemplos pueden tener este sentido. Las variantes marcadas con un asterisco no son posibles en la interpretación de correferencia.

Sin embargo, en algunos casos el artículo determinado o el pronombre demostrativo no tienen ninguna relación anafórica como la de los ejemplos anteriores y entonces no son posibles en esta interpretación :

 

15.  *Compró una casa. Las/Estas flores son bonitas.

16.  *Juan estaba comiendo. Era oscuro en el/este teatro.

17.  *Juan asistió a una ceremonia religiosa. El mulla y el rabino predicaron un sermón.

 

Por otro lado, estos ejemplos son más o menos aceptables si no hay ninguna relación anafórica entre las flores y casa, teatro y comer. En estos casos, las dos frases no pueden tener ninguna relación directa y la segunda frase puede referirse a un contexto más amplio, o su artículo determinado o pronombre pueden tener una función déictica: el portavoz simplemente puede apuntar con el dedo a las flores o puede estar en el teatro.

Particularmente interesante es el caso de los pronombres demostrativos. Aunque la mayoría de los ejemplos anteriores no permite el uso de pronombres en la interpretación anafórica, ellos parecen absolutamente razonables en otras interpretaciones:

 

18.  Compré una casa. Esta cocina (paredes, techo) era sumamente grande.

19.  Estaba comprando una casa. Contaba este dinero cuidadosamente.

 

Una de las posibles interpretaciones no-anafóricas de tales ejemplos es la contraposición: “esta cocina es grande mientras las otras cocinas no lo son;” en este caso una tensión de entonación especial se usa y no se refleja en el texto escrito. Otra posible interpretación no-anafórica es de nuevo la función déictica: el portavoz está físicamente en esta cocina o está mostrándole este dinero al oyente.

Otro ejemplo que no permite la relación anafórica es:

 

20.  *Pedro detesta que Juan estuviera comiendo aquí. La/esta mesa estaba sucia.

 

Una pregunta surge: ¿Cómo distinguir los casos de la posible relación de correferencia expresada por el artículo determinado o por el pronombre demostrativo en el discurso? ¿En qué casos semejantes la relación es posible? En las próximas secciones, nosotros discutimos algunas condiciones necesarias para esta relación.

3.     Correferencia indirecta como una referencia a un elemento del escenario

La correferencia indirecta puede pensarse como correferencia entre una palabra y una entidad que está introducida implícitamente en el texto anterior. Llamamos a tales entidades implícitas de una palabra, un escenario prototípico de esta palabra. Así, la relación de correferencia aquí es entre una palabra y un elemento del escenario prototípico de otra palabra en el texto; el elemento correspondiente no tiene la representación superficial en el texto. La idea de escenarios explícitos fue desarrollada, por ejemplo, en (Shank, Lebowitz, y Birnbaum 1980).

Hay tres posibles tipos de correferencia indirecta que dependen de las relaciones entre el antecedente y el anafor: (1) el anafor es una palabra en el texto mientras que el antecedente es un elemento de un escenario de otra palabra; éste es el caso más común, y (2) viceversa, un concepto implícito hace referencia a una palabra en el texto (un caso bastante raro), (3) la referencia se hace entre los conceptos implícitos (un caso aún más raro). Permítanos considerar los ejemplos siguientes:

 

21.  Juan estaba comiendo. La mesa estaba sucia.

22.  Juan se murió. La viuda estaba loca de dolor.

23.  Juan fue enterrado. La viuda estaba loca de dolor.

 

Aquí los artículos determinados se usan con la mesa y la viuda. Sin embargo, estas palabras (y los conceptos correspondientes) no aparecen literalmente en el discurso anterior. ¿Cuál es la razón para su determinación? Puede explicarse por la existencia de la relación de correferencia indirecta: comer – mesa, morir – viuda, enterrar – viuda. El antecedente para comer contiene en su escenario prototípico una ranura para un lugar con un posible valor de mesa en el primer ejemplo. En el segundo ejemplo el verbo morirse se incluye en el significado léxico de la palabra viuda. En el tercer ejemplo, el concepto morirse es común con los significados léxicos de viuda y enterrar.

Así, nosotros podemos formular la versión preliminar siguiente de una condición necesaria para la posibilidad de correferencia indirecta:

 

Condición 1 (preliminar). La correferencia indirecta sólo es posible si cualquiera de las siguientes condiciones se sostiene:

·        El anafor pertenece al escenario del antecedente, o

·        El antecedente pertenece al escenario del anafor, o

·        Sus escenarios se intersectan.

 

Las tres partes de la Condición 1 corresponden con los tres tipos de la correferencia indirecta y no son iguales. Así que la decisión que se tomó en base de la primera parte de Condición 1 tiene más probabilidad que una basada en la segunda. La tercera parte de Condición 1 es un caso aún más raro y el menos probable. Así, en el algoritmo cuantitativo ellas tienen probabilidades diferentes.

Permítanos notar que la correferencia indirecta puede combinar con algunos fenómenos que involucran substitución de una palabra por otra, como el uso de sinónimos, los términos más generales o más específicos (vea ejemplos 12 y 10, correspondientemente), metáfora (ejemplo 13), o cambiando la parte de la oración superficial en el discurso (derivación). Tales fenómenos son transparentes para la correferencia indirecta, aunque disminuye la adecuación de correferencia indirecta en el texto y así disminuye la fiabilidad del resultado de su descubrimiento. Probablemente, sea mayor distancia entre las nociones correspondientes, menor naturalmente sea la expresión de correferencia indirecta.

Llamaremos a las palabras que pueden sustituirse por un anafor o antecedente compatible con él. Ellos son equivalentes a la palabra básica de nuestros algoritmos. Para una palabra compatible es posible usar, por ejemplo, un sinónimo, un término más específico o más generalizado, o una metáfora de la palabra básica, aunque no cualquiera de éstos, dependiendo de un contexto específico. Las reglas para determinar compatibilidad están más allá del alcance de este artículo. Por ejemplo, la relación de compatibilidad no es simétrica: una metáfora apenas puede aparecer como un elemento del escenario, mientras su apariencia como un elemento de relación anafórica de superficie es posible. Análogamente, un término más generalizado apenas puede usarse como un anafor de la superficie mientras el antecedente oculto es su término más específico. Probablemente, las razones para esto están en el mecanismo de la correferencia indirecta cuando la presencia del concepto potencialmente introducido y su representación de superficie (y, así, el tipo de la situación) deben clarificarse en el contexto explícito, vea ejemplos 8, 10; en el ejemplo 24:

 

24.  Juan asistió a una ceremonia religiosa. Los mullas predicaron un sermón.

 

sólo la segunda frase clarifica que la ceremonia era musulmana. Estos hechos necesitan investigación extensa. Aquí, damos énfasis a que ellos tomarán en cuenta al aplicar las condiciones de la correferencia indirecta formuladas a continuación entre la compatibilidad del anafor y el antecedente.

Ahora nosotros podemos formular una versión mejorada de Condición 1:

 

Condición 1. La correferencia indirecta sólo es posible si cualquiera de las condiciones se sostienen:

·        El anafor es compatible con un elemento del escenario del antecedente, o

·        El antecedente es compatible con un elemento del escenario del anafor, o

·        Sus escenarios intersectan (en el significado de compatibilidad).

4.     Condiciones sintácticas

En este artículo, nosotros consideramos sólo relaciones de correferencia entre las palabras en frases diferentes (o partes diferentes de una frase compuesta). Una discusión interesante de la posibilidad de las relaciones anafóricas dentro de una frase simple será el tema de nuestro trabajo futuro. Aquí nosotros discutimos sólo una complicación más relacionada a las frases incluidas.

Como el ejemplo 20 muestra, la Condición 1 no es la única condición necesaria para la posibilidad de la relación anafórica. Nuestro análisis extenso se relacionó con los problemas inducidos por este ejemplo. A primera vista, la condición siguiente es adecuada:

 

Condición 2 (preliminar). La correferencia indirecta sólo es posible para el nivel semántico más alto de la situación.

 

En el ejemplo 20, el nivel más alto de la situación es “Pedro detestó” y la correferencia indirecta a la situación subordinada no es posible. El nivel semántico más alto corresponde obviamente sintácticamente a la parte principal de la frase compleja. Sin embargo, esta condición no es verdadera para el ejemplo siguiente:

 

25.  Juan se desanimó al encontrar que su automóvil no funcionaba. La/*Esta batería estaba muerta.

 

Puesto que ambos ejemplos, 20 y 25, consisten de dos frases, la diferencia entre ellos no puede depender de las relaciones de la primera y la segunda partes. Nosotros creemos que la diferencia está en el nivel de coherencia entre las dos frases. En el ejemplo 25, las dos frases son coherentes: una nueva frase puede construirse relacionándolas  con una conjunción subordinada porque. En el ejemplo 20, ninguna conjunción subordinada es aplicable. Así que nosotros podamos introducir una noción de conexión sintáctica en el sentido descrito anteriormente. Si dos frases pueden conectarse por una conjunción subordinada, entonces ellas están sintácticamente conectadas. Esta noción obviamente tiene una naturaleza discursiva y se relaciona a la coherencia del texto (Downing y Noonan 1995; Fraurud 1992, 1996; Partee y Sgall 1996; Tomlin 1987). Permítanos considerar más ejemplos para esta noción:

 

26.  Juan detestó que yo comprara una casa. La cocina (paredes, techo) era sumamente grande.

27.  Juan detestó que yo comprara una casa. El dueño anterior estaba contento.

28.  *Juan estaba satisfecho de que yo comprara una casa. Yo detesté el precio.

29.  *Detesté que Juan estuviera comiendo allí. La comida estaba deliciosa.

30.  *Estaba desanimado de que Juan estaba leyendo allí. Le gustó el autor.

31.  *Yo estaba muy frastornado por la muerte de Juan. La viuda estaba loca de dolor.

 

Los ejemplos 26 y 27 sólo son aceptables si nosotros asumimos que hay una relación causal entre las primeras y las segundas frases, es decir, si a Juan no le gustan las cocinas grandes (ejemplo 26) y por una razón desconocida odia al dueño anterior (ejemplo 27). Si no hay ninguna relación, entonces los ejemplos son inaceptables. Así, nosotros podemos modificar la Condición 2:

 

Condición 2. Si no se conectan las partes que contienen el anafor y el antecedente sintácticamente, entonces la correferencia indirecta sólo es posible para el nivel semántico más alto de la situación.

 

Desgraciadamente, hasta ahora no tenemos ningún algoritmo que descubra la conexión sintáctica. Entretanto, la Condición 2 podría justificarse por una evaluación estadística: ¿que es lo más frecuente en los textos, la presencia o ausencia del conexión sintáctica? Esto requiere investigaciones extensas, aunque nuestra evaluación muestra que las relaciones subordinadas normalmente tienen una representación de superficie. Ahora usamos la Condición 2 en nuestro algoritmo, aunque los casos donde la Condición 2 se aplicaría son bastante raros en los textos reales.

Enfatizamos que las Condiciones 1 y 2 muestran sólo la posibilidad de la correferencia indirecta pero no su presencia obligatoria, siendo así condiciones necesarias pero no suficientes.

5.     El algoritmo y el diccionario

El algoritmo para detectar la correferencia trabaja como sigue. Considera cada palabra. Si una palabra se introduce con un artículo determinado o un pronombre demostrativo, entonces es un anafor potencial, y el algoritmo intenta encontrar un antecedente creíble para él. Busca los posibles candidatos para antecedentes basándose en la distancia lineal y en la estructura del anafor potencial. En el caso más simple, es suficiente probar las palabras precedentes a la izquierda, cuyos pesos bajan conforme la distancia crece; el algoritmo se detiene cuando un antecedente se encuentra o las probabilidades son demasiado bajas. Como hemos mencionado, el algoritmo actual no prueba las palabras dentro de la misma frase simple.

Para cada antecedente potencial, se prueban las condiciones descritas antes. Como hemos discutido, en algunos casos (por ejemplo, midiendo compatibilidad) el grado de satisfacción de la condición puede determinarse como una probabilidad, en lugar de una respuesta sí-no. En ese caso, se combinan las probabilidades para las condiciones y la distancia (multiplican), y un umbral se usa para decidir cual par de las palabras pasa la prueba. Si el candidato satisface todas las condiciones aplicables, la relación anafórica se encuentra.

Para verificar la posibilidad de una relación de correferencia indirecta entre dos palabras, se usa un diccionario que lista los miembros del escenario prototípico para cada palabra. En nuestro caso, nosotros usamos un diccionario compilado de varias fuentes, como el diccionario de Clasitex (Guzmán Arenas 1998), FACTÓTUM que es el diccionario de SemNet derivado del tesauro de Roget, y algunos otros diccionarios.

Nuestro diccionario de escenarios prototípicos tiene la estructura sugerida en (Guzmán Arenas 1998), y se discutió con mayor detalle en (Gelbukh, Sidorov, y Guzmán Arenas 1999). En ese diccionario cada palabra se relaciona a las palabras que pueden significar los participantes potenciales de la situación expresadas por la palabra de la entrada para el caso más simple. No se especifican los tipos de relaciones entre las palabras lo que significa que la relación no debería ser una de las relaciones estandard predeterminadas (parte, actuante, etc.). Este tipo de conocimiento no se usa en el algoritmo. Por ejemplo, la entrada del diccionario para la palabra iglesia incluye las palabras relacionadas a ésta en uno en los diccionarios expresados arriba: sacerdote, vela, icono, oración, etc.

Para verificar a compatibilidad de palabras (sinonimia, generalización, especificación, metáfora) usamos un tesauro compilado en base al diccionario FACTÓTUM de SemNet, WordNet, y algunas otras fuentes.

6.     Conclusiones y trabajo futuro

Nosotros hemos discutido un algoritmo basado en un diccionario de filtración de posibles candidatos para los antecedentes de la correferencia indirecta expresados con un artículo determinado o, como un caso especial, con un pronombre demostrativo. A saber, el algoritmo verifica las dos condiciones: (1) la intersección entre los escenarios, (2) la posibilidad sintáctica de la relación. En la práctica, sugerimos usar este algoritmo más bien para el descubrimiento de la misma presencia de la correferencia indirecta, y no sólo para el descubrimiento del antecedente cuando la presencia de la relación anafórica se conoce.

Planeamos extender el presente trabajo de información en el diccionario. Primero, el diccionario debe incluir un tipo de “los pesos” de los elementos del escenario. Los elementos obligatorios tienen el peso más alto; sin embargo, los “optativo” pueden relacionarse más estrechamente la palabra encabezado o pueden estar más bien lejos de ella. Por ejemplo, la palabra mesa en el ejemplo 7 no es obligatoria, pero es un participante muy probable de la situación de comer. Por otro lado, la palabra bosque en el ejemplo 8 es un posible, pero no probable participante de esta situación. En el ejemplo 16, la palabra teatro parece ser imposible como un lugar de comer. Pueden obtenerse tales pesos de algunos diccionarios semánticos como el número de relaciones entre las palabras, y también de un corpus grande.

La segunda extensión al diccionario es la especificación de las alternativas. La fuente más importante de alternativas es el grupo de palabras que ocupan el mismo ranura en el escenario, o el mismo rol semántico, como asunto, lugar, etc. En el ejemplo 17, el escenario para la ceremonia religiosa incluiría como posibles participantes mulla y rabino, y la presencia de cualquiera de ellos es obligatoria, sin embargo, ellos no pueden aparecer, los dos, en el escenario prototípico. Así, el escenario debe especificar un rol que liste un curo, padre, papa, mulla, y rabino. El rol es marcado como obligatorio, pero la noción ceremonia religiosa puede ser el antecedente para sólo una palabra de esta lista. Semejantemente, el escenario de lugar para el verbo comer incluiría mesa, bosque, etc. Así, planeamos agrupar las palabras en los escenarios según su exclusividad mutua en la situación.

Agradecimiento

Este trabajo fue realizado con soporte parcial de CONACyT, SNI, CGEPI-IPN y REDII-CONACyT.

Referencias

Aone, Ch., and D. McKee. 1993. Language-independent anaphora resolution system for understanding multilingual texts. Proceedings of the 31st meeting of the ACL. The Ohio State University, Columbus, Ohio.

Ariel, M. 1988. Referring and accessibility. Journal of Linguistics, 24: 67-87.

Bosch, P. 1988. Representing and accessing focussed referents. Language and Cognitive Processes, 3: 207-231.

Carter, D. 1987. Interpreting anaphora in natural language texts. Ellis Horwood, Chichester.

Cornish, F. 1996. ‘Antecedentless’ anaphors: deixis, anaphora, or what? Some evidence from English and French. Journal of Linguistics, 32: 19-41.

Cowan, R. 1995. What are Discource Principles Made of? In P. Downing and M. Noonan (Eds.), Word Order in discource. Benjamins, Amsterdam/Philadelfia.

Chafe, W. 1976. Giveness, Contrastiveness, Definiteness, Subject, Topics, and Point of View. In Ch. N. Li (Ed.), Subject and Topic. Academic Press, New York. pp. 27-55.

Chafe, W. 1987. Cognitive Constraints in Information Flow. In R. Tomlin  (Ed.), Coherence and Grounding in Discourse. Benjamins, Amsterdam. pp. 21-51.

Chafe, W. 1994. Discourse, Consciousness, and Time. The University of Chicago Press, Chicago – London. 327 pp.

Downing, P., and M. Noonan (Eds.). 1995. Word Order in discourse. Benjamins, Amsterdam/Philadelfia. 595 pp.

Erku, F., and J. K. Gundel. 1987. The pragmatics of indirect anaphors. In J. Verschueren and M. Bertuccelli-Papi (Eds.), The pragmatic perspective: Selected papers from the 1985 International Pragmatics Conference. John Benjamins, Amsterdam. pp. 533-545.

Fox, B. A. 1987. Discourse structure and anaphora: written and conversational English. Cambridge University Press, Cambridge.

Fraurud, K. 1992. Processing noun phrases in natural discourse. Doctoral dissertation, Stockholm University, Stockholm.

Fraurud, K. 1996. Cognitive ontology and NP form. In T. Fretheim and J. K. Gundel (Eds.), Reference and referent accessibility (pp. 193-212). John Benjamins, Amsterdam.

Fretheim, T., and J. K. Gundel (Eds.). 1996. Reference and referent accessibility. John Benjamins, Amsterdam.

Gelbukh, A. F., G. Sidorov, and A. Guzmán-Arenas. 1999. Use of a Weighted Topic Hierarchy for Document Classification. Proceedings of the International Conference: Text, Solution, Dialogue (TSD’99). Prague. (to appear)

Gundel, J., N. Hedberg, and R. Zacharski. 1988. Giveness, Implicature and Demonstrative Expressions in English Discource. Proceedings of 25th meeting of Chicago Linguistic Society, Part II (Parasession on Language in Context). Chicago. pp. 89-103.

Guzmán-Arenas, A. 1998. Finding the main themes in a Spanish document. Journal Expert Systems with Applications, 14 (1, 2): 139-148.

Hahn, U., M. Strube, and K. Markert. 1996. Bridging textual ellipses. Proceedings of the 16th International Conference on Computational Linguistics. pp. 496-501.

Hellman, C. 1996. The ‘price tag’ on knowledge activation in discourse processing. In T. Fretheim and J. K. Gundel (Eds.), Reference and referent accessibility. John Benjamins, Amsterdam.

Hirst, G. 1981. Anaphora in Natural Language Understanding. Springer Verlag, Berlin.

Indirect Anaphora Workshop. 1996. Lancaster University, Lancaster.

Kameyama, M. 1997. Recognizing Referential Links: an Information Extraction Perspective. Proceedings of ACL’97/EACL’97 workshop on Operational factors in practical, robust anaphora resolution. Madrid.

Lambrecht, K. 1994. Information Structure and Sentence Form. Topic, Focus and the Mental Representation of Discource Referents. Cambridge University Press, Cambridge. 388 pp.

Mel’čuk, I. A. 1988. Dependency Synax: Theory and Practice. The State University of New York Press, Albany, New York. 428 pp.

Mel’čuk, I. A. 1999. Communicative Organization in Natural Language: The Semantic-Communicative Structure of Sentence. 380 pp. (to appear)

Mitkov, R. 1997. Factors in Anaphora Resolution: They are not the Only Things that Matter. A Case Study Based on Two Different Approaches. Proc. of the ACL’97/EACL’97 workshop on Operational factors in practical, robust anaphora resolution. Madrid.

Partee, B., and P. Sgall (Eds.). 1996. Discource and Meaning. Papers in Honour of Eva Hajičova. Benjamins, Amsterdam/Philadelphia.

Sanford, A. J., S. C. Garrod, A. Lucas, and R. Henderson. 1983. Pronouns without explicit antecedents? Journal of Semantics, 2: 303-318.

Shank, R. C., M. Lebowitz, and L. Birnbaum. 1980. An Integrated Understander. American Journal of Computational Linguistics, 6 (l): 13-30.

Tomlin, R. (Ed.). 1987. Coherence and Grounding in Discource. Benjamins, Amsterdam. 512 pp.

Ward, G., and B. Birner. 1994. Definiteness and the English existential. Language, 71: 722-742.

Yule, G. 1982. Interpreting anaphora without identifying reference. Journal of Semantics, 1: 315-322.