INVESTIGACIONES EN ANÁLISIS SINTÁCTICO PARA EL ESPAÑOL

Sofía N. Galicia Haro y Alexander Gelbukh

Libro

IPN, 2007, 324 pp., ISBN 970-36-0265-7

Bajar - Contacto - Resumen - Contenido general - Contenido detallado

Bajar texto completo: PDF HTML

Contacto, más información sobre el tema y otros publicaciones de los mismos autores: aquí

Resumen: El libro introduce al lector a los formalismos sintácticos contemporáneos y presenta algunas nuevas técnicas de análisis sintáctico automático del español. Los métodos expuestos en el libro combinan las aproximaciones clásicas simbólicas con la nueva corriente en la lingüística computacional basada en el aprendizaje automático y el análisis estadístico de volúmenes muy grandes de textos. La exposición sigue la tradición conocida como la teoría Significado Û Texto. Se concentra en el análisis de las valencias sintácticas de diferentes palabras, principalmente verbos. Se presenta un método para aprendizaje automático no supervisado de un diccionario de subcategorización sintáctica, el cual se puede usar para el análisis sintáctico automático o bien como una fuente de datos en la compilación manual de un diccionario sintáctico semántico, asistida por computadora.

El libro será útil para los estudiantes y especialistas que se dedican al análisis automático del español y áreas afines —tanto para los lingüistas como para los especialistas en la computación—. Los expertos en la computación apreciarán una detallada introducción en los formalismos lingüísticos y numerosos ejemplos de diferentes fenómenos sintácticos del español, útiles en el desarrollo de los programas para el procesamiento de lenguaje natural. Los lingüistas encontrarán en este libro varios ejemplos de la utilidad del análisis computacional en la lexicografía y la elaboración de las gramáticas y diccionarios, así como los ejemplos de la aplicación de sus conocimientos para el procesamiento automático del español.

 

Índice general

 

Prefacio1

Capítulo 1 Introducción   3

Capítulo 2 Formalismos gramaticales  23

Capítulo 3 Las valencias sintácticas en el análisis del español  111

Capítulo 4 Descripción sintáctica en el análisis automático   139

Capítulo 5 Compilación de patrones de rección avanzados  193

Capítulo 6 Otras fuentes de conocimiento para el análisis sintáctico   247

Glosario   295

Vocabulario bilingüe de términos (inglés — español) 299

Índice analítico   303

Referencias  305

Apéndice: conjunto de prueba   329

  

Índice detallado

 

Prefacio1

Capítulo 1 Introducción   3

1.1    Lenguaje natural y lingüística teórica  3

1.2    Procesamiento automático de textos  6

1.3    Procesamiento de textos basado en conocimiento lingüístico  7

1.3.1    Sintaxis  10

1.3.1.1 Enfoque de constituyentes  11

1.3.1.2 Enfoque de dependencias  13

1.4    Peculiaridades sintácticas del español 16

1.5    Ambigüedades en el análisis sintáctico  17

1.6    Estructura del libro  19

Capítulo 2 Formalismos gramaticales  23

2.1    La sintaxis  23

2.2    Gramáticas generativas  27

2.2.1    Primera Etapa  27

2.2.1.1 Modelo Transformacional 28

2.2.1.2 Teoría estándar  31

2.2.1.3 Teoría estándar ampliada  32

2.2.1.4 Teoría de la rección y Ligamento (GB)  35

2.2.1.5 Gramática de estructura de frase generalizada (GPSG)  38

2.2.1.6 Gramática léxica funcional (LFG)  41

2.2.1.7 Gramática de estructura de frase dirigida por el Núcleo-H (HSPG)  45

2.2.2    Restricciones  48

2.2.2.1 Gramática categorial (CG)  49

2.2.2.2 Gramática de restricciones (GR)  51

2.2.2.3 Gramática de Adjunción de árboles (TAG)  52

2.3    Gramáticas de dependencias  54

2.3.1    Gramática de dependencias y unificación  55

2.3.2    Teoría Significado Û Texto  57

2.4    Descripción sintáctica  60

2.4.1    Subcategorización en gramáticas generativas  64

2.4.1.1 Gramática de rección y ligamento  64

2.4.1.2 GPSG   70

2.4.1.3 Subcategorización en LFG   72

2.4.1.4 Subcategorización en CG   78

2.4.1.5 Subcategorización en HPSG   84

2.4.2    Valencias sintácticas en gramáticas de dependencias  90

2.4.2.1 Valencias Sintácticas en DUG   90

2.4.2.2 Valencias Sintácticas en la MTT  95

2.4.3    Convergencia de los dos enfoques  99

2.4.4    Diccionarios para el análisis sintáctico  103

2.4.5    Revisión de enfoques para la descripción de valencias sintácticas  109

Capítulo 3 Las valencias sintácticas en el análisis del español  111

3.1    Peculiaridades sintácticas del español 111

3.2    Diversidad numérica de valencias  113

3.3    Patrones de rección  116

3.3.1    Verbos  116

3.3.1.1 Verbos sin valencias  117

3.3.1.2 Verbos con una valencia  117

3.3.1.3 Verbos con dos valencias  118

3.3.1.4 Verbos con tres valencias. 119

3.3.1.5 Verbos con cuatro valencias  120

3.3.1.6 Verbos con cinco valencias  122

3.3.2    Adjetivos y sustantivos  123

3.4    Animidad  127

3.4.1    Dependencia del objeto directo en la animidad  127

3.4.2    Uso de la animidad como marca semántica  129

3.5    Repetición limitada de valencias  131

3.6    El complemento beneficiario  134

Capítulo 4 Descripción sintáctica en el análisis automático   139

4.1    Métodos tradicionales para caracterizar formalmente las valencias  139

4.1.1    Subcategorización  139

4.1.2    Patrones de rección  141

4.1.2.1 Primera sección  141

4.1.2.2 Segunda sección  141

4.1.2.3 Tercera sección  142

4.1.2.4 Cuarta sección  143

4.2    Una gramática de contituyentes para el español 146

4.2.1    Marcas morfológicas  148

4.2.2    Desarrollo y ampliación de cobertura de la gramática  153

4.2.3    Mejora en la gramática  155

4.2.4    Verificación preliminar de la gramática  157

4.2.5    Reglas gramáticales  160

4.2.5.1 Signos convencionales de la gramática  163

4.2.5.2 Reglas de la gramática  165

4.2.6    Algoritmo de transformación de árboles de constituyentes en árboles de dependencias  174

4.2.6.1 Condiciones de transformación  174

4.2.6.2 Algoritmo básico de transformación  176

4.3    Analizador basado en constituyentes y unificación  180

4.4    Los patrones de rección avanzados, un método alternativo  185

Capítulo 5 Compilación de patrones de rección avanzados  193

5.1    Métodos lexicográficos: tradicionales y automatizados  194

5.1.1    Métodos tradicionales de compilación de diccionarios  195

5.2    Información sintáctica para los PRA   200

5.2.1    Enlace de frases preposicionales  202

5.2.2    Obtención de marcos de subcategorización  205

5.2.3    Bases del método estadístico  207

5.2.4    Deducción del modelo  210

5.2.5    Limitaciones del modelo  218

5.2.6    Afinidades con otros métodos  219

5.2.7    Proceso iterativo  220

5.3    Aplicación del método a textos reales  223

5.3.1    Proceso general 226

5.3.2    Pesos de las combinaciones y su uso  229

5.3.3    Verbos con combinaciones compiladas automáticamente  230

5.3.3.1 Tipos de elementos novedosos  231

5.3.3.2 Ruido de información. 233

5.4    Comparación de resultados de la obtención de estructuras de las valencias en forma tradicional y en forma automatizada  234

5.5    Algunas conclusiones a favor de la automatización  238

5.6    Analizador sintáctico con estadísticas de rección  240

5.6.1    Resultados de la aplicación de los pesos de combinaciones en el analizador básico  244

Capítulo 6 Otras fuentes de conocimiento para el análisis sintáctico   247

6.1    Combinación de métodos  247

6.1.1    Modelos empleados  249

6.1.2    Combinación de métodos  251

6.2    Estructura general del analizador 252

6.2.1    Patrones de rección  254

6.2.2    Reglas ponderadas  254

6.2.3    Proximidad semántica  255

6.2.4    Módulo de votación  256

6.3    Reglas ponderadas  257

6.3.1    Evaluación cuantitativa  257

6.4    Proximidad semántica  259

6.4.1    Red Semántica  259

6.4.2    Desambiguación sintáctica  264

6.4.3    Evaluación cuantitativa  266

6.5    Análisis sintáctico basado en diferentes fuentes de conocimiento  267

6.5.1    Ejemplos de evaluación cuantitativa  268

6.5.2    Características de votación del analizador sintáctico  272

6.6    Colocaciones  275

6.6.1    Estructura del sistema de colocaciones  277

6.6.1.1 Principales tipos de relaciones  278

6.6.2    Inferencia  282

6.7    Pares coordinados estables  284

6.7.1 Pares coordinados  284

6.7.2 Parámetros para la clasificación de los pares coordinados  286

6.7.3 Algunas estadísticas  291

6.7.4 Uso de los PCE en Análisis sintáctico  291

6.7.5 Descripción formal de algunos pares coordinados estables  292

Glosario   295

Vocabulario bilingüe de términos (inglés — español) 299

Índice analítico   303

Referencias  305

Apéndice: conjunto de prueba   329