Abstract
Wir beschreiben das Format der logischen Formen des Antwortextraktionssystem ExtrAns. ExtrAns vermag zu zeigen, dass der gegenwärtige Stand der Forschung in Computerlinguistik die Verwendung linguistischer Analyse realer Texte zur Auffindung der eine Frage beantwortenden Passagen erlaubt. ExtrAns verwendet eine Abfolge von Modulen um sowohl den Quelltext (UNIX manpages) als auch die Benutzeranfragen zu bearbeiten. Die wichtigsten Module umfassen Parsing, Disambiguierung, Anaphernresolution und die Generierung einer logischen Form (letztere von uns entwickelt).
Als Verarbeitungsergebnis erhalten wir Minimale logische Formeln (MLFs) in Hornklausellogik. MLFs sind existentiell geschlossene Konjunktionen atomarer Formeln, welche nur die minimal für die Antwortextraktion benötigte Information enthalten, sogar für was normalerweise als universelle Quantifikation, Implikation oder propositionaler Inhalt dargestellt wird. Um dies zu bewerstelligen verwenden wir Reifikation von Objekten, Eventualitäten und Eigenschaften.
Ein Hauptmerkmal der MLFs ist, dass sie nicht alle im Text vorhandenen, sondern nur die für ExtrAns benötigte Information enthalten. Alles andere wird unterspezifiziert gelassen, kann aber jederzeit ergänzt werden, ohne dass Information in den MLFs modifiziert oder gelöscht werden müsste. Dies erlaubt die Verwendung von Inferenztechniken, die auf der Monotonie der logischen Form aufbauen, um die Antwort auf eine Frage zu finden.
We describe the format of the logical forms used in ExtrAns, an Answer Extraction system. ExtrAns has been conceived to show that the current state of the art in computational linguistics allows the use of deep linguistic analysis to analyse real-world text and retrieve from it those passages that directly answer a question. ExtrAns uses a chain of interconnected modules to process the text of a set of documents (UNIX manual pages) and the queries. Key stages in the processing are full parsing, disambiguation, anaphora resolution, and logical form generation (the latter fully developed by us).
The result of the processing is a set of Minimal Logical Forms (MLFs) which are stored in the shape of Horn clauses. MLFs are existentially-closed conjunctions of atomic formulae that encode the minimal information needed to perform answer extraction on the text, even for what would normally be represented as universally quantified statements, implications, belief sentences, etc. In order to do so we resort to the reification of objects, eventualities, and properties.
A key feature of the MLFs is that they do not encode all the information that is available in the text, but only what is needed by ExtrAns. All the rest is left unspecified, but it can be always added without having to modify nor delete the information in the MLFs. This allows the use of inference techniques that rely on the monotonicity of the logical forms to find the answer.
Als Verarbeitungsergebnis erhalten wir Minimale logische Formeln (MLFs) in Hornklausellogik. MLFs sind existentiell geschlossene Konjunktionen atomarer Formeln, welche nur die minimal für die Antwortextraktion benötigte Information enthalten, sogar für was normalerweise als universelle Quantifikation, Implikation oder propositionaler Inhalt dargestellt wird. Um dies zu bewerstelligen verwenden wir Reifikation von Objekten, Eventualitäten und Eigenschaften.
Ein Hauptmerkmal der MLFs ist, dass sie nicht alle im Text vorhandenen, sondern nur die für ExtrAns benötigte Information enthalten. Alles andere wird unterspezifiziert gelassen, kann aber jederzeit ergänzt werden, ohne dass Information in den MLFs modifiziert oder gelöscht werden müsste. Dies erlaubt die Verwendung von Inferenztechniken, die auf der Monotonie der logischen Form aufbauen, um die Antwort auf eine Frage zu finden.
We describe the format of the logical forms used in ExtrAns, an Answer Extraction system. ExtrAns has been conceived to show that the current state of the art in computational linguistics allows the use of deep linguistic analysis to analyse real-world text and retrieve from it those passages that directly answer a question. ExtrAns uses a chain of interconnected modules to process the text of a set of documents (UNIX manual pages) and the queries. Key stages in the processing are full parsing, disambiguation, anaphora resolution, and logical form generation (the latter fully developed by us).
The result of the processing is a set of Minimal Logical Forms (MLFs) which are stored in the shape of Horn clauses. MLFs are existentially-closed conjunctions of atomic formulae that encode the minimal information needed to perform answer extraction on the text, even for what would normally be represented as universally quantified statements, implications, belief sentences, etc. In order to do so we resort to the reification of objects, eventualities, and properties.
A key feature of the MLFs is that they do not encode all the information that is available in the text, but only what is needed by ExtrAns. All the rest is left unspecified, but it can be always added without having to modify nor delete the information in the MLFs. This allows the use of inference techniques that rely on the monotonicity of the logical forms to find the answer.
Translated title of the contribution | Incremental minimal logical forms in Answer Extraction |
---|---|
Original language | German |
Title of host publication | Sprachwissenschaft auf dem Weg in das dritte Jahrtausend |
Subtitle of host publication | Akten des 34. Linguistischen Kolloquiums in Germersheim 1999. Teil 1: Text, Bedeutung, Kommunikation |
Editors | Reinhard Rapp |
Place of Publication | Frankfurt |
Publisher | Peter Lang Verlag |
Pages | 803-812 |
Number of pages | 10 |
ISBN (Print) | 3631395426, 0820459820 |
Publication status | Published - 1999 |
Externally published | Yes |
Event | Colloquium of Linguistics (34th : 1999) - Germersheim, Germany Duration: 7 Sept 1999 → 10 Sept 1999 Conference number: 34th |
Publication series
Name | Linguistik International (Linguistics international) |
---|---|
Publisher | Peter Lang Verlag |
Volume | 7 |
ISSN (Print) | 1436-6150 |
Conference
Conference | Colloquium of Linguistics (34th : 1999) |
---|---|
Country/Territory | Germany |
City | Germersheim |
Period | 7/09/99 → 10/09/99 |