Plural semantics for natural language understanding : a computational proof-theoretic approach

The semantics of natural language plurals poses a number of intricate problems – both from a formal and a computational perspective. In this thesis I investigate problems of representing, disambiguating and reasoning wit
The semantics of natural language plurals poses a number of intricate problems – both from a formal and a computational perspective. In this thesis I investigate problems of representing, disambiguating and reasoning with plurals from a computational perspective. The work defines a computationally suitable representation for important plural constructions, proposes a tractable resolution algorithm for semantic plural ambiguities, and integrates an automatic reasoning component for plurals. My solution combines insights from formal semantics, computational linguistics and automated theorem proving and is based on the following main ideas. Whereas many existing approaches to plural semantics work on a model-theoretic basis using higher-order representation languages I propose a proof-theoretic approach to plural semantics based on a flat firstorder semantic representation language thus showing that a trade-off between expressive power and logical tractability can be found. The problem of automatic disambiguation of plurals is tackled by a deliberate decision to drastically reduce recourse to contextual knowledge for disambiguation but rely instead on structurally available and thus computationally manageable information. A further central aspect of the solution lies in carefully drawing the borderline between real ambiguity and mere indeterminacy in the interpretation of plural noun phrases. As a practical result of my computational proof-theoretic approach to plural semantics I can use my methods to perform automated reasoning with plurals by applying advanced firstorder theorem provers and model-generators available off-the shelf. The results are prototypically implemented within the two logic-oriented natural language understanding applications DRoPs and Attempto. DRoPs provides an automatic plural disambiguation component for uncontrolled natural language whereas Attempto works with a constructive disambiguation strategy for controlled natural language. Both systems provide tools for the automated analysis of technical texts allowing users for example to automatically detect inconsistencies, to perform question answering, to check whether a conjecture follows from a text or to find equivalences and redundancies.
show moreshow less
Die Beschreibung der Semantik natürlichsprachlicher Pluralkonstruktionen wirft sowohl aus theoretischer als auch aus anwendungsorientierter Sicht komplexe Probleme auf. In meiner Dissertation untersuche ich Probleme der 
Die Beschreibung der Semantik natürlichsprachlicher Pluralkonstruktionen wirft sowohl aus theoretischer als auch aus anwendungsorientierter Sicht komplexe Probleme auf. In meiner Dissertation untersuche ich Probleme der Repräsentation, der Desambiguierung und der logischen Inferenz mit Pluralen aus einer computersemantischen Perspektive. Die Arbeit definiert eine geeignete Repräsentation für die automatische semantische Verarbeitung von wichtigen Pluralkonstruktionen, entwickelt einen Algorithmus zur automatischen Auflösung semantischer Pluralambiguitäten, und integriert eine Komponente für die automatische Deduktion mit Pluralen. Meine Lösung kombiniert Einsichten aus der formalen Semantik, der Computerlinguistik, und des automatischen Theorembeweisens und basiert auf den folgenden Grundideen. Wohingegen viele existierende Ansätze zur Pluralsemantik auf einer modell-theoretischen Basis unter Verwendung höherstufiger Repräsentationssprachen arbeiten, schlage ich einen beweistheoretischen Ansatz für die Pluralsemantik vor, der auf flachen, erststufigen Repräsentationen beruht. Dies zeigt gleichzeitig, dass ein Kompromiss zwischen Ausdrucksstärke und logischer Praktikabilität gefunden werden kann. Ich behandle das Problem der automatischen Desambiguierung von Pluralen, indem ich bewusst die Verwendung von kontextuellen Faktoren für die Desambiguierung von Pluralen drastisch reduziere und statt dessen strukturelle, und daher praktisch handhabbare Informationen verwende. Ein weiterer zentraler Aspekt der Lösung liegt darin, dass eine sorgfältige Unterscheidung zwischen echter Ambiguität und bloßer Unbestimmtheit bei der Interpretation von Pluralnominalphrasen gezogen wird. Ein praktisches Ergebnis meines computersemantischen beweistheoretischen Ansatzes zur Beschreibung der Pluralsemantik besteht darin, dass ich bereits weit entwickelte, frei verfügbare erststufige Theorembeweiser und Modellgeneratoren anwenden kann, um automatische Deduktion mit Pluralen zu realisieren. Die Resultate habe ich prototypisch implementiert in zwei logik-basierten Systemen zur Simulation von Sprachverstehen: DRoPs und Attempto. DRoPs bietet eine Komponente zur automatischen Desambiguierung von Pluralen für unkontrollierte natürliche Sprache, während Attempto mit einer konstruktiven Desambiguierungsstrategie für kontrollierte natürliche Sprache arbeitet. Beide Systeme stellen Werkzeuge für die automatische Analyse von technischen Texten zur Verfügung. Die Werkzeuge erlauben den Benutzern beispielsweise, dass logische Widersprüche in einem Text vom System automatisch entdeckt werden, dass Fragen zu einem Text beantwortet werden können, dass geprüft werden kann, ob ein Text aus einem anderen Text folgt, oder dass Äquivalenzen und Redundanzen im Text gefunden werden.
show moreshow less

Download full text files

  • application/pdf SchwertelUta.pdf (3170 KB)

Export metadata

  • Export Bibtex
  • Export RIS

Additional Services

    Share in Twitter Search Google Scholar
Metadaten
Author:Uta Schwertel
URN:urn:nbn:de:hebis:30-1030739
URL:http://www.dissertationen.unizh.ch/
Document Type:Doctoral Thesis
Language:English
Date of Publication (online):2005/11/30
Year of first Publication:2005
Publishing Institution:Univ.-Bibliothek Frankfurt am Main
Release Date:2005/11/30
HeBIS PPN:134410084
Dewey Decimal Classification:400 Sprache
Sammlungen:Linguistik
Sonstige

$Rev: 11761 $