Humanistiske Data har hatt en samtale med Per Vestbøstad som for kort tid siden kom tilbake fra Arizona State University etter å ha deltatt på konferansen "Making Connections" som ble holdt i dagene 17-21. mars.
Konferansen ble arrangert av Association for Computers and the Humanities og Association for Literary and Linguistic Computing.
Per Vestbøstad forteller at forventningene til konferansen var store etter deltakelse på konferansen for to år siden i Toronto, hvor ikke minst demonstrasjonsdelen av konferansen var imponerende. På den internasjonale konferansen i Arizona var det ca. 230 deltakere, herav bare ca. 40 deltakere fra Europa - noe som trolig skyldes den politiske situasjonen og advarslene som var gitt mot flyreiser i tiden forut for konferansen, sier Vestbøstad.
I forhold til Toronto var demonstrasjonsdelen av opplegget en skuffelse, ettersom denne delen var trengt sammen til noen få timer og foregikk i trange klasserom. De faglige presentasjonene var imidlertid svært omfattende og dekket et bredt spekter av emner, særlig innenfor det en tidligere kalte datamaskinell språkbehandling, som bl.a. omfatter datamaskinell tekstanalyse og leksikografi.
Vestbøstad forteller at stor oppmerksomhet ble viet det internasjonalt drevne utviklingsarbeidet som er knyttet til tekstkoding (Text Encoding Initiative) hvor det bl.a. er en norsk gruppeformann, professor Stig Johansson, Universitetet i Oslo. (Se egen omtale. )
Faren er at man - slik målsettingen også er - har tenkt på alle finurligheter i forbindelse med koding av tekster i skriftlig og talt form i så stor detalj at den som trenger enkle løsninger på sitt tekstproblem gjerne går seg vill i alle detaljene, sier Vestbøstad, som legger til at et norsk system for tekstkoding utviklet innenfor Det norske Wittgenstein-prosjektet i Bergen også fikk positiv omtale på konferansen.
Vestbøstad mener ellers at interessen for bygging og bruk av store tekst- og språkdatabaser er sterkt stigende i mange land, f.eks. i USA og Canada. Datamaskinell tekstanalyse bygget på store corpora synes nå å være en vitenskapelig stueren aktivitet, men nå er det ikke snakk om million-corpora, men om å legge til rette tekstsamlinger i størrelsesorden 40-50 millioner ord. På spørsmål om det er store forskjeller på den type arbeid som ble presentert på denne internasjonale konferansen og det som foregår på feltet i vårt land, sier Vestbøstad at det neppe er store forskjeller i kvalitet, men heller i prosjektstørrelse og bredde på aktivitetene.
Av fagfelt som hadde egne sesjoner på konferansen, nevner Vestbøstad automatisk innholdsanalyse, semantikk, databaser som utnytter kunnskapsbaserte metoder, ekspertsystemer og leksikografi og metaforstudier. På flere av disse feltene er det heller liten aktivitet i Norge, sier Vestbøstad.
Men ikke alle synes at metodeutviklingen gir resultater fort nok. På konferansen ble et hovedforedrag holdt av en av nestorene på feltet, Professor Martin Kay fra Xerox Park i Palo Alto, California. Han undret seg over at en stor del av de temaene og problemene som ble tatt opp, allerede var formulert på 70-tallet. En av grunnene kan kanskje være, sier Vestbøstad, at det nå er en ny generasjon forskere som tar fatt. De vil da gjerne med stort pågangsmot løfte på steiner som også generasjonen før har løftet på uten at den nye generasjonen kanskje alltid vet om det, sier Vestbøstad. (Se egen omtale av prof. Kays foredrag)
Hovedgevinsten med å overvære en slik konferanse, mener Vestbøstad, ligger i å kunne "ta pulsen på" hele fagfeltet akkurat nå og oppnå nye faglige kontakter. Og på dette felt skjer det i alle fall noe nytt, forteller Vestbøstad: Når du melder deg på en slik konferanse, vil du heretter automatisk bli medlem av det elektroniske universitet: Nesten alle deltakere oppgir nå E-mail-adresser. At dette nettverket fungerer fra første stund, fikk Vestbøstad også erfare: Før han var kommet hjem, var det allerede en - elektronisk - melding i posten fra en av deltakerne som han ikke hadde hatt direkte kontakt med på konferansen.
Vestbøstad forteller til slutt at konferansen arrangementsteknisk ble fint gjennomført, og at det forelå godt utarbeidede sammendrag til nesten alle foredragene. Det siste har redaksjonen tenkt å la leserne av Humanistiske Data få glede av. Under finner du en oversikt over konferanseforedragene. Dersom du kopierer listen og krysser av for de sammendrag som du ønsker kopier av, og sender kopien til oss, vil vi sende deg tekstene i retur - om ikke ønsket ditt er altfor omfattende.
Neste ACH/ALLC-konferanse blir holdt i Oxford i England i 1992.
Hovudet på TEI sine brevark forklarar tiltaket som eit "Initiative for Text Encoding Guidelines and a Common Interchange Format for Literary and Linguitic Data".
Text Encoding Initiative er styrt av dei tre internasjonale organisasjonane Association for Computers and the Humanities (ACH), Association for Computational Linguistics (ACL) og Association for Literary and Linguistic Computing (ALLC), og støtta av mange fleire organisasjonar, som alle er opptekne av å fremja tekstorientert forsking.
Og tekst skal her forståast i svært vid meining: TEI tek sikte på å laga retningslinjer for merking av alt frå ordlister og ordbøker via faglitteratur og avistekst til poesi og talt språk.
Legg elles merke til at dette ikkje er nok eit glupt kodesystem for merking av tekst, men overordna retningsliner for kva særdrag ved ein teksttype som bør merkjast for at tekstane skal kunna brukast mest mogleg allsidig i ulike slag forsking. Utveksling av maskinlagra tekstar mellom forskarar har ofte vore hemma av at den einskilde forskaren sine snevre interesser har prega den merkinga som er lagt inn i teksten, slik at lite eller ingenting av dette kan nyttast til å studera andre fenomen.
Eit akseptert sett av retningliner vil gjera det lettare for forskarar og andre interesserte å utveksla bearbeidde tekstar og såleis byggja vidare på kvarandres innsats.
Hausten 1990 la TEI fram eit utkast (versjon 1.0) til slike retningliner. Her vert det gjeve råd om korleis ein kan handtera fenomen som diakritiske teikn, teikn i ikkje-romanske alfabet, spesialsymbol o.s.b., fotnotar, tekstkritisk apparat, parallelltekst og andre ikkje-linjære innslag i tekstar som skal omformast til ein linjær datastraum. Den logiske oppdelinga av tekstar t.d. i bok, kapitel, avsnitt eller i akt, scene og replikk, informasjon om opphavet til teksten, kven som er ansvarleg for innlagd merking, utgjevar m.v.
Utkastet tilrår også eit utvekslingsformat for tekst som skal vera medium- og programvare-uavhengig.
Utkastet har no vore ute til vurdering minst eit halvår. Ein av krumtappane i arbeidet med utkastet, C.M. Sperberg-McQueen (Univerity of Illinois at Chicago) oppsummerte reaksjonane slik på ACH/ALLC-konferansen i Tempe, Arizona: Dei fleste meiner utkastet er rimeleg veleigna til å byggja vidare på, sjølv om mange har merknader til detalj-løysingar. Einskilde forskarar har meint at tilrådingane er for strenge, andre at dei er for vide og upresise. Han venta at mange detaljar i utkastet kom til å verta endra, men såg førebels reaksjonane som ei stadfesting av at dei var på rett veg med dei store retningslinene. I tida fram til dei endelege retningslinene skal publiserast, truleg i juni 1992, skal retninglinene testast på realistiske mengder med varierte tekstar, parallelt med at nye utkast kjem til frå dei arbeidsgruppene som ikkje har levert tilrådingar enno.
Eit eksemplar av utkastet kan tingast kostnadsfritt hjå: Oxford University Computing Service, 13 Banbury Road, Oxford OX2 6NN, UK. Ytterlegare eksemplar må betalast med £20,- pr. stk.
Forventningane i salen vart utløyst i eit latterbrøl då den velkjende datalingvisten Martin Kay, æresdoktor ved Gteborgs Universitet og professor i lingvistikk ved Stanford University, innleia åpningsforedraget ved ACH/ALLC-konferansen slik: "It is good to be back in the Humanities after thirty years in the Engine room"! Replikken spela på dei mange åra han har vore forskar ved Xerox sitt forskingssenter i Palo Alto, CA. No har vel Martin Kay hatt eit bein i kvar leir mesteparten av tida som er gått sidan han etablerte seg som datalingvist på 1960-talet. Han har i det minste halde fleire kurs i datalingvistikk i Europa i denne perioden. I 1973 var han t.d. hovudforelesar på Nordisk sommarkurs i Bergen.
Tittelen på hans "Keynote speech" var "Remarkable and Unremarkable Language".
Han opna med nokre muntre, sjølvironiske utsegner, der han såg seg sjølv som sermonimeister og forsamlinga som "dei truande". Vidare oppsummerte han datalingvistikkken sine bragdar dei siste tredve åra med å peika på at dei konkrete resultata avgrensa seg til programvare for stavings- og grammatikk-kontroll. Det manglar såleis ikkje på utfordringar i faget.
Kay peikte på at vitskapen til vanleg er ute etter å finna generelle prinsipp.
Litteraturvitskapen derimot studerer det avvikande, leitar etter skilnader.
Lingvistane leitar etter generelle trekk ved språket. Dei søkjer kjernen, det robuste i språket som ikkje så lett vert endra.
Litterturforksarane samanliknar to eller fleire forfattarar, verk, genrar eller periodar, medan lingvistane samanliknar det som finst med det som kunne ha funnest. "Vanlege" lingvistar studerer trekk som har med språkproduksjon å gjera, medan datalingvistane er meir innretta mot å analysera språket og mottaksprosessen, altså språkforståinga.
Kay spurde korleis folk veit kva som høyrer med i språket deira. Denne avgrensinga er svært problematisk å få formalisert, slik at det kan nyttast i datamaskinprogram. Legg merke til at programma for grammatikk-kontroll ikkje kontrollerer om grammatikken er korrekt, men berre peikar på meir eller mindre opplagde feil.
Når me informerer folk, gjev me dei bitar til ein modell som me ønskjar at dei skal byggja i medvitet. For å illustrera kor samansett denne prosessen er, ba Kay tilhøyrarane samanlikna desse to utsegna:
- | "Eg er nett komen attende frå Saudi-Arabia og har mest gløymt korleis godt øl smakar!" (Informasjon: Eg har vore lenge utan øl!) |
- | "Eg er nett komen attende frå Tjekkoslovakia og har mest gløymt korleis godt øl smakar!" (Informasjon: Ølet i Tjekkoslovakia er dårleg!) |
Med fleire slike døme viste Martin Kay at språket ikkje nokon enkel og stabil kode, men ein system av sjølvmodifiserande kodar. Konlusjonen hans var følgjande: "What we are doing all the time is to use language in a very remarkable way".
Chair: Robert Oakman, South Carolina
Kip Canfield, Maryland, Baltimore:
OBJECT-ORIENTED DATABASE DESIGN FOR RESEARCH
AND EDUCATION IN TEXTUAL STUDIES
Keith Devlin, Colby College:
THE LOGIC OF INFORMATION
Edward A. Fox, Virginia
Polytechnic:
CODER: A RETRIEVAL AND HYPERTEXT
SYSTEM USING SGML AND A LEXICON
Chair: Sylvia Candelaria de Ram, New Mexico State
Terumasa Ehara and Tsuyoshi Morimoto ATR, Kyoto:
CONTENT AND STRUCTURE OF THE ATR BILINGUAL
DATABASE OF SPOKEN DIALOGUES
Kevin Donaghy, Rochester Institute of Technology:
IMPERATIVES, SPEECH ACTS AND PRACTICAL
ARGUMENTS
Harry C. Bunt, ITK - Tilburg:
THEORY BUILDING ON THE COMPUTER
Chair: Eric Dahlin, UC Santa Barbara
Peter Serdiukov, Kiev Pedagogical Institute of Foreign
Languages:
CALL IN THE USSR
Deborah Wilde, Getty Art History Information:
THE ULTIMATE CONNECTION: SCHOLARS AS
END-USERS
Chair: Gordon Dixon, Manchester Polytechnic
Donalee H. Attardo. Purdue:
FRAMEBUILDER: A TOOL FOR COMPUTATIONAL
LEXICOGRAPHY
Brainimir Boguraev and Mary S. Neff, IBM. Yorktown Heights,
NY:
TEXT REPRESENTATION, DICTIONARY STRUCTURE,
AND LEXICAL KNOWLEDGE
Elisabetta Marinai, et.al., CNR, Pisa:
FIRST PROTOTYPE OF A SYSTEM FOR THE
SEMI-AUTOMATIC LINKING AND MERGING OF MONO-
AND BILINGUAL LDBS
Chair: Joseph Rudman, Carnegie Mellon
Douglas Biber, et.al., Southern California:
MULTI-DIMENSIONAL ANALYSES OF AUTHOR'S STYLE:
SOME CASE STUDIES FROM THE 18TH CENTURY
David Holmes, Bristol Polytechnic:
VOCABULARY RICHNESS AND THE BOOK OF MORMON:
A STYLOMETRIC ANALYSIS OF MORMON SCRIPTURE
Estelle Irizarry, Georgetown:
ONE WRITER, TWO AUTHORS: RESOLVING THE
POLEMIC OF LATIN AMERICA'S FIRST NOVEL
Chair: Vicki Walsh, UCLA
Marilyn Deegan, Oxford:
CULTURAL THEORY AND COMPUTING: A MODEL FOR
THE STUDY OF ANGLO-SAXON SOCIETY
Rosanne G. Potter, Iowa State:
MODERN BRITISH LITERATURE, READER RESPONSE
CRITICISM, AND GENDER DIFFERENCES
Chair: Charles Bush, BYU
Lori Levin, et.al., Carnegie Mellon:
CAPTURING CONTEXT IN A COMPUTER-BASED
FOREIGN LANGUAGE ASSISTANT
Gregory Lessard and Michael Levison, Queen's University:
COMPUTER-AIDED ANALYSIS AND MODELLING OF
SECOND LANGUAGE PERFORMANCE ERRORS
Christophe Fouquer, Paris-Nord:
EVIDENCE FOR PREFERENTIAL ANALYSIS
Chair: Michael Neuman, Georgetown
Dennis Karjala, ASU:
ELECTRONIC TEXTS, COPYRIGHT AND THE LAW
Mark Rooks, InteLex, Pittsboro, NC:
COPYRIGHT AND THE DEVELOPER OF ELECTRONIC
TEXT
Darrell Bock, Dallas Theological Seminary:
ELIMINATING CONCERNS AND ASSESSING THE COSTS
Eric Calaluca, Chadwyck-Healey, New York, Ny:
MARKETING ELECTRONIC TEXT
Chair: Joel Goldfield, Institute for Academic Technology, Chapel Hill, NC
Clifford W. Anderson and George E. McMaster, Brandon
University:
CONNECTED EMOTION IN SIMPLIFIED TEXT: DID THEY
REALLY RUIN PETER RABBIT?
John Reeves, UCLA:
COMPUTER MODEL OF THEMATIC STORY
UNDERSTANDING FROM MORAL REASONING
Kathryn Sutherland, Oxford:
WAITING FOR CONNECTIONS: HYPERTEXTS,
MULTIPLOTS, AND THE ENGAGED READER
Chair: Nancy Frishberg, IBM, Yorktown Heights, NY
Tom Horton, Florida Atlantic:
TEXT RETRIEVAL OF PASSAGES BASED ON WORD
CO-OCCURRENCES
Takahiro Nakamura and Satoshi Aisaka, Computer Applications,
Tokyo:
KEYWORD EXTRACTION IN JAPANESE BY FUZZY
INFERENCE
Susan Siegfried, Getty Art History Information:
MATCHING PERSONAL NAMES IN THE HUMANITIES
Chair: Paul Fortier, Manitoba
Peter Robinson, Oxford:
A NEW PROGRAM FOR INTERACTIVE COLLATION OF
LARGE MANUSCRIPT TRADITIONS
Heyward Ehrlich, Rutgers, and George Vallasi, Chernow
Editorial, New York, NY:
THE JAMES JOYCE TEXT MACHINE
Michael Hilton, South Carolina:
THE URICA! II INTERACTIVE COLLATION SYSTEM
Chair: David Chisholm, Arizona
Ralph Griswold, Arizona:
THE PROGRAMMING LANGUAGE CONNECTION
Chair: Susan Hockey, Oxford
Lou Burnard, Oxford and Michael Sperberg-McQueen, Illinois at Chicago
Chair: Mary Dee Harris, Language Technology, Washington, DC
Bipin Indurkhya, Boston U:
METAPHOR AS CHANGE OF REPRESENTATION
James Martin, Colorado:
A COMPUTER UNDERSTANDING OF CONVENTIONAL
METAPHORIC LANGUAGE
Dan Fass, Simon Fraser:
A COMPUTER METHOD FOR RECOGNIZING METAPHORS
IN SENTENCES
Chair: Roy Flannagan, Ohio University
Malcolm Hayward, Indiana University of Pennsylvania:
A CONNECTIONIST COMPUTER MODEL OF POETIC
METER
David G. Novick and Thomas A. Doehne, Oregon Graduate
Institute:
AUTOMATED POETRY CLASSIFICATION
David Chisholm and Royce Robbins, Arizona:
FRAME: A COMPUTER PROGRAM FOR THE STUDY OF
PHONOLOGICAL EQUIVALENCE IN LITERARY
LANGUAGE
Chair: Ian Lancashire, Toronto
Junko Hosaka, et.al., ATR, Kyoto:
CLASSIFICATION OF S-POSTPOSITIONS IN SPOKEN
LANGUAGE: TOWARD SPEECH RECOGNITION
John M. Kirk and William A. Kretzschmar, Georgia:
THE ANALYSIS AND INTERPRETATION OF DIALECT
DATABASES BY INTERACTIVE MAPPING
Martin Dickey and Leonard Faltz, ASU:
STATISTICAL ANALYSIS OF PHONETIC DIALECT AND
GRENDER DIFFERENCES IN A CD-ROM SPEECH CORPUS
Chair: Wendy Wilkins, ASU
Rodolfo Delmonte, Venice, and Dario Bianchi, Parma:
COMPUTING DISCOURSE ANAPHORA FROM
GRAMMATICAL REPRESENTATIONS
Palmira Marrafa, Lisbon:
ON SECONDARY PREDICATION IN PORTUGUESE:
CONSTITUENCY AND COMPUTABILITY
Xiaojin Yu and Robert Oakman, South Carolina:
CAPTURING SYNTACTIC DEPENDENCIES IN BUILDING
LOGICAL SENTENCE FORMS FOR MACHINE
TRANSLATION
Chair: Elaine Brennan, Brown
Panelists: Elaine Brennan, Brown, Steve Siebert, Dragonfly Software, New York, NY, Sperling Martin, Consultant, Gaithersberg, MD
Chair: Marianne Gaunt, Rutgers
Jeutonne Brewer, UNC Greensboro, and Boyd H. Davis, UNC
Charlotte:
REPETITION AND POLITENESS IN ELECTRONIC
CLASSROOM COMMUNITIES
Karen Smith and Barbare Hoffman Maginnis, Arizona:
COMPUTER-MEDIATED COMMUNICATION
ENVIRONMENTS FOR EDUCATION: RESEARCH AND
METHODOLOGY
Kathleen Skubikowski and John Elder, Middlebury:
COMPUTERS AND THE SOCIAL CONTEXTS OF WRITING
Chair: Maureen Schmid, Tandem Translation Project, Tempe, AZ
Hsin-Hsi Chen, National University of Taiwan:
THE TRANSFER OF PREPOSITIONAL PHRASES IN AN
ENGLISH-CHINESE MACHINE TRANSLATION SYSTEM
One-Soon Her, et.al, Executive Communication Systems, Provo,
UT:
THE TREATMENT OF ENGLISH IDIOMS IN THE
LFG-BASED ECS MACHINE TRANSLATION SYSTEM
Chair: Randall Jones, BYU
James E. Tierney, Missouri-St. Louis:
A CD-ROM SUBJECT INDEX TO PRE-1800 BRITISH
PERIODICALS
Patricia Galloway, Mississippi Department of Archives:
HISTORICAL MAPS AND RUBBER SHEETS: FINDING
NATIVE AMERICAN HISTORY ON THE GROUND
Chair: Glyn Holmes, University of Western Ontario
Paul Fortier and Carl J. Schwarz, Manitoba:
PROCRUSTEAN ANALYSIS OF THEMATIC STRUCTURES
IN ANDRE GIBE'S L'IMMORALISTE
Gregory Lessard and Jean-Jacques Hamm, Queen's University:
COMPUTER-AIDED ANALYSIS OF REPEATED
STRUCTURES: THE CASE OF STENDHAL'S ARMANCE
Chair: Ken Church, AT&T Bell Laboratories, Murray Hill, NJ
Mark Liberman, U of Pennsylvania:
HOW MANY WORDS DO PEOPLE KNOW?
Martin Kay, Xerox PARC, Palo Alto, CA:
TEXT-TRANSLATION ALIGNMENT
Bob Mercer, IBM, Yorktown Heights, NY:
A STATISTICAL APPROACH TO MACHINE TRANSLATION
Ken Church, AT&T Bell Laboratories, Murray Hill, NJ:
USING STATISTICS IN LEXICAL ANALYSIS
Chair: Allen Renear, Brown
Keiko Kitamura and Hisashi Yasunaga, National Institute of
Japanese Literature, Tokyo:
DATA BASE DELIVERY FOR JAPANESE LITERATURE BY
CD-ROM
Andrea de Leeuw van Weenen Leiden:
DEVELOPMENTS AT THE LEIDEN ARMENIAN DATA
BASE
Sune Magnberg, Stockholm:
CORPUS BASED RESEARCH ON MODELS FOR
PROCESSING UNRESTRICTED SWEDISH TEXT
Concordanze della Lingua Italiana Poetica dell'Otto/Novecento (CLIPON), Italian National Council for Research (CNR) Chair: Luciano Farina, Ohio State
Giuseppe Savoca, Catania:
WORDS BY UNGARETTI AND BY MONTALE
Alida D'Aquino:
TOWARDS A DICTIONARY OF D'ANNUNZIO'S POETRY
Sebastiano Catrona:
COMPUTING SOLUTIONS FOR DEALING WITH ITALIAN
LITERARY TEXTS
Amalia Mannino:
ABOUT SOME FORMAL AND SEMANTIC FIELDS IN
LEOPARDI'S CANTI
Chair: David Bantz, Chicago
Nancy M. Ide, et.al., Centre National de la Recherche
Scientifique (CNRS):
CAUGHT IN THE WEB OF WORDS: USING NETWORKS
GENERATED FROM DICTIONARIES FOR CONTENT
ANALYSIS
Burghard Rieger, Trier:
AUTOMATIC WORD MEANING REPRESENTATION AND
CONTENT-DRIVEN INFERENCING
David Hunter, Texas at Arlington, and Rita D'Arcangelis, Mary
Washington:
A PARTITIONED RULE-BASED APPROACH TO CONTENT
ANALYSIS OF SPOKEN LANGUAGE
Chair: David Owen, Arizona
Syun Tutiya, Chiba:
ARCHAEOLOGY OF TEXTUAL INFORMATION
Alastair McKinnon, McGill:
THE MULTIDIMENSIONAL CONCORDANCE: A NEW
TOOL FOR LITERARY RESEARCH
Chair: Leonard Faltz, ASU
Patrizia Cotoneschi, Biblioteca di Ingegneria Florence, and
Monica Monachini, CNR, Pisa:
AN EMPIRICAL EXPERIENCE ON THE UTILIZATION OF
THE ITALIAN REFERENCE CORPUS IN MEANING
ANALYSIS
Sumali Pin-Ngern Conlon and Martha Evens, Mississippi:
BUILDING A NOUN LEXICAL DATABASE TO SUPPORT
NATURAL LANGUAGE PROCESSING APPLICATIONS
Patrick Saint-Dizier, U Paul Sabatier, Toulouse:
A DENOTATIONAL SEMANTICS FOR SYNONYMS AND
OPPOSITES
Chair: George Logan, Queen's University
David R. Chesnutt, South Carolina:
THE PAPERS OF HENRY LAURENS: A TEST CASE FOR
THE TEI GUIDLINES
Hans van Halteren, Nijmegen:
EFFICIENT STORAGE OF AMBIGUOUS STRUCTURES IN
TEXTUAL DATABASES
Michael Sperberg-McQueen, Illinios at Chicago:
THE VALIDATED-OR VIOLATED?-TEXT: ISSUES IN
SPECIFYING DOCUMENT STRUCTURES
Chair: Dan Brink, ASU
Helen Agüera, National Endowment for the Humanities,
Washington, DC:
A CONNECTION BETWEEN PAST AND FUTURE: NEH
FUNDING OF HUMANITIES COMPUTING PROJECTS
Chair: Don Walker, Bellcore, Morristown, NJ
Mark Liberman, U of Pennsylvania:
THE NEED FOR OPEN LEXICAL AND TEXTUAL
RESOURCES
Nicoletta Calzolari, CNR, Pisa:
THE REUSABILITY OF LEXICAL AND TEXTUAL
RESOURCES
Yorick Wilks, New Mexico State:
THE ROLE OF A CONSORTIUM FOR LEXICAL RESEARCH
Antonio Zampolli, CNR, Pisa:
DETERMINING WHAT LANGUAGE DATA ARE
AVAILABLE IN MACHINE-READABLE FORM
Elizabeth Hinkelman, Chicago:
ACCESSIBILITY AND QUALITY OF SOFTWARE
RESOURCES
Chair: Peter Lafford, ASU
Donalee H. Attardo, el.at., Purdue:
THE SMEARR SEMANTIC DATABASE: AN INTELLIGENT
AND VERSATILE RESOURCE FOR THE HUMANITIES
Walter Daelemans, Tilburg, Nederland:
AN OBJECT-ORIENTED LINGUISTIC TOOLBOX
Chair: Kevin Roddy, UC Davis
Gregory Crane, Harvard:
GENERATING AND PARSING CLASSICAL GREEK
Vyacheslav Ivanov, Moscow:
COMPUTER-ASSISTED ANALYSIS OF A BILINGUAL,
HATTIC-HITTITE TEXT
Chair: Nancy Ide, Vassar
Jeremy Clear, Oxford UP:
CRITERIA FOR CONSTRUCTING CORPORA
Beatrice Santorini, Pennsylvania:
BUILDING VERY LARGE NATURAL LANGUAGE
DATABASES: SOME METHODOLOGICAL
CONSIDERATIONS
Nicoletta Calzolari, CNR, Pisa:
KNOWLEDGE EXTRACTION FROM CORPORA
Chair: Don Nilsen, ASU
Donald Ross, Minnesota, and David Hunter, Texas at Arlington:
M-EYEBALL: AN INTELLIGENT SYSTEM FOR STYLISTIC
DESCRIPTIONS AND COMPARISONS
Bettina Harriehausen-Mhlbauer, IBM, Tyskland:
THE COMPUTER AS "TEACHER" FOR GRAMMAR AND
STYLE ERRORS
Julie Payette and Graeme Hirst, Toronto:
COMPUTER-ASSISTED INSTRUCTION IN SYNTACTIC
STYLE