ILC

ISTITUTO DI LINGUISTICA COMPUTAZIONALE

  • FACILE O DIFFICILE? READ-it, UNO STRUMENTO AVANZATO PER VALUTARE LA LEGGIBILITA’ DI UN TESTO – demo e poster: un accesso globale e condiviso all’informazione rappresenta una sempre più emergente necessità di una società dell’informazione veramente inclusiva. Le tecnologie linguistico-computazionali possono dirsi oggi mature per fornire una valutazione affidabile e linguisticamente motivata dell’accessibilità di un testo. READ-IT è il primo strumento avanzato per la valutazione della leggibilità di testi in lingua italiana che si basa su un’analisi sofisticata delle strutture linguistiche sottostanti al testo. READ-IT è anche in grado di identificare i luoghi di complessità del testo, fornendo così un valido supporto per un eventuale processo di semplificazione testuale. Lo strumento aiuta ad avvicinare all’informazione persone con uno scarso livello di istruzione, apprendenti l’italiano come prima o seconda lingua oppure persone con disabilità linguistico-cognitive. Audience: generale.
  • CHI, COSA, DOVE, QUANDO? T2K (TEXT-TO-KNOWLEDGE), UNO STRUMENTO PER ACCEDERE AL CONTENUTO DI UN TESTO – demo e poster: la necessità quotidiana di accedere a grandi quantità di dati per lo più testuali ha dato grande impulso allo sviluppo di tecnologie per l’acquisizione, la classificazione e la gestione automatica del contenuto testuale e al loro sempre più diffuso impiego in una miriade di contesti applicativi. T2K è una piattaforma web finalizzata all’acquisizione di informazione semantico-lessicale da corpora di dominio. Attraverso l’uso combinato di tecniche statistiche e di strumenti avanzati di Trattamento Automatico del Linguaggio, T2K è in grado di analizzare il contenuto dei documenti, estrarre i termini e le entità (nomi, luoghi, persone) potenzialmente più significativi, individuare le relazioni che legano termini e entità, indicizzare il corpus di partenza e ricostruire una mappa multidimensionale della conoscenza di dominio contenuta nella collezione documentale. Audience: generale.
  • CLAVIUS ON THE WEB: ALLA SCOPERTA DELLA STORIA, DEL LATINO E DELL’ASTRONOMIA – demo e poster: lo stand che si propone per la Notte dei Ricercatori 2014 si inserisce nell’ambito del progetto Clavius on the Web e ha lo scopo di illustrare approcci digitali e orientati al Web per la valorizzazione di testi antichi, con particolare riferimento ad alcuni manoscritti del XVI secolo di proprietà dell’Archivio Storico della Pontificia Università Gregoriana. Allo stand saranno mostrati a insegnanti, studenti e studiosi strumenti innovativi, sviluppati nel corso del progetto, per la digitalizzazione, la codifica TEI/XML, l’annotazione multi-livello (linguistica, lessicale, semantica), il collegamento a basi di conoscenza in formato Linked Data, la creazione di storie mediante tecniche di storytelling e la visualizzazione su piattaforme Web. Audience: studenti delle scuole superiori/università; insegnati; studiosi.
  • CATTURARE I SENTIMENTI E LE OPINIONI SUL WEB: TECNOLOGIE SEMANTICHE AL SERVIZIO DEL BUSINESS – demo e poster: state per scegliere un hotel, un ristorante, uno smartphone appena uscito e volete sapere cosa ne pensano gli altri clienti? Naturalmente cercherete delle recensioni sui vari social media specializzati. Oggi le opinioni di persone lontane da noi sono accessibili e ci influenzano come mai prima d’ora. Ma siamo sicuri di saper leggere tra le righe? Un “goed” olandese è la stessa cosa di un “gut” tedesco o di un “buono” italiano? E come fanno gli albergatori a sapere che devono migliorare la colazione, o ristrutturare un po’ i bagni, senza dover passare le loro giornate su TripAdvisor? Le tecnologie semantiche sviluppate in OpeNER  permettono analizzare a fondo i testi delle recensioni, di andare al di là del “conto delle stelline”, analizzando gli aspetti di un prodotto o servizio che maggiormente attraggono critiche o lodi, e di aggregare e rappresentare tutto questo graficamente, magari tenendo conto anche delle differenze culturali. Audience: generale.
  • AFFORDANCES: QUANDO GLI OGGETTI CI DICONO COME VOGLIONO ESSERE USATI – demo e poster: studi neurofisiologici dimostrano che il rapporto esistente tra azione e percezione è molto più stretto e complesso di quanto spesso si immagini. In particolare, il modo in cui interagiamo con gli oggetti passa attraverso il riconoscimento delle loro affordances, ovvero le “possibilità d’azione” che ogni oggetto offre agli essere viventi. La percezione visiva di una tazza col manico orientato a destra, ad esempio, intuitivamente suggerisce un certo particolare tipo di presa (con la mano destra, per il manico), nonostante possa essere afferrata in molti altri modi. Sapere cosa possiamo fare con gli oggetti e come possiamo interagire con essi, in base alle loro caratteristiche visivamente percepibili, è un tipo di conoscenza importante per gli studi sul lessico, soprattutto per lo studio della polisemia verbale: spesso i sensi diversi di un verbo d’azione corrispondono semplicemente a tipi di oggetto diversi che sono coinvolti nell’evento e che offrono diverse possibilità d’azione, ovvero presentano diverse affordances. Audience: generale.
  • AZIONI, OGGETTI, STRUMENTI: LA LINGUISTICA PER LA ROBOTICA – demo e poster: che tipo di conoscenza bisogna fornire a un robot per permettergli di interagire linguisticamente con un umano? Più nello specifico, come si può arrivare alla definizione di un robot in grado di eseguire istruzioni relative al dominio delle azioni concrete su oggetti con relativi strumenti? Molta di questa informazione è depositata nel linguaggio che usiamo quotidianamente ma ha bisogno di essere estratta e classificata con strumenti computazionali per essere usabile. E’ molto importante strutturare la conoscenza in modo che sia estendibile e generalizzabile: sappiamo che aprire la finestra e aprire la bottiglia sono due azioni profondamente differenti, sebbene etichettate con lo stesso verbo. Quali oggetti sono più simili a finestra e bottiglia, e quindi rientrano in due tipologie di azione chiare e distinte? Audience: generale.
  • RETI SEMANTICHE AL SERVIZIO DELL’INTERPRETAZIONE DEL TESTO – demo e poster: le reti semantiche sono potenti strumenti che codificano relazioni semantiche e lessicali  tra parole, come WordNet che oltre ai termini ed ai loro significati,  codifica ogni relazione tra significati e tra  termini. Le collocazioni sono associazioni abituali e privilegiate di due o più parole all’interno di un contesto, spesso imprevedibili e legittimate dall’uso più che dalle regole: è una collocazione, ad esempio, “toro”, forte”, in “forte come un toro”. Le collocazioni sono resistenti alla sostituzione dei componenti con altri dal significato simile: se cambiamo “forte” con “intenso”, la frase “intenso come un toro” suona strana. Ma le collocazioni sono veramente così lasche? Oppure c’è qualcosa di nascosto che sfugge ad una  prima interpretazione? Le reti semantiche possono essere un valido aiuto ad approfondire le collocazioni? Nella nostra demo esamineremo due testi arabi, estratti da “Mille e una notte”, e con l’aiuto delle reti semantiche cercheremo di scoprire  cosa si nasconde dietro una collocazione. Audience: generale.
  • CORRISPONDENZE IMPERFETTE – demo e poster: lo stand propone due lavori fra loro complementari per lo studio in parallelo delle lingue classiche e delle traduzioni moderne. Da un lato viene presentata AncientGreekWordNet, una risorsa lessico-semantica per la ricerca dei sensi associati a parole greche raggruppate in liste di sinonimi, strutturate in base alle loro relazioni semantiche di iponimia e iperonimia, e collegate alle relative traduzioni in latino, italiano e inglese. Dall’altro viene presentato il sistema Euporia, per l’annotazione di testi greci e latini, in parallelo con traduzioni italiane o inglesi. Lo scopo principale della dimostrazione è far capire il valore del multilinguismo e del multiculturalismo, evidenziando come le corrispondenze imperfette fra le lingue rendano le parole e i testi originali irriducibili rispetto alle loro traduzioni. Audience: studenti e insegnanti delle superiori; studenti universitari.

Le iniziative all'Area della Ricerca di Pisa