• Edizioni di altri A.A.:
  • 2019/2020
  • 2020/2021

  • Lingua Insegnamento:
    Le lezioni saranno svolte in Italiano. Le slides e il libro di testo sono in italiano. Il testo per gli approfondimenti è in lingua inglese 
  • Testi di riferimento:

    Libro di testo consigliato:
    Valentina Porcu, Guida al text mining e alla sentiment analysis con R, edito da Valentina Porcu 2016, eBook
    Durante lo svolgimento delle lezioni sarà fornito materiale integrativo sul sito https://fad.unich.it/.
    Ulteriori testi di approfondimento
    Julia Silge, David Robinson, Text Mining With R: A Tidy Approach, Oreilly & Associates Inc (31 luglio 2017)
     
  • Obiettivi formativi:

    Il corso persegue l’obiettivo di fornire agli studenti i concetti relativi ai metodi per l’analisi e la descrizione di dati testuali.
    Il text mining è una delle tecniche di analisi dati che ha tratto più benefici dal progredire delle tecniche per la raccolta di dati online e dallo sviluppo del web. Infatti, i dati in forma di testo sono estremamente importanti per tutta una serie di analisi, dalla ricerca ed estrazione d'informazione, alla classificazione automatica di un testo, all'estrazione di concetti, alle traduzioni automatiche.
    Le esercitazioni riguarderanno l’applicazione delle tecniche e metodologie introdotte attraverso l’utilizzo del linguaggio statistico R.

    RISULTATI DELL'APPRENDIMENTO ATTESI Conoscenza e capacità di comprensione
    1. Comprensione della natura dei dati testuali e delle metodologie statistiche per il loro trattamento. .
    2. Comprensione delle differenti fonti di dati testuali.
    3. Comprensione e capacità di spiegare i concetti base degli algoritmi per l’estrazione di informazioni da basi di dati testuali.
    Autonomia di giudizio
    - Apprendere i concetti logici e statistici che sono indispensabili per lavorare autonomamente nella ricerca, selezione ed elaborazione di dati testuali derivanti da diverse fonti.
    Abilità comunicative
    - Imparare la terminologia e le tecniche statistiche per comunicare o discutere correttamente i risultati dell'analisi dei dati testuali.
     
  • Prerequisiti:

    Conoscenze base di statistica.
     
  • Metodi didattici:

    Il corso sarà articolato in lezioni teoriche ed esercitazioni pratiche svolte attraverso l’utilizzo del linguaggio di programmazione R. La frequenza alle attività didattiche non è obbligatoria tuttavia è fortemente consigliata
     
  • Modalità di verifica dell'apprendimento:

    L’esame si articola nello svolgimento di un progetto di gruppo durante il corso e la successiva presentazione orale dei risultati ottenuti.
     
  • Sostenibilità:
     
  • Altre Informazioni:

    E-mail: lara.fontanella@unich.it
    Giorni ed orari di ricevimento studenti: dopo le lezioni e per appuntamento da concordarsi via e-mail
     


Il corso prevede la trattazione dei seguenti argomenti per il raggiungimento dei risultati di apprendimento attesi: Introduzione al Text Mining e alla programmazione in R; Algoritmi per la preparazione dei testi; Metodologie statistiche ed algoritmi per l’analisi dei dati testuali; Visualizzazione di dati testuali


1) Introduzione al Text Mining
2) Introduzione a R
3) Preparazione dei testi
Standardizzazione o preprocessing
Tokenizzazione
Stopwords
Stemming
Lemmatizzazione
Normalizzazione
Boundary detection
Il modello “Bag of words”
4) Algoritmi per l'analisi dei testi
Regressione logistica
Naïve Bayes
Classificazione automatica di testi (k-means)
5) Visualizzazione dati testuali

Avvisi

Nessun avviso in evidenza

Documenti

Nessun documento in evidenza

Scopri cosa vuol dire essere dell'Ud'A

SEDE DI CHIETI
Via dei Vestini,31
Centralino 0871.3551

SEDE DI PESCARA
Viale Pindaro,42
Centralino 085.45371

email: info@unich.it
PEC: ateneo@pec.unich.it
Partita IVA 01335970693

icona Facebook   icona Twitter

icona Youtube   icona Instagram