SlideShare une entreprise Scribd logo
1  sur  15
Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale,
U N I V E R S I T À degli Studi di P A D O V A-Corsi car

T.A. L.T .A.C. 2
Obiettivo del corso: sviluppare competenze di gestione di Taltac2 attraverso M.A.D.I.T.

•Trattamento
automatico
•Lessicale

Unità di testo = PAROLE

•Testuale

Unità di contesto = frammenti/documenti

•Contenuto

Ricerca di parole chiave,misure di specificità

•Corpus

Struttura del testo, DNA del testo
T.A. L .T.A.C. 2

Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale,
U N I V E R S I T À degli Studi di P A D O V A-Corsi car

Analisi lessicale:

1. Misure lessico-metriche
2. Analisi dei segmenti ripetuti
3. Tagging (grammaticale e semantico)
4. Confronti lessicali
5. Analisi delle specificità
6. Linguaggio peculiare (parole rilevanti, TFIDF)
T.A.L. T .A.C. 2

Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale,
U N I V E R S I T À degli Studi di P A D O V A-Corsi car

Analisi testuale:

1. Analisi delle concordanze
2. Estrazione informazioni con query
T.A.L. T .A.C. 2

Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale,
U N I V E R S I T À degli Studi di P A D O V A-Corsi car

Quale tipologia di testo analizza lo strumento?

Risposte a DOMANDE APERTE/TESTI INTERI:
•

Testi da blog
•

Testi di focus group
•

Articoli di giornale

•

Opere di un autore

VARIABILI
CATEGORIALI
T.A.L. T .A.C. 2

Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale,
U N I V E R S I T À degli Studi di P A D O V A-Corsi car

Da cosa è composto IL CORPUS?
= INSIEME DI FRAMMENTI

Insieme di risposte a domanda aperta

1 frammento = 1 risposta

o
Intero libro/manuale

1 frammento = 1 capitolo
T.A.L. T .A.C. 2

1 Corpus = più frammenti

Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale,
U N I V E R S I T À degli Studi di P A D O V A-Corsi car

sezione
sezione
sezione

Es. corpus = raccolta di articoli

= abstract, testo articolo,
titolo, rif. bibliografico
T.A.L. T .A.C. 2

Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale,
U N I V E R S I T À degli Studi di P A D O V A-Corsi car

Come costruire il corpus affinché Taltac2 lo legga?

LE REGOLE DELLA SINTASSI
ES. 3 frammenti (= 3 articoli), suddivisi in 3 sezioni (occhiello, titolo, testo)
con 2 VARIABILI (testata e mese di pubblicazione)
****ARTICOLO1*TESTATA=repubblica*MESE=gennaio
++++ occhiello
Sjdfsjfoijwfpw sjodjsaodjapid aidhosjdoiljdap osjdosdjopsa sojdojdo
++++ titolo
ksjhlihdL AJHsaj AsjlkJSò
++++ testo
T.A.L. T .A.C. 2

Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale,
U N I V E R S I T À degli Studi di P A D O V A-Corsi car

LE REGOLE DELLA SINTASSI
ES. 3 frammenti (= 3 articoli), suddivisi in 3 sezioni (occhiello, titolo, testo)
con 2 VARIABILI (testata e mese di pubblicazione)

****ARTICOLO1*TESTATA=repubblica*MESE=gennaio

*NOMEVAR=NOME MODALITA’
Indica che
inizia una variabile

No segni di
interpunzione
né spazi

RIGHE DI
IDENTIFICAZIONE
FRAMMENTO

Qualsiasi carattere ma non *
T.A.L. T .A.C. 2

Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale,
U N I V E R S I T À degli Studi di P A D O V A-Corsi car

1. Se un frammento non presenta 1
modalità?
*NOMEVAR=nullo
****ARTICOLO1*TESTATA=repubblica*MESE=nullo
2. Quante variabili sono ammesse?

Al massimo 99
1 o più frammenti non contenga 1 o più
sezioni

3. Lo strumento ammette che:

Tutti i frammenti non abbiano VAR associate
Tutti i frammenti non presentino sezioni
T.A.L. T .A.C. 2

Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale,
U N I V E R S I T À degli Studi di P A D O V A-Corsi car

In quale formato redarre il corpus?

Scrivere il testo in Word,
salvarne una versione = .doc

In quale formato salvare il corpus?

Salvare il testo in
testo delimitato da tabulazione = .txt

Dove salvare i documenti?
T.A.L. T .A.C. 2

Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale,
U N I V E R S I T À degli Studi di P A D O V A-Corsi car

In quali ambienti vengono salvati i file prodotti dallo
strumento?
CARTELLA DI LAVORO = CARTELLA DI SESSIONE

File di risultato

file di testo .txt

Primo step: Inserimento corpus in Taltac e costruzione del
vocabolario
T.A.L. T .A.C. 2

Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale,
U N I V E R S I T À degli Studi di P A D O V A-Corsi car

Prima esercitazione: costruzione del corpus oggetto
dell’analisi
Obiettivo: costruire il file di testo rispetto alle seguenti
indicazioni

Il file di testo è composto da: 3 FRAMMENTI DI 2 VARIABILI SUDDIVISI IN 2 SEZIONI
LA DOMANDA: Pensando alla sua esperienza con la Facoltà di Psicologia, mi
può descrivere una situazione in cui NON è stato pienamente soddisfatto?
Pensando alla sua esperienza con la Facoltà di Psicologia, mi può descrivere
una situazione in cui è stato pienamente soddisfatto?
I RISPONDENTI: PSICOLOGI NEO LAUREATI
VARIABILI: data = mese di dicembre (I,II,III,IV settimana)
luogo = it. Centro, sud, nord, e estero
SEZIONE: dom 1 e dom 2
T.A. L.T .A. C . 2

Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale,
U N I V E R S I T À degli Studi di P A D O V A-Corsi car

Lessico, testuale, del contenuto e del corpus
LESSICO: il significato del termine è stabilito dai parlanti, è negoziato nell’interazione
(il significato è quello del dizionario).
CONCETTO: si stabilisce che il significato del termine ha una modalità d’uso entro
un particolare campo di applicazione in cui il termine vale per tutti allo stesso modo.
COSTRUTTO: il significato del termine è stabilito all’interno di una determinata
teoria in uno specifico testo.

Come usare lo strumento secondo riferimenti scientifici?
L’INDICE IS DI MORRONE, l’incidenza delle occorrenze del segmento rispetto alle
occorrenze delle forme semplici che lo compongono” (Bolasco, 1999).
La formula per il calcolo dell’indice di Morrone è la seguente:
L fsegm
IS = [ ∑ ---------- ] * P
i=1 ffgi
“per ciascuna delle L forme grafiche componenti il segmento, si considera il rapporto
fsegm (occorrenze del segmento) su ffg (occorrenze della forma grafica componente),
moltiplicando poi la somma di tutti questi quozienti per il numero P di parole piene
presenti nel segmento. Tale indice è sempre positivo, si annulla quando il segmento è
composto solo da parole vuote, ed ha il suo massimo valore uguale a L2.” (
Bolasco, 1999).
L’INDICE IS RELATIVO, ottenuto rapportando l’indice al suo massimo valore ottenuto,
collocandosi su un continuum di valori che va da 0 a 1.
Laddove per “parole piene” si intende “parole chiave per l’analisi in corso”, mentre per “parole vuote”
si intende “parole che non esprimono aspetti rilevanti rispetto all’analisi o parole strumentali alla
costruzione sintatticamente corretta delle proposizioni” (Tuzzi, 2003).[
Pretrattamento:
•
•
•
•

normalizzazione
eliminazione forme/taglio di soglia
correzione errori ortografici e grammaticali
disambiguazione: es famiglia, es. analisi
dei segmenti, es. utilizzo delle maiuscole
(attenzione conflitto con normalizzazione),
analisi dei segmenti
• categorizzazione

Contenu connexe

En vedette

Google datastore & search api
Google datastore & search apiGoogle datastore & search api
Google datastore & search apiGeoffrey Garnotel
 
Social media analysis in R using twitter API
Social media analysis in R using twitter API Social media analysis in R using twitter API
Social media analysis in R using twitter API Mohd Shadab Alam
 
Emploi: Faire face aux tests Rorschah et TAT
Emploi: Faire face aux tests Rorschah et TATEmploi: Faire face aux tests Rorschah et TAT
Emploi: Faire face aux tests Rorschah et TATREALIZ
 
Sentiment analysis of tweets
Sentiment analysis of tweetsSentiment analysis of tweets
Sentiment analysis of tweetsVasu Jain
 
Sentiment Analysis in Twitter
Sentiment Analysis in TwitterSentiment Analysis in Twitter
Sentiment Analysis in TwitterAyushi Dalmia
 
Sentiment Analysis of Twitter Data
Sentiment Analysis of Twitter DataSentiment Analysis of Twitter Data
Sentiment Analysis of Twitter DataSumit Raj
 
Presentación. diagnostico de rincon la portada. emilia copa
Presentación. diagnostico de rincon la portada. emilia copaPresentación. diagnostico de rincon la portada. emilia copa
Presentación. diagnostico de rincon la portada. emilia copaCIDES UMSA
 
Redescubriendo el verdadero thaki. enseñanzas de los yatiris mayores de tiwanaku
Redescubriendo el verdadero thaki. enseñanzas de los yatiris mayores de tiwanakuRedescubriendo el verdadero thaki. enseñanzas de los yatiris mayores de tiwanaku
Redescubriendo el verdadero thaki. enseñanzas de los yatiris mayores de tiwanakuCIDES UMSA
 
Presentacion modelos de cuidado ana sulcata
Presentacion modelos de cuidado ana sulcataPresentacion modelos de cuidado ana sulcata
Presentacion modelos de cuidado ana sulcataCIDES UMSA
 
Presentación proyecto cuidar a los niños para emancipar a las mujeres eliana ...
Presentación proyecto cuidar a los niños para emancipar a las mujeres eliana ...Presentación proyecto cuidar a los niños para emancipar a las mujeres eliana ...
Presentación proyecto cuidar a los niños para emancipar a las mujeres eliana ...CIDES UMSA
 
Presentación iniciativa ciudadana eliana estrada
Presentación iniciativa ciudadana eliana estradaPresentación iniciativa ciudadana eliana estrada
Presentación iniciativa ciudadana eliana estradaCIDES UMSA
 
Presentacion genero y educacion temprana maya crone
Presentacion genero y educacion temprana maya cronePresentacion genero y educacion temprana maya crone
Presentacion genero y educacion temprana maya croneCIDES UMSA
 
Presentación desarrollo infantil carla fuentes
Presentación desarrollo infantil carla fuentesPresentación desarrollo infantil carla fuentes
Presentación desarrollo infantil carla fuentesCIDES UMSA
 
Historia de la educación especial en bolivia 2011
Historia de la educación especial en bolivia 2011Historia de la educación especial en bolivia 2011
Historia de la educación especial en bolivia 2011CIDES UMSA
 
Présentation sur Twitter et le microblogging
Présentation sur Twitter et le microbloggingPrésentation sur Twitter et le microblogging
Présentation sur Twitter et le microbloggingDamien Guinet
 
Text Mining with R -- an Analysis of Twitter Data
Text Mining with R -- an Analysis of Twitter DataText Mining with R -- an Analysis of Twitter Data
Text Mining with R -- an Analysis of Twitter DataYanchang Zhao
 

En vedette (17)

Google datastore & search api
Google datastore & search apiGoogle datastore & search api
Google datastore & search api
 
Social media analysis in R using twitter API
Social media analysis in R using twitter API Social media analysis in R using twitter API
Social media analysis in R using twitter API
 
Emploi: Faire face aux tests Rorschah et TAT
Emploi: Faire face aux tests Rorschah et TATEmploi: Faire face aux tests Rorschah et TAT
Emploi: Faire face aux tests Rorschah et TAT
 
Sentiment analysis of tweets
Sentiment analysis of tweetsSentiment analysis of tweets
Sentiment analysis of tweets
 
Sentiment Analysis in Twitter
Sentiment Analysis in TwitterSentiment Analysis in Twitter
Sentiment Analysis in Twitter
 
Sentiment Analysis of Twitter Data
Sentiment Analysis of Twitter DataSentiment Analysis of Twitter Data
Sentiment Analysis of Twitter Data
 
Presentación. diagnostico de rincon la portada. emilia copa
Presentación. diagnostico de rincon la portada. emilia copaPresentación. diagnostico de rincon la portada. emilia copa
Presentación. diagnostico de rincon la portada. emilia copa
 
Redescubriendo el verdadero thaki. enseñanzas de los yatiris mayores de tiwanaku
Redescubriendo el verdadero thaki. enseñanzas de los yatiris mayores de tiwanakuRedescubriendo el verdadero thaki. enseñanzas de los yatiris mayores de tiwanaku
Redescubriendo el verdadero thaki. enseñanzas de los yatiris mayores de tiwanaku
 
Presentacion modelos de cuidado ana sulcata
Presentacion modelos de cuidado ana sulcataPresentacion modelos de cuidado ana sulcata
Presentacion modelos de cuidado ana sulcata
 
Presentación proyecto cuidar a los niños para emancipar a las mujeres eliana ...
Presentación proyecto cuidar a los niños para emancipar a las mujeres eliana ...Presentación proyecto cuidar a los niños para emancipar a las mujeres eliana ...
Presentación proyecto cuidar a los niños para emancipar a las mujeres eliana ...
 
Presentación iniciativa ciudadana eliana estrada
Presentación iniciativa ciudadana eliana estradaPresentación iniciativa ciudadana eliana estrada
Presentación iniciativa ciudadana eliana estrada
 
Presentacion genero y educacion temprana maya crone
Presentacion genero y educacion temprana maya cronePresentacion genero y educacion temprana maya crone
Presentacion genero y educacion temprana maya crone
 
Presentación desarrollo infantil carla fuentes
Presentación desarrollo infantil carla fuentesPresentación desarrollo infantil carla fuentes
Presentación desarrollo infantil carla fuentes
 
Historia de la educación especial en bolivia 2011
Historia de la educación especial en bolivia 2011Historia de la educación especial en bolivia 2011
Historia de la educación especial en bolivia 2011
 
Introduction à Twitter
Introduction à TwitterIntroduction à Twitter
Introduction à Twitter
 
Présentation sur Twitter et le microblogging
Présentation sur Twitter et le microbloggingPrésentation sur Twitter et le microblogging
Présentation sur Twitter et le microblogging
 
Text Mining with R -- an Analysis of Twitter Data
Text Mining with R -- an Analysis of Twitter DataText Mining with R -- an Analysis of Twitter Data
Text Mining with R -- an Analysis of Twitter Data
 

Similaire à Presentacion taltac2

Progetto e realizzazione di uno strumento per la modifica sistematica di codi...
Progetto e realizzazione di uno strumento per la modifica sistematica di codi...Progetto e realizzazione di uno strumento per la modifica sistematica di codi...
Progetto e realizzazione di uno strumento per la modifica sistematica di codi...Università degli Studi di Trieste
 
Sistemi autore, linguaggio controllato e manualistica aziendale: scrivere per...
Sistemi autore, linguaggio controllato e manualistica aziendale: scrivere per...Sistemi autore, linguaggio controllato e manualistica aziendale: scrivere per...
Sistemi autore, linguaggio controllato e manualistica aziendale: scrivere per...LUSPIO LanguageCamp
 
Sistemi autore, linguaggio controllato e manualistica aziendale: scrivere per...
Sistemi autore, linguaggio controllato e manualistica aziendale: scrivere per...Sistemi autore, linguaggio controllato e manualistica aziendale: scrivere per...
Sistemi autore, linguaggio controllato e manualistica aziendale: scrivere per...LUSPIO LanguageCamp
 
Classificazione di frasi in linguaggio naturale per il riconoscimento di inte...
Classificazione di frasi in linguaggio naturale per il riconoscimento di inte...Classificazione di frasi in linguaggio naturale per il riconoscimento di inte...
Classificazione di frasi in linguaggio naturale per il riconoscimento di inte...Marco Virgo
 

Similaire à Presentacion taltac2 (6)

Tesina 2009
Tesina 2009Tesina 2009
Tesina 2009
 
Progetto e realizzazione di uno strumento per la modifica sistematica di codi...
Progetto e realizzazione di uno strumento per la modifica sistematica di codi...Progetto e realizzazione di uno strumento per la modifica sistematica di codi...
Progetto e realizzazione di uno strumento per la modifica sistematica di codi...
 
Vb.net
 Vb.net Vb.net
Vb.net
 
Sistemi autore, linguaggio controllato e manualistica aziendale: scrivere per...
Sistemi autore, linguaggio controllato e manualistica aziendale: scrivere per...Sistemi autore, linguaggio controllato e manualistica aziendale: scrivere per...
Sistemi autore, linguaggio controllato e manualistica aziendale: scrivere per...
 
Sistemi autore, linguaggio controllato e manualistica aziendale: scrivere per...
Sistemi autore, linguaggio controllato e manualistica aziendale: scrivere per...Sistemi autore, linguaggio controllato e manualistica aziendale: scrivere per...
Sistemi autore, linguaggio controllato e manualistica aziendale: scrivere per...
 
Classificazione di frasi in linguaggio naturale per il riconoscimento di inte...
Classificazione di frasi in linguaggio naturale per il riconoscimento di inte...Classificazione di frasi in linguaggio naturale per il riconoscimento di inte...
Classificazione di frasi in linguaggio naturale per il riconoscimento di inte...
 

Plus de CIDES UMSA

Presentacion sistematizacion comparativa de politicas publicas de proteccion ...
Presentacion sistematizacion comparativa de politicas publicas de proteccion ...Presentacion sistematizacion comparativa de politicas publicas de proteccion ...
Presentacion sistematizacion comparativa de politicas publicas de proteccion ...CIDES UMSA
 
Presentacion el cuidado en la familia cecilia salazar
Presentacion el cuidado en la familia cecilia salazarPresentacion el cuidado en la familia cecilia salazar
Presentacion el cuidado en la familia cecilia salazarCIDES UMSA
 
Presentación cuidado como derecho social. cecilia salazar
Presentación cuidado como derecho social. cecilia salazarPresentación cuidado como derecho social. cecilia salazar
Presentación cuidado como derecho social. cecilia salazarCIDES UMSA
 
Municipio escuela cepad
Municipio escuela cepadMunicipio escuela cepad
Municipio escuela cepadCIDES UMSA
 
Analisis de interesados
Analisis de interesadosAnalisis de interesados
Analisis de interesadosCIDES UMSA
 
Servicios sociales eeuu
Servicios sociales eeuuServicios sociales eeuu
Servicios sociales eeuuCIDES UMSA
 
Presentación cuidado. fernanda wanderley
Presentación cuidado. fernanda wanderleyPresentación cuidado. fernanda wanderley
Presentación cuidado. fernanda wanderleyCIDES UMSA
 
Presentación cuidado. fernanda wanderley
Presentación cuidado. fernanda wanderleyPresentación cuidado. fernanda wanderley
Presentación cuidado. fernanda wanderleyCIDES UMSA
 
Presentación cuidado. cecilia salazar
Presentación cuidado. cecilia salazarPresentación cuidado. cecilia salazar
Presentación cuidado. cecilia salazarCIDES UMSA
 
Bolivia obstaculos eng
Bolivia obstaculos engBolivia obstaculos eng
Bolivia obstaculos engCIDES UMSA
 

Plus de CIDES UMSA (10)

Presentacion sistematizacion comparativa de politicas publicas de proteccion ...
Presentacion sistematizacion comparativa de politicas publicas de proteccion ...Presentacion sistematizacion comparativa de politicas publicas de proteccion ...
Presentacion sistematizacion comparativa de politicas publicas de proteccion ...
 
Presentacion el cuidado en la familia cecilia salazar
Presentacion el cuidado en la familia cecilia salazarPresentacion el cuidado en la familia cecilia salazar
Presentacion el cuidado en la familia cecilia salazar
 
Presentación cuidado como derecho social. cecilia salazar
Presentación cuidado como derecho social. cecilia salazarPresentación cuidado como derecho social. cecilia salazar
Presentación cuidado como derecho social. cecilia salazar
 
Municipio escuela cepad
Municipio escuela cepadMunicipio escuela cepad
Municipio escuela cepad
 
Analisis de interesados
Analisis de interesadosAnalisis de interesados
Analisis de interesados
 
Servicios sociales eeuu
Servicios sociales eeuuServicios sociales eeuu
Servicios sociales eeuu
 
Presentación cuidado. fernanda wanderley
Presentación cuidado. fernanda wanderleyPresentación cuidado. fernanda wanderley
Presentación cuidado. fernanda wanderley
 
Presentación cuidado. fernanda wanderley
Presentación cuidado. fernanda wanderleyPresentación cuidado. fernanda wanderley
Presentación cuidado. fernanda wanderley
 
Presentación cuidado. cecilia salazar
Presentación cuidado. cecilia salazarPresentación cuidado. cecilia salazar
Presentación cuidado. cecilia salazar
 
Bolivia obstaculos eng
Bolivia obstaculos engBolivia obstaculos eng
Bolivia obstaculos eng
 

Dernier

Ticonzero news 148.pdf aprile 2024 Terza cultura
Ticonzero news 148.pdf aprile 2024 Terza culturaTiconzero news 148.pdf aprile 2024 Terza cultura
Ticonzero news 148.pdf aprile 2024 Terza culturaPierLuigi Albini
 
La seconda guerra mondiale per licei e scuole medie
La seconda guerra mondiale per licei e scuole medieLa seconda guerra mondiale per licei e scuole medie
La seconda guerra mondiale per licei e scuole medieVincenzoPantalena1
 
Corso di digitalizzazione e reti per segretario amministrativo
Corso di digitalizzazione e reti per segretario amministrativoCorso di digitalizzazione e reti per segretario amministrativo
Corso di digitalizzazione e reti per segretario amministrativovaleriodinoia35
 
Esperimenti_laboratorio di fisica per la scuola superiore
Esperimenti_laboratorio di fisica per la scuola superioreEsperimenti_laboratorio di fisica per la scuola superiore
Esperimenti_laboratorio di fisica per la scuola superiorevaleriodinoia35
 
XIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia RomanaXIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia RomanaStefano Lariccia
 
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla CresimaIL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla CresimaRafael Figueredo
 
lezione di fisica_I moti nel piano_Amaldi
lezione di fisica_I moti nel piano_Amaldilezione di fisica_I moti nel piano_Amaldi
lezione di fisica_I moti nel piano_Amaldivaleriodinoia35
 
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia RomanaXI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia RomanaStefano Lariccia
 

Dernier (8)

Ticonzero news 148.pdf aprile 2024 Terza cultura
Ticonzero news 148.pdf aprile 2024 Terza culturaTiconzero news 148.pdf aprile 2024 Terza cultura
Ticonzero news 148.pdf aprile 2024 Terza cultura
 
La seconda guerra mondiale per licei e scuole medie
La seconda guerra mondiale per licei e scuole medieLa seconda guerra mondiale per licei e scuole medie
La seconda guerra mondiale per licei e scuole medie
 
Corso di digitalizzazione e reti per segretario amministrativo
Corso di digitalizzazione e reti per segretario amministrativoCorso di digitalizzazione e reti per segretario amministrativo
Corso di digitalizzazione e reti per segretario amministrativo
 
Esperimenti_laboratorio di fisica per la scuola superiore
Esperimenti_laboratorio di fisica per la scuola superioreEsperimenti_laboratorio di fisica per la scuola superiore
Esperimenti_laboratorio di fisica per la scuola superiore
 
XIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia RomanaXIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
XIII Lezione - Arabo G.Rammo @ Libera Accademia Romana
 
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla CresimaIL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
 
lezione di fisica_I moti nel piano_Amaldi
lezione di fisica_I moti nel piano_Amaldilezione di fisica_I moti nel piano_Amaldi
lezione di fisica_I moti nel piano_Amaldi
 
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia RomanaXI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
XI Lezione - Arabo LAR Giath Rammo @ Libera Accademia Romana
 

Presentacion taltac2

  • 1. Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale, U N I V E R S I T À degli Studi di P A D O V A-Corsi car T.A. L.T .A.C. 2 Obiettivo del corso: sviluppare competenze di gestione di Taltac2 attraverso M.A.D.I.T. •Trattamento automatico •Lessicale Unità di testo = PAROLE •Testuale Unità di contesto = frammenti/documenti •Contenuto Ricerca di parole chiave,misure di specificità •Corpus Struttura del testo, DNA del testo
  • 2. T.A. L .T.A.C. 2 Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale, U N I V E R S I T À degli Studi di P A D O V A-Corsi car Analisi lessicale: 1. Misure lessico-metriche 2. Analisi dei segmenti ripetuti 3. Tagging (grammaticale e semantico) 4. Confronti lessicali 5. Analisi delle specificità 6. Linguaggio peculiare (parole rilevanti, TFIDF)
  • 3. T.A.L. T .A.C. 2 Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale, U N I V E R S I T À degli Studi di P A D O V A-Corsi car Analisi testuale: 1. Analisi delle concordanze 2. Estrazione informazioni con query
  • 4. T.A.L. T .A.C. 2 Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale, U N I V E R S I T À degli Studi di P A D O V A-Corsi car Quale tipologia di testo analizza lo strumento? Risposte a DOMANDE APERTE/TESTI INTERI: • Testi da blog • Testi di focus group • Articoli di giornale • Opere di un autore VARIABILI CATEGORIALI
  • 5. T.A.L. T .A.C. 2 Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale, U N I V E R S I T À degli Studi di P A D O V A-Corsi car Da cosa è composto IL CORPUS? = INSIEME DI FRAMMENTI Insieme di risposte a domanda aperta 1 frammento = 1 risposta o Intero libro/manuale 1 frammento = 1 capitolo
  • 6. T.A.L. T .A.C. 2 1 Corpus = più frammenti Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale, U N I V E R S I T À degli Studi di P A D O V A-Corsi car sezione sezione sezione Es. corpus = raccolta di articoli = abstract, testo articolo, titolo, rif. bibliografico
  • 7. T.A.L. T .A.C. 2 Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale, U N I V E R S I T À degli Studi di P A D O V A-Corsi car Come costruire il corpus affinché Taltac2 lo legga? LE REGOLE DELLA SINTASSI ES. 3 frammenti (= 3 articoli), suddivisi in 3 sezioni (occhiello, titolo, testo) con 2 VARIABILI (testata e mese di pubblicazione) ****ARTICOLO1*TESTATA=repubblica*MESE=gennaio ++++ occhiello Sjdfsjfoijwfpw sjodjsaodjapid aidhosjdoiljdap osjdosdjopsa sojdojdo ++++ titolo ksjhlihdL AJHsaj AsjlkJSò ++++ testo
  • 8. T.A.L. T .A.C. 2 Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale, U N I V E R S I T À degli Studi di P A D O V A-Corsi car LE REGOLE DELLA SINTASSI ES. 3 frammenti (= 3 articoli), suddivisi in 3 sezioni (occhiello, titolo, testo) con 2 VARIABILI (testata e mese di pubblicazione) ****ARTICOLO1*TESTATA=repubblica*MESE=gennaio *NOMEVAR=NOME MODALITA’ Indica che inizia una variabile No segni di interpunzione né spazi RIGHE DI IDENTIFICAZIONE FRAMMENTO Qualsiasi carattere ma non *
  • 9. T.A.L. T .A.C. 2 Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale, U N I V E R S I T À degli Studi di P A D O V A-Corsi car 1. Se un frammento non presenta 1 modalità? *NOMEVAR=nullo ****ARTICOLO1*TESTATA=repubblica*MESE=nullo 2. Quante variabili sono ammesse? Al massimo 99 1 o più frammenti non contenga 1 o più sezioni 3. Lo strumento ammette che: Tutti i frammenti non abbiano VAR associate Tutti i frammenti non presentino sezioni
  • 10. T.A.L. T .A.C. 2 Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale, U N I V E R S I T À degli Studi di P A D O V A-Corsi car In quale formato redarre il corpus? Scrivere il testo in Word, salvarne una versione = .doc In quale formato salvare il corpus? Salvare il testo in testo delimitato da tabulazione = .txt Dove salvare i documenti?
  • 11. T.A.L. T .A.C. 2 Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale, U N I V E R S I T À degli Studi di P A D O V A-Corsi car In quali ambienti vengono salvati i file prodotti dallo strumento? CARTELLA DI LAVORO = CARTELLA DI SESSIONE File di risultato file di testo .txt Primo step: Inserimento corpus in Taltac e costruzione del vocabolario
  • 12. T.A.L. T .A.C. 2 Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale, U N I V E R S I T À degli Studi di P A D O V A-Corsi car Prima esercitazione: costruzione del corpus oggetto dell’analisi Obiettivo: costruire il file di testo rispetto alle seguenti indicazioni Il file di testo è composto da: 3 FRAMMENTI DI 2 VARIABILI SUDDIVISI IN 2 SEZIONI LA DOMANDA: Pensando alla sua esperienza con la Facoltà di Psicologia, mi può descrivere una situazione in cui NON è stato pienamente soddisfatto? Pensando alla sua esperienza con la Facoltà di Psicologia, mi può descrivere una situazione in cui è stato pienamente soddisfatto? I RISPONDENTI: PSICOLOGI NEO LAUREATI VARIABILI: data = mese di dicembre (I,II,III,IV settimana) luogo = it. Centro, sud, nord, e estero SEZIONE: dom 1 e dom 2
  • 13. T.A. L.T .A. C . 2 Laboratorio M.A.D.I.T. Dipartimento di Psicologia Generale, U N I V E R S I T À degli Studi di P A D O V A-Corsi car Lessico, testuale, del contenuto e del corpus LESSICO: il significato del termine è stabilito dai parlanti, è negoziato nell’interazione (il significato è quello del dizionario). CONCETTO: si stabilisce che il significato del termine ha una modalità d’uso entro un particolare campo di applicazione in cui il termine vale per tutti allo stesso modo. COSTRUTTO: il significato del termine è stabilito all’interno di una determinata teoria in uno specifico testo. Come usare lo strumento secondo riferimenti scientifici?
  • 14. L’INDICE IS DI MORRONE, l’incidenza delle occorrenze del segmento rispetto alle occorrenze delle forme semplici che lo compongono” (Bolasco, 1999). La formula per il calcolo dell’indice di Morrone è la seguente: L fsegm IS = [ ∑ ---------- ] * P i=1 ffgi “per ciascuna delle L forme grafiche componenti il segmento, si considera il rapporto fsegm (occorrenze del segmento) su ffg (occorrenze della forma grafica componente), moltiplicando poi la somma di tutti questi quozienti per il numero P di parole piene presenti nel segmento. Tale indice è sempre positivo, si annulla quando il segmento è composto solo da parole vuote, ed ha il suo massimo valore uguale a L2.” ( Bolasco, 1999). L’INDICE IS RELATIVO, ottenuto rapportando l’indice al suo massimo valore ottenuto, collocandosi su un continuum di valori che va da 0 a 1. Laddove per “parole piene” si intende “parole chiave per l’analisi in corso”, mentre per “parole vuote” si intende “parole che non esprimono aspetti rilevanti rispetto all’analisi o parole strumentali alla costruzione sintatticamente corretta delle proposizioni” (Tuzzi, 2003).[
  • 15. Pretrattamento: • • • • normalizzazione eliminazione forme/taglio di soglia correzione errori ortografici e grammaticali disambiguazione: es famiglia, es. analisi dei segmenti, es. utilizzo delle maiuscole (attenzione conflitto con normalizzazione), analisi dei segmenti • categorizzazione