Docente
|
PEDICINI MARCO
(programma)
Le infrastrutture di rete. Mezzi e tecnologie per la trasmissione delle informazioni. Le reti a commutazione di circuito e le reti a commutazione di pacchetto. Le reti locali. Mezzi di trasmissione e topologie per le reti locali. L'interconnessione di reti LAN. L'architettura del software per la rete. Principi di funzionamento del protocollo TCP/IP. IP-address, notazione decimale puntata, netmask, gateway, DNS. Autorità di dominio. (cap. 1, di [1])
Le applicazioni di rete. Architetture tipo client/server; DBMS, Modello relazionale, Differenze tra database e data warehouse. Protocollo http: visualizzazione, interrogazione, specifica documenti, URI, - Linguaggio HTML, browser come interprete del linguaggio; Definizione di proxy. (cap. 2, di [1])
Teoria dell’informazione. Modello di comunicazione di Shannon. Quantità di informazione. Concetto di Entropia. Mutua Informazione. Applicazioni all’analisi automatica del testo. Strutturazione dell'informazione per il trattamento automatico. (cap. 2, [2]).
I motori di ricerca. Algoritmi di ranking: la teoria alla base dei motori di ricerca. Navigazione su web e probabilità. Le matrici di transizione e i loro autovalori. Interpretazione dell'autovettore come ranking (capp. 6 e 7 di [4]). Algoritmi di ranking e interfacciamento motori di ricerca. Come specificare query avanzate a Google [5].
Strutturazione dell'informazione. Introduzione al linguaggio di tagging XML. Sintassi del linguaggio XML; Definizione di una grammatica mediante espressioni regolari. Definizione dei DTD (Data Type Definition). [6]
(testi)
[1] James Kurose, Keith Ross. 2013. Reti di Calcolatori e Internet, ISBN:9788871929385. [2] Manning, C. and Schütze, H. 1999. Foundations of Statistical Natural Language Processing. MIT Press, Cambridge, MA. [3] Fabrizio Sebastiani. 2002. Machine learning in automated text categorization. ACM Comput. Surv. 34, 1 (March 2002), 1-47. DOI=http://dx.doi.org/10.1145/505282.505283 [4] Michael W. Berry, Murray Browne. 2005.
Understanding search engines: mathematical modeling and text retrieval. SIAM. ISBN:0-89871-581-4 [5] Stephan Spencer. 2011. Google Power Search. O’Reilly. 978-1-449-31156-8 [6] Luca Roversi, Gestione Strutturata dell'Informazione, Appunti online
|