Gruppo opzionale:
comune Orientamento unico II ANNO -QUATTRO A SCELTA TRA - (visualizza)
|
24
|
|
|
|
|
|
|
|
20802125 -
BIG DATA
(obiettivi)
Il corso mira a illustrare le moderne soluzioni tecniche e metodologiche alla gestione dei big data, ovvero collezioni di dati destrutturati le cui dimensioni superano le capacità di memorizzazione, gestione e analisi tipiche dei tradizionali sistemi per basi di dati. Partendo dai requisiti delle moderne applicazioni per basi di dati, verranno affrontate le diverse problematiche di memorizzazione e uso dei big data, illustrando le architetture hardware e software che sono state proposte per la loro gestione. Gli argomenti che verranno trattati includono: il le architetture basate su cluster, il paradigma map-reduce, il Cloud computing, i sistemi NoSQL, gli strumenti e i linguaggi per l'analisi dei dati. Durante il corso si cercherà di coniugare aspetti metodologici e tecnologici mediante esercitazioni pratiche con l'ausilio di sistemi reali, seminari aziendali e svolgimento di progetti pratici.
-
TORLONE RICCARDO
( programma)
- Infrastrutture e paradigmi di programmazione per i big data - L'ecosistema Hadoop - Cloud computing - Elaborazione di big data (MapReduce, Hive, Spark) - I sistemi NoSQL - Tecniche di analisi di big data - I Data Lake - Sistemi e applicazioni - Seminari aziendali
( testi)
Martin J. Fowler, PramodkumarJ. Sadalage. "NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence". Materiale predisposto dal docente (disponibile sul sito Web del corso)
|
6
|
ING-INF/05
|
54
|
-
|
-
|
-
|
Attività formative caratterizzanti
|
ITA |
20810006 -
ADVANCED TOPICS IN COMPUTER SCIENCE
(obiettivi)
Presentare modelli, metodi e sistemi relativi ai più recenti avanzamenti nel settore dell’ingegneria informatica in grado di soddisfare i requisiti delle nuove applicazioni moderne. Il corso viene tenuto in inglese da docenti stranieri di alta qualificazione.
-
TORLONE RICCARDO
( programma)
Il programma viene definito all'inizio dell'anno sulla base dei docenti stranieri invitati. Il sito Web del corso viene tenuto aggiornato con le informazioni più recenti.
( testi)
La documentazione e i testi sono scelti dai docenti stranieri.
|
6
|
ING-INF/05
|
42
|
-
|
-
|
-
|
Attività formative caratterizzanti
|
ITA |
20810087 -
MACHINE LEARNING
(obiettivi)
Consentire agli studenti di approfondire i principali modelli e metodi dell’Apprendimento Automatico, come ad. esempio la Regressione, la Classificazione, il Clustering, il Deep Learning, ed utilizzarli come strumenti per lo sviluppo di tecnologie innovative.
-
Erogato presso
20810266 Machine Learning in Ingegneria informatica LM-32 MICARELLI ALESSANDRO, GASPARETTI FABIO
( programma)
1. Regression Richiami di Linear Regression Overfitting nella Regressione Feature Selection e Lasso
2. Classification Richiami di Logistic Regression per la classificazione Overfitting nella Classificazione Boosting. Algoritmo AdaBoost Support Vector Machine (Large Margin Classification, Kernel I, Kernel II) Naïve Bayes
3. Clustering e Retrieval Algoritmo K-NN Algoritmo K-Means Expectation Maximization Applicazioni all’Information Retrieval
4. Dimensionality Reduction Compressione e visualizzazione dei dati Principal Component Analysis (PCA) Scelta del numero di componenti principali Applicazioni nei Recommender Systems
5. Deep Learning Deep Forward Networks Regularization per il Deep Learning Convolutional Networks Applicazioni varie
6. Casi di Studio e Progetti Si esporranno vari casi di studio e si proporranno progetti in cui applicare le nozioni apprese su vari domíni d’interesse.
( testi)
Dispense a cura del docente.
|
6
|
ING-INF/05
|
54
|
-
|
-
|
-
|
Attività formative caratterizzanti
|
ITA |
20802126 -
VISUALIZZAZIONE DELLE INFORMAZIONI
(obiettivi)
La quantità di dati relazionali disponibili in forma elettronica rende la loro esplorazione interattiva attraverso interfacce visuali un interessante dominio di ricerca ed una promettente area per lo sviluppo di prodotti software. Nuovi strumenti di esplorazione visuale trovano quotidianamente applicazione nelle reti sociali, nelle basi di dati, nelle reti di calcolatori, nel web semantico, nella sicurezza, ecc. Recentemente, la diffusione di tablet e smartphone hanno esasperato la necessità di interfacce visuali innovative che siano contemporaneamente efficaci ed intuitive. Gli obiettivi del corso sono proprio quelli di introdurre lo studente ai problemi e alle soluzioni relative all'esplorazione visuale di dati astratti, con particolare enfasi sulle metafore grafiche adottate e sui metodi e modelli algoritmici utilizzati. Verranno approfondite le conoscenze degli studenti su problemi di ingegneria degli algoritmi e di ottimizzazione su reti. Tali conoscenze verranno applicate a problemi di visualizzazione dell'informazione di varia natura e con forte connotazione pratica.
-
PATRIGNANI MAURIZIO
( programma)
Data and Visualization: Data overloading. Comparison of Scientific Visualization and Information Visualization. Structured and Unstructured data. Data transformation. Data tables.
Visual Perception: Our vision’s principles and limitations. Peripheral and central view. The perception of color.
Cognitive Issues and User Tasks: Perception abilities. Weber's law. Stevens' power law. Gestalt laws. A two stage model for visual perception. Task taxonomies.
Infovis on the Web - SVG and D3.js: Basic ingredients of Web data visualization. JavaScript crash course. Raster and vector graphics. Overview of JavaScript libraries. Focus on D3.js.
Multivariate Data Representations: Combined views. Icons or glyphs. Alternative coordinate systems.
Visualization in Computer Networks: Visual analysis in the computer network domain. Motivations. Taxonomies. Real-world examples and use cases. Open questions.
Design Methods and Evaluation: Design methodologies and design choices. Design evaluation (goals, difficulties, practices, guidelines).
Visualization of Time Series Data: Definition of time series and temporal data. Visualization of time series (single dependent variable, multiple dependent variables). Case studies.
Interaction: Classification of interaction mechanisms, goals, and timings. Examples of interaction strategies.
Introduction to Graph Drawing: Graph Drawing conventions and aesthetics. The divide an conquer approach for testing planarity of a graph.
Node-link Representations of Trees: Representing trees within the node-link paradigm. Layered drawings of trees. Hv-drawings of trees. Limitations of node-link representations.
Space-Filling Visualizations of Trees: Algorithms and systems for the representation of trees using the space-filling strategy. Treemaps. 3D Space-filling approaches.
Representations of Graphs and Networks with the Force-Directed Approach: The force-directed paradigm. The barycenter method. Spring embedders. Scalability and flexibility of the force-directed paradigm. Fruchterman-Reingold and Barnes–Hut algorithms. Simulating graph theoretic distances. Magnetic fields. Generic energy functions. Handling drawing constraints.
Representations of Hierarchical Data: Algorithms for the representation of layered networks. The Sugiyama approach. Step 1: Cycle removal. Step 2: Level Assignment. Step 3: Crossing Reduction. Step 4: X-Coordinate Assignment
Orthogonal Drawings: Computing orthogonal drawings via Network Flows. The Topology-Shape-Metric approach. Extension to graphs of arbitrary degree. Representations of orthogonal drawings obtained from visibility representations and by incremental approaches.
Visualizing Large Graphs: Strategies for the visualization of massive amount of data providing both overview and details. Alternate between views. Combine different views. Filtering and clustering principles. Three-dimensional and two-dimensional representations of clustered graphs. Hybrid representations.
Tools and Libraries for Drawing Graphs: Tools and Libraries for drawing graphs. Programming languages, input and output formats, and interaction. Some practical example.
Architectures for Scalable Information Visualization: Computational and memory scalabity. Visualization architectures. Strategies for visualizing massive amounts of data.
( testi)
Trasparenze fornite dal docente e scaricabili via via dal sito del corso: http://www.dia.uniroma3.it/~infovis/ Per scaricare le slides sono neccessarie delle credenziali da richiedere al docente (maurizio.patrignani@uniroma3.it)
|
6
|
ING-INF/05
|
54
|
-
|
-
|
-
|
Attività formative caratterizzanti
|
ITA |
20810205 -
Imprenditorialità digitale
(obiettivi)
Fornire agli studenti le competenze tecniche e metodologiche necessarie a concepire, sviluppare e realizzare un progetto imprenditoriale digitale. Il corso sarà articolato in tre parti. La prima parte ha l’obiettivo di illustrare le motivazioni alla base del successo delle aziende digitali (in particolare, ma non solo, le startup) e le dinamiche dell’innovazione digitale. La seconda parte propone agli studenti gli strumenti tecnici e metodologici per la realizzazione di un progetto imprenditoriale digitale. La terza parte consiste nella realizzazione di un progetto ed è caratterizzata da un approccio fortemente sperimentale.
-
MERIALDO PAOLO
( programma)
Prima parte (1CFU) Cosa ha determinato il successo delle imprese digitali • Dall’invenzione del microprocessore al cloud computing • Modelli di business delle imprese digitali • Ciclo di vita di una impresa digitale Seconda parte (2CFU) Come progettare, costruire e migliorare un prodotto o servizio digitale • Idea, team, finanziamenti • Lean Canvas: Segmento dei clienti (e clienti-tipo), Problema (e soluzioni esistenti), canali di profitto, Soluzione, Unique Value Proposition (Proposta di valore), Canali, Metriche Chiave, Struttura dei costi, Vantaggio Competitivo • User-centered design (UCD) e minimum viable product (MVP) • Come funzionano gli investitori: 4F, acceleratori, business angels, venture capitalists, corporate ventures. Partner finanziari e Partner Industriali Terza parte (3CFU) Lavoro di gruppo. In questa parte del corso gli studenti dovranno esercitarsi nei passi fondamentali per la ideazione di una impresa digitale. Gli studenti potranno optare se partecipare al programma di ateneo Dock3 oppure sviluppare la propria idea in maniera indipendente. In entrambi i casi saranno seguiti dal docente e da un comitato di esperti e in impreditorialità digitale.
( testi)
Creare modelli di business: Un manuale pratico ed efficace per ispirare chi deve creare o innovare un modello di business da Alexander Osterwalder , Yves Pigneur
The Four Steps to the Epiphany: Successful Strategies for Products that Win (English Edition) di Steve Blank
The Lean Startup: How Today's Entrepreneurs Use Continuous Innovation to Create Radically Successful Businesses di Eric Ries
|
6
|
ING-INF/05
|
54
|
-
|
-
|
-
|
Attività formative caratterizzanti
|
ITA |
20810211 -
Algoritmi per big data
(obiettivi)
n molti contesti applicativi sono in gioco enormi volumi di dati che vengono utilizzati in ambito economico-finanziario, politico, sociale ed anche istituzionale. Spesso i dati sono memorizzati in enormi cloud distribuite e talvolta sono generati secondo un flusso continuo, così consistente da renderne impossibile una memorizzazione completa. In moltissimi casi i dati sono inerenti ad entità in fitta relazione tra loro e danno luogo a immense reti di collegamenti. Esempi comuni di tali reti sono le reti sociali e biologiche, le reti di distribuzione e il grafo del Web. Inoltre il fatto che i dati siano memorizzati in sistemi gestiti da terze parti pone problemi di integrità che non trovano riscontro nella letteratura informatica classica sia per la tipologia sia per la scala.
Questo scenario pone sfide algoritmiche inedite sulle quali è al lavoro una vasta platea di ricercatori. Tale sforzo ha prodotto, nell’ultimo decennio, molte novità sia sul piano metodologico sia sul piano tecnologico. L’insegnamento ha lo scopo di trasferire agli studenti alcuni tra i più importanti strumenti metodologici nati nell’ambito della ricerca sugli algoritmi per Big Data. Tali strumenti metodologici sono proposti assieme a contesti applicativi sfidanti.
-
DI BATTISTA GIUSEPPE
( programma)
1) Algorithms for data streams - Approximate counting - Majority problems - Sampling and reservoir sampling - Bloom filters - Frequent itemsets - Number of distinct elements 2) Dimensionality reduction Johnson–Lindenstrauss lemma Embedding metric spaces with low distortion 3) Algorithms and data structures for quantitative features analysis - orthogonal range searching (kd-trees and range trees) - nearest neighbour search, k-nearest neighbour search - fractional cascading and simplex range search 4) Algorithms for the decomposition of complex networks - Decomposition into k-connected components - Decomposition into k-cores, maximal cliques, maximal k-plexes 5) NoSQL internals: Distributed Hash Tables, chord, consistent hashing 6) Scalable security: integrity of big data sets in the cloud, consistency and scalability issues with authenticated data structures, pipelining, blockchain scalability trilemma.
( testi)
Mining of Massive Datasets Jure Leskovec, Anand Rajaraman, Jeff Ullman Cambridge University Press http://www.mmds.org/
-
PATRIGNANI MAURIZIO
( programma)
1) Algorithms for data streams - Approximate counting - Majority problems - Sampling and reservoir sampling - Bloom filters - Frequent itemsets - Number of distinct elements 2) Dimensionality reduction - Johnson–Lindenstrauss lemma - Embedding metric spaces with low distortion 3) Algorithms and data structures for quantitative features analysis - orthogonal range searching (kd-trees and range trees) - nearest neighbour search, k-nearest neighbour search - fractional cascading and simplex range search 4) Algorithms for the decomposition of complex networks - Decomposition into k-connected components - Decomposition into k-cores, maximal cliques, maximal k-plexes 5) NoSQL internals: Distributed Hash Tables, chord, consistent hashing 6) Scalable security: integrity of big data sets in the cloud, consistency and scalability issues with authenticated data structures, pipelining, blockchain scalability trilemma.
( testi)
Mining of Massive Datasets Jure Leskovec, Anand Rajaraman, Jeff Ullman Cambridge University Press http://www.mmds.org/
-
FRATI FABRIZIO
( programma)
1) Algorithms for data streams - Approximate counting - Majority problems - Sampling and reservoir sampling - Bloom filters - Frequent itemsets - Number of distinct elements 2) Dimensionality reduction - Johnson–Lindenstrauss lemma - Embedding metric spaces with low distortion 3) Algorithms and data structures for quantitative features analysis - orthogonal range searching (kd-trees and range trees) - nearest neighbour search, k-nearest neighbour search - fractional cascading and simplex range search 4) Algorithms for the decomposition of complex networks - Decomposition into k-connected components - Decomposition into k-cores, maximal cliques, maximal k-plexes 5) NoSQL internals: Distributed Hash Tables, chord, consistent hashing 6) Scalable security: integrity of big data sets in the cloud, consistency and scalability issues with authenticated data structures, pipelining, blockchain scalability trilemma.
( testi)
Mining of Massive Datasets Jure Leskovec, Anand Rajaraman, Jeff Ullman Cambridge University Press http://www.mmds.org/
-
PIZZONIA MAURIZIO
( programma)
1) Algorithms for data streams - Approximate counting - Majority problems - Sampling and reservoir sampling - Bloom filters - Frequent itemsets - Number of distinct elements 2) Dimensionality reduction - Johnson–Lindenstrauss lemma - Embedding metric spaces with low distortion 3) Algorithms and data structures for quantitative features analysis - orthogonal range searching (kd-trees and range trees) - nearest neighbour search, k-nearest neighbour search - fractional cascading and simplex range search 4) Algorithms for the decomposition of complex networks - Decomposition into k-connected components - Decomposition into k-cores, maximal cliques, maximal k-plexes 5) NoSQL internals: Distributed Hash Tables, chord, consistent hashing 6) Scalable security: integrity of big data sets in the cloud, consistency and scalability issues with authenticated data structures, pipelining, blockchain scalability trilemma.
( testi)
Mining of Massive Datasets Jure Leskovec, Anand Rajaraman, Jeff Ullman Cambridge University Press http://www.mmds.org/
-
DA LOZZO GIORDANO
( programma)
1) Algorithms for data streams - Approximate counting - Majority problems - Sampling and reservoir sampling - Bloom filters - Frequent itemsets - Number of distinct elements 2) Dimensionality reduction -Johnson–Lindenstrauss lemma Embedding metric spaces with low distortion 3) Algorithms and data structures for quantitative features analysis - orthogonal range searching (kd-trees and range trees) - nearest neighbour search, k-nearest neighbour search - fractional cascading and simplex range search 4) Algorithms for the decomposition of complex networks - Decomposition into k-connected components - Decomposition into k-cores, maximal cliques, maximal k-plexes 5) NoSQL internals: Distributed Hash Tables, chord, consistent hashing 6) Scalable security: integrity of big data sets in the cloud, consistency and scalability issues with authenticated data structures, pipelining, blockchain scalability trilemma.
( testi)
Mining of Massive Datasets Jure Leskovec, Anand Rajaraman, Jeff Ullman Cambridge University Press http://www.mmds.org/
|
6
|
ING-INF/05
|
54
|
-
|
-
|
-
|
Attività formative caratterizzanti
|
ITA |
|