Docente
|
LANCIONI GIULIANO
(programma)
Il corso offrirà un'introduzione alla linguistica araba di corpus, presentandone problemi, metodologie e risultati. Gli studenti saranno avviati alle problematiche dell'annotazione di testi linguistici in arabo standard e parlato, con una particolare enfasi sui testi misti e informali. Alla parte teorica si affiancherà un'esemplificazione empirica su alcuni degli strumenti open source di riferimento per l'analisi semiautomatica dei testi arabi. Agli studenti saranno inoltre presentati principi e applicazioni degli standard di annotazione linguistica dei testi (TEI, Universal Dependencies).
(testi)
Bassiouney, R., 2009. Arabic sociolinguistics: topics in diglossia, gender. identity, and politics. Georgetown University Press, Washington, DC.
Boella, M., Romani, F.R., Al-Raies, A., Solimando, C., Lancioni, G., 2011. The SALAH Project: Segmentation and Linguistic Analysis of ḥadīṯ Arabic Texts, in: Information Retrieval Technology, Lecture Notes in Computer Science. Presented at the Asia Information Retrieval Symposium, Springer, Berlin, Heidelberg, pp. 538–549.
Lancioni, G., Joosse, N.P., 2016. The Arabic Diatessaron Project: Digitalizing, Encoding, Lemmatization. JRMDC 5, 205–227.
Pasha, A., Al-Badrashiny, M., Diab, M., Kholy, A.E., Eskander, R., Habash, N., Pooleery, M., Rambow, O., Roth, R., 26-31. MADAMIRA: A Fast, Comprehensive Tool for Morphological Analysis and Disambiguation of Arabic, in: Chair), N.C. (Conference, Choukri, K., Declerck, T., Loftsson, H., Maegaard, B., Mariani, J., Moreno, A., Odijk, J., Piperidis, S. (Eds.), Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC’14). European Language Resources Association (ELRA), Reykjavik, Iceland.
Ryding, K.C., 1991. Proficiency Despite Diglossia: A New Approach for Arabic. The Modern Language Journal 75, 212–218.
TEI Consortium (Ed.), 2018. TEI P5: Guidelines for Electronic Text Encoding and Interchange. 5.0. TEI Consortium.
|