Towards Fusion of Textual and Visual Modalities for Describing Audiovisual Documents

Fourati, Manel; Jedidi, Anis; Hassin, Hanen Ben; Gargouri, Faiez

Towards Fusion of Textual and Visual Modalities for Describing Audiovisual Documents

Manel Fourati, Anis Jedidi, Hanen Ben Hassin and Faiez Gargouri
Additional contact information
Manel Fourati: Laboratory MIR@CL, University of Sfax, Sfax, Tunisia
Anis Jedidi: Laboratory MIR@CL, University of Sfax, Sfax, Tunisia
Hanen Ben Hassin: Laboratory MIR@CL, University of Sfax, Sfax, Tunisia
Faiez Gargouri: Laboratory MIR@CL, University of Sfax, Sfax, Tunisia

International Journal of Multimedia Data Engineering and Management (IJMDEM), 2015, vol. 6, issue 2, 52-70

Abstract: Audiovisual documents provide a wide range of content description through more descriptors from different media types. Indeed, the extraction of these descriptions has received an increasing attention. But, the lack of semantic description always persists. In fact, this lack affects the retrieval process. To address this problem, this paper describes an automatic and semantic description of cinematic audiovisual documents. This description is based not only on the audiovisual flux in this post-production phase but also in the documentation in the pre-production phase by using textual and visual modalities. In this context, to extract content description, we find it is essential to extract texts superposed in the image. This process is mainly based on the neural network classifier. Moreover, an effective OCR (Tesseract) is adapted for texts recognition. Experiments results confirmed the interesting performance through two databases, namely, “ICDAR 2011” and our own created database from the Internet Movie Database Imdb.

Date: 2015
References: Add references at CitEc
Citations:

Downloads: (external link)
https://services.igi-global.com/resolvedoi/resolve ... 18/IJMDEM.2015040104 (application/pdf)

Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.

Export reference: BibTeX RIS (EndNote, ProCite, RefMan) HTML/Text

Persistent link: https://EconPapers.repec.org/RePEc:igg:jmdem0:v:6:y:2015:i:2:p:52-70

Access Statistics for this article

International Journal of Multimedia Data Engineering and Management (IJMDEM) is currently edited by Shu-Ching Chen

More articles in International Journal of Multimedia Data Engineering and Management (IJMDEM) from IGI Global Scientific Publishing
Bibliographic data for series maintained by Journal Editor ().